零假设是观察到的数据是从具有预期频率的群体中抽样得到的。卡方检验结合了观察值和期望值之间的差异。
计算方法
1.计算每个类别的观察值和预期值之间的差异。
2.将该差值平方,然后除以预期计数。
3.将所有类别的数值相加。换句话说,计算 (O-E)2/E 的总和。
4.使用计算机程序计算 P 值。您需要知道自由度数等于类别数减 1。
零假设是观察到的数据是从具有预期频率的群体中抽样得到的。P 值回答了这个问题:
假设产生期望值的理论是正确的,那么观察到观察值和期望值之间存在如此大的差异(或更大)的概率是多少?
小的 P 值证明数据不是从您期望值的分布中采样的。
Yates 修正
当只有两个类别时,一些统计学家建议使用 Yates 修正。这会降低卡方检验值,因此会增加 P 值。在样本量大的情况下,这种校正的作用不大。而对于小样本,则差别较大。统计学家对何时使用 Yates 修正意见不一,Prism 也没有使用。
在只有两个类别的情况下,最好使用二项式检验,因为二项式检验给出的是精确结果,而不是卡方计算的任何一种形式,因为卡方计算只是一种近似计算。