当样本较少时(比如少于一打值),选择参数检验和非参数检验的决定最为重要。
如果您选择参数检验,而您的数据并非来自高斯分布,那么结果就不会有太大意义。当样本极小时,参数检验对高斯分布的偏离并不十分稳健。
如果您选择了非参数检验,但实际数据确实是高斯分布,那么您很可能会得到一个过大的 P 值,因为非参数检验的检验力小于参数检验,而且在样本极小的情况下,这种差异会很明显。
不幸的是,当样本很小时,正态性检验几乎没有检验力来检测样本是否来自高斯群体。小样本根本无法包含足够的信息,让你对整个群体的分布形状做出可靠的推断。
选择参数检验还是非参数检验,对于大样本(比如大于 100 个左右)来说并不那么重要。
如果您选择了参数检验,而您的数据并非真正的高斯分布,那么您也不会有太大的损失,因为参数检验对违反高斯假设是很稳健的,尤其是在样本量相等(或接近相等)的情况下。
如果您选择了非参数检验,但实际数据确实是高斯数据,那么您的损失也不大,因为当样本量较大时,非参数检验的检验力与参数检验几乎一样大。
正态性检验在样本量大的情况下效果很好,因为样本中包含的数据足以让你对数据所来自的群体的分布形状做出可靠的推断。但正态性检验并不能回答你关心的问题。你想知道的是,数据分布是否与高斯分布有足够大的差异,从而对参数检验的有用性产生怀疑。但正态性检验回答的是另一个问题。正态性检验问的是是否有证据表明分布与高斯分布不同。但在样本量巨大的情况下,正态性检验会检测出与高斯分布的微小偏差,这种偏差足够小,因此不会影响参数检验和非参数检验的决定。
大样本(>100 个左右) |
小样本(<12 左右) |
|
非高斯数据的参数检验 |
好的。测试稳健。 |
误导。不稳健。 |
高斯数据的非参数检验 |
好检验力良好。 |
误导。检验力太低。 |
正态性检验的用处 |
有点用。 |
用处不大。 |