当样本非常小(例如,少于12个数值)时,您选择参数或非参数检验的决定最重要。
如果您选择参数检验,但您的数据并非来自高斯分布,则结果将不会很有意义。当样本非常小时,参数检验对与高斯分布的偏差并不是非常可靠。
如果您选择非参数检验,但实际上有高斯数据,您得到的P值可能会过大,因为非参数检验的检验力低于参数检验的检验力,而且这种差异在小样本中显而易见。
遗憾的是,当样本非常小时,正态性检验在检测样本是否来自高斯群体的检验力有限。小样本根本无法包含足够信息,因而您无法对整个群体的分布形状做出可靠推断。
样本非常大(例如,大于100左右)时,选择参数或非参数检验的决定并不重要。
如果选择参数检验,但数据并非是真正的高斯数据,您并未损失过多,因为参数检验对违反高斯假设是可靠的,尤其是当样本量相等(或接近相等)时。
如果您选择非参数检验,但实际上有高斯数据,您并未损失过多,因为当样本量非常大时,非参数检验的检验力几乎与参数检验的检验力一样大。
正态性检验对大样本非常奏效,因为大样本包含足够数据,允许您对群体分布(从中提取数据)的形状做出可靠推断。但正态性检验不能回答您关心的问题。您想知道的是,分布是否与高斯分布的差异是否足够,使得对参数检验的有用性产生怀疑。但正态性检验可以回答不同问题。正态性检验提出了一个问题,即是否有证据表明这种分布不同于高斯。但对于大样本,正态性检验将检测到与高斯有微小偏差,差异足够小,使得其不应影响对参数检验和非参数检验的决定。
大样本(>100份左右) |
小样本(<12份左右) |
|
针对非高斯数据的参数检验 |
正常。检验可靠。 |
误导。不可靠。 |
针对高斯数据的非参数检验 |
正常。检验的检验力良好。 |
误导。检验力过小。 |
正态性检验的有用性 |
有点用。 |
不是非常有用。 |