正态性检验均报告了一个P值。如需理解任何P值,则需了解零假设。在此情况下,“零假设”指所有值抽样自服从高斯分布的群体。
P值回答了该问题:
如果零假设为真,则与这些数据一样偏离理想高斯分布的随机数据样本的概率是多少?
Prism也采用传统的0.05截止值来回答数据是否通过正态性检验的问题。如果P值大于0.05,答案为“是”。如果P值小于或等于0.05,答案为“否”
所得出的结论只能是,数据并不符合高斯分布。正态性检验无法证实数据抽样自高斯分布。正态性检验所能够实现的是证明偏离理想高斯分布的程度不比您希望偶然看到的程度更多。对于大量数据集,这是可靠的。对于少量数据集,正态性检验并没有更多检验力来检测与理想高斯分布的适度偏差。
零假设是指在高斯分布中进行数据抽样。如果P值足够小,您即可拒绝零假设,并因此接受数据并非抽样自高斯群体的备择假设。该分布可能接近(具有大数据集),也可能远离高斯分布。正态性检验未显示任何关于备选分布的信息。
如果P值足够小,并可声明高斯想法的偏离“具有统计学显著性”,则拥有以下四个选择:
•数据可能来自另一个可识别的分布。若是如此,也许能够转换您的值以创建高斯分布。例如,如果数据出自对数正态分布,将所有值转换为各自的对数。
•一个或几个异常值的存在可能导致正态性检验失效。运行异常值检验。考虑排除异常值。
•如果正态的偏离程度很小,则可选择什么也不做。统计检验往往对高斯设想出现轻度违反。
•切换为并未设想高斯分布的非参数检验。但是决定使用(或不使用)非参数检验是一个重要决定。这并非基于单一正态检验或自动检验。