Prism提供四种正态性检验(作为列统计学分析的一部分):
我们建议使用D'Agostino - Pearson似然比检验。如果每个值均唯一,Shapiro - Wilk检验也非常有效,但如果有联系,就不太有效。检验的基础对于非数学专业的人来说很难理解。出于这些原因,我们更偏向使用D'Agostino - Pearson检验,尽管Shapiro - Wilk检验在大多数情况下均很有效。
Kolmogorov - Smirnov检验(使用Dallal - Wilkinson - Lilliefor校正的P值)包括在内是为与Prism的旧版本兼容,但不推荐使用。
|
所有三个检验均询问分布偏离正态分布理想模型有多远。由于检验使用不同的方法量化偏离正态分布的情况,因此它们给出不同的结果也就不足为奇了。基本问题是这些检验并未询问两个定义的分布(例如,正态分布和指数分布)中哪一个更适合数据。相反,他们比正态分布斯和非正态分布。这是一个相当模糊的比较。鉴于不同的检验处理问题的方式不同,因此它们给出的结果也不同。
|
Kolmogorov - Smirnov检验需要5个或更多值。Shapiro - Wilk检验需要3个或更多的值。D'Agostino检验需要8个或更多的值,Anderson - Darling检验亦如此。
|
正态性检验均报告了一个P值。如需理解任何P值,则需了解零假设。在此情况下,零假设是所有值均根据高斯分布进行抽样。P值回答了该问题:
如果零假设为真,则与这些数据一样偏离理想高斯分布的随机数据样本的概率是多少?
|
您可在分析对话框中设置阈值。默认使用传统的0.05临界值。如果P<0.05,数据不能通过正态性检验。如果P>0.05,数据通过正态性检验。当然,该临界值是完全任意。
|
不是。一个总体的分布可能是正态分布,也可能不是。数据样本不能是正态分布或非正态分布。该词仅适用于数据抽样的总体值。
|
可能没有。几乎在所有情况下,我们均可确定数据并非根据理想的高斯分布进行抽样。这是因为理想的高斯分布包括一些非常低的负值和一些非常高的正值。这些值将构成正态分布总体中所有值的一小部分,但它们是分布的一部分。收集数据时,可能的值会受到限制。压力、浓度、重量、酶活性、和许多其他变量不能有负值,因此不能根据理想的高斯分布进行抽样。其他变量可以是负值,但有物理或生理限制,不允许超大值(或负值极低)。
|
不是,但大量的模拟显示,即使总体接近正态分布时,这些检验也能很有作用。
|
不完全是。很难定义“足够接近”是什么意思,正态性检验的设计也没有考虑到这一点。
|
每个正态性检验报告一个中间值,用来计算P值。遗憾的是,没有明显方法来解读K2(由D'Agostino检验计算)、KS(由Kolmogorov - Smirnov检验计算)或W(由Shapiro - Wilk检验计算)。据我所知,没有简单的方法使用这些值来决定偏离正态性是否严重到足以从参数检验中转换出来。Prism只报告这些值,因此您可将结果与文本和其他程序进行比较。
|
在大多数情况下,不是很有用。对于小样本,正态性检验并无太大的检验检验力来检测非正态分布。对于大样本,如果数据是非正态分布的也并不重要,因为t检验和方差分析对违反该标准的情况相当稳健。
您想要的只是一个检验,让您知道偏离理想正态分布是否严重到足以导致假设正态分布的统计方法无效。但正态性检验不能做到这一点。
|
参考文献
1 RB D'Agostino,《拟合优度技术中的正态分布检验》,由RB D'Agostino和MA Stepenes、Macel Decker编辑,1986。
本页的部分内容摘自Motulsky,H.J.(2010)第24章。《直觉生物统计学》,第2版。牛津大学出版社。ISBN=978-0-19-973006-3。