Kruskal-Wallis 检验是一种非参数检验,用于比较三个或更多不匹配的组。要执行此检验值,Prism 首先会将所有数值从低到高排序,不关注每个数值属于哪个组。最小的数值的秩为 1,最大的数值的秩为 N,其中 N 是所有组中数值的总数。秩和之间的差异合并成一个单一的值,称为 Kruskal-Wallis 统计量(有些书把这个值称为 H)。Kruskal-Wallis 统计量越大,秩和之间的差异就越大。
P 值可以回答这个问题:
如果您的样本很小(即使存在并列),Prism 会计算精确的 P 值。如果样本较大,Prism 会根据高斯近似(基于 Kruskal-Wallis 统计量 H 近似于卡方检验分布)计算近似 P 值。Prism 会相应地将 P 值标记为精确或近似。 这里的高斯与秩和分布有关,并不意味着您的数据必须服从高斯分布。对于大样本,近似值相当精确,而且是标准值(所有统计程序都会使用)。在数据集较大或计算机速度较慢的情况下,精确计算可能会比较慢。在这种情况下,您可以点击进度对话框中的取消按钮来取消计算。如果取消精确 P 值的计算,Prism 将显示近似 P 值。
如果 P 值较小,则可以否定随机抽样导致差异的观点,而得出种群分布不同的结论。
如果 P 值很大,那么数据并不能让你得出结论说分布不同。这并不等于说分布相同。Kruskal-Wallis 检验的检验力很小。事实上,如果总样本量为 7 个或更少,无论各组的差异有多大,Kruskal-Wallis 检验的 P 值总是大于 0.05。
Kruskal-Wallis 检验是为连续测量的数据而开发的。因此,您期望测量的每个值都是唯一的。但偶尔也会出现两个或多个值相同的情况。当 Kruskal-Wallis 计算将数值转换为等级时,这些数值会因等级相同而并列,因此它们都会被分配为并列的两个(或多个)等级的平均值。
Prism 在计算 Kruskal-Wallis 统计量时使用标准方法修正并列。
目前还没有完全标准的方法在出现并列时从这些统计量中得到 P 值。 Prism 6 及以后版本处理并列的方法与以前版本不同。在样本量适中的情况下,Prism 会计算精确的 P 值。而早期版本在出现并列时总是计算近似 P 值。因此,在存在并列关系的情况下,Prism 6 及更高版本报告的 P 值可能与 Prism 早期版本或其他程序报告的 P 值不同。
如果样本较小,Prism 会计算精确的 P 值。如果样本较大,则会根据卡方检验分布近似 P 值。对于大样本,近似值相当精确。对于中等样本量,Prism 可能需要很长时间才能计算出精确的 P 值。在计算过程中,Prism 会显示一个进度对话框,如果近似 P 值足够好,您可以按 "取消 "键中断计算。 Prism 总是会报告 P 值是精确计算的还是近似计算的。
邓恩检验
邓恩多重比较检验将两列之间秩和的差异与预期平均差异(基于组数和组规模)进行比较。
对于每一对列,Prism 会以 >0.05、<0.05、<0.01 或 <0.001 报告 P 值。P 值的计算要考虑到进行比较的次数。如果零假设成立(所有数据都是从分布完全相同的人群中随机抽样得到的,因此组间的所有差异都是随机抽样造成的),那么至少有一个后检验的 P<0.05 的概率为 5%。这 5%的概率并不适用于每次比较,而是适用于整个比较族。
有关后检验的更多信息,请参阅 PWS-Kent 出版公司 1990 年出版的 WW Daniel 的《应用非参数统计》或 S. Siegel 和 N. J. Castellan 于 1988 年出版的《行为科学的非参数统计》。原始参考文献是 O.J. Dunn,Technometrics,5:241-252,1964 年。
Prism 将后检验称为邓恩后检验。有些书籍和程序只是将此检验称为 Kruskal-Wallis 检验后的后检验,并没有给出确切的名称。
在解读结果之前,请先查看分析核对表。