Wilcoxon检验是一种比较两个配对组的非参数检验。Prism首先计算每组对之间的差值,并将差值的绝对值按由低到高的顺序排序。然后,Prism对A列值较高的差值的秩数进行求和(正秩数),对B列值较高的差值的秩数求和(称为负秩数),并报告两个总和。如果两组的秩和平均和差异很大,则P值会较小。
P值回答了该问题:
如果P值较小,则可拒绝“差异因偶然性所致”这一观点,并得出群体中值不同的结论。
如果P值很大,则数据不给您任何理由来得出总体中值不同的结论。这不等于说真正的中值均相同。您只是没有确凿证据证明它们不同。如果样本很小,则Wilcoxon检验在检测微小差值方面的检验力很低。
如果少于200对,则Prism会计算出精确P值。有关更多详细信息,见关于Wilcoxon有符号秩检验的页面。Prism 6及更高版本即使有约束,也可以做到这一点。当超过200对时,其基于高斯近似法计算P值。本文使用的“高斯”一词与秩和分布有关,并不意味着数据需要服从高斯分布。
如果一些受试者在干预前后的值完全相同(两列中的值相同),则会发生什么情况?
Wilcoxon开发该检验时,建议这些数据可以忽略不计。假设有十对。其中九对的前后值不同,但第十对的值相同,因此差值等于零。使用Wilcoxon的原始方法,将忽略第十对,分析其他九对。这就是InStat和Prism早期版本(直至版本5)处理这种情况的方法。
Pratt(1,2)提出了一种不同的方法来说明相关值。Prism 6及更高版本提供了使用此方法的选择。
应选择哪种方法?显然,如果所有对的前后值均不同,那也没关系。举例来说,如果200对中只有一对的前后值相同,也无关紧要。
直觉告诉我们,不应忽略数据,因此Pratt的方法一定更好。然而,Conover(3)已经表明,这两种方法的相对优点取决于数据的潜在分布情况,而您并不知道这一点。
Prism可以计算配对差值中值的95%置信区间(在“选项”选项卡上选择)。仅当假设差值分布对称时,才能解释这一点。Prism 6及更高版本所使用的方法说明见Sheskin(第四版)第234 - 235页和第Klotz第302 - 303页。
使用配对检验的要点在于控制实验的变异性。一些在实验中无法控制的因素会对前后测量结果产生相同的影响,因此不会影响前后的差值。因此,配对检验可以通过只分析差值纠正这些分散源。
如果配对有效,则预计前后测量结果一起变化。Prism通过计算非参数Spearman相关系数rs(基于r推导得到)来量化。基于rs,Prism可以计算P值来回答该问题:如果两组之间的确无任何相关性,则随机选择的受试者与实验中观察到的相关系数一样大(或更大)的几率有多大?P值是单尾值,因为您对观察到强烈负相关的可能性不感兴趣。
如果配对有效,则rs 将是正值,并且P值会较小。这意味着两组显著相关,因此选择配对检验有意义。
如果P值较大(例如,>0.05),则应该质疑使用配对检验是否有意义。是否选择使用配对检验不应该基于该P值,还应该基于实验设计和在其他类似实验中看到的结果(假设已经重复了几次实验)。
如果rs 为负值,则意味着配对会适得其反!您期望各对的值同向变动 - 如果一个更高,另一个也更高。而这种情况正好相反 - 如果一个值较高,另一个值较低。很可能这只是一个偶然问题。如果rs 接近 - 1,应该审查程序,因为数据不寻常。
Prism 6及更高版本的结果可能与先前版本的结果不同,因为Prism现在可以在曾经Prism 5进行近似计算的两种情况下进行精确计算。所有版本的Prism均会报告其所用方法是近似方法还是精确方法。
•Prism执行精确计算的速度比Prism 5快得多,对于早期版本Prism只能执行近似计算的某些样本量,Prism执行精确计算的速度也快得多。
•如果两对Prism的前后差值相同,则先前版本Prism总是使用近似方法。除非样本很大,否则Prism 6使用精确方法。
Prism报告其使用的是近似方法还是精确方法,因此很容易判断这是否是导致不同结果的原因。
描述性统计的分析选项卡仅总结了用于Wilcoxon检验的数据。如果一列中存在任何数据,而另一列中没有,则这些值不包括在配对t检验所包括的描述性统计结果中。当然,一般描述性统计分析会对所有数据进行分析。
1.Pratt JW(1959)关于Wilcoxon符号秩程序中零点和结的注记。《美国统计学会会刊》,第54卷,第287期(1959年9月),第655 - 667页
2.Pratt,J.W.和Gibbons,J.D.(1981)《非参数理论的概念》,纽约:Springer Verlag。
3.WJ Conover,Wilcoxon符号秩检验中的结处理方法,《美国统计学会会刊》,第68卷,第344期(1973年12月),第985 - 988页