Friedman检验是一种非参数检验,比较三个或更多匹配或配对的研究组。Friedman检验首先从低到高排列每个匹配集合(每行)中的值。每一行均分开排列。然后对每个组(列)中的秩求和。如果总和相差很大,则P值会很小。Prism报告了Friedman统计值,该值由秩和样本量的总和计算得到。该值有若干名称。一些程序和文本将该值称为Q或T1或FM。其他一些程序和文本将其称为卡方,因为其分布近似卡方,因此卡方分布用于计算P值。
使用匹配检验的全部目的是控制受试者之间的实验变异性,从而提高检验的检验力。在实验中您无法控制的一些因素会增加(或减少)受试者的所有测量值。由于Friedman检验对每行中的数值进行排序,因此其不会受到同等影响行中所有值的变异性来源的影响(因为该因素不会改变行中的排序)。
P值回答了该问题:如果不同治疗(列)确实完全相同,则随机抽样导致在该实验中观察到的相距甚远(或者更远)的秩总和的可能性有多大?
如果P值很小,则您可以拒绝认为列之间的所有差异均因随机抽样所致,而得出至少有一种治疗(列)与其他治疗不同的结论。然后查看检验后结果,确定哪些组与其他组不同。
如果P值很大,则数据不给您任何理由来得出总体中值不同的结论。这不等于说真正的中值均相同。您只是没有确凿证据证明它们不同。如果您的样本量较小,则Friedman检验的检验力很低。
Prism可基于一张相当小的表格进行精确计算。当表格较大时,Prism使用标准近似值。为决定何时使用近似方法,Prism计算(T!)S (S幂次方的T阶乘),其中T表示治疗数量(数据集),S表示受试者人数(行数)。当该值超过109时,Prism使用近似方法。例如,如果有3种治疗和12行,则(T!)S 等于612,等于2.2×109因此,Prism使用了一种近似方法。
近似方法有时称为高斯近似法。“高斯” 一词 与秩和分布有关,并不意味着您的数据需要从高斯分布中抽样得到。对于中等样本量,Prism可能需要很长时间来计算精确P值。如果近似P值满足需要,则可以中断计算。
精确方法的工作原理是检查所有可能值的重新排列情况,将每个值保持在同一行(同一受试者,因为这是重复的测量设计),但允许列(处理)赋值变化。
如果两个或以上的值(在同一行中)相同,则先前版本的Prism无法计算精确P值,因此即使使用很小的样本量,Prism也能计算出近似P值。Prism 6及更高版本甚至可以在有联系的情况下计算精确P值,因此仅在样本量相当大时才使用近似值,如上所述。这意味着,对于一些数据集,Prism报告的结果不同于旧版本报告的结果。
完成Friedman检验后,Prism可以执行Dunn后检验。详见WW Daniel著,PWS - Kent出版公司于1990年出版的《应用非参数统计》或S Siegel和NJ Castellan著,于1988年出版的《行为科学用非参数统计》。最初参考文献是O.J. Dunn著《技术计量学》,5:241 - 252,1964。请注意,一些书籍和程序仅将该检验称为Friedman检验之后的后检验,并未给出确切名称。
Dunn后检验比较了两列之间的秩和与预期平均差异(基于各组的数量和大小)。对于每对列,Prism报告的P值为>0.05、<0.05、<0.01或<0.001。计算P值时考虑了正在进行的比较的数量。如果零假设为真(所有数据均从具有相同分布的群体中抽样得到,因此各组之间的所有差异均因随机抽样所致),则至少有一个后检验有5%的几率出现P<0.05。5%的几率并不适用于每个比较结果,而是适用于整个比较族。