Mann - Whitney检验(又称“Wilcoxon秩和检验”)是一种比较两个非配对组的非参数检验。为执行Mann - Whitney检验,Prism首先将所有值按由低到高的顺序排序,而不考虑每个值所属的组。最小数字的秩为1。最大数字的秩为 n,其中 n 是两组各值的总数。Prism然后对每组中的秩进行平均,并报告两个平均值。如果两组中秩的平均值显著不同,则P值将较小。
您无法在知道检验的零假设之前解释P值。对于Mann - Whitney检验,零假设有点难以理解。零假设是两组的分布相同,因此从一个群体中随机选择的值的观察结果有50%的概率超过从另一个群体中随机选择的值的观察结果。
P值回答了该问题:
在大多数情况下(包括存在联系时),Prism会计算精确P值(2)。如果样本较大(较小的组有100多个值),则以高斯近似法近似P值。在本文中,“高斯”一词与秩和的分布有关,这并不意味着您的数据需要服从高斯分布。对于较大样本,该近似值相当精确,且属于标准值(所有统计程序均使用)。
请注意,Prism计算精确P值的速度比旧版本快得多,对于中等大小的数据集亦如此,而其中Prism 5使用的是近似方法。当最小样本量小于或等于100时,其会计算精确P值,否则会计算近似值(对于此类大样本量,近似值非常好)。
如果P值较小,则可拒绝“差异因随机抽样所致”这一零假设,并得出群体不同的结论。
如果P值较大,则数据会让您没有任何理由去拒绝零假设。这不等于两个群体相同。您只是没有确凿证据证明它们不同。如果样本较小,则Mann - Whitney检验的检验力较低。事实上,如果总样本量小于等于7,则无论各组之间的差异有多大,Mann - Whitney检验得出的P值总是大于0.05。
Prism可以报告Mann - Whitney U值,以便您比较计算结果与其他程序或文本的计算结果。如需计算U值,请从A组中选取一个值,并从B组中选取一个值。记录具有较大值的组。针对两组的所有值重复上述步骤。将A组值大于B组值的数量和B组值大于A组值的数量相加。这两个值中较小的值是U。这两个值中较大的值是U’(见下文)。
计算U时,比较的次数等于A组值的数量乘以B组值的数量的乘积。如果零假设为真,则U值应等于该值的一半左右。如果U值比该值小得多,则P值就会小。U的最小可能值为零。最大可能值是A组值数量与B组值数量的乘积的一半。
一些程序也报告了U’,但Prism未报告。其可以轻易计算为n1*n2 - U,其中n1和n2是两个样本量,而U由Prism报告。Prism将U定义为两个值中较小的一个,因此U’是两个值中较大的一个。有些程序根据首先输入的数据集来定义“U”和“U'”,因此在某些分析中可能会颠倒“U”和“U'”的定义。
Mann - Whitney检验可以比较两组的秩分布。如果假设两个群体的分布形状相同(不一定是高斯分布),则可以将其视为两个中值的比较结果。请注意,如果不做这种假设,Mann - Whitney检验无法比较中值。
仅当选中比较中值的复选框(在Options选项卡上)时,Prism才会报告中值之间的差值。其以两种方式报告差值。其中一种方法是明显的方法 - 使用一组的中值减去另一组的中值。另一种方法是计算Hodges - Lehmann估计值(4)。Prism系统地计算第一组中每个值与第二组中每个值之间的差值。Hodges - Lehmann估计值等于该差值集的中值。
Prism使用Sheskin(1)第521 - 524页和Klotz(3)第312 - 313页中说明的方法计算差值的置信区间。该方法以Hodges - Lehmann方法为基础。
由于非参数检验采用秩数进行,因此通常无法获得恰好95%的置信区间。Prism找到一个接近的置信水平,并报告其内容。例如,要求95%的置信区间时,可能会得到96.2%的置信区间。Prism报告其使用的置信水平,该置信水平尽可能接近要求的水平。在报告置信区间时,可以报告精确的置信水平(“96.2%”),或者只报告请求的置信水平(“95%”)。我认为后一种方法更常用。
当较小样本的数值数量少于等于100个时,Prism计算精确的置信区间,否则计算近似的置信区间。对于大样本,该近似值相当精确。
Mann - Whitney检验旨在用于连续测量的数据。因此,您期望测量的每个值均为唯一值。但偶尔两个或多个数值相同。当Mann - Whitney计算将这些值转换为秩时,这些值会针对相同的秩联系在一起,因此为其分配了所对应的两个(或更多)秩的平均值。
Prism在计算U时(或秩和;两者相同)使用标准方法来校正联系。
遗憾的是,当存在联系时,尚无标准方法可以基于这些统计数据得到P值。当较小样本的数值数量少于等于100个时,即使存在联系(2),Prism也会计算精确P值。其将每一种可能的方法制成表格,将数据按实际使用的样本量随机分为两组,并计算平均秩数之间差值大或比实际观察到差值的大的随机数据集的分数。样本较大(较小研究组有超过100个数值)时,Prism使用近似方法,将U或秩和转换为Z值,然后在高斯分布上查找该值以获得P值。
Prism 6及更高版本可以报告与先前版本不同的结果的原因有二:
•精确P值与近似P值。样本较小时,Prism计算精确P值。样本较大时,Prism计算近似P值。结果中报告了这一点。Prism 6在计算精确P值方面非常(非常)快,因此可以处理较大的样本。每当较研究组的值少于100个时,便进行精确检验。
•如何处理联系?如果两个值相同,则其秩相同。不同于大多数程序,Prism 6即使在有联系的情况下也能计算出精确P值。Prism 5和早期版本总是会计算一个近似P值,不同版本使用不同的近似值。详情。
1.DJ Sheskin, 《参数和非参数统计程序手册》,第4版,2007,ISBN = 1584888148。
2.Ying Kuen Cheung和Jerome H. Klotz,使用链表的Mann - Whitney Wilcoxon分布,《Statistical Sinica》7:805 - 813,1997。
3.JH Klotz,《统计学的计算方法》,2006,https://www.mimuw.edu.pl/~pokar/StatystykaI/Literatura/KlotzBook.pdf 4. L Hodges和EL Lehmann,“基于秩检验的位置估计”,《Annals of mathematical statistics》34: 598-611,1963。