为什么不总是使用非参数检验?您避免假设数据是从高斯分布中抽样 - 这是一个很难确定的假设。问题是非参数检验的检验力低于标准检验。检验力会降低多少?答案取决于样本量。
最好通过示例加以理解。以下是一些样本数据,比较两组的测量结果,每组有三名受试者。
对照 |
治疗 |
3.4 |
1234.5 |
3.7 |
1335.7 |
3.5 |
1334.8 |
您看到这些数值时,显然,处理会大大增加测量的数值。
让我们使用以下方法进行分析Mann - Whitney检验(比较两个不匹配组的非参数检验)。该检验只考虑秩。因此将上述数据输入Prism,但Mann Whitney计算只考虑秩:
对照 |
治疗 |
1 |
4 |
3 |
6 |
2 |
5 |
然后,Mann - Whitney检验会询问在对照组和治疗组之间这些秩是否被随机打乱,在一组中获得三个最低秩以及在另一组中获得三个最高秩的可能性有多大。非参数检验只考虑秩,忽略这样一个事实,即,经过处理的值不仅更高,而且高得多。答案是,双尾P值是0.10。使用传统的显著性水平5%,这些结果没有显著差异。该示例表明,在每组中N = 3的情况下,Mann - Whitney检验永远不能获得小于0.05的P值。换言之,每组有三名受试者,按照传统的“显著性”定义,Mann - Whitney检验的检验力为零。
相比之下,对于大样本,Mann - Whitney检验几乎和t检验一样有检验力。如需进一步了解大样本量非参数检验和传统检验的相对检验力,请查阅高级统计书籍中的术语“渐近相对效率”。