当你不愿意假设数据来自高斯分布时,就会用到非参数检验。常用的非参数检验值是从低到高排序,然后观察组间秩和的分布情况。这就是 Wilcoxon 秩和(检验一个组与假设中位数的比较)、Mann-Whitney(比较两个非配对组)、Wilcoxon 配对(比较两个匹配组)、Kruskal-Wallis(三个或更多非配对组)和 Friedman(三个或更多匹配组)的基础。
计算非参数检验值时,不必对值的分布做任何假设。这就是它被称为非参数检验的原因。但是,如果要计算非参数检验分析研究的必要样本量,就必须对值的分布做出假设。仅仅说分布不是高斯分布是不够的,还必须说它是什么样的分布。如果你愿意做出这样的假设(比如,假设数值呈指数分布或均匀分布),你就应该查阅高级教科书或使用更高级的程序来计算样本量。
大多数人在不知道基本分布形状时会选择非参数检验。如果不对分布作出明确的假设,就不可能进行详细的样本量计算。哎呀
但并非一无所获!依赖于分布的性质,非参数检验可能需要更多或更少的受试者。但如果以下两个假设成立,它们所需的额外受试者绝不会超过 15%:
•受试者人数较多(具体多少取决于分布和检验的性质,但至少需要几十个受试者)
•数值分布并不异常(没有无限大的尾巴,在这种情况下,其标准偏差将无限大)。
因此,一般的经验法则是这样的 (1):
如果您打算使用非参数检验,请计算参数检验所需的样本量并加上 15%。
Erich L. Lehmann,《非参数:基于等级的统计方法》,修订版,1998 年,ISBN=978-0139977350,第 76-81 页。