有些程序会报告检验力值,作为 t 检验和其他统计检验结果的一部分。Prism 不会这样做,本页将解释原因。
永远不可能回答 "这个实验设计的检验力是多少"这个问题。这个问题毫无意义。相反,您必须问 "这个实验设计检测特定效应量的检验力是多少?"效应量可能是两个均值之间的差值、相对风险或其他治疗效果的测量值。
您应该计算哪种效应量的检验力?应该寻求多大的差异?这些都不是统计问题,而是科学问题。只有当你科学地思考数据时,做检验力分析才有意义。计算一项研究设计的检验力是有意义的,它可以检验出你所关心的最小效应。或者,计算一项研究的检验力,以发现由先前研究确定的效应量,也是有意义的。
在计算统计比较结果时,一些程序会报告在该特定实验中实际观察到的效应量(或差异、相对风险等)的检验力,从而增强其结果。这种结果有时称为检验力,这种程序有时称为事后检验力分析或回顾性检验力分析。
许多(也许是大多数)统计学家(我也同意)认为这些计算是无用的、误导性的。如果您的研究得出的结论是差异在统计学上不显著,那么--顾名思义--其检验实际观察到的效应的检验力是非常低的。通过这样的计算,你什么也学不到。计算研究的检验力对于检测在科学或临床上值得检测的差异可能是有用的。计算研究的检验力来检测实际观察到的差异(或效应)是不值得的。
Hoenig 和 Helsey(2001 年)指出,观察到的检验力可以通过观察到的 P 值以及您选择的α 值(通常为 0.05)来计算。当 P 值为 0.05 时(假设您将统计学显著性定义为 P<0.05,因此将 α 设为 0.05),那么检验力必须为 50%。如果 P 值小于 0.05,则观察到的检验力大于 50%。如果 P 值大于 0.05,则观察到的检验力小于 50%。检验力不传递新信息。下图(摘自 Helsey, 2001)显示了在α设为 0.05 时,非配对 t 检验的 P 值与观察到的检验力之间的关系。
SN Goodman 和 JA Berlin,The Use of Predicted Confidence Intervals When Planning Experiments and the Misuse of Power When Interpretting the Results, Annals Internal Medicine 121: 200-206, 1994.
Hoenig JM、Heisey DM,1710,《检验 力的滥用》,《美国统计学家》。2001年2月1日,55(1):19-24. doi:10.1198/000313001300339897.
Lenth, R. V. (2001),《 有效确定样本量的一些实用指南》,《美国统计学家》,55, 187-193
M Levine and MHH Ensom,Post Hoc Power Analysis:An Idea Whose Time Has Passed, Pharmacotherapy 21:405-409, 2001.
Thomas, L,《检验 力分析》,《保护生物学》第 11 卷(1997 年),第 1 期,第 276-280 页