计算样本量需要您决定您要寻找的差异有多大 - 差异有多大(关联、相关性..)在科学上会很有趣。如果您的目的是发现微小的差异,则需要较大样本量。如果您只是在寻找更大差异,则可使用较小样本量。
在一本非常有影响力的书中(1),Jacob Cohen提出一些建议,您不知道自己在寻找什么样的效应量时,该怎么做。其将这些建议局限于行为科学(他的专业领域),并警示称,所有一般性建议在某些情况下比在其他情况下更有帮助。以下是其非配对t检验指南:
•均值之间的“小”差值等于标准差的五分之一。
•“中”效应量等于标准差的一半。
•“大”效应量等于标准差的0.8倍。
因此,如果您在决定您要寻找的效应量时遇到困难(且因此无法确定样本量),Cohen会建议您选择寻找“小”、“中”还是“大”效应,然后使用标准定义。
Russell Lenth(2)认为,应避免这些“固定”效应量,且推理合理。您必须基于对您正在使用试验系统和您正在提出的科学问题的理解,决定您想要检测的差异有多大。Cohen的建议似乎是一种避免思考试验要点的方法。仅考虑您所期望的分散(期望标准差)的差异,甚至不考虑均值是多少,这没有意义。
如果您选择α(0.05)、检验力(80%)和效应量的标准定义(见上文),则无需进行任何计算。如果您接受所有研究的标准定义(使用非配对的检验,比较两组),则所有研究每组需要有26份样本以检测大效应,每组需要有65份样本以检测中等效应,每组需要有400份样本以检测小效应。
选择标准效应量实际上与选择标准样本量相同。
1.J. Cohen,《行为科学的统计检验力分析》,1988,ISBN=978-0805802832
2.R. V. Lenth、R. V.(2001),“有效样本量确定的一些实用指南”,《美国统计学家》,55,187-193。初稿发布为pdf文件。