GraphPad Prism 10 Statistics Guide - 为什么要提前选择样本量？

Zoom Window Out
Larger Text | Smaller Text
Hide Page Header
Show Expanding Text
Printable Version
Save Permalink URL

为什么要提前选择样本量？

随心所欲选择样本量的魅力

对很多人来说，在研究开始前计算样本量似乎是个麻烦事。为什么不在收集数据的同时进行分析呢？如果结果在统计学上不显著，那就再收集一些数据，然后重新分析。如果结果在统计学上显著，那就停止研究，不要浪费时间或金钱去收集更多数据。

这种方法的问题在于，如果你不喜欢结果，你就会继续研究，但如果你喜欢结果，你就会停止研究。这样做的后果是，如果零假设为真，得到 "显著"结果的几率远远高于 5%。

模拟说明不预先选择样本量的危险性

下图通过模拟说明了这一点。我们通过从高斯分布（均值=40，SD=15，但这些值是任意的）中抽取数值来模拟数据。两组都使用完全相同的分布进行模拟。我们在每组中挑选 N=5，计算非配对 t 检验并记录 P 值。然后，我们在每组中增加一名受试者（因此 N=6），并重新计算 t 检验值和 P 值。如此反复，直到每组的受试者人数达到 100 人。然后，我们将整个模拟重复三次。这些模拟是在两组组平均值完全相同的情况下进行的。因此，我们得到的任何 "统计学显著"结果都一定是巧合--第一类错误。

该图将 Y 轴上的 P 值与 X 轴上的样本量（每组）对比。图表底部的绿色阴影区域表示 P 值小于 0.05，因此被视为 "统计学显著"。

绿色曲线显示的是第一组模拟实验的结果。当 N=7 时，它达到的 P 值小于 0.05，但其他样本量的 P 值都高于 0.05。红色曲线显示的是第二组模拟实验的结果。当 N=61 时，P 值小于 0.05；当 N=88 或 89 时，P 值也小于 0.05。蓝色曲线是第三次实验。当 N=92 到 N=100 时，P 值小于 0.05。

如果按照顺序法，我们会宣布三个实验的结果都具有 "统计学显著性"。在绿色实验中，我们会在 N=7 时停止实验，因此不会看到曲线的虚线部分。红色实验在 N=61 时停止，蓝色实验在 N=92 时停止。在这三种情况下，我们都会宣布实验结果 "统计学显著"。

由于这些模拟是在两个群体的真实平均值相同的情况下创建的，因此任何 "统计学显著性 "的声明都是 I 类错误。如果零假设成立（两个种群均值相同），我们期望在 5%的实验中看到这种 I 类错误（如果我们使用传统的 alpha=0.05 定义，那么 P 值小于 0.05 就会被宣布为显著）。但采用这种顺序方法，我们的三个实验都出现了 I 类错误。如果你把实验时间延长得足够长（无限 N），所有实验最终都会达到统计学显著性。当然，在某些情况下，即使没有 "统计学显著性"，你最终也会放弃。但是，即使零假设为真，这种有序的方法也会在远超 5%的实验中产生 "显著 "结果，因此这种方法是无效的。

小结

选择样本量并坚持下去非常重要。如果你喜欢实验结果时就停下来，不喜欢时就继续下去，那你就自欺欺人了。如果在结果不具有统计学显著性时继续实验，而在结果具有统计学显著性时却停止实验，那么误认为结果具有统计学显著性的几率远远大于 5%。

有一些特殊的统计技术可以对数据进行顺序分析，如果结果不明确就增加受试者，如果结果明确就停止。在高级统计学书籍中查找 "顺序医学试验"，了解更多信息。

Please enable JavaScript to view this site.

随心所欲选择样本量的魅力

模拟说明不预先选择样本量的危险性

小结