您在出版物或演示文稿中查看数据时,您可能会试图通过查看误差条是否重叠来得出关于组平均值间差异的统计学显著性的结论。结果证明是,检查误差条是否重叠会告诉您比您可能猜测的要少。然而,有一条法则值得记住:
两组的SEM条重叠,且样本量相等时,您可确定两个平均值之间的差异没有统计学显著性(P>0.05)。
事实并非如此。观察到一个标准误差(SE)条的顶部位于另一个SE误差条的底部以下,并无法使您得出该差异具有统计学显著性的结论。事实上,两个SE误差条未重叠,则您将无法做出任何关于统计学显著性的结论。这两个平均值之间的差异可能具有统计学显著性,或该差异可能不具有统计学显著性。误差条并不重叠的事实并不能帮助您区分这两种可能性。
如果误差条代表标准偏差而非标准误差,那么就不可能得出结论。这两个平均值之间的差异可能具有统计学显著性,或该差异可能不具有统计学显著性。SD误差条重叠或不重叠的事实并不能帮助您区分这两种可能性。
显示95%置信区间(CI)的误差条比SE误差条更宽。观察到两个95% CI误差条重叠没有帮助,因为这两个平均值之间的差异可能具有统计学显著性,也可能不具统计学显著性。
有用的经验法则:如果两个95% CI误差条不重叠,且样本量几乎相等,则P值远小于0.05时,差异具有统计学显著性(Payton,2003)。
在方差分析之后的多重比较中,显著性水平通常适用于整个比较族。在许多比较的情况下,其需要更大的差异才能被宣布为“具有统计学显著性”。但误差条通常是为每个治疗组单独绘制(和计算)的,而不考虑多重比较。因此,上述关于重叠CI误差条的法则并不适用于多重比较的情况。
误差条的类型 |
结论是如果它们重叠 |
结论是如果它们不重叠 |
SD |
无结论 |
无结论 |
SEM |
P>0.05 |
无结论 |
95% CI |
无结论 |
P<0.05 |
对此有两种思考方式。如果您真正关心的是统计学显著性,则请勿注意误差条是否重叠。但如果您真正关心的是两个分布重叠的程度,则请勿太在意P值和关于统计学显著性的结论。
上述经验法则仅当样本量相等或接近相等时才是正确的。
此处是一个关于置信区间的经验法则不正确的示例(且样本量非常不同)。
样本1:平均值 = 0,SD = 1,n = 10
样本2:平均值 = 3,SD = 10,n = 100
置信区间并未重叠,但P值较高(0.35)。
此处是一个关于SE的经验法则不正确的示例(且样本量非常不同)。
样本1:平均值 = 0,SD = 1,n = 100,SEM = 0.1
样本2:平均值 = 3,SD = 10,n = 10,SEM = 3.33
SEM误差条重叠,但P值很小(0.005)。