Please enable JavaScript to view this site.

Navigation: 统计原理 > 置信区间

标准偏差的置信区间

Scroll Prev Top Next More

根据数据样本计算出的几乎所有值,包括标准偏差,都可以计算置信区间。

样本的标准差与总体的标准差不同

根据数值样本计算标准偏差很简单。但这个标准偏差有多准确呢?您可能碰巧获得了一些紧密相连的数据,从而使标准差偏低。或者,您可能随机获得了比总体更分散的数值,从而使标准差偏高。样本的标中值并不等于总体的标中值,而且可能相差甚远。

置信区间不仅适用于均值

置信区间通常是针对均值计算的。但置信区间的概念非常广泛,您可以用 95% 置信区间 (CI) 来表示任何计算值的精度。另一个本示例是回归拟合优度值的置信区间,例如斜率的置信区间。

标差的 95% 置信区间

样本 SD 只是您从数据样本中计算出的一个值。这种方法并不常见,但确实可以计算标样的置信区间。GraphPad Prism 不进行这种计算,但免费的 GraphPad QuickCalc可以。

解读标差的 CI 非常简单。如果假定数据是从高斯分布中随机独立抽样得到的,那么就可以有 95% 的把握认为 CI 包含了真实的群体 SD。

自变量的 CI 有多宽?答案当然依赖于样本量(n)。如下表所示,样本量小的情况下,区间相当宽。

n        95% CI of SD

2        0.45*SD 至 31.9*SD

3        0.52*SD 至 6.29*SD

5        0.60*SD 至 2.87*SD

10        0.69*SD 至 1.83*SD

25        0.78*SD 至 1.39*SD

50        0.84*SD 至 1.25*SD

100        0.88*SD 至 1.16*SD

500        0.94*SD 至 1.07*SD

1000        0.96*SD 至 1.05*SD

本示例

数据:23、31、25、30、27

平均值:        27.2

标准差:        3.35

根据五个数值计算出的样本标准偏差为 3.35。但从这些数值中抽取的总体的真实标准偏差可能大相径庭。从表中 n=5 行来看,95% 置信区间从 0.60 倍标准差延伸到 2.87 倍标准差。因此,95% 置信区间从 0.60*3.35 到 2.87*3.35,即从 2.01 到 9.62。当你只从五个值计算出一个标样时,标样的 95% 置信区间上限几乎是下限的五倍。

大多数人都对小样本能如此准确地定义标中值感到惊讶。随机抽样会对小数据集产生巨大影响,导致计算出的标准偏差与真实的总体标准偏差相差甚远。

请注意,置信区间并不是围绕计算出的标准差对称的。为什么?因为标准差总是一个正数,所以置信区间的下限不可能小于零。这意味着置信区间上限在样本标差之上的延伸通常比下限在样本标差之下的延伸更远。对于小样本,这种不对称现象非常明显。

用 Excel 计算标差的 Ci

n 为样本量;α 为 0.05(95% 置信度)、0.01(99% 置信度)等:

下限: =SD*SQRT((n-1)/CHIINV((alpha/2), n-1))

上限:=SD*SQRT((n-1)/CHIINV(1-(alpha/2), n-1))

这些公式来自《Sheskin》第 197-198 页(参考文献如下)。

参考文献

David J. Sheskin,Handbook of Parametric and Nonparametric Statistical Procedures, Fourth Edition, IBSN:1584888148.

 

© 1995-2019 GraphPad Software, LLC. All rights reserved.