Please enable JavaScript to view this site.

Navigation: 统计学原理 > 置信区间

关键概念:平均值置信区间

Scroll 前一页 Top 后一页 More

平均值的置信区间是多少?

平均值的置信区间(CI)告诉您确定平均值的精确程度。

例如,您对小样本(N = 5)的重量进行测量,然后计算平均值。该平均值不太可能等于群体平均值。可能差异的程度取决于样本量和样本变异性。

如果您的样本很小且可变,则样本平均值很可能与群体平均值相差甚远。如果您的样本很大且几乎不分散,则样本平均值可能与群体平均值非常接近。统计计算可以结合样本量与变异性(标准偏差)来生成群体平均值的置信区间。顾名思义,置信区间是一系列值。

在解释平均值的置信区间时做了哪些假设?

如需解读平均值的置信区间,必须假设所有值均从群体中独立随机抽样得到,且该群体值的分布服从高斯分布。如果您接受这些假设,则95%置信区间有95%的几率包含真实的群体平均值。换言之,如果您基于许多样本生成许多95%置信区间,您可以预期95%置信区间在95%的情况下包含真实的群体平均值,而在其他5%的情况下不包含群体平均值。

平均值的置信区间一定会包括真实平均值

下图中的靠上示图中显示了10组数据(N = 5),随机抽样取自高斯分布,平均值为100,标准偏差为35。下部视图中显示了每个样本平均值的95%置信区间。

由于这些数据均为模拟数据,我们知道真实群体平均值(100)的确切值,因此可以询问每个置信区间是否包括真实群体平均值。在上图中从右数第二个数据集中,95%置信区间不包括100的真实平均值(虚线)。

在分析数据时,您不知道群体平均值,因此不能知道某个特定置信区间是否包含真实的群体平均值。您所知道的是,置信区间有95%的几率包括群体平均值,有5%的几率不包括群体平均值。

平均值的置信区间的计算方式?

平均值的置信区间以样本平均值为中心,并在两个方向上对称延伸。该距离等于平均时间SE乘以t分布的常数。该常数的值仅取决于样本量(N),如下所示。

N

乘数

2

12.706

3

4.303

5

2.776

10

2.262

25

2.064

50

2.010

100

1.984

500

1.965

N

= TINV(0.05,N - 1)

上图中显示的样本有五个值。因此,其中一个样本的置信下限计算为平均值减去2.776乘以SEM,置信上限计算为平均值加上2.776乘以SEM。

上表的最后一行示出了用于在Excel中计算乘数的公式。较新的语法 = T.INV.2T(0.005,N - 1)。

一种常见的经验法则是,95%置信区间从加上或减去两个SEM的平均值计算得到。对于大样本,该法则非常准确。对于小样本,与按经验法则得出的置信区间相比,平均值的置信区间要宽得多。

© 1995-2019 GraphPad Software, LLC. All rights reserved.