95%置信区间是一个数值范围,您可以95%确定包含群体的真实平均值。这与包含95%数值的范围不同。以下图表突出了这一区别。
该图表显示了三个样本(大小不同),都是从同一群体中抽样。
左侧是小样本,95%置信区间与数据范围相似。但是右侧的大样本中只有一小部分值在置信区间范围内。这很有道理。95%置信区间定义了一个值范围,您可以95%确定包含群体平均值。大样本的平均值比小样本的平均值具有更高的精度,因此从大样本计算出的置信区间非常窄。
请勿将置信区间误解为包含95%值的范围。 |
准确来说,计算置信区间有95%的几率具有真实的群体平均值。群体平均值有95%的几率在区间范围内的这一说法并不太准确。
有什么不同?
群体平均值只有一个值。您不知道该值是什么(除非在做模拟),但它只有一个值。即使重复进行实验,该值也不会改变(您仍然不知道该值是什么)。因此,严格来说,询问群体平均值在某个范围内的概率并不总是正确的。
相比之下,计算的置信区间取决于偶然收集的数据。如果重复进行实验,则得出的置信区间几乎肯定不同。因此,可以询问区间包含群体平均值的概率。
询问群体平均值在区间内的概率并不太正确。概率要么在区间范围内,要么不在。并无关于此方面的几率。您可以说,如果多次进行此类实验,置信区间不会都一样,您会期望95%的置信区间包含群体平均值,5%的置信区间不包含群体平均值,您永远无法得知某个特定实验的区间是否包含群体平均值。
尽管置信区间通常用95%的置信度来表示,但这只是一个惯例。可针对任何想要的置信度计算置信区间。
人们经常惊讶于99%的置信区间比95%的区间更宽,而90%的区间则更窄。但这完全是合理的。如果区间包含真实参数的置信度越高,则区间将会更宽。如果您想100.000%确定一个区间包含真正群体,则该区间必须包含所有可能的值,因此需要非常宽。如果您只有50%的把握确定一个区间包含真正的值,则该区间可能会更窄。