高斯分布在统计学中起着核心作用,因为它包含一种称为“中心极限定理”的数学关系。如需理解该定理,应遵循该理想试验:
1.创建一个已知分布群体(不必为高斯分布)。
2.从群体中随机挑选许多相同大小的样本。将这些样本平均值制成表格。
3.绘制平均值频率分布的直方图。
中心极限定理表明,如果样本足够大,即使群体不服从高斯分布,平均值的分布也会服从高斯分布。由于大多数统计检验(如t检验和方差分析)只关注平均值之间的差异,中心极限定理让这些检验即使在群体不服从高斯分布的情况下也能很好地工作。为确保有效,样本量必须足够大。到底多大?这取决于群体分布与高斯分布的不同程度。假设群体的分布并非十分不寻常,样本量为10通常就足以使中心极限定理成立。
如需了解理想高斯分布为何如此有用,请阅读任何统计文本中的中心极限定理。