Please enable JavaScript to view this site.

当许多独立随机因素以相加方式产生变异时,会出现高斯分布。这最好通过一个示例来理解。

想象一个非常简单的“实验”。您使用移液器,取一些水并称重。您的移液器应该可以吸取10微升水,但实际上可以随机吸取9.5-10.5微升水。如果您吸取一千次,并创建一个结果的频率分布直方图,它将如下图所示。

平均重量10毫克,相当于10微升水的重量(至少在地球上如此)。分布平坦,无高斯分布迹象。

现在,我们让实验变得更复杂。我们使用移液管吸取两次,然后称量结果。平均而言,现在的重量是20毫克。但您会期望这些误差在某些时候抵消。结果如下图所示。

每个移液步骤均有一个平坦的随机误差。将它们相加后,分布变得不平坦。例如,仅当两个移液步骤基本上朝同一方向出错时,才能获得接近21毫克的重量,这种情况很少见。

现在让我们将该实验扩展到十个移液步骤,观察下总数的分布情况。

该分布看起来很像理想的高斯分布。重复实验15,000次,而非1,000次,会更接近高斯分布。

该模拟演示了一个可以通过数学方法证明的原理。如果您的实验散点有许多来源是相加的和几乎相等的权重,且样本量很大,则散点将近似为高斯分布。

高斯分布是一种理想的数学分布。很少有生物分布(如有)真正服从高斯分布。高斯分布从负无穷大扩展到正无穷大。如果以上示例中的权重真正服从高斯分布,则权重可能为负值(但可能性极低)。由于权重可能是负值,分布不能完全服从高斯分布,但它非常接近高斯分布,因此可使用假设高斯分布的统计方法(例如,t检验和回归)。

© 1995-2019 GraphPad Software, LLC. All rights reserved.