统计学的基本概念很简单:
您想用有限的数据作出一般性的结论。
为此,统计学家开发了基于简单模型的方法:假设存在一个无限大的群体值,且您的数据(您的“样本”)从该群体中随机选择。分析您的样本,并使用概率规则来推断群体数量。
该模型是对某些情况的准确描述。例如,质量控制样本实际上是从庞大群体中随机选取。临床试验不包括随机选择的患者样本,但通常可合理根据您研究的样本对相似患者的更大群体进行推断。
在一个典型的试验中,您并不是从一个群体中抽样,但您确实想从您的数据中推断出一个更具有一般性的结论。如果您将样本定义为您收集的数据,将群体定义为如果您无数次重复该试验就会收集的数据,则样本和群体的概念仍可使用。
问题是,统计推断只能适用于从中可获得样本的群体,但通常您想要作出的结论甚至涉及到对超出该庞大群体的更大群体的推断。例如,您在实验室做了三次试验。所有试验均使用相同的细胞制备、相同的缓冲液和相同的设备。通过统计推断,您可得出结论,如果您用相同的细胞制备、相同的缓冲液和相同的设备,多次重复试验,可能会发生什么。
您可能想进一步推断,如果其他人用不同的细胞来源、新制成的缓冲液和不同的仪器重复试验会发生什么。遗憾的是,统计计算对这种进一步推断没有帮助。您必须运用科学判断和常识作出超越统计学限制的推论。