标准偏差(SD)量化了变异性或分散性,并以与数据相同的单位表示。
如果数据从高斯分布群体中抽样得到,则您预计68%的值处于平均值的SD内,95%的值处于平均值的两个SD内。该图示出了从高斯分布群体抽样得到的250个值。阴影面积覆盖平均值的一个正负SD,包括数值的约三分之二。虚线基于平均值加减两个标准偏差绘出,约95%的值处于这些范围内。
以下图表示出了标准偏差与高斯分布之间的关系。概率分布下面积代表整个群体,因此部分概率分布下面积代表群体的一部分。在左侧图表中,绿色(阴影)部分低于平均值的一个SD延伸到高于平均值的一个SD。绿色面积约占总面积的68%,因此略多于三分之二的值处于平均值加减一个SD的区间内。右侧图表示出了约95%的值位于平均值的两个标准偏差内。
下图示出了三组数据,所有三组数据均具有完全相同的平均值和SD。左侧样本近似为高斯分布。另外两个样本远离高斯分布,但具有完全相同的平均值(100)和标准偏差(35)。
该图表指出,如果您假设数据服从高斯分布,但该假设不正确,则采用常规方式解释平均值和SD时可能会产生误导。
SD仍然可以在不假设服从高斯分布的情况下进行解释。切比雪夫定理提到,即使数据并非从高斯分布群体中抽样得到:
•至少75%的值必须位于平均值的两个标准偏差内
•至少89%的值必须位于三个标准偏差内
许多人报告的平均值和标准偏差如下:“115±10 mmHg”,“方法”部分具有一条脚注或声明,其将第二个值定义为标准偏差。
报告(1,2)称,由于标准偏差是一个量化分散的单一值,因此它不应跟在加号/减号之后,而应采用下述方式:”115mHg (SD 10)”。
1.Curran - Everett D和Benos D,美国生理学会出版的期刊统计报告指南。《AJP - 胃肠和肝脏生理学》。2004年8月1日;287(2):G307。
2.Ludbrook J,临床和实验药理学和生理学的统计学介绍。《临床实验药物生理学》。2008年10月1日;35(10):1271 - 4;authorreply1274。