Please enable JavaScript to view this site.

如何计算SD?

1.计算每个值与样本均值之差的平方。

2.将这些值相加。

3.用总和除以 N-1。这就是方差。

4.取平方根,得到标准偏差。

为什么是 n-1?

为什么要除以 n-1,而不是上面第三步中的 N?在步骤 1 中,您计算的是每个值与这些值的平均值之间的差。您不知道总体的真实平均值,您只知道样本的平均值。除了样本平均值恰好等于总体平均值的极少数情况外,数据与样本平均值的接近程度会高于与真正的总体平均值的接近程度。因此,您在步骤 2 中计算出的值可能会比您在步骤 1 中使用真实总体均值时计算出的值要小一些(不可能更大)。为了弥补这一点,我们要除以 n-1 而不是 n。

但为什么是 n-1?如果你知道样本平均数,以及除一个值之外的所有值,你就可以计算出最后一个值是多少。统计学家说有 n-1 个自由度。

关于 n 与 n-1 的更多信息。

但我见过分母是 n 而不是 n-1 的等式!

n-1 等式常用于分析样本数据并希望得出更一般结论的情况。用这种方法计算的 SD 值(分母为 N-1)是您对总体中 SD 值的最佳猜测。

如果您只是想量化特定数据集中的变化,而不打算推断出更广泛的结论,那么就用分母中的 N 来计算 SD。由此得出的标差是这些特定值的标差,但很可能低估了这些点所在人群的标差。

科学的目标始终是概括,因此在分析科学数据时不应使用分母为 n 的等式。我能想到的唯一一个在分母中使用 n(而不是 n-1)可能有意义的本示例是量化考试分数之间的差异。但更好的方法是显示每个分数的散点图或频率分布直方图。

Prism 总是使用 n-1 计算 SD。

计算标中值需要多少个值?

标差是对散点的量化,因此显然需要不止一个值!两个值就够了吗?很多人认为,只用两个值是不可能计算出 SD 的。但这是错误的。当只有重复数据(n=2)时,计算标差的方程也能正常工作。

结果有效吗?在数学上没有理由不这么认为,但我用模拟来回答了这个问题。我模拟了一万个数据集,n=2,每个数据点从高斯分布中随机选择。由于所有统计检验值实际上都是基于方差(SD 的平方),因此我将根据重复值计算出的方差与实际方差进行了比较。10,000 个模拟数据方差的平均值与模拟数据的真实方差相差在 1%以内。这说明,根据重复数据计算出的 SD 值可以有效评估数据的分散性。它同样可能过高或过低,但很可能与真实的 SD 相差甚远

用 Excel 计算标差

Excel 可以使用 STDEV() 函数从一系列数值中计算出 SD。例如,如果您想知道单元格 B1 到 B10 中数值的标准偏差,请使用 Excel 中的本示例公式:

=STDEV(B1:B10)

该函数使用分母中的 n-1 计算标准差。如果要使用分母中的 N 计算标差(见上文),请使用 Excel 的 STDEVP() 函数。

标差与 SEM 相同吗?

不一样!

© 1995-2019 GraphPad Software, LLC. All rights reserved.