Please enable JavaScript to view this site.

SD的计算方法?

1.计算每个值与样本平均值之间差值的平方。

2.将这些值相加。

3.将总和除以N - 1。将其称为方差。

4.开平方根,获得标准偏差。

为什么选择n - 1?

为什么在上述第三步中除以n - 1(而非N)?在第1步中,计算每个值和这些值的平均值之差。您不知道群体的实际平均值;您所知道的是样本的平均值。除样本平均值恰好等于群体平均值的罕见情况外,数据将更接近样本平均值,而非实际群体平均值。因此,您在第2步中计算的值可能会比在第1步中使用实际群体平均值时的值小一点(且无法更大)。为弥补这一不足,我们除以n - 1而非n。

但是,为什么使用n - 1?如果您知道样本平均值,以及除了一个值之外的所有值,则您可以计算最后一个值必须是什么。统计学家称存在n - 1 自由度。

关于n与n - 1的更多信息。

但我看到方程的分母中是n,而非n - 1!

n - 1方程用于分析数据样本,并希望得到更一般结论的常见情况。以此方式计算的SD(分母中为N - 1)是您对总群体SD值的最佳猜测。

如果您只是想要量化一组特定数据的变化,而不打算外推以得到更广泛的结论,则在分母中使用N计算SD。由此产生的SD是这些特定值的SD,但很可能低估这些数值点提取群体的SD。

科学的目标始终是普遍化,因此在分析科学数据时,不应在方程的分母中使用n。我能想到的唯一一个在分母中使用n(而非n - 1)可能有意义的示例是量化检测评分之间的差异。但更好的方法是显示每个评分的散点图,或者频率分布直方图。

Prism始终使用n - 1计算SD。

计算SD需要多少个值?

SD量化离散度,因此显然需要不止一个值!两个值是否足够?许多人认为仅有两个值无法计算SD。但这是错误观点。您仅有重复(n = 2)数据时,计算SD的方程正常工作。

结果是否有效?从数学角度来看,我们没有理由不这么想,但我用模拟回答了该问题。我模拟了一万个n = 2的数据集,并且每个数据点均从高斯分布中随机选取。由于所有统计检验实际上均以方差(SD的平方)为基础,因此我比较了根据重复数据计算的方差和真正方差。模拟数据的10,000个方差的平均值与模拟数据来源真正方差的差异不超过1%。这意味着根据重复数据计算的SD是对数据离散度的有效评估。其同样可能过高或过低,但也可能距离真SD非常远

使用Excel计算SD

Excel可以使用STDEV()函数,根据一系列值计算SD。例如,如果您想知道单元格B1 - B10中值的SD,则在Excel中使用以下公式:

= STDEV(B1:B10)

该函数在分母中使用n - 1,计算SD。如果您想在分母中使用N以计算SD(见上文),则使用Excel的STDEVP()函数。

SE和SEM是否相同?

不相同!

© 1995-2019 GraphPad Software, LLC. All rights reserved.