Please enable JavaScript to view this site.

峰度

峰度度量数据分布的尾部是否符合高斯分布。

高斯分布的峰度为 0。

如果尾部数值少于高斯分布,则峰度为负。

尾部数值比高斯分布多(或尾部数值比高斯分布大)的分布为正峰度。

峰度没有单位。

虽然峰度通常被认为是用来测量峰值的形状,但实际上峰度并不能告诉你峰值的形状。它唯一明确的解读就是尾部的数值。从本质上讲,它衡量的是异常值的存在 (1)。

由于高斯分布的期望值峰度为 0.0,因此 Prism 报告的值有时被称为过度 峰度。

峰度的另一个定义是将 Prism 报告的值加上 3。根据这一定义,高斯分布的峰度应为 3.0。

如何计算峰度

1.从每个值中减去样本平均值,大于平均值的结果为正,小于平均值的结果为负,与平均值完全相等的结果为零。

2.用步骤 1 计算出的每个差值除以数值的标准偏差。这些比率(每个值与平均值之间的差除以标准偏差)称为 z 比率。根据定义,这些值的平均值为 0,标准偏差为 1。

3.计算每个值的z4。如果效果不好,那就是 z 的四次方检验力。 所有这些值都是正数。

4.用这些值的总和除以 n-1,得出平均值,其中 n 是样本中的值的个数。为什么是 n-1 而不是 n?与计算标准偏差时使用 n-1 的原因相同

5.在高斯分布中,平均值应等于 3。因此,从平均数中减去 3。这个值(减去 3 后)有时被称为过度峰度。

为什么分布中间的值对峰度影响不大?

因为 z 值是取四次幂的,所以只有大的 z 值(因此只有远离均值的值)才会对峰度有很大的影响。如果一个值的 z 值为 1,而另一个值的 z 值为 2,那么第二个值对峰度的影响将是前者的 16 倍(因为 2 的四次方是 16)。如果一个值的 z 值为 1,而另一个值的 z 值为 3(因此与均值相差 3 倍),那么第二个值对峰度的影响将是前者的 81 倍(因为 3 的四次方是 81)。因此,接近均值的值(尤其是那些离均值小于 1 SD 的值)对峰度的影响很小,而远离均值的值对峰度的影响则很大。因此,峰度并不能量化峰度,也不能真正量化大部分分布的形状。相反,峰度可以量化远离均值的点的整体影响。

参考文献

1.Westfall, P. H. (2014).Kurtosis as Peakedness, 1905-2014.R.I.P. The American Statistician, 68(3), 191-195.

© 1995-2019 GraphPad Software, LLC. All rights reserved.