Please enable JavaScript to view this site.

峰度

峰度 量化数据分布的尾部是否匹配高斯分布。

高斯分布的峰度为0。

尾部的值比高斯分布少的分布具有负峰度。

尾部的值比高斯分布多的分布(或值较远离尾部)具有正峰度。

峰度无单位。

虽然人们通常认为峰度是测量峰的形状,但实际上峰度并不会告知您峰的形状。唯一明确的解读是尾部的值。本质上,它测量了异常值的存在(1)。

Prism报告的值有时称为 超出峰度。因为高斯分布的预期峰度为0.0。

峰度的另一个定义是通过将Prism报告的值加3计算得出的值。根据这一定义,高斯分布的峰度预计为3.0。

如何计算峰度

1.从每个值中减去样本平均值。对于大于平均值的值,结果为正;对于小于平均值的值,结果为负;对于完全等于平均值的值,结果为零。

2.将步骤1中计算的每个差值除以值的标准偏差。这些比率(每个值与平均值之差除以标准偏差)称为z比率。根据定义,这些值的平均值为零,标准偏差为1。

3.对于每个值,计算z4。如果呈现的结果欠佳,则为z的四次方。所有这些值均为正数。

4.通过将这些值的总和除以n - 1来计算值列表的平均值,其中n是样本中的值的数量。为什么是n - 1而非n?出于同样的原因,计算标准偏差时也是使用n - 1。

5.对于高斯分布,您期望平均值等于3。因此,从平均值中减去3。高斯数据的峰度预计为0。该值(减去3后)有时称为 超出峰度

为什么中间的分布值对峰度影响不大?

因为z值取四次方,只有较大的z值(即只有远离平均值的值)才会对峰度产生较大的影响。如果一个值的z值为1,而另一个值的z值为2,则第二个值将对峰度产生16倍的影响(因为2的四次方为16)。如果一个值的z值为1,而另一个值的z值为3(因此进一步等于平均值的三倍),则第二个值将对峰度产生81倍的影响(因为3的四次方为81)。因此,接近平均值的值(尤其是比平均值低一个SD的值)对峰度影响很小,而远离平均值的值对峰度影响很大。因此,峰度不能量化峰值,也不能真正量化大部分分布的形状。相反,峰度可以量化远离平均值的点的整体影响。

参考文献

1.Westfall,P. H.(2014)。将峰度作为峰值,1905 - 2014。R.I.P.《美国统计学家》,68(3),191 - 195。

© 1995-2019 GraphPad Software, LLC. All rights reserved.