偏斜度用于量化分布的对称程度。
•对称分布的偏斜度为零。
•长尾向右的非对称分布(较高的值)存在一个正偏态。
•长尾向左的非对称分布(较低的值)存在一个负偏态。
•偏度是无单位量纲。
•任何阈值或经验法则均为任意值,但以下情况除外:如果偏斜度大于1.0(或小于-1.0),则偏斜度相当大,且分布远离对称。
以多种方式定义偏斜度。以下步骤解释了Prism所使用的方法,称为G1(最常见的方法之一)。其与Excel中的偏态()函数相同。
1.我们想知道样本平均值周围的对称性。因此,第一步是从每个值中减去样本平均值。对于大于平均值的值,结果为正;对于小于平均值的值,结果为负;对于完全等于平均值的值,结果为零。
2.如需计算无单位的偏斜度度量,将步骤1中计算的每个差异除以值的标准偏差(请注意,计算偏斜度时,应使用N而不是N-1来计算标准偏差)。这些比率(每个值与平均值之差除以标准偏差)称为“z评分”。
3.针对每个值计算z3。请注意,立方值保留符号。正值的立方仍为正,且负值的立方仍为负。
4.计算z3值的平均值(计算所有z3值的总和,并将此总和除以样本中的数值)。如果分布对称,则正值和负值将相互抵消,平均值将接近零。如果分布不对称,分布向右倾斜时,平均值为正值;向左倾斜时,平均值为负值。此平均值称为Fisher-Pearson偏斜度系数,有时用“g1”表示。
5.偏差修正。步骤4中计算的平均值在小样本情况下有偏倚 - 其绝对值小于应有值。通过将z3的平均值乘以比率sqrt(N*(N-1))/(N-2)来校正偏倚。如果偏斜度为正值,则该修正会增大该值;如果偏斜度为负值,则该值会变成更小的负值。随着N变得越来越大,这种校正变得越来越接近值1,导致校正量减少。但对于小样本,该修正更为重要。最终校正值有时被称为“调整后的Fisher-Pearson偏斜度系数”,有时称为“G1”。这是Prism报告的偏斜值。
Prism报告的偏斜值的完整公式如下:
其中: