PCA 生成的最终图形是方差比例图。正如在讨论PC 选择方法的章节中所述,任何给定主成分所解释的方差比例可按以下方式计算:
解释的方差百分比 = [(PC 特征值)/(所有特征值之和)]*100
因此,方差比例只是特征值的归一化版本。因此,方差比例图上的曲线形状将与特征值(Scree)图相同。该曲线显示了每个 PC 所解释的总方差的特异性比例,而该图的条形图则呈现了该 PC 及其之前所有 PC 所解释的累积方差。
在本示例中,我们使用平行分析作为 PC 选择方法。但是,如果我们选择根据累积方差的阈值来选择 PC,那么在该图中就会以指定阈值处的水平线的形式显示。从下图中我们可以看到,仅前两个 PC 就可以解释 90%以上的数据方差。3 个 PC 可以解释 95% 以上的数据差异,4 个 PC 可以解释 99% 以上的数据差异。所有五个 PC 均可解释数据总方差的 100%(记住:创建 PC 并不会改变数据的总方差。选择 PC 子集会减少该子集可解释的方差量)。
