平行分析法(有时也称为 "霍恩平行分析法",以其创始人约翰-L-霍恩的名字命名)是一种选择主成分的方法,可以考虑随机误差或噪声导致的数据差异。执行平行分析的过程可概括如下:
1.对数据集执行 PCA,确定每个 PC 的特征值
2.模拟与原始数据具有相同变异性(p)和观测值(n)的数据集
3.对模拟数据集执行 PCA 并确定模拟特征值
4.大量重复模拟/PCA 过程(默认为 1000 次),计算每次模拟的特征值
5.计算所有模拟中每个 PC 特征值的平均值和第 95 百分位数
6.将实际特征值与模拟特征值的 95th 百分位数进行比较
7.保留(选择)特征值大于模拟特征值第 95 百分位数的成分
这里的想法是,仅仅由于数据中的随机误差(随机抽样变异性),PCA 会生成一些特征值大于 1 的成分。一般来说,"噪声"数据生成的第一个特征值会随着变量数量的增加而增加,并随着观测值的增加而减少。如果只保留那些特征值大于模拟特征值第 95 百分位数的 PC,就能确保这些 PC 所解释的方差可能代表 "真实"方差,而非噪声方差。