主成分回归(PCR)是多元线性回归和主成分分析的结合。
主成分分析的主要目标之一在于减少未来分析的预测因子的数量,这也减少了模型的自由度。例如,您可以从50列X变量开始,并且凭借PCA,也许可以用几个(3、5、10、…)主成分来解释大量(70-95%)处于X变量范围内的偏差。然后,为对结果变量Y建模,您可以只使用选定的主成分作为预测因子,而非最初的50列数据。
选择通过PCA对话框运行PCR时,您必须选择哪个变量是结果(因)变量。它并非输入变量之一。 然后,Prism执行以下步骤:
1.对所有选定变量进行PCA
2.使用选定方法提取适当数量的主成分
3.执行多元线性回归和选择的主成分评分作为预测因子以及截距
4.将使用PC评分计算的参数系数估计值转换回原始变量的尺度(使用为每个PC定义的变量的线性组合)
如果您希望回归模型具有更大的灵活性(例如,拟合逻辑或泊松模型),则可以运行多元线性回归,具体方法是将PC评分表的结果与关注的因(结果)变量一起复制/粘贴到新的多变量数据表。请注意,在此情况下,任何结果斜率系数均与主成分有关,而非原始变量。
否,与变量选择属于不同的概念。变量选择是确定模型中包含哪些变量的过程。通过变量选择,您可以选择要纳入回归模型中以及从中排除的变量。如果您想使用模型来预测结果变量的未来值,您只需要测量保留在模型中的变量。
相比之下,凭借PCR,使用所有原始变量来计算每个主成分(进行变量加权)。这意味着,为使用PCR生成的模型来预测结果变量的未来值,您仍然需要获得所有原始变量的测量值。
因此,您的模型中可能只有一个预测因子(一个PC),但预测因子使用您的所有原始变量计算得出。这就是我们提到PCA会降低您的数据的维度的原因。如需了解这些细节,需熟悉线性代数和奇异值分解。
否。