除非您计划使用PC评分进行进一步分析,否则图表通常是PCA最重要的结果。PCA生成的图表包括:
•评分图
•载荷图
•双标图
•碎石图
PC评分用于沿所选主成分轴绘制数据行。这些图提供了数据的低维表示。其主要用于根据某些点在所选择的两个成分中相对于其他点出现的位置来聚类或导出一些其他含义。在Prism中,您可将光标悬停在感兴趣点上,以获得指向数据表中相关行或列的链接。
Prism中绘制该图的基础图表是气泡图,它非常灵活。
通过使用工具栏()中的按钮或者双击绘图区域中的任何位置(轴上位置除外),可以访问“图表格式”对话框。这允许您自定义许多图表功能,其中包括:
•使用对话框的“轴变量”部分,更改在每根轴上绘制的PC
•符号颜色、尺寸和边框
•标签
•图例
•等等
载荷图简单地绘制了指定主要成分载荷矩阵的数值。
与PC评分图如何描绘数据行(沿PC旋转)有点类似,载荷图提供了关于列的信息。载荷是数据列与PC之间的相关性(或协方差)。该图对于识别变量聚类非常有用。
在下图中(其中使用了Prism中所包含的乳腺癌样本数据),我们看到所有列均出现在左侧。这意味着第一主成分对所有载荷而言均为负值。负值并无解释,但由于所有变量均位于同一侧,这意味着每个变量均与第一个PC在相同方向上相关,即随着变量的上升,PC1评分下降。
类似地,在图上看起来靠得很近的变量(例如,对称性和平滑度,或半径和周长)表示沿前两个PC的聚类。如果我们确定前两个PC解释了原始变量的大部分方差,则我们可以得出结论:聚类在该图上的变量记录了大量冗余信息。在此情况下,我们可能只能为未来的研究测量任一这些变量。
双标图通过一个乘数来缩放载荷,以便可以在相同图表上绘制PC评分和载荷。它们是PCA的常用图表,因此我们包含了功能,但在大多数情况下,我们更喜欢分别绘制载荷和PC评分。
在传统上,碎石图用于确定PCA期间要包含的主成分数量。它们以碎石自然形成的斜坡形状命名,碎石是堆积在悬崖底部的落石。
如需使用碎石图(不推荐)选择PC的数量,可直观地确定特征值结束陡降并开始变平的点。在曲线开始变平之前,保留曲线上的所有PC,但不包括曲线从“陡峭”变为“水平”的PC。在此情况下,只保留前两个主成分。
如图所示,还在碎石图上给出每个PC的特征值。根据在“PCA参数”对话框的“选项”选项卡上选择的PC选择方法,还可以使用附加信息修改碎石图。
如果选择平行分析作为选择保留哪些PC的方法,则Prism将在碎石图中包含该分析的模拟特征值。
如果选择使用“Kaiser准则”(不推荐)或指定自己的特征值阈值(不推荐),则Prism将在碎石图上包含一条指示该阈值的水平线。
方差比例图类似于碎石图,但不是绘制特征值,而是绘制每个PC解释的方差比例。该方差比例等于该PC的特征值除以所有PC的特征值之和(报告为百分比)。此外,其还包括一个累计总数的条形图。例如,下图表明前两个PC仅解释了输入变量中约80%的总方差。
方差比例图还可能包括有关分析的附加信息,具体取决于在“PCA参数”对话框的“选项”选项卡上选择的PC选择方法。
如果选择通过设置总解释方差的阈值(通常为总解释方差的75%或80%)来选择PC,则Prism将在方差比例图上包含一条指示该阈值的水平线。下文给出了一个将阈值设置为75%的示例。