以图表形式可视化分析结果是理解分析生成的结果的最佳方式之一。对于Cox回归,研究不同个体组的“估计生存概率-时间”关系通常具有一定意义。这些研究组由回归模型中预测变量的值定义(例如,“女性”vs.“男性”,或者“吸烟者”vs.“非吸烟者”)。更重要的是,这些研究组不必由单一变量定义(例如,“45岁男性”、“45岁女性”、“50岁男性”和“50岁女性”)。
Cox比例风险回归的“图表”选项卡可用于为您指定的任何组自动构建估计生存曲线。所需的全部操作如下:
1.定义您需要创建的单独图表的数量
2.使用模型中的变量指定您想在每张图表上为哪些研究组创建估计生存曲线
下文给出了这些控件如何发挥作用的示例,但必须认识到,这些图表上显示的生存曲线均为基于模型的估计生存曲线,不同于使用所选数据执行Kaplan-Meier生存分析时生成的生存曲线。请记住,Cox回归依赖于比例风险的假设。作为该假设的结果,所有估计生存曲线的基本形状相同,所有个体曲线的指定值与基线生存曲线成比例。从数学上讲,使用该等式确定给定研究组在任何时间点的估计生存值:
最后,需注意的是,如果在生成估计生存曲线时未指定变量,则生成的生存曲线假设该变量的值为零(对于连续变量)或者为参考值(对于分类变量)。
如需了解如何使用该选项卡上的控件,请考虑一个示例分析,其中模型包括三个预测变量:
•治疗组 - 具有两个水平(“对照”和“治疗”)的分类变量
•性别 - 具有两个水平(“女性”和“男性”)的分类变量
•年龄 - 连续变量
我们假设我们关注一些不同的比较。具体而言,我们想考察估计生存率随时间出现的差异:
•对照群体的所有成员 vs. 治疗群体的所有成员
•30岁群体的所有成员 vs. 50岁群体的所有成员
•按性别划分的对照群体和治疗群体(即,对照群体中的女性、治疗群体中的女性、对照群体中的男性和治疗群体中的男性)
为使生存曲线的比较易于查看,为上文列出的各研究组比较创建单独的图表。因此,在“图表”选项卡上,将“需要生成的图表数量”设置为3:
添加图表后,可以选择在每张图表上添加基线生存曲线。与“基线函数”结果表上报告的曲线相同。在本示例中,不会启用该选项。选择上方框中的各图表后,可以在以下“定义曲线生成研究组”部分,指定我们想要添加在每张图表中的变量。在对话框的上方框中选择“估计生存率#1”后,使用对话框下方框中的下拉菜单选择“治疗组”变量。默认情况下,选择分类变量时,该变量的所有水平均包括在内。如需确认我们同时选择“对照”和“治疗”水平,可以单击“选择”按钮,查看指定变量的所有可用水平列表。
对于第二张图表,在上方框中选择“估计生存率#2”,然后使用下拉菜单在下方框中选择变量“年龄”。由于年龄属于连续变量,因此需要输入一个值,让Prism用该变量来生成估计生存曲线。对于这张图表,首先输入值30。然后,可以使用“添加值”按钮创建新的输入方框,我们可以在此方框输入第二个值50。
对于第三张图表,在上方框中选择“估计生存率#3”,然后使用下拉菜单选择变量“治疗”。然后,可以添加第二个变量“性别”,并确保对这两个变量选择两个水平。
请注意,即使我们只选择两个变量,Prism也会自动在这张图表上创建我们想要的所有估计生存曲线。为单张图表选择多个变量时,Prism会自动确定每个指定变量的值(或水平)的所有可能组合,并为每个研究组合生成单独的估计生存曲线。
因此,单击“确定”按钮时,我们将在导航器中看到三张新图表,我们可以研究这三张新图表:
对照 vs. 治疗组的估计生存率
30岁 vs. 50岁组的估计生存率
对照女性、对照男性、治疗女性和治疗男性的估计生存率
基于这些图表,我们可以看出,“治疗组”和“性别”变量似乎均对估计生存率有相当大的影响,而“年龄”的影响相当小。例如,图表1(Treatment_Group)中的生存曲线之间的差异比图表2(年龄)中的生存曲线更加分离。另外,在第三张图表中,我们看到“对照:女性”与“治疗:女性”的曲线之间、“对照:男性”与“治疗:男性”曲线之间、“对照:女性”与“对照:男性”曲线之间,以及“治疗:女性”与“治疗:男性”曲线之间存在显著差异(注意,在该图表上,“对照:女性”和“治疗:男性”的曲线几乎重叠,因此初看起来,这张图表上可能只有三条曲线)。