“Cox比例风险回归参数”对话框的“残差”选项卡用于生成许多不同的图表,这些图表阐明了模型拟合的质量,并评估了作为分析一部分做出的一些假设的有效性。
务必注意的是,在Cox回归中称为残差的值并非典型意义上的残差。在多元线性回归(以及简单线性回归和非线性回归)中,残差定义为相同观察的结局变量观察结果和结局变量预测值之间的差值。例如,如果使用有关个体年龄、性别和体重的变量生成多元线性回归模型来估计个体身高,则可以比较用于构建模型的每个测量身高,以及模型使用相同的年龄、性别和体重输入值预测的相应身高。这两个值(观察结果和预测值)之间的差值是残差。
遗憾的是,对于这种“实际值减去观察结果”的概念,并未获得适用于Cox比例风险回归的直接模拟。而是提出许多不同的值,试图在Cox比例风险回归中回答与其他类型回归(例如,多元线性回归)的标准残差相同的问题。
其中第一个问题是比例风险的假设是否有效。这种假设实质上意味着研究群体中任何两个个体的风险比随着时间的推移保持不变(见指南的这一部分中给出的风险示例)。为检验这种假设的有效性,Prism提供两张图表:缩放的Schoenfeld残差 vs.时间或行顺序,以及对数-负对数生存率图。
•缩放的Schoenfeld残差 vs.时间/行顺序 - 如果比例风险假设有效,则这些残差应随机分布在以零点为中心的水平线周围。如果这些残差存在明显的趋势,则可能违反比例风险假设。请注意,对于删失观察,不存在缩放的Schoenfeld残差
•对数-负对数(LML)生存率图 - 如果指定模型包含分类变量,则该图表的选项允许您选择这些分类变量来构建LML图。该图表针对所选分类变量,为每个研究组(水平)生成一条曲线。为构建这些曲线,使用Nelson-Aalen风险估计计算各研究组的累积风险。回想一下累积风险H(t)= -Ln(S(t))。取每个研究组Nelson-Aalen累积风险估计的自然对数,得到Ln(H(t))或Ln(-Ln(S(t))。即图表名称所指的“对数-负对数”值,绘制在Y轴上,Ln(时间)绘制在X轴上。如果比例风险假设有效,则对于单个分类预测变量,每个研究组(水平)的曲线将大致平行。以下图表示出了比较“女性”和“男性”曲线的LML图。虽然该图表中的曲线并未完全平行,但表明未严重违反该分析的比例风险假设。如果单个分类预测变量组(水平)的曲线相互交叉,则很可能违反分析的比例风险假设。
请注意,创建LML图时,Prism还将包括未变换的“时间”和“估计生存函数”值,这些值可以绘制在图的X轴和Y轴上。对于指定分组变量,结果是每个选定组/水平的标准非参数生存曲线。
为检测分析输入数据中的潜在异常值,提出了许多不同的Cox比例风险残差图。
•偏差残差 vs.线性预测值/HR - 该图表中的点应大致以零点为中心,而残差绝对值较大的点可能代表异常值。请注意,在这些图表中观察到的趋势可能因样本量不足或观察结果删失模式所致。
•鞅残差 vs.线性预测值/HR - 类似于偏差残差,这些残差可用于发现数据中的潜在异常值。但这些残差呈偏斜趋势(不以零点为中心),事件观察结果的残差位于(-inf,1]范围内,而删失观察结果的残差位于(-inf,0]范围内。这些残差通常比偏差残差更难解释。请注意,在这些图表中观察到的趋势可能因样本量不足或观察结果删失模式所致。
•Schoenfeld残差 vs.时间或行顺序 - 不同于偏差残差和鞅残差,这些残差用于确定观察结果对各回归系数的影响。选择该残差时,将生成图表,允许您检查每个不同变量系数的Schoenfeld残差。另外,该图表也可用于检验比例风险假设(如果这些图表显示非零斜率,则可能违反比例风险假设)
Prism提供来两张可用于评估预测变量对模型产生影响的线性度的图表。类似于检验是否存在潜在异常值的图表,可以使用偏差残差或鞅残差。
•偏差残差 vs.协变量 - 这将生成绘制偏差残差与模型中的每个连续预测变量的图表。如前所述,预计偏差残差将随机以零点为中心。这些残差的趋势可能表明所选预测变量偏离线性度
•鞅残差 vs.协变量 - 这些残差呈偏斜趋势,落在(-inf,1]范围内,但平均值应该仍然为零。这些残差的可视趋势可能表明所选预测变量偏离线性度这些残差通常比偏差残差更难解释
这些残差图仅作为将Prism生成的结果与其他统计软件包或先前文献中发布的结果进行比较的方式。Cox-Snell残差是为Cox比例风险回归制定的第一批残差之一,且在很大程度上由本页列出的其他残差取代。
•累积风险比的Cox-Snell vs.Nelson-Aalen估计 - 该图表最初建议用于评估模型的整体拟合。拟合良好的回归将在该图表上生成一条点的近似直线,该直线穿过原点,斜率为1。但问题在于,该图表需要拟合不良的模型来产生不具有这种外观的可视化,且未阐明为什么拟合不良(违反比例风险假设、异常值、时间相关变量等)。