Please enable JavaScript to view this site.

进行Cox比例风险回归后,可能会关注研究模型在描述输入数据方面的表现有多好。评估该拟合优度的方法之一是比较模型估计的每个个体的风险与这些相同个体的输入数据中观察到的生存时间。

简短版本

Prism报告了Harrell's C(一致性)统计量及其相关的95%置信区间。为计算C统计量,考虑所有可能的观察结果配对,其中至少一个配对包括一例事件(在计算中省略其中经过删失处理的观察结果对的配对)。针对每个配对,比较观察时间(“T”,输入表中)和相对风险(“XB”,由模型确定)。将事件发生前历时更短的观察结果是相对风险更高的观察结果的配对视为“一致”(这些属于观察结果配对,其中,模型通过分配更高的相对风险来正确识别应具有更短生存时间的观察结果)。不符合这种预期关系的配对视为“不一致”(或者在某些情况下,不能简单地视为“一致”,原因在于它们在观察时间或相对风险评分等方面具有关联值,请参见以下“详细版本”)。

 

C统计量表示一致配对的比例(模型正确预测更短生存时间的配对部分),因此取0-1之间的值。该值是一个条件概率 - 对于任意观察结果配对,该模型为生存时间较短的观察结果分配更高的风险比。因此,C统计量接近1的模型表明该模型具有更好的识别能力,而C统计量接近0.5的模型并未优于随机几率。C统计量小于0.5的模型极为罕见,通常只在样本量非常小的情况下才会出现。如果您观察到小于0.5的C统计量,很可能是出了问题!

C统计量背后的直觉

对于给定的观察结果,较大的相对风险(XB)值意味着较高的风险,因此生存时间较短。因此,如果某观察结果比另一项观察结果具有更高的XB值和更短的事件发生前历时,则可以认为这些观察结果表现符合预期。然而,如果某观察结果比另一项观察结果具有更高的XB值和更长的感兴趣事件发生前历时,则可以认为这些观察结果表现异常。一致性只是数据配对中表现符合预期的部分(假设任何观察结果配对之间的相对风险值无关联)。

另一种解释一致性的方法是将模型视为一种预测设备。给出两个数据的观察结果时,该模型将预测这两项观察结果中哪一个将生存更长时间。完美的预测设备将正确预测每一个观察结果配对,而真正随机的设备将预期正确预测一半配对(认为该模型属于纯粹通过抛硬币来决定哪项观察结果应具有更高的相对风险的设备:我们预计其在~50%的时间内获得正确结果)。

一致性值反映了这种表现,且必须取一个介于0-1之间的值。“一”意味着模型正确预测所有观察结果配对(预测生存更长的观察结果确实生存更长,预测更快发生感兴趣事件的观察结果确实更快发生)。如果模型具有真正随机性,则该一致性值将是0.5,这表明在一半时间内,模型将正确预测感兴趣事件发生之前哪些观察结果“生存”更长。

如果该一致性的概念听起来类似于ROC曲线下面积逻辑回归报告的拟合优度度量,则这是因为这两个概念绝对等同。

详细版本

回顾一下Cox比例风险模型:

 

可以将其重新安排为以下形式:

 

请注意,在Cox回归背景下,“xi”表示预测变量值(例如,年龄、体重、治疗组等)。

实际上,Cox比例风险并未假设基线风险的任何特定形式,但可以看出,线性预测因素(Σxii,或者简称“XB”)与风险比[h(t)]成正比。这意味着,随着XB值的增加,风险比会增加。随后,随着风险比的增加,发生感兴趣事件的概率会增加,因此生存时间预计会缩短。

总之,XB越大,预测感兴趣事件前的历时越短。

使用输入数据表中计算的参数系数(β)和观察到的事件发生前时间数据,我们可以评估模型在预测该关系时的表现有多好。通过适合确定一致性的Harrell’s C统计量来实现。

经Frank Harrell(1)扩展后,该值可以解释如下:

考虑输入数据表中每个可能的成对观察结果组合,其中至少一项观察结果属于事件(在计算中省略两项观察结果均经删失处理的配对)

如果该配对中的两项观察结果均包含一例事件

比较由模型和观察时间确定的线性预测因素(XB)与每次观察输入数据中的感兴趣事件

为方便表示,我们称第一次观察的相对风险为XB1,第二次观察的相对风险为XB2,第一次观察的历时为T1,第二次观察的历时为T2

如果出现以下情况,观察结果配对视为“一致”:

XB1 > XB2且T1 < T2

XB2 < XB2且T1 > T2

如果出现以下情况,观察结果配对视为“不一致”:

XB1 > XB2且T1 > T2

XB1 < XB2且T1 < T2

如果出现以下情况,观察结果配对视为“在XB中有关联”:

XB1 = XB2

如果出现以下情况,观察结果配对视为“在T中有关联”:

T1 = T2

如果出现以下情况,观察结果配对视为“在XB和T中有关联”:

XB1 = XB2且T1 = T2

如果一配对中的一项观察结果经删失处理

对于以下定义,发生事件的观察结果将具有观察时间Te和相对风险XBe,而删失观察结果将具有观察时间Tc和相对风险XBc

如果Tc<Te,则无法确定谁先发生这例事件(在事件发生之前留有删失观察结果的个体),因此从计算中省略该观察结果配对

如果出现以下情况,则将该观察结果配对视为“一致”:

Tc ≥ Te且XBc < XBe

如果出现以下情况,则将该观察结果配对视为“不一致”:

Tc ≥ Te且XBc > XBe

如果出现以下情况,则将该观察结果配对视为“在XB中有关联”:

XBc = XBe

涉及一例删失事件和一例无法在T中建立联系的事件的观察结果配对

 

一致性统计量计算公式

使用上述定义,确定以下内容:

nconcordant - 一致配对的数量

ndiscordant - 不一致配对的数量

ntied in XB - 在XB中有关联的配对数量

当任何观察结果配对在XB中无关联时,C统计量的计算公式如下:

 

 

这表示模型能够正确分配适当相对风险值的观察结果“部分”(较高的相对风险值得出较低的生存时间)。如果对于所有观察结果配对,相对风险较高的观察结果也是生存时间较短的观察结果,则所有配对将一致,且该部分将等于1!当有多个观察结果配对的相对风险值有关联时,公式略有不同:

 

 

该公式相似,但在分子和分母中为关联观察结果增加一个数据项。回到早先章节的“预测设备”示例,我们可以考虑当模型呈现在线性预测因素(XB)中有关联的观察结果时会发生什么。在此情况下,预测设备无法知道哪项观察结果应生存更长时间,因此它可以做的就是抛硬币来做出决定。我们预计,硬币翻转在约50%的情况下正确,这就是在XB中有关联的观察结果配对数量在上述等式的分子中乘以0.5的原因所在。因此,在此情况下,C统计量仍然代表模型能够正确分配适当相对风险值的观察结果的一部分。

参考文献

1.Harrell FE、Califf RM、Pryor DB、Lee KL、Rosati RA,评价医学检验的结果。《美国医学会杂志》。1982;247:2543–46。

© 1995-2019 GraphPad Software, LLC. All rights reserved.