Kaplan-Meier 生存分析的主要结果之一是每个时间点的生存比例或百分比。这些值通常以图形显示,但有时查看这些结果的表格也很有用。这些值的分析结果选项卡默认是不可见的。要查看它,只需单击分析选项卡右侧的下拉菜单,然后从列表中选择即可。
Prism 使用Kaplan-Meier (乘积极限)方法计算生存比例。对于每个 X 值(时间),Prism 都会报告尚未经历相关事件的观察值的分数(或百分比)(如果生成的是累积发病率图而不是生存率图,这些值将代表已经历相关事件的观察值的分数/百分比)。这些值是绘制存活率(或累积发生率)与时间关系图所需的值。
如本指南前文所示,用于生成这些比例的计算要考虑到删剪观察值。受试者的观察结果被删剪--可能是因为他们离开了研究,也可能是因为研究结束了--在删剪时间之后就不能再提供任何信息了。这意味着生存百分比的计算要比简单的分数复杂一些。虽然直观上看,曲线的终点应该是以经历相关事件的受试者总数除以受试者总数计算出来的生存率,但这只有在没有删剪数据的情况下才是正确的。如果某些观测数据被删剪,那么计算就会更加复杂(这正是Kaplan-Meier 方法要处理的问题)。
如果发生相关事件的经过时间与其他受试者的删剪经过时间相同,则 Prism 会假定相关事件先发生而进行计算。
Prism 以标准误差或 95% 置信区间的形式报告生存概率的不确定性。标准误差采用格林伍德方法计算。
计算 95% 置信区间时,Prism 提供了以下方法供选择:
•不对称法(推荐)。这些置信区间使用对数-对数变换法计算,也被称为指数格林伍德公式。Machin 第 42 页和第 43 页对该方法进行了说明(参见下面的参考文献)。将误差方法设为格林伍德,conf.type 设为对数,可以从 survfit R 函数中得到相同的结果。这些区间适用于每个时间点。我们的想法是,在每个时间点上,95% 的概率区间都包含了真实的群体存活率。我们称这种方法为不对称区间,因为区间在存活比例上方延伸的距离通常不等于区间在存活比例下方延伸的距离。这就是所谓的点置信限。计算置信带也是可行的(但在 Prism 中无法实现),置信带有95% 的几率包含整个人群的生存曲线。这些置信带比点状置信限更宽
•对称法。这些区间的计算方法是每个方向的标准误差的 1.96 倍。但要注意的是,在某些情况下,这种方法计算出的置信区间会低于 0 或高于 1(或 100%)。在这种情况下,置信区间会在这些界限处进行修剪,以避免出现不可能的值。我们不推荐使用这种方法,提供这种方法只是为了与 Prism 的旧版本兼容。
Kaplan-Meier 方法在逻辑上非常简单。对于每个时间点,它首先计算在该时间点之前或该时间点没有发生相关事件的受试者比例。要做到这一点,只需用该时间点之后未发生相关事件的受试者人数除以该时间点之前未发生相关事件的受试者总人数即可(分子和分母中均不包括此时已被删剪的观测值)。
然后,计算从时间 0 开始直到数据表中每个特异性时间点都未发生相关事件的受试者比例。计算方法是将第一个时间点计算出的分数乘以随后每个时间点计算出的分数。本示例以单个天数表示时间点,首先计算第 1 天的分数。然后用这个分数乘以第 2 天的分数,得到一个新值。然后用这个新值乘以第 3 天的分数,以此类推。重复这个乘法过程直到 "K"天,得出所有受试者在 K 天结束时未发生相关事件的分数,换句话说,就是 K 天的存活概率。Kaplan-Meier 方法会自动考虑删剪观测值,将其从观测值被删剪当天的分数分子和分母中去除。指南本页给出了这些计算的本示例。这种重复的分数相乘过程就是这种方法名称的由来:乘积极限法。
1.David Machin, Yin Bun Cheung, Mahesh Parmar, 生存分析:实用方法》,第 2 版,IBSN:0470870400。