进行生存分析时,反应变量是感兴趣事件发生之前的历时量。该变量是连续变量(意味着它可以有任意多个不同的值),且其值不能是负数。我们将该变量称为T(大写的T,表示它是历时的随机变量,其值未知。相比之下,特定时间点将用小写的t表示)。虽然T值未知,但该变量可以使用称为f(t)的概率密度函数(pdf)和称为F(t)的累积分布函数(cdf)进行定义。
一开始有关pdf的直接解释可能有点混乱,超出了我们将在本指南中涵盖的范围。然而,在我们继续之前,有几个关于pdf的重要事实需要注意,
1.对于t的所有值,f(t)值均为正数(大于或等于零)
2.F(t)曲线下涵盖所有可能T值的面积都等于一
3.pdf与cdf之间的关系由下式给出
利用关于pdf和cdf的这些事实,我们可以提供一个相对容易理解的F(t)的解释:它是感兴趣事件在时间t之前(含)发生的概率。从数学上讲:
换言之,F(t)给出了观察到的历时T小于表达式中评估的特定时间t的概率。但在生存分析中,我们通常对特定时间之前的事件发生概率并不感兴趣。我们而是想知道事件在特定时间内未发生的概率。我们可以使用早先介绍的关于pdf和cdf的一些事实来给出该数学形式。
我们知道,在所有t值上,pdf的曲线下面积等于一:
如果我们知道cdf是事件在时间t之前发生的概率,则cdf的补集一定是时间t之前未发生事件的概率,我们可以建立以下关系:
这称为生存函数或S(t),并给出历时t之前未发生感兴趣事件的概率。