从数据表中选择包含分析所关注事件的经过时间的变异性变量。请注意,目前 Prism 只接受用于 Cox 比例风险回归的经过时间。如果您的数据包含 "开始时间"和 "结束时间"变量,则需要将其转换为每个观察值的单一经过时间值(经过时间 = 结束时间 - 开始时间)。
从数据表中选择一个变量,该变量包含每个观测值是否发生了相关事件或观测值是否被删剪 的信息。该变量可以是连续性的,也可以是分类性的。如果该变量是连续性的,则通常会对信息进行编码,数值为 "1"代表经历了相关事件的个 人,数值为 "0"代表被删剪的个人。如果变异性变量是一个分类变量,其等级可能会像 "死亡 "和 "删剪 "一样容易解读。无论结果变量是连续的还是分类的,该选项卡上的控件都可以让您指定哪个值(或级别)代表事件,哪个代表删剪观察值。
附加的 "将其他值视为"下拉菜单允许您指定 Prism 应如何处理所选变量中的任何其他值。依赖度取决于所选选项,这些行可能被视为
•缺失。使用该选项后,Prism 会将任何不包含 "删剪"和 "事件"指定值的行视为该行中没有该变量的值。因此,这些行将从分析中省略。这是该下拉菜单的默认选项
•删剪:使用此选项,除 "删剪"和 "事件"指定值外,其他值的行将被视为删剪观察值。如果输入(或编码)数据时考虑了多种类型的删剪(例如 "因缺乏随访而丢失"或 "在研究结束时仍存活"),该选项会很有帮助。
•死亡/事件:使用该选项后,除为 "删剪"和 "事件"指定的值外,任何其他值的行都将被视为事件。只有当您有兴趣研究所有事件的概率,而不是事件之间的差异时,才应选择此选项。例如,如果您研究的是一般生存概率,那么将 "死于车祸"和 "死于心脏病"等同处理可能没问题,但在研究实验性治疗对心力衰竭的影响时,将这两者等同处理可能不是一个好主意(在本示例中,"死于车祸"可能会被视为删剪观测值)
Cox 比例风险回归模型要求记录每个观测值的事件发生时间信息,这些时间的先后顺序对该分析的计算非常重要。但是,经常会出现多个事件被记录为具有相同的经过时间的情况(可能是由于数据收集的方式,也可能是由于事件的具体排序未知)。当事件观测值具有相同的经过时间时,这些观测值就被称为 "并列",分析可以用不同的方法来处理并列。默认情况下,Prism 会自动选择处理并列的最佳方法。根据并列的数量,Prism 将使用精确法或 Efron 法(更多信息请参阅下文)。Breslow 方法仅用于匹配其他应用程序生成的结果,一般不推荐使用。
精确法通常被认为是最准确的方法,在进行所需的计算时会考虑所有可能的并列事件排序。例如,如果观测值 A、B 和 C 并列,则有六种不同的排列方式:
1.A、B、C
2.A、C、B
3.B、A、C
4.B、C、A
5.C、A、B
6.C, B, A
随着数据集中并列次数的增加,排列组合的总数也迅速增加,导致计算时间急剧增加。为了解决这个问题,人们开发了一些精确方法的近似方法。最常见的两种近似方法是
1.布雷斯罗近似法
2.埃夫隆近似法
布雷斯罗近似方法是这两种方法中较早的一种,其精确度不如埃夫隆近似方法,尤其是当数据中存在大量并列关系时。因此,我们不建议使用布雷斯罗近似法,除非是特异性地试图匹配不同应用程序生成的结果。请注意,比较不同估计方法的一种方法是比较使用每种估计方法拟合模型的AIC值。该值将在结果的模型诊断部分进行报告。
与多元线性回归和多元逻辑回归一样,Cox 比例风险回归也可以接受连续变量和分类变量作为模型中的预测因子变量。不过,这些其他分析与 Cox 比例风险回归的一个重要区别是,Cox 比例风险回归没有明确的截距项。如果要加入截距项,它只会被未指定的基线危险(h0(t))"吸收"。
主效应可能是您要研究的变量(如治疗组或基因型),也可能是您要简单校正的变量(如年龄、性别、体重等协变量)。虽然对这些变量的解读可能不同,但从模型定义的角度来看并无区别。使用复选框指定在模型中包含哪些预测因子变量。拟合模型时,Prism 会为模型中每所选的主效应估计一个回归系数(β 系数)。当包含一个分类预测变量时,为该预测因子估计的回归系数数将等于该分类变量的级数减一(例 如,一个有四个级数的分类预测变量将产生三个估计回归系数)。模型中包含的每个交互作用和转换也将估算出一个回归系数(见下文)。
Prism 可以非常方便地在模型中加入任意数量的自变量预测因子的双向或三向交互作用。只需展开您想包含的交互作用(双向或三向交互作用)列表,选择您想添加的交互作用的第一个预测因子变量,然后选择在此交互作用中包含哪些变量即可。要选择与某一预测因子变量可能发生的所有交互作用,只需在 "定义模型 "窗口的双向或三 向交互作用部分选择该预测因子变量旁边的主复选框即可。
除交互作用外,Prism 还允许您在模型中包含任何预测因子变量的平方、立方、平方根、对数或指数。只需展开感兴趣的变异性部分,然后使用复选框指定哪些预测因子变量需要变异性作为分析模型的一部分。