"所有模型都是错误的,但有些模型是有用的。"
乔治-博克斯
上面这句话强调了一个事实,即统计模型很少(如果有的话)能捕捉到系统或群体的真正复杂性。相反,模型被用来将事实简化为一种更容易解读和理解的形式。其结果是,可能会有许多不同的模型被提出来作为同一系统或群体的简化模型。正因为如此,很多我们通常认为是对单一模型结果的 "解读",实际上是对不同竞争模型的巧妙伪装比较。例如,一种常见的比较是分析中指定的模型与所谓的 "空"或"空"模型之间的比较。这种"空"模型只是一个不包含任何预测变量的模型,与分析中的指定模型进行比较后,可用于确定指定模型中包含的预测因子的相对重要性,或评估指定模型的总体"拟合度"。例如,结果中模型诊断部分的值(AIC、偏对数似然、负二倍偏对数似然和伪 R 平方)通常用于比较指定模型和空模型。
相比之下,分析参数对话框"比较"选项卡上的控件则用于比较用户指定的两个模型(两个竞争模型)。这些控件的工作原理与多元线性回归和多元逻辑回归等其他类型的多元回归类似。该选项卡上的选项允许您指定第二个模型(使用不同的预测变量、交互作用项和/或变换组合),并比较每个模型对输入数据的拟合程度。如上所述,这些控件不应用于尝试指定"空模型"进行比较,而只应用于比较包含预测因子变量的两个模型。请在下面的"与空模型的比较"部分阅读更多有关与空模型比较的信息。
Prism 提供两种不同的方法来评估模型选项卡上指定的模型和比较选项卡上指定的模型的比 较。这两种方法分别是阿凯克信息准则(AIC)和似然比检验。
AIC 是一种信息论方法,用于确定数据对每个模型的支持程度,同时考虑到每个模型的部分对数似然值以及每个模型所含参数的数量。在"Cox 比例风险回归"对话框的"选项"选项卡上,还可以选择报告所选模型的部分对数似然(以及部分似然的负两倍)。结果表示为每个模型正确的概率,概率总和为 100%。显然,该修正方法不考虑不同模型正确的可能性。它只是对要求比较的两个模型进行比较。如果一个模型比另一个正确的可能性大得多(比如 1%比 99%),你就会想选择它。但是,如果差别不是很大(比如 40% 对 60%),您就不能确定哪个模型更好,因此您需要收集更多的数据。重要的是,AIC 可用来比较同一数据集上的任意两个模型。计算 AIC 的公式相对简单:
AIC = -2*(部分对数似然)+ 2*k、
其中 k 是模型参数的个数。
该检验报告了为所选模型中的每个模型计算出的 AIC 值的差异。这里给出了更多关于如何计算 Cox 比例风险回归 AIC 的信息。请注意,由于在存在删剪的情况下很难指定观察值的数量,因此 Prism 和其他应用程序一样,只报告 AIC,而不报告校正后的 AIC (AICc)。
与 AIC 相似,LRT 也使用部分对数似然来确定哪个模型更优。不过,与 AIC 不同的是,LRT 只适用于当一个模型是另一个模型的缩小版时进行检验。描述这种情况的另一种方法是说两个模型是"嵌套"的。虽然这种检验只有在模型嵌套时才有效,但 Prism 不会检查模型是否嵌套。因此,在选择使用该检验比较两个模型时必须谨慎。
该检验统计量是以较简单模型(参数较少的模型)与较复杂模型(参数较多的模型)的偏对数似然值之差的比例计算的:
LRT 统计量 = -2*[部分对数似然(较简单模型)]-部分对数似然(较复杂模型)]。
在模型中增加参数(几乎)总是会增加模型的部分对数似然。因此,该统计检验的是与复杂模型相比,由简单模型生成数据的"可能性"有多大。该统计量的值用于计算 P 值。P 值越小,说明拒绝了简单模型正确的零假设。在 Prism 中,您可以指定 P 值必须多小才能拒绝这个零假设(默认值为 0.05)。
最后在"Cox 比例风险回归"对话框的"比较"选项卡上,必须定义第二个模型的主效应、交互作用和变换。在许多情况下,第二个模型将嵌套在第一个模型中(即使用第一个模型的效应、交互作用和变换的子集)。如果是这种情况,第二个模型将是一个"简单"模型。请注意,Cox 比例风险回归模型不包括截距项,因此这将不是一个选项。
在进行 Cox 比例风险回归时,一个通常非常有用的比较方法是将指定模型与"空模型"(这是一个完全不包含预测因子变量的模型)进行比较。不过,您不需要使用"比较"选项卡上的选项来设置这种比较。事实上,Prism 会自动将与空模型的比较结果作为"模型"选项卡上指定模型的标准输出的一部分。默认情况下,"表格结果"的"模型诊断"部分会报告指定模型和空模型的 AIC 值,分析对话框的"选项"选项卡上有报告指定模型和空模型的部分对数似然比或部分对数似然比的负 2 倍(用于计算似然比检验统计量)的选项。