在 Prism 7 之前,Prism 只报告始终围绕拟合优度值对称的渐近置信区间。
对于某些模型中的某些参数,不对称区间能更好地表达精度。Prism(从第 7 版开始)在非线性回归对话框的 置信区间 选项卡中提供了剖面似然置信区间。其缺点是很多人都不熟悉,而且计算时间较长(但如果计算机运算速度较快,除非拥有庞大的数据集并选择用户自定义方程,否则可能根本不会注意到)。
这个想法非常简单。额外的平方和检验比较两个模型。
•更复杂的模型就是你选择的模型。整页结果都是针对这个模型的。
•简单模型将一个参数固定值。我们的想法是将该参数固定为不同的值,直到找到置信限(如下所述)。
下面是一个非常简化的算法,可以解释该方法背后的思路。定义平方和为 SS,自由度为 DF。
1.将变异性 Delta 设为您要找到 CI的参数的 SE(然后对其他参数重复)。
2.将参数固定为其拟合优度值减去Delta 值,然后再次运行拟合,让所有其他参数值都发生变化。记录这次拟合的新 SS 和 DF。
3.使用额外的平方和 F 检验,比较原始拟合优度和强制参数减去 delta 的拟合优度。第二次拟合将一个参数保持为恒定值,因此拟合的参数少了一个,自由度多了一个。计算 P 值。
a.如果 P 值小于 0.05,说明 delta 太大。将其变小,回到第 2 步。
b.如果 P 值大于 0.05,则 delta 太小。将其调大并返回第 2 步。
c.如果 P 值非常接近 0.05,那么置信下限等于原始拟合优度值减去当前的 delta 值。
4.将参数固定为最佳拟合值加上delta,再次运行拟合,让所有其他参数值都发生变化。记录这次拟合的 SS 和 DF。
5.使用额外的平方和 F 检验,比较原始拟合优度和强制参数 增加delta 的拟合优度。计算 P 值。
a.如果 P 值小于 0.05,说明 delta 过大。将其减小并返回第 4 步。
b.如果 P 值大于 0.05,则 delta 太小。将其调大并返回第 4 步。
c.如果 P 值非常接近 0.05,则置信上限等于原始拟合优度值加上当前的 delta 值。
6.对每个参数重复上述步骤。
这样就为一个参数建立了 100*(1-α)% 的置信区间(α 设为 0.05 的常见情况下为 95% 的置信区间)。如果要检验 "真实参数值等于其拟合优度值 "的零假设,那么对于置信区间内的任何参数值,该零假设都不会被拒绝。
更正式地说:定义 θbf 为参数的拟合优度值,θhyp 为参数的假设不同值。对于置信区间内的任何 θhyp 值,θbf = θhyp 的零假设在 α 显著性水平下不会被拒绝,但对于置信区间外的任何 θhyp 值,θbf = θhyp 的零假设将被拒绝。
Prism 实际上使用 Venzon 和 Moolgavkar(1) 为每个参数详细说明的步骤。这种方法为每个参数创建一个剖面似然。对于参数的各种可能值,算法拟合曲线(优化其他参数)并确定数据来自该模型的可能性。置信区间是指可能性不会比最大值低太多的参数值范围。当然,"过低 "是有严格定义的。
最大似然值是指参数的拟合优度值。在文本中绘制这些剖面似然图时,通常绘制的是似然的负对数。最大似然与最小 -log(似然)相同,因此在这些图中,拟合优度值是 Y 处于最低值时的 X 值。
如果假设所有残差都服从高斯分布,那么最大似然就等于最小平方和。
• 计算置信上限的最终 delta 值可能不等于(或甚至接近)计算下限的最终 delta 值。这就是置信区间可能与拟合优度值不对称的原因。
•上述 0.05 的 P 值目标仅用于需要 95% 置信区间时。如果您想要 99% 的置信区间,请使用 0.01 等。
•参考文献 1 中的方法(Prism 使用的方法)比上述方法更巧妙,因此计算量更少。
•这种方法计算的置信区间只针对一个参数。我们的想法是,每个置信区间有 95% 的几率包含真实参数值。95% 并不适用于所有区间。我们期望 所有 置信区间都 有 95% 的概率 包含各自的真实参数值,这种 说法是不正确的 。
•在计算上述额外的平方和 F 检验时,请注意两个模型相差一个自由度。这是因为我们固定了一个参数,而让 Prism 去拟合其他参数。一些出版物(2)认为您固定的是所有参数,而不仅仅是一个参数。因此,输入 F 检验的两个模型相差 K 个自由度,其中 K 是拟合参数的数量。这些置信区间更宽,我认为其意图是 95% 置信水平同时适用于所有置信区间,而不是只适用于一个置信区间。棱镜不使用这种方法。使用棱镜时,被比较的两个模型总是相差一个自由度。
•我们使用的方法也是由 Watts(3)描述的。对于表 III 中的数据,Prism 与他在表 IV 中给出的结果相吻合。
•在某些情况下,该方法无法找到置信区间,只能报告"?
1.Venzon DJ, Moolgavkar SH.基于剖面似然的置信区间计算方法。应用统计学。1988;37(1):87.
2.Kemmer, G., & Keller, S. (2010).Excel 电子表格中的非线性最小二乘数据拟合。自然协议》,5(2), 267-281. http://doi.org/10.1038/nprot.2009.182
3.Watts, D.G. (2010) Parameter estimates from nonlinear models, Chapter 2 of Essential Numerical Computer Methods by M Johnson, Academic Press 2010.