哪种模式 "最好"?起初,答案似乎很简单。非线性回归的目标是最小化平方和,因此似乎平方和较小的模型是最好的。如果两个备选模型的参数数相同,那么这的确是最好的方法。
但当模型的参数数不同时,这种方法就过于简单了,而通常情况就是如此。参数越多的模型拐点越多,当然也就越接近拐点。它可以弯曲和扭曲得更多,以接近数据点。因此,两相模型的拟合效果几乎总是好于单相模型,而三相模型的拟合效果甚至更好。因此,任何将简单模型与更复杂模型进行比较的方法,都必须在平方和的减少与参数数量的增加之间取得平衡。
Prism 提供了三种比较不同参数数模型的方法。这些方法并不是解决这一问题的唯一方法,但却是最常用的方法。
平方和外 F 检验基于传统的统计检验假设。它仅用于最小二乘回归(非泊松回归)。
零假设是较简单的模型(参数较少的模型)是正确的。较复杂模型的改进被量化为平方和的差异。您期望的改进只是偶然的,而您期望的偶然改进的程度是由数据点的数量和每个模型的参数数量决定的。F 检验将平方和的差异与您偶然预期的差异进行比较。结果用 F 比值表示,并由此计算出 P 值。
P 值回答了这个问题:
如果简单模型是正确的,那么在多大比例的实验中(你的实验的规模),平方和的差异会和你观察到的一样大,甚至更大?
如果 P 值很小,则断定简单模型(零假设)是错误的,并接受更复杂的模型。临界 P 值通常设定为传统的 0.05。如果 P 值小于 0.05,那么就拒绝接受更简单的(零假设)模型,并得出更复杂的模型拟合值明显更高的结论。
选择 Poisson 非线性回归时,Prism 不提供 F 检验(上文),而是提供似然比检验。
似然比可以回答这个问题:如果一个模型为真,与另一个模型为真相比,观察到的数据更有可能是多少。根据似然比和两个模型的 df 差值计算出 P 值。
P 值回答了这个问题:
如果更简单的模型是正确的,那么在多大比例的实验中(你的实验的规模),似然比会和你观察到的一样大,甚至更大?
如果 P 值很小,就断定简单模型(零假设)是错误的,并接受更复杂的模型。临界 P 值通常设定为传统的 0.05。如果 P 值小于 0.05,则拒绝接受简单模型(零假设),并得出复杂模型拟合值明显更高的结论。
额外的平方和 F 检验相当于选择最小二乘回归时的似然比检验。
这种替代方法基于信息论,不使用传统的 "假设检验 "统计范式。因此,它不会产生 P 值,不会得出 "统计学显著性 "的结论,也不会 "拒绝 "任何模型。
该方法在考虑拟合优度(平方和)和模型参数数量的基础上,确定数据对每个模型的支持程度。结果以每个模型正确的概率表示,概率总和为 100%。如果一个模型比另一个模型正确的可能性大得多(比如,1% 对 99%),你会想选择它。如果可能性相差不大(比如 40% 对 60%),你就会知道任何一个模型都可能是正确的,因此想要收集更多的数据。计算如何进行?
在大多数情况下,您要比较的模型都是 "嵌套 "的。这意味着一个模型是另一个模型的简单模型。本示例中,单相指数模型是双相指数模型的简单模型。标准希尔斜率为 1.0 的三参数剂量反应曲线是四参数剂量反应曲线的特例,它也能找到希尔斜率的拟合优度值。
如果两个模型是嵌套的,可以使用 F 检验(或似然比检验,如果是 Poisson 回归)或 AIC 方法。选择哪种方法通常取决于个人偏好和传统。药理学和生理学的基础科学家倾向于使用 F 检验。生态学和群体生物学等领域的科学家则倾向于使用 AIC 方法。
如果模型没有嵌套,那么 F 检验和似然比检验都无效,所以应该选择信息论方法。请注意,Prism 不会检验模型是否嵌套。
通过 Prism 的"比较 "选项卡,您可以询问 "不同数据集所选的非共享参数的拟合优度值是否不同?"或 "一条曲线是否充分拟合所有数据集?"。应用 F 检验或 Akaike 方法回答这些问题非常简单。Prism 比较两个拟合的平方和。
•在一次拟合中,模型分别拟合每个数据集,拟合优度用平方和量化。这些平方和值的总和可以量化拟合所有数据集的曲线族的拟合优度。
•另一种拟合是一次性对所有数据集进行全局拟合,共享指定参数。如果询问 Prism 一条曲线是否充分拟合所有数据集,那么它共享所有参数。
这两种拟合是嵌套的(第二种是第一种的简化情况,拟合参数较少),因此可以使用F 检验或Akaike 方法比较平方和(实际上是第一种拟合的平方和之和)。
R2是衡量模型对数据拟合程度的指标,因此,在竞争模型中选择R2或调整后R2 最低的模型似乎是合理的。事实上,这种方法的效果非常差 (1)。不要使用这种方法!
1. Spiess, A.-N. & Neumeyer, N. An evaluation of R2 as an inadequate measure for nonlinear models in pharmacological and biochemical research: a Monte Carlo approach.BMC Pharmacol 10, 6-6 (2010).