Please enable JavaScript to view this site.

模型比较方法

哪个模型“最佳”?起初,答案似乎很简单。非线性回归目的是最小化平方和,因此平方和看起来越小的模型越好。如果两个备选模型参数相同,则这确实是最好的方法。

但当模型具有不同数量的参数时,这种方法过于简单,但通常情况就是这样。一个有更多参数的模型可以有更多拐点,因此当然会更接近拐点。该模型可以更弯曲和更扭曲,以接近数据点。据此,两期模型几乎总是比一期模型更适合,而三期模型更适合。因此,任何比较简单模型和复杂模型的方法都必须平衡减少的平方和与增加的参数数量。

比较模型的三种统计方法

Prism提供了三种方法来比较具有不同参数数量的模型。这些并非解决该问题的唯一方法,而是最常用的方法。

额外平方和F检验

额外平方和F检验以传统统计假设检验为基础,其仅用于最小二乘回归(非泊松回归)。

零假设确实是简单模型(参数较少的模型)。复杂模型的改进被量化为平方和的差异。您期望一些偶然地改进,但您偶然期望的数量是由每个模型中的数据点的数量和参数的数量决定的。F检验将平方和的差异与您所期望的偶然差异进行比较。结果表示为F比率,由此计算出P值。

P值回答了该问题:

如果简单模型正确,在实验比例(您试验的规模)如何时,平方和差值将与您观察到的结果一样大,甚至更大?

如果P值很小,则得出结论,简单模型(零假设)错误,并接受复杂模型。通常,将阈值P值设为0.05的传统值。如果P值小于0.05,则拒绝更简单的(空)模型,并得出结论,复杂模型更适合。

似然比检验

选择泊松非线性回归时,Prism不提供F检验(如上),而是提供似然比检验。

似然比是该问题的答案:与另一个模型是真的相比,一个模型观察到的数据更可能为真。P值是根据两个模型之间的似然比和测向差来计算的。

P值回答了该问题:

如果简单模型正确,在当实验比例(您试验的规模)如何时,似然比将与您观察到的结果一样大,甚至更大?

如果P值很小,则得出结论,简单模型(零假设)错误,并接受复杂模型。通常,将阈值P值设为0.05的传统值。如果P值小于0.05,则拒绝更简单的(空)模型,并得出结论,复杂模型更适合。

在选择最小二乘回归时,额外平方和F检验相当于似然比检验。

信息论接近Akaike标准(AIC)

这种替代方法基于信息论,并不使用传统的“假设检验”统计范式。因此,它不产生P值,不会得出关于“统计显著性”的结论,也不“拒绝”任何模型。

该方法考虑拟合优度(平方和)和模型中参数的数量,确定数据对每个模型的支持程度。结果表示为每个模型正确的概率,概率总和为100%。如果一个模型比另一个模型更有可能正确(比如说,1%与99%),您会想要选择正确率更高的模型。如果可能性的差异不是很大(比如说,40%与60%),您就会知道这两种模型都可能是正确的,因此您会想要收集更多数据。计算的工作原理

选择哪种方法?

在大多数情况下,您想要比较的模型将是“嵌套的”。这意味着一个模型是另一个模型的简单示例。例如,单相指数模型是两相指数模型的一个更简单示例。标准Hill斜率为1.0的三参数剂量-反应曲线是四参数剂量-反应曲线的一个特例,其也能找到Hill斜率的最佳拟合值。

如果两个模型为嵌套模型,则可使用F检验(如果是泊松回归,也可使用似然比)或AIC方法。选择通常是个人偏好和惯例问题。药理学和生理学的基础科学家倾向于使用F检验。生态学和种群生物学等领域的科学家倾向于使用AIC方法。

如果模型不是嵌套的,则F检验和似然比检验都是无效的,因此您应该选择信息论方法。请注意,Prism不会检验模型是否嵌套。

这些方法如何比较数据集?

Prism的“比较”选项卡允许您询问“所选非共享参数的最佳拟合值是否因数据集而异?”或者“一条曲线是否充分适合所有数据集?”。应用F检验或Akaike方法来回答这些问题是很简单的。Prism可比较两个拟合值的平方和。

在一次拟合中,模型分别拟合至每个数据集,并用平方和量化拟合优度。这些平方和值的总和量化了适合所有数据集的曲线族的拟合优度。

另一种拟合是同时对所有数据集进行全局拟合,共享指定的参数。如果您询问Prism一条曲线是否适合所有数据集,则其会共享所有参数。

这两个拟合是嵌套的(第二个是第一个的更简单示例,需拟合的参数更少),因此平方和(实际上是第一个拟合的平方和)可使用F检验Akaike方法

请勿使用R²或调整后R²比较模型

R² 是一个用于评判模型拟合您的数据的程度的量度,因此通过选择最低R²或调整后R²值的模型来选择竞争模型似乎有意义的。事实上,几乎没什么作用(1),请勿使用这种方法!

1.        Spiess, A.-N.和Neumeyer, N,对R2作为药理学和生物化学研究中非线性模型的不充分测量的评价:Monte Carlo方法。《BMC药理学》10,6-6(2010)。

解读模型的比较

 

© 1995-2019 GraphPad Software, LLC. All rights reserved.