哪个模型“最佳”?起初,答案似乎很简单。非线性回归的目的是将平方和最小化,因此平方和较小的模型显然拟合最佳,但理由过于简单。
参数较少的模型几乎始终将数据拟合得更差。比较两个模型时,简单模型(参数较少)平方和较高。比较数据集时,全局拟合的平方和高于单个拟合的平方。比较有无限制为特定值的参数的拟合时,会出现高于您未限制参数的模型的平方和。
F检验和AIC方法均考虑了拟合优度的差异和参数的数量。问题在于平方和的减少(从简单模型到复杂模型)是否值得“耗费”更多的参数进行拟合。F检验和AICc方法以不同方式处理该问题。
Prism在结果的非线性回归表顶部报告比较结果。报告清楚说明零假设和替代假设。如选择F检验,则其会报告F比率和P值。如选择Akaike法,则报告AICc差异和每个模型正确的概率。
最后,Prism报告了“首选”模型,应理解Prism决定哪个模型为“首选”的方式,因为您可能“更喜欢”另一个模型。
如选择额外平方和F检验,则Prism会计算一个P值来回答该问题:
如果零假设正确,则哪个实验部分(样本量)中的平方和差异会像您观察到的那样大还是更大?
在“比较”选项卡中,还可知道Prism将哪个P值设为临界值(默认值为0.05)。如果P值低于该值,则Prism会选择复杂模型,否则选择简单模型。
如果选择Akaike法,则Prism会选择可能更正确的模型,但您应看看这两种可能性,如果在数值上相似,则证据就没有说服力,且两种模型非常拟合。
两种模型是否均拟合?
在运行额外的平方和F检验或计算AICc值之前,Prism会首先做一些常识性的比较。如果Prism不适合任何一种模型,或者如果拟合模糊或完美,则Prism不会比较模型。
两种模型是否合适?
在接受Prism的结果前,执行一次真实性检查。如果其中一个拟合值的结果在科学上无效,则无论F检验或AIC比较的结果如何,接受另一个模型。
例如,如果其中一个阶段的幅度仅仅是总响应的一小部分(尤其是在没有很多数据点的情况),您可能不想接受两个阶段的指数模型。如果其中一个阶段的半衰期值比第一个时间点小得多,或远远超过最后一个时间点,则您也不会愿意接受这种模型。
在接受“首选”模型之前,应像只适合一个模型时一样考虑同样的问题,可参考详细检查表或下述缩写版本。
最佳参数值的精确程度为多少?
置信区间是否过宽?
残差图看起来是否良好?
最佳拟合曲线周围散布的点是否遵循高斯分布?