尽管Akaike方法的理论基础难以遵循,但容易进行计算并且理解结果。
任何模型对数据集的拟合均可以用Akaike开发的一种信息标准来概括,该标准称为“AIC”。如果您接受非线性回归的常规假设(曲线周围点的散布服从高斯分布),则AIC由两个模型的平方和以及自由度数的简单方程定义。无法理解该AIC值本身,因为其单位取决于您的数据所使用的单位。
如需比较模型,只是获得两个AIC值之间的差值。取其差值时,单位相互抵消,结果为无单位量纲。
对于最小二乘回归,方程为:
对于泊松回归,方程为:
用于逻辑回归的AICc方程与泊松回归方程(使用参数数量代替方程中的自由度)几乎完全相同。
该方程目前有了直观意义。类似于F检验,其平衡了平方和(或泊松回归的似然比)评估的拟合优度的变化与自由度数(由于待拟合的参数数量的差异)的变化。由于模型1更为简单,其几乎总是拟合更差,因此SS1将大于SS2。由于分数的对数始终为负,因此第一项将为负。模型1具有更少参数且因此具有更大自由度,使得最后一项为正。如果最终结果为负,这意味着基于参数数量的差异,平方和的差值比预期的大,因此可得出结论,可能需要更复杂的模型。
Prism将两个AICc值之间的差值报告为更简单模型的AICc减去更复杂模型的AICc。当更复杂(更多参数)的模型的AICc更低,因此作为首选项时,Prism将AICc的差值报告为正数。当更简单模型的AICc更低,因此作为首选项时,Prism将AICc的差值报告为负数。
上述方程有助于您理解AIC的工作方式 - 平衡拟合优度变化与参数数量差异。但您不必用该方程。只需查看单个AIC值,并选择具有最小AIC值的模型。该模型最有可能是正确的模型。
Prism实际上并未报告AIC,而是报告AICc。该值包括对低样本量的修正。该方程更为复杂,而且在小样本量的情况下更精确。当样本量较大时,AIC和AICc几乎相同。
请注意,这些计算均以信息论为基础,不要使用传统的“假设检验”统计范例。因此,没有P值,没有关于“统计显著性”的结论,且没有“拒绝”模型。
根据AICc值的差值,Prism计算并报告每个模型均正确的概率,其中概率总和为100%。如果一个模型比另一个模型更有可能正确(比如说,1%与99%),您会想要选择正确率更高的模型。如果可能性的差异不是很大(比如说,40%与60%),您就会知道这两种模型都可能是正确的,因此您会想要收集更多数据。这些概率均使用该方程进行计算,其中,Δ指AICc值之差。
请注意,这种方法仅仅比较您所选择的两种模型的拟合度。很有可能是第三种模型,一种您并未选择的模型,比您所选择的任何一种模型更拟合。