Prism 中包含一组普通多项式方程和一组居中多项式方程。本示例中,当您查看多项式列表时,会同时看到 "二阶多项式 "和 "居中二阶多项式"。我们建议您始终选择居中的方程之一,而不是普通的多项式方程。本页将解释原因。
标准多项式模型是这样的
y= b0 + b1*x +b2*x^2
高阶方程会包含更多的项。
多项式拟合有两个问题:
•当 X 值很大,且起始值远高于零时(本示例中 X 为日历年),将非常大的 X 值取大幂会导致数学溢出。即使程序没有报告任何数学错误,结果也可能不准确。有些系数是正数,有些是负数,因此 Y 的值依赖于从其他巨大的数字中减去巨大的数字,从而导致不精确的结果。
•即使 X 值不大,模型的参数也是交织在一起的,所以具有很高的协方差和依赖度。这就导致标准误差大、置信区间宽、置信带或预测区间非常宽。在很多情况下,这个问题严重到 Prism 会报告结果 "模糊",因此不会报告所有参数的置信区间,也无法绘制置信带。
当 X 值居中时,这两个问题都会消失。居中的概念是在拟合模型之前从所有 X 值中减去平均值 X。这可以作为非线性回归的一部分,使用以下模型来完成:
XC = X - Xmean
y= b0 + b1*xc +b2*xc^2
这里,XC 是居中的 X 值,等于 X 值减去 Xmean(即所有 X 值的平均值)。换句话说,XC 是任何 X 值与所有 X 值平均值的距离。 Xmean 是常数,不是 Prism 试图拟合的参数。 当然,您可以在 Y 的定义中包含更多的项,以创建高阶多项式方程。
拟合居中模型会得到完全相同的曲线(除非常规方法会导致数学错误)。相应地,平方和是相同的,模型比较的结果也是相同的。
不过,居中方程对模型进行了重新参数化。这些参数具有不同的含义,因此具有不同的拟合优度值(除了第一个参数是相同的)、不同的标准误差和依赖度区间、较小的协方差和依赖度以及较紧的置信带/预测区间。
您可以将数据拟合到一个内置的居中多项式方程,而无需了解 Prism 是如何实现模型的。如果您很好奇,请继续阅读。
内置的居中多项式方程组如上图所示,通过约束参数 XMean 等于 "数据集常数(= X 平均值)",使其等于 X 值的平均值。
如果在 Prism 5.02 或 5.0b 之前的版本中打开使用居中多项式回归的文件,该约束将丢失,居中多项式回归将无法运行。