科学家使用非线性回归可达成两个不同的目的:
•使用模型拟合数据,以获得参数的最佳拟合值,或比较替代模型的拟合。如果这是您的目的,则必须仔细挑选一个模型(或两个替代模型),并注意所有结果。
•简单地拟合一条平滑曲线,以便从曲线中插值,或者使用平滑曲线绘制一张图表。如果这是您的目的,您可纯粹通过观察数据和曲线来评估,没必要学太多理论。直接跳到用Prism解释插值。
线性回归采用直线模型拟合数据。非线性回归扩展了这一概念,使用任何模型拟合数据。区分非线性回归与线性回归,以及其他类型的回归。
线性和非线性回归的目的均是调整模型参数值,以找到最接近数据的直线或曲线。因此,对于线性回归,目的是找到斜率和截距的最佳拟合值,以使直线接近数据。对标准化剂量-反应曲线进行非线性回归,目的是调整EC50的值(在最小和最大反应之间激发反应的浓度)和曲线斜率。
更准确地说,回归的目的是找到最有可能正确的参数值。如需做到这一点,需假设数据在曲线上的分散性。
最常见的假设是,数据点随机分布在一条理想曲线(或直线)上,其分布服从高斯分布。如果您接受这一假设,则回归的目的就是调整模型参数,以找到这样一条曲线,各点与该曲线的垂直距离平方和最小。
为何要最小化距离的平方和?为何不简单地最小化实际距离的总和?
如果随机散布服从高斯分布,则其具有两个中等大小的偏差(例如,每个偏差5个单位)比具有一个小偏差(1个单位)和一个大偏差(9个单位)的可能性更高。最小化距离绝对值总和的程序将不会倾向于一条距离两点5个单位的曲线和一条距离其中一点1个单位,且距离另一点9个单位的曲线。在所有情况下,距离的总和(更准确地说,距离绝对值总和)为10个单位。最小化距离平方和的程序更倾向于距离两点5个单位(平方和=25),而非距离其中一点1个单位,且距离另一个点9个单位(平方和=82)。如果散布是高斯分布(或接近高斯分布),则通过最小化平方和确定的曲线最有可能是正确的。