Please enable JavaScript to view this site.

评估非线性回归的方法取决于您的目的。

在许多情况下,您的目的是创建一条标准曲线,从中插入未知值。我们为此创建了不同的检查表

更常见的情况是,您的目的是确定模型的最佳拟合值。如果这是您的目的,则在评估拟合度时,可问自己一些问题:

曲线

该图表看起来是否合理?

第一步应该用叠加曲线检查图表数据。大多数问题均可通过这种方式发现。

游程或重复检验是否显示出曲线系统偏离数据?

.游程重复数据检验用于确定曲线是否符合数据趋势。每一个X上有单个Y值时,将使用游程检验,其会询问数据点是否聚集在曲线的任一侧,而非随机分散在曲线的上方和下方。每个X上有重复的Y值时,使用重复检验,其会询问与复制值之间的分散点相比,点是否离曲线“过远”。

如果游程检验或重复检验产生低P值,则可得出结论,曲线并不能很好描述数据,您可能选择了错误的模型,或应用了无效的限制条件。

参数

最佳参数值是否可信?

在评估非线性回归报告的参数值时,检查结果是否科学可信。Prism不“知道”这些参数的含义,因此可报告没有科学意义的最佳参数拟合值。例如,确保参数没有不可能出现的值(速率常数不能为负)。检查EC50值是否在数据范围内。检查最大稳定段不会超出最高数据点太多。

如果最佳拟合值在科学上不合理,则结果就没有用处,请考虑将参数限制在合理范围内,然后重试。

最佳参数值的精确程度为多少?

您不仅想知道每项参数的最佳拟合值。还想知道该值的确定程度。因此,评估非线性回归结果的一个重要部分是检查每项参数的95%置信区间。

如果非线性回归的所有假设都是真的,则区间有95%的几率包含真参数值。如果置信区间相当窄,则代表已达目的-合理确定地找到了参数的最佳拟合值。如果置信区间相当宽,则这代表您的设计有问题。该参数可以有很大范围的值。您还没有把它确定下来。“过宽”程度取决于您工作的科学背景。

置信区间是否过宽?

置信区间直观地向您显示所确定参数的精确程度。通过选中非线性回归对话框的“拟合”选项卡上的选项,选择绘制置信区间。如果非线性回归的所有假设都得到满足,则真正的曲线落在这些区间之间的概率为95%,这给了您一种数据定义模型的直观感觉。

残差

残差图看起来是否良好?

残差图显示了数据的X值与点到曲线的距离(残差)之间的关系。如果满足回归的假设,则残差图应该看起来平稳,无明显趋势。

最佳拟合曲线周围散布的点是否遵循高斯分布?

最小二乘回归是基于曲线周围散布的点遵循高斯分布的假设。Prism提供了三种正态性检验(在“诊断”标签中),可检验该假设(我们推荐D'Agostino检验)。如果正态性检验的P值很低,即可得出散射不遵循高斯分布的结论。

异常值是否会影响结果?

一个或几个异常值的存在(比其他点离曲线更远的点)会否定最小二乘法的计算,并导致误导性的结果。

可以通过检查图表来发现异常值(只要您绘制的是单个副本,而非平均值和误差线)。但是也可以自动检测到异常值。GraphPad开发了一种识别异常值的新方法,我们称之为ROUT方法。检查诊断选项卡上的选项以计算异常值,但将它们留在计算中。或者选中“拟合”选项卡上的选项,从计算中排除异常值。

模型

另一种模式是否会更适合?

非线性回归可以找出使模型尽可能接近数据的参数(给定一些假设)。它不会自动询问另一种模式是否更佳。

即使一个模型很适合您的数据,它也可能不是最好的,或者最正确的模型。应该时刻警惕不同模型可能更好的可能性。在某些情况下,如果不在更大的范围内收集数据,就无法区分模型。在其他情况下,则需要在不同的实验条件下收集数据。这就是科学前进的方式。为数据考虑其他的解读(模型),然后设计实验以将其区分。

如果选择在数据集之间共享参数,则这些数据集是否以相同的单位表示?

全局非线性回归(在数据集之间共享一个或多项参数的任何拟合值)使数据点和曲线之间的平方距离之和(在所有数据点上)最小。仅当所有数据集的Y值都以相同的单位表示时,这才有意义。

拟合优度

R² 与之前的运行分析相比,是否过低?

然而许多人会先看R²值 ,但这并不能帮助您透彻地理解结果。仅当您重复一个以前做过很多次的实验时,其才会有帮助。如果是这样,则您就会知道R²值预计为多少。如果R²显著低于预期,则可能出现了问题。一种可能性是存在异常值。

平方和与sy.x的值 与之前的运行分析相比是否过低?

这些值与R²相关,检查结果仅当您过去做过类似实验(使得知道预期值)时才有用。

 

 

© 1995-2019 GraphPad Software, LLC. All rights reserved.