Please enable JavaScript to view this site.

重新参数化方程不会改变最佳拟合曲线

希望将S酶动力学数据与标准模型相匹配。但该模型有两种常用形式:

Y=Vmax*X^h/(Khalf^h + X^h)

Y=Vmax*X^h/(Kprime + X^h)

两者是等价的,Kprime等于Khalfh 所以两次拟合会产生完全相同的曲线,具有相同的平方和,相同的R2,和相同的自由度数。尽管这两个方程表达了相同的模型,但写法不同,有意思的术语是其以不同方式参数化。

其均符合Vmax(外推至极高底物浓度的最大活性)和h(描述曲线陡度的Hill斜率)。但一个模型符合Khalf(获得最大速度一半所需的浓度),另一个模型符合Kprime(对底物作用的更抽象的度量)。

哪种模型更好?

在这两种模型之间进行选择的一种方法是匹配其他的教科书和论文,这样您就可轻易将您的结果与其他的结果进行比较。另一种方法是选择与您思考方式拟合的表格。在该示例中,如果您更偏向形象化思考,可选择Khalf。如果机械性思考,则可选择Kprime。

但选项不仅仅是置信度和惯例的问题。模型的选择可决定置信区间的准确性。继续阅读,了解原因。

参数分布并不总是对称的

模拟可确定参数的对称性。我用Vmax=100、h=5,Kprime=25、具有SD的高斯散射=7.5来模拟S酶动力学。X值与上图中的值相匹配,每个X处有三个Y值。Prism可很容易地进行此类模拟。使用Prism蒙特卡洛分析,我重复模拟了5000次,将每条曲线与两种形式的模型进行拟合,并将Kprime和Khalf的最佳拟合值制成表格,并计算每条曲线的偏斜度。

Khalf分布非常对称,看起来像高斯分布。因此,其偏斜度接近于零。相比之下,Kprime的分布相当不均衡。请注意,一些模拟数据集的最佳拟合值Kprime大于100。偏斜度值(4.89)证实了通过检验显而易见的事实 - 分布离对称还有很大距离。

对称渐近置信区间的覆盖

与几乎所有非线性回归程序一样,GraphPad Prism的先前版本可计算最佳拟合参数的置信区间,因此该区间围绕最佳拟合值对称。如果一项参数的不确定性是真正对称的,则可从表面上解读这些置信区间。如果不确定性是不对称的,则置信区间就不准确。

理想情况下,很容易解读置信区间。95%置信区间有95%的几率包含参数的真实值,有5%的几率忽略它。分析真实数据时,我们永远不知道真实参数的值,因此永远不知道区间是否包含它。但模拟数据时,您知道参数的真实值,因此可量化置信区间的覆盖范围。我设置了上面提到的相同模拟,将每个数据集均与两个方程相匹配,并将每个置信区间是否包含真实的参数值制成表格。该表显示了置信区间不包括真实参数值的5000次模拟的分数(Kprime为25,Khalf为1.9037)。


“95% CI”

“99% CI”

理想

5.0%

1.0%

Kprime

8.8%

4.8%

Khalf

5.1%

1.0%

这些结果表明Khalf表现良好,正如其对称性所预期的那样(见上文)。预计95%的置信区间会在5.0%的模拟中错过真实值。事实上,这种情况发生的几率为5.1%。同理,99%的置信区间预计会在1.0%的模拟中错过真实值,这正是发生的情况。相比之下,Kprime表现不太好。计算为95%置信区间的区间不够宽,因此在8.8%的模拟中错过了真实值。99%的间隔同样不够宽,因此在4.8%的模拟中错过了真实值。因此,计算为99%区间的置信区间,实际上变成了95%区间。

这些模拟显示了选择适合Khalf的方程而非适合Kprime的方程的优势。Khalf具有对称分布性,因此从这些拟合中计算出的置信区间可按表面进行解读。相比之下,Kprime具有不对称分布性,其置信区间不能按表面解读。

不对称似然置信区间的覆盖

Prism7的一个新特性是可计算不对称似然置信区间。无论方程如何参数化,这些区间均具有相同的覆盖范围。Khalf的95%置信区间在10,000次模拟中只有5.3%没有包含真实值(25)。方程经过参数化以适应Kprime时,95%置信区间在10,000个模拟中的5.1%中没有包括真实值(1.9037)。

这证明了使用不对称置信区间的优势。无论您如何参数化方程,您均会得到有意义的置信区间。可选择与您对系统看法相匹配或易于解释的拟合参数化。您无需选择导致参数对称分布的参数化。

Hougaard偏度

以上结果均通过运行大量模拟获得。有一种更简单的方法来计算一项参数有多对称。Hougaards偏斜度可量化根据方程计算的每项参数的数据点数、X值的间距和参数值的不对称性。

对于模拟数据集,Hougaard偏斜度Khalf为0.09,Kprime为1.83。经验法则是,Hougaard偏斜度的绝对值大于0.25时,不对称会造成影响,而Hougaard偏斜度大于1.0时,不对称会造成大问题。所以Hougaard偏斜度告诉您,置信区间在您拟合Khalf,的时候是准确的,但在您拟合Kprime的时候就不那么准确了。

请注意,Hougaard偏斜度可报告为非线性回归结果的一部分(在“诊断”选项卡中选择),无需模拟。

最后一行

通常可用多种方式参数化模型。无论怎样,您均会得到相同的曲线,但选择一种最佳参数化可确保参数的置信区间是可信的。评估各种参数化的最佳方式是要求Prism报告每项参数的Hougaards偏斜度测量值。模拟需要更多的作用,但可让您看到一项参数有多对称。

用于此示例的文件 不对称CI文件

© 1995-2019 GraphPad Software, LLC. All rights reserved.