Please enable JavaScript to view this site.

重新设置方程参数不会改变拟合优度曲线

您想将西格玛酶动力学数据拟合到一个标准模型中。但该模型有两种常用形式:

Y=Vmax*X^h/(Khalf^h + X^h) 

Y=Vmax*X^h/(Kprime + X^h) 

两者是等价的,Kprime 等于Khalfh,因此这两个拟合将生成完全相同的曲线,具有相同的平方和、相同的R2 和相同的自由度数。尽管这两个方程表达了相同的模型,但它们的写法不同。花哨的说法是它们的参数不同。

它们都拟合了 Vmax(推断出底物浓度非常高时的最大活性)和 h(Hill 斜率,描述曲线的陡峭程度)。但一个模型拟合的是 Khalf(获得最大速度一半所需的浓度),另一个模型拟合的是 Kprime(底物作用的一种更抽象的衡量标准)。

哪个模型更可取?

在两种模型中做出选择的一种方法是与其他教科书和论文进行比对,这样您的结果就可以很容易地与其他结果进行比较。另一种方法是选择适合自己思维方式的形式。就本示例而言,如果你喜欢图形化思维,就选择 Khalf。如果是机械思考,则选择 Kprime。

但是,选择可能不仅仅是一个方便和约定俗成的问题。模型的选择可以决定置信区间的准确性。请继续阅读以了解原因。

参数的分布并不总是对称的

模拟可以确定参数的对称性。我使用 Vmax=100、h=5、Kprime=25 和 SD 等于 7.5 的高斯散射模拟了西格玛酶动力学。X 值与上图相符,每个 X 处有三份 Y 值。利用 Prism 的蒙特卡洛分析,我重复模拟了 5000 次,将每条曲线拟合为两种形式的模型,并将 Kprime 和 Khalf 的拟合优度值列表,还计算了各自的偏斜度。

Khalf 的分布相当对称,看起来是高斯分布。因此,其偏斜度接近零。相比之下,Kprime 的分布则相当偏斜度。请注意,有几个模拟数据集的 Kprime 拟合优度值大于 100。偏斜度值(4.89)证实了一个显而易见的事实--分布远非对称。

对称渐近置信区间的覆盖范围

以前版本的 GraphPad Prism 和几乎所有非线性回归程序一样,都会计算拟合优度参数的置信区间,因此置信区间围绕拟合优度值对称。如果参数的不确定性确实是对称的,那么这些置信区间就可以按表面价值来解读。如果不确定性不对称,那么置信区间就不准确。

理想情况下,置信区间易于解读。一个 95% 的置信区间有 95% 的几率包含参数的真实值,有 5% 的几率缺失参数的真实值。在分析真实数据时,我们永远不知道真实参数的值,因此永远不知道区间是否包含它。但模拟数据时,我们知道参数的真实值,因此可以量化置信区间的覆盖范围。我设置了上述相同的模拟,将每个数据集拟合到两个方程中,并将每个置信区间是否包含真实参数值列表。该表显示了 5000 次模拟中置信区间不包括真实参数值的部分(Kprime 为 25,Khalf 为 1.9037)。


"95% CI

"99% CI

理想

5.0%

1.0%

Kprime

8.8%

4.8%

Khalf

5.1%

1.0%

这些结果表明,鉴于 Khalf 的对称性(见上文),Khalf 表现良好。95% 的置信区间期望值在 5.0% 的模拟中缺失真实值。事实上,只有 5.1% 的情况会出现这种情况。同样,期望值为 99% 的置信区间会在 1.0% 的模拟中缺失真实值,事实也正是如此。相比之下,Kprime 的表现就没那么好了。计算出的 95% 置信区间不够宽,因此在 8.8% 的模拟中缺失了真实值。99% 置信区间同样不够宽,因此有 4.8% 的模拟结果缺失了真实值。因此,计算得出的置信区间为 99%,实际结果为 95%。

这些模拟显示了选择适合 Khalf 的方程而不是适合 Kprime 的方程的优势。Khalf 的分布是对称的,因此根据这些拟合值计算出的置信区间可以按表面值来解读。相比之下,Kprime 的分布不对称,其置信区间不能从表面价值来解读。

覆盖不对称似然置信区间

Prism 7 的一个新功能是可以计算不对称似然置信区间。无论方程如何参数化,这些区间都具有相同的覆盖率。在 10,000 次模拟中,Khalf 的 95% CI 仅有 5.3% 未包含真实值 (25)。当方程参数化以拟合 Kprime 时,在 10,000 次模拟中,有 5.1% 的 95% CI 未包含真实值 (1.9037)。

这说明了使用不对称置信区间的优势。无论你如何对方程进行参数化,都能得到有意义的置信区间。您可以选择符合您对系统的思考方式或易于解释的参数。您不必选择导致参数对称分布的参数化。

霍加偏斜度

上述结果是通过大量模拟计算得出的。还有一种更简单的方法来确定参数的对称性。Hougaards 偏斜度量化了每个参数的不对称性,由方程、数据点数量、X 值间距和参数值计算得出。

对于模拟数据集,Khalf 的霍加偏斜度为 0.09,Kprime 为 1.83。一个经验法则是,当 Hougaard 偏斜度的绝对值大于 0.25 时,期望值会因不对称性而出现问题,而当其值大于 1.0 时,则会出现大问题。因此,霍加偏斜度告诉你,当你拟合 Khalf 时,置信区间会很准确,但当你拟合 Kprime 时,置信区间就不那么准确了。

请注意,霍加偏斜度可以作为非线性回归结果的一部分进行报告(在 "诊断 "选项卡中选择)。无需进行模拟。

小结

模型通常可以通过多种方式进行参数化。无论哪种方式都会得到相同的曲线,但选择一种最佳参数化方式可以确保参数的置信区间是可信的。评估各种参数化的最佳方法是让 Prism 报告每个参数的霍加偏斜度测量值。模拟需要更多的工作,但可以让您看到参数的对称性。

本示例使用的文件 不对称 CI 文件。 

© 1995-2019 GraphPad Software, LLC. All rights reserved.