GraphPad Prism 10 Curve Fitting Guide - 对方程重新参数化

Zoom Window Out
Larger Text | Smaller Text
Hide Page Header
Show Expanding Text
Printable Version
Save Permalink URL

Navigation: 用 Prism10进行回归 > 使用 Prism 进行非线性回归 > 在 Prism 中输入用户定义的模型 > 输入用户定义方程时使用的语法

对方程重新参数化

Scroll Prev Top Next More

重新设置方程参数不会改变拟合优度曲线

您想将西格玛酶动力学数据拟合到一个标准模型中。但该模型有两种常用形式：

Y=Vmax*X^h/(Khalf^h + X^h)

Y=Vmax*X^h/(Kprime + X^h)

两者是等价的，Kprime 等于Khalfh，因此这两个拟合将生成完全相同的曲线，具有相同的平方和、相同的R2 和相同的自由度数。尽管这两个方程表达了相同的模型，但它们的写法不同。花哨的说法是它们的参数不同。

它们都拟合了 Vmax（推断出底物浓度非常高时的最大活性）和 h（Hill 斜率，描述曲线的陡峭程度）。但一个模型拟合的是 Khalf（获得最大速度一半所需的浓度），另一个模型拟合的是 Kprime（底物作用的一种更抽象的衡量标准）。

哪个模型更可取？

在两种模型中做出选择的一种方法是与其他教科书和论文进行比对，这样您的结果就可以很容易地与其他结果进行比较。另一种方法是选择适合自己思维方式的形式。就本示例而言，如果你喜欢图形化思维，就选择 Khalf。如果是机械思考，则选择 Kprime。

但是，选择可能不仅仅是一个方便和约定俗成的问题。模型的选择可以决定置信区间的准确性。请继续阅读以了解原因。

参数的分布并不总是对称的

模拟可以确定参数的对称性。我使用 Vmax=100、h=5、Kprime=25 和 SD 等于 7.5 的高斯散射模拟了西格玛酶动力学。X 值与上图相符，每个 X 处有三份 Y 值。利用 Prism 的蒙特卡洛分析，我重复模拟了 5000 次，将每条曲线拟合为两种形式的模型，并将 Kprime 和 Khalf 的拟合优度值列表，还计算了各自的偏斜度。

Khalf 的分布相当对称，看起来是高斯分布。因此，其偏斜度接近零。相比之下，Kprime 的分布则相当偏斜度。请注意，有几个模拟数据集的 Kprime 拟合优度值大于 100。偏斜度值（4.89）证实了一个显而易见的事实--分布远非对称。

对称渐近置信区间的覆盖范围

以前版本的 GraphPad Prism 和几乎所有非线性回归程序一样，都会计算拟合优度参数的置信区间，因此置信区间围绕拟合优度值对称。如果参数的不确定性确实是对称的，那么这些置信区间就可以按表面价值来解读。如果不确定性不对称，那么置信区间就不准确。

理想情况下，置信区间易于解读。一个 95% 的置信区间有 95% 的几率包含参数的真实值，有 5% 的几率缺失参数的真实值。在分析真实数据时，我们永远不知道真实参数的值，因此永远不知道区间是否包含它。但模拟数据时，我们知道参数的真实值，因此可以量化置信区间的覆盖范围。我设置了上述相同的模拟，将每个数据集拟合到两个方程中，并将每个置信区间是否包含真实参数值列表。该表显示了 5000 次模拟中置信区间不包括真实参数值的部分（Kprime 为 25，Khalf 为 1.9037）。

	"95% CI	"99% CI
理想	5.0%	1.0%
Kprime	8.8%	4.8%
Khalf	5.1%	1.0%

这些结果表明，鉴于 Khalf 的对称性（见上文），Khalf 表现良好。95% 的置信区间期望值在 5.0% 的模拟中缺失真实值。事实上，只有 5.1% 的情况会出现这种情况。同样，期望值为 99% 的置信区间会在 1.0% 的模拟中缺失真实值，事实也正是如此。相比之下，Kprime 的表现就没那么好了。计算出的 95% 置信区间不够宽，因此在 8.8% 的模拟中缺失了真实值。99% 置信区间同样不够宽，因此有 4.8% 的模拟结果缺失了真实值。因此，计算得出的置信区间为 99%，实际结果为 95%。

这些模拟显示了选择适合 Khalf 的方程而不是适合 Kprime 的方程的优势。Khalf 的分布是对称的，因此根据这些拟合值计算出的置信区间可以按表面值来解读。相比之下，Kprime 的分布不对称，其置信区间不能从表面价值来解读。

覆盖不对称似然置信区间

Prism 7 的一个新功能是可以计算不对称似然置信区间。无论方程如何参数化，这些区间都具有相同的覆盖率。在 10,000 次模拟中，Khalf 的 95% CI 仅有 5.3% 未包含真实值 (25)。当方程参数化以拟合 Kprime 时，在 10,000 次模拟中，有 5.1% 的 95% CI 未包含真实值 (1.9037)。

这说明了使用不对称置信区间的优势。无论你如何对方程进行参数化，都能得到有意义的置信区间。您可以选择符合您对系统的思考方式或易于解释的参数。您不必选择导致参数对称分布的参数化。

霍加偏斜度

上述结果是通过大量模拟计算得出的。还有一种更简单的方法来确定参数的对称性。Hougaards 偏斜度量化了每个参数的不对称性，由方程、数据点数量、X 值间距和参数值计算得出。

对于模拟数据集，Khalf 的霍加偏斜度为 0.09，Kprime 为 1.83。一个经验法则是，当 Hougaard 偏斜度的绝对值大于 0.25 时，期望值会因不对称性而出现问题，而当其值大于 1.0 时，则会出现大问题。因此，霍加偏斜度告诉你，当你拟合 Khalf 时，置信区间会很准确，但当你拟合 Kprime 时，置信区间就不那么准确了。

请注意，霍加偏斜度可以作为非线性回归结果的一部分进行报告（在 "诊断 "选项卡中选择）。无需进行模拟。

小结

模型通常可以通过多种方式进行参数化。无论哪种方式都会得到相同的曲线，但选择一种最佳参数化方式可以确保参数的置信区间是可信的。评估各种参数化的最佳方法是让 Prism 报告每个参数的霍加偏斜度测量值。模拟需要更多的工作，但可以让您看到参数的对称性。

本示例使用的文件不对称 CI 文件。

Please enable JavaScript to view this site.