一些程序会报告一个卡方值和非线性回归结果。Prism不会。本页解释了卡方值的用处,以及为什么我们不报告。
非线性回归使得数据点和曲线之间的垂直距离的平方和最小化。但如何解读平方和(缩写为SS)?您解释不了,因为其取决于收集的数据点数量和用来表示Y值的单位
卡方检验方法是将观察到的曲线周围散布的点与您期望看到的基于理论的实验散点的数量进行比较。这是通过使用以下方程计算卡方来实现的:
卡方检验是点到曲线的距离除以该点在X值处的预测标准偏差之比率的平方和。请注意,分母是预测标准偏差,而非在该特定实验中计算的实际标准偏差。
如果您知道所有X值的SD均相同,这就简化为:
SD值必须从大量数据中计算出来,这样SD才会非常准确。或者,更好的是,SD可基于理论得出。
如果您假设重复值根据您输入的SD遵循高斯分布,且将数据拟合到正确的模型,则根据该方程计算的卡方值将遵循已知的卡方分布。这种分布取决于自由度的数量,自由度等于数据点的数量减去参数的数量。已知卡方值和自由度,即可计算出P值。
如果P值很小,您如何解读?如果您非常确定散点确实遵循高斯分布,且预测SD是正确的,P值很小表示所选模型不正确 - 曲线并未很好地拟合数据。您应找一个更好的模型。
但通常P值较低只是在告诉您所预测SD不像您想象的那么好。很难精确确定SD值,因此很难解读卡方值。由于该原因,Prism没有尝试卡方计算。我们担心卡方计算的误导作用大于其帮助作用。
我们设计了几种方法,来回答SS是否过高的问题:
•R可用平方和的值来计算2。该值是通过比较平方和(曲线周围点的分散程度)和Y值的总变差(忽略X值,忽略模型)来计算的。您所期望的2 R值为多少?一个值有多低才算过低?您无法笼统地回答该问题,因为答案取决于您的实验系统。
•如果已收集对应各X值的重复Y值,可将SS值与根据重复值之间的分散度预测的值进行比较。Prism将此称为“重复值检验”。这是非常有用的,但前提是您收集了对应各x值的重复Y值
•可采用替代模型,并将它们与数据的拟合情况进行比较
卡方将数据和曲线之间的实际差距与基于重复值之间的已知SD的预期差距(假设所选模型正确)进行比较。如果差距很大,证明模型错误。卡方计算的优势在于,其可检验一个模型是否适用,无需拟定替代模型,也不必有重复值。缺点是计算依赖于需要足够精确地已知SD,但这通常不现实。
推荐的替代选择是比较两种模型的拟合情况,或者选择使用重复值检验。