Please enable JavaScript to view this site.

关于R2

R2是什么量化

数值R2 可量化拟合优度。通过所有Y值的平均值将您的模型的拟合度与水平线的拟合度进行比较。

您可将R2 作为Y的总方差中由模型(方程)解释的部分。通过利用实验数据(和一个合理的模型),始终能够得到介于0.0-1.0之间的结果。

另一种思索R2的方式是实际值与预测Y值之间相关系数的平方。

R2值的范围是多少是否存在?

简单的答案即为R2通常是介于0.0和1.0之间的分数,无单位。但也有特殊情况:

R2 当曲线经过每个点时,等于1.00。但如果在同一X值时具有重复的Y值,则曲线不可能经过所有点,因此R2 必须小于1.00。

当R2 等于0.0时,最佳拟合曲线对数据的拟合度不得超过一条穿过所有Y值平均值的水平线。在此情况下,知道X值并不能帮助您预测Y值。

当您选择的模型实在不合适或施加的限制条件不实用(通常因失误所致)时,则最佳拟合曲线的拟合度将劣于水平线。在此情况下,2 R将为负数。是的,似乎有些奇怪,但R2 并非真正是任何数值的平方,因此这是有可能发生的。详情请见本页底部。

您可能会看到引用的R2 值可能大于1.0。仅当使用无效方程时,才会出现这种情况,因此该结果完全错误。

r2 或者R2?

按照传统,统计学家用大写字母(R)2表示非线性和多元回归的结果,用小写字母(r2)为线性回归的结果,但这是一种没有差异的对比。

为什么有人建议非线性回归2 不报告R?

Minitab报告非线性回归时不报告R2,因为其认为具有误导性。Kvalseth(1)也对其使用提出警告。相关问题包括:

在线性回归中,R2 将最佳拟合回归线与水平线的拟合度进行比较(强制将斜率设为0.0)。水平线是回归线中最简单的情况,因而具有一定意义。对于许多用于非线性回归的模型,水平线根本无法从模型中生成。因此,将所选模型的拟合度与水平线的拟合度进行比较在数学上并无多大意义。为此,SAS将该值称为“伪R2

虽然很想使用R2 比较备选模型的拟合度。但不应该这样做。调整后R² 更适合于该目的,但结果并不理想。Prism提供了两种更好的方法用于比较备选模型的拟合度。模型的选择必须评估权衡 - 复杂模型通常拟合度更高,但参数也会更多。Prism提供的两种方法均可评估此类权衡。R2 并不。R2 使用复杂模型时,几乎始终会变得更大,即使该模型不太可能正确无误。不要根据R选择模型2

两项参数数量相同的模型可采用AICc方法以完全不同的方式拟合数据,然后会反映出其中一个模型可能更加真实。但R2 数值可能仅在小数点后的第三位或第四位有所不同。

高R2 反映出该曲线非常接近于各点。但这并不意味着以其他方式进行拟合亦“合适”。关于参数的最佳拟合值可能毫无意义(例如,负比率常量),或者置信区间可能很宽。拟合度可能是模糊。您需要查看所有结果以评价拟合度,而不仅仅是R2

为什么Prism会报告非线性回归的R2

Prism进行计算并报告R2 默认。您可以在非线性回归对话框的诊断选项卡中关闭报告R的选项,2 然后将该偏好设置为未来拟合度的默认值。

许多人以此方式发现R2 有用:当您运行一系列实验时,您想要确保今天的实验与另外运行的实验相一致。例如,如果您总是得到介于0.90和0.95之间的R2 ,但今天您得到r2=0.75,则您应感到怀疑,并仔细查看该特定实验中使用的方法或试剂是否出现问题。此外,如果新员工使用同一系统 为您带来的结果显示R²为0.99,则应仔细查看剔除了多少“异常值”以及某些数据是否为虚构的。

我认为这实际上是R2唯一有用的方式,而且对于此目的而言可能十分有用。

如何计算R2 - 未加权的拟合度

R2 由非线性回归确定的最佳拟合曲线与各点距离的平方和经计算得出。该平方和数值又称为SSreg,其单位为Y轴的平方。如需将R2 转换为分数,使结果归一化为从水平线经过所有Y值平均值的各点距离的平方和。该值又称“SStot”。如果该曲线与数据的拟合度良好,则SSres将远小于SStot。

下图为R2的计算示意图。两幅图显示的是相同的数据和最佳拟合曲线。左图还显示了所有Y值平均值的水平线,以及显示各点与所有Y值平均值之间距离的垂直线。这些距离的平方和(SStot)等于62735。右图显示了各点与最佳拟合曲线的垂直距离。这些距离的平方和(SSres)等于4165。

R2 使用以下方程计算得出:

R2 =1.0 - (SSresiduals/SStotal)=1.0-4165/62735=0.9336

这是Kvalseth(1)的方法1。

如果您共享参数(执行全局非线性回归),则上式中的SSResiduals是Prism在拟合共享参数模型的全局结果列中报告的平方和,SSTotal是所有Y值平均值(来自所有数据集)周围每个Y值(来自每个数据集)的平方和。

如何计算R2 - 加权的拟合度

似乎缺乏一种既定的方法来计算加权非线性拟合的R2。Prism(自6.00起)的计算方法如下。但请注意,在早期版本的Prism中,R2 加权拟合的计算方法不同。

1.利用相对(1/Y2)拟合模型或Poisson(1/Y)或一般(1/XK)加权以计算加权平方和(wSSmodel)。这是您的模型残差的加权平方和。

2.记住各点得到的权重。

3.利用与步骤1中所使用各点相同的权重,将数据拟合至水平线模型(Y =平均值+0*X)。这是水平线残差的加权平方和(wSShorizontal)。

加权R2

1.0 - (wSSmodel/wSShorizontal)

请注意,权重仅在拟合模型时计算。Prism不会计算水平线拟合度的权重,而采用与拟合模型时完全相同的权重。从而确保两种拟合中权重总和相同。

为获得更多详细信息,Prism在Willett和Singer(2)中使用方程4。

R如何2 是否为负数?

数值的平方怎么会是负数?可以,R2 实际上并非是某数值的平方。通过减去两个数值计算得出。如果SSres大于SStot,R2将为负数(见上式)。

怎么会出现这种情况?SSres是各点与最佳拟合曲线(或线条)垂直距离的平方和。SStot是各点与在平均Y值处所绘制水平线垂直距离的平方和。当最佳拟合线或曲线对数据的拟合度劣于水平线时,SSres将大于SSot。

R2 当最佳拟合的直线或曲线对数据的拟合度不理想时,将为负数。仅当拟合模型选择不当(可能因失误所致)时,或者对模型应用毫无意义的限制条件时(可能在打算输入负数时意外输入正数),才会发生这种情况。例如,如果您将剂量反应曲线的Hill斜率限制为大于1.0,但曲线实际上呈下降趋势(因此Hill斜率为负数),您可能最终会得到一个负的R2值和无意义的参数值。

以下是一项简单的示例。蓝线是一条直线的拟合度,X=0时,限制Y轴的截距为Y=150。SSres是红点与该蓝线距离的平方和。SStot是红点与绿色水平线距离的平方和。由于SSres远大于SStot,因此R2 (对于蓝线的拟合度)为负数。

Prism文件

如果R2 为负数,请检查您选择的模型是否合适,并已正确设置任何限制条件。

 

 

1.Kvalseth,T.O. (1985)关于R²的注意事项。《美国统计学家》,39,279-285。

2.Willett,J.B.和Singer,J.D(1988)。关于R2的另一注意事项:其在加权最小二乘回归分析中的应用。《美国统计学家》42: 236.

 

 

© 1995-2019 GraphPad Software, LLC. All rights reserved.