Please enable JavaScript to view this site.

r2的含义

r2值是介于 0.0 和 1.0 之间的分数,没有单位。r2值为 0.0 意味着了解 X 并不能帮助预测 Y,X 和 Y 之间不存在线性关系,拟合优度线是一条穿过所有 Y 值平均值的水平线。当r2等于 1.0 时,所有点都正好位于一条直线上,没有散点。了解了 X,就能完美预测 Y。

如何计算r2

本图展示了 Prism 如何计算r2

左侧面板显示的是拟合优度线性回归线,该线使各点与直线的垂直距离平方和最小。这些垂直距离也显示在图的左侧面板中。在本示例中,这些距离的平方和(SSreg)等于 0.86。其单位是 Y 轴平方的单位。要使用这个值来衡量拟合优度,就必须将其与其他值进行比较。

图的右半部分显示了零假设 -- 一条通过所有 Y 值平均值的水平线。该模型的拟合优度(SStot)也是根据各点与直线垂直距离的平方和计算得出的,本示例中为 4.907。两个平方和的比值将回归模型与零假设模型进行比较。计算r2的方程如图所示。本示例中r2为 0.8428。回归模型比零假设更适合数据,所以 SSreg 比 SStot 小很多,r2接近 1.0。如果回归模型并不比零假设好得多,r2就会接近零。

您可以将r2视为 X 变量 "解释 "的 Y 总方差的一部分。换句话说,r2是 X 和 Y 之间共享的变异部分。

在本示例中,线性回归模型 "解释 "了 Y 总变异的 84%。线性回归模型的数据方差(SS)只相当于 Y 值总方差(SStot)的 16%。

r2有什么用?

很多人都发现r2有这样的作用:当您进行一系列实验时,您希望确保今天的实验与其他实验是一致的。本示例中,如果你总是得到 0.90 到 0.95 之间的r2,但今天却得到了 r2=0.75,那么你就应该起疑心,仔细观察该实验所使用的方法或试剂是否出了问题。如果新员工带来的结果显示使用同一系统的r2为 0.99,那么你就应该仔细查看有多少 "异常值 "被剔除,以及是否有一些数据是编造的。

为什么 Prism 在约束线性回归中不报告r2

如果强制直线通过原点(或任何其他点),Prism 不会报告r2,因为计算结果会含糊不清。当回归线受到约束时,有两种方法可以计算r2。如上一节所述,r2是通过比较回归线的平方和与零假设所定义模型的平方和来计算的。对于约束回归,有两种可能的零假设。一个是通过所有 Y 值平均值的水平线。但这条线并不符合约束条件--它不经过原点。另一个零假设是一条通过原点的水平线,远离大部分数据。

由于r2在约束线性回归中是模糊的,Prism 不会报告它。如果您真的想知道r2 值,可以使用非线性回归将数据拟合到方程 Y=斜率*X。Prism 将报告第一种方法定义的r2(比较回归平方和与 Y 均方值水平线的平方和)。

大写还是小写?

对于线性回归,通常使用缩写r2。对于非线性回归,习惯使用R2。这种区分似乎没有理由。

© 1995-2019 GraphPad Software, LLC. All rights reserved.