Please enable JavaScript to view this site.

Navigation: 回归原理 > 简单线性回归原理

比较线性回归与相关性

Scroll 前一页 Top 后一页 More

线性回归不同于相关性。

目的是什么?

线性回归能够找出根据X预测Y的最佳直线。

相关性量化两个变量的关联程度。相关性不能拟合通过数据点的直线。您只是在计算相关系数(r),该系数可告知您一个变量随另一个变量的变化。r为0.0时,无相关性。r为正值时,一个变量随另一个变量升高而升高。r为负值时,一个变量随另一个变量下降而升高。

哪种数据?

X为操纵的变量(时间、浓度等)时,通常使用线性回归。

测量两个变量时,几乎总会用到相关性。如果一个变量是您通过试验操纵的变量,则其很少适用。

哪个变量为X,哪个为Y,是否存在差异?

在回归中决定将哪个变量称为“X”,哪个变量称为“Y”很重要,因为如果这两个变量互换,将得到一条不同的最佳拟合线。根据X预测Y的最佳拟合线与根据Y预测X的最佳拟合线不同(然而,这两条线具有相同的R²值)。

通过相关性,您无需考虑因果关系。这两个变量中的哪一个为“X”,哪一称为“Y”并不重要。如果将两者互换,得到的相关系数相同。

假设

通过线性回归,X值可测量或X值可以为试验者控制的变量。不假设X值是从高斯分布中抽样。假设点到最佳拟合线的距离服从高斯分布,散点的SD与X或Y值无关。

相关系数本身只是描述两个变量如何一起变化的一种方式,因此可针对任何两个变量进行计算和解读。但进一步推理需另外假设X和Y均已测量(为区间或比率变量),两者均从高斯分布中抽样获得。这称为“二元高斯分布”。如果这些假设为真,则可解读r和P值的置信区间,r和P值能够检验零假设 - 两个变量之间实际上并无相关性(且您所观察到的任何相关性均为随机抽样的结果)。

各结果之间的关系

线性回归使用r²量化拟合优度,有时用大写字母R²表示。如果将相同数据放入相关性(这很不合适;见上文),则基于相关性的r²等于基于回归的r²。

相关性计算皮尔森相关系数-r的值,范围为-1到+1。

© 1995-2019 GraphPad Software, LLC. All rights reserved.