Please enable JavaScript to view this site.

相关性和线性回归不一样。

目的是什么?

相关性量化两个变量相关联的程度。相关性不能拟合通过数据点的直线。您只是在计算相关系数(r),该系数可告知您一个变量在另一个变量发生变化时产生的变化。r为0.0时,无相关性。r为正值时,变化趋势为一个变量随另一个变量上升而上升。r为负值时,变化趋势为一个变量随另一个变量下降而上升。

线性回归能够找出根据X预测Y的最佳直线。

哪种数据?

您测量两个变量时,几乎总会用到相关性。如果一个变量是您通过试验操纵的变量,它很少适用。

X是您操纵的变量(时间、浓度等)时,通常使用线性回归。

哪个变量是X,哪个是Y,是否有所不同?

通过相关性,您无需考虑因果关系。您把这两个变量中的哪一个称为“X”,哪一个称为“Y”,这并不重要。如果将两者互换,则将会得到相同的相关系数。

在回归中决定将哪个变量称为“X”,将哪个变量称为“Y”很重要,因为如果将这两个变量互换,您会得到一条不同的最佳拟合线。根据X预测Y的最佳拟合线与根据Y预测X的最佳拟合线不同(然而,这两条线具有相同的R²)。

假设

相关系数本身只是描述两个变量如何一起变化的一种方式,因此可针对任何两个变量,进行计算和解读。然而,进一步推论需要额外的假设 - X和Y均为测量值(区间或比率变量),且均从高斯分布中抽样。其称为“二元高斯分布”。如果这些假设为真,则可解读r和P值的置信区间,r和P值能够检验零假设 - 两个变量之间实际上并无相关性(且您所观察到的任何相关性均为随机抽样的结果)。

通过线性回归,X值可测量或X值可以是试验者控制的变量。不假设X值是从高斯分布中抽样。假设点到最佳拟合线的距离服从高斯分布,散点的SD与X或Y值无关。

各结果之间的关系

相关性计算Pearson相关系数r的值,范围从-1到+1。

线性回归使用r²量化拟合优度,有时用大写字母R²表示。如果您将同样的数据放入相关性(这很不合适;参阅上文),则基于相关性的r²等于基于回归的r²。

© 1995-2019 GraphPad Software, LLC. All rights reserved.