Please enable JavaScript to view this site.

相关性和线性回归并不相同。

目的是什么?

相关性量化了两个变量的相关程度。相关性并不通过数据点拟合一条直线。您只是在计算相关系数 (r),它告诉您当一个变量发生变化时,另一个变量的变异性有多大。当 r 为 0.0 时,表示没有关系。当 r 为正值时,一个变异性会随着另一个变异性的上升而上升。当 r 为负值时,一个变异性会随着另一个变异性的下降而上升。

线性回归可以找到从 X 预测 Y 的最佳直线。

什么样的数据?

相关性几乎总是在测量两个变量时使用。当一个变量是您通过实验操作的变量时,很少使用相关性。

线性回归通常用于 X 变异性的情况(时间、浓度等)。

哪个变量是 X,哪个变量是 Y 重要吗?

使用相关性时,您不必考虑因果关系。两个变量中哪个是 "X",哪个是 "Y"并不重要。将两个变量对调,得到的相关系数是一样的。

在回归中,决定把哪个变量称为 "X",哪个变量称为 "Y"很重要,因为如果把这两个变量对调,就会得到不同的拟合优度线。从 X 预测 Y 的最佳拟合线与从 Y 预测 X 的拟合线并不相同(但这两条拟合线的R2 值相同)。

假设

相关系数本身只是描述两个变量如何共同变异性的一种方法,因此可以对任何两个变量进行计算和解读。然而,进一步的推论还需要一个额外的假设,即 X 和 Y 都是经过测量的(是区间变量或比率变量),并且都是从高斯分布中采样的。这就是所谓的二元高斯分布。如果这些假设成立,那么你就可以解读 r 的置信区间和检验两个变量之间确实不存在相关性的 P 值(你观察到的任何相关性都是随机抽样的结果)这一零假设。

在线性回归中,X 值可以是测量值,也可以是由实验者控制的变异性变量。不假定 X 值是从高斯分布中抽样得到的。假设各点与拟合优度线的距离服从高斯分布,散点的 SD 与 X 值或 Y 值无关。

结果之间的关系

相关性计算皮尔森相关系数 r 的值,其范围为-1 到+1。

线性回归用r2 量化拟合优度,有时大写显示为R2。如果将相同的数据放入相关性中(这很少合适;见上文),相关性中 r 的平方将等于回归中的r2

© 1995-2019 GraphPad Software, LLC. All rights reserved.