相关性和线性回归不一样。 目的是什么? 相关性量化两个变量相关联的程度。相关性不能拟合通过数据点的直线。您只是在计算相关系数(r),该系数可告知您一个变量在另一个变量发生变化时产生的变化。r为0.0时,无相关性。r为正值时,变化趋势为一个变量随另一个变量上升而上升。r为负值时,变化趋势为一个变量随另一个变量下降而上升。 线性回归能够找出根据X预测Y的最佳直线。 哪种数据? 您测量两个变量时,几乎总会用到相关性。如果一个变量是您通过试验操纵的变量,它很少适用。 X是您操纵的变量(时间、浓度等)时,通常使用线性回归。 哪个变量是X,哪个是Y,是否有所不同? 通过相关性,您无需考虑因果关系。您把这两个变量中的哪一个称为“X”,哪一个称为“Y”,这并不重要。如果将两者互换,则将会得到相同的相关系数。 在回归中决定将哪个变量称为“X”,将哪个变量称为“Y”很重要,因为如果将这两个变量互换,您会得到一个不同的最佳拟合线。根据X预测Y的最佳拟合线与根据Y预测X的最佳拟合线不同(然而,这两条线具有相同的R²值)。 假设 相关系数本身只是描述两个变量如何一起变化的一种方式,因此可针对任何两个变量,进行计算和解读。然而,进一步推论需要额外的假设 - X和Y均为测量值(区间或比率变量),且均从高斯分布中抽样。称之为二元高斯分布。如果那些假设为真,则可解读r和P值的置信区间,r和P值能够检验零假设 - 两个变量之间实际没有相关性(且您所观察到的任何相关性均为随机抽样的结果)。 通过线性回归,X值可测量或X值可以是试验者控制的变量。不假设X值是从高斯分布中抽样。假设点到最佳拟合线的距离服从高斯分布,散点的SD与X或Y值无关。 各结果之间的关系 相关性计算Pearson相关系数r的值。其值范围从-1到+1。 线性回归使用r²量化拟合优度,有时用大写字母R²表示。如果您把相同数据放入相关性(这很不合适;参阅上文),则相关性r的平方等于回归分析得到的r² 。 |