•当两个变量一起变化时,统计学家称之为有许多协变量或相关性。
•相关系数r可以量化相关性的方向和大小。
•当测量两个变量(通常是X和Y)时,使用相关性。如果其中一个变量作为实验的一部分进行操纵或控制,则相关性不合适(X值通常符合此描述:例如,剂量反应实验中使用的特定浓度是控制值)。
•两个变量的值几乎总是实数(不是整数,不是类别,不是计数)。
•相关分析报告相关系数值。其不创建回归线。如果希望设定一条拟合度最佳的线,则选择 线性回归。
•注意,相关性与线性回归不同。 审查差异。 特别要注意的是,相关性分析不适合或绘制一条线。
•相关性计算相关系数及其置信区间。其值范围为-1(理想的逆相关关系;随着一个变量的值上升,另一个变量的值下降)至1(理想的正相关关系;随着一个变量的值上升,另一个变量的值也上升)。相关系数为零意味着两个变量的值之间完全不相关。
•此外,相关性分析还会报告一个P值,该值可用于检验零假设,即从两个变量之间不相关的总体中抽取数据(换言之,零假设是r=0)。
•Pearson和Spearman相关性的区别在于,只有假设两个变量值均取自具有高斯分布的群体,才能够解读Pearson相关性的置信区间和P值。Spearman修正并未做出此假设。
•如果变量只有两个可能值,则Pearson相关性的结果与点 - 双列相关的结果相同。