数据点是独立的吗?
相关性假设任何随机因素只影响一个数据点,而不影响其他数据点。如果从一组受试者和另一组受试者中各选一半,就违反了这一假设。组间差异会影响一半受试者,而不会影响另一半。
X 和 Y 是独立测量的吗?
如果 X 和 Y 相互交织,则计算无效。如果将期中考试成绩与课程总成绩相关联,就违反了这一假设,因为期中考试成绩是总成绩的组成部分之一。
是否对 X 值进行了测量(而不是控制)?
如果控制了 X 值(如浓度、剂量或时间),则应计算线性回归而不是相关性。
协方差是线性的吗?
如果随着 X 值的增加,Y 值会增加到某一点,然后随着 X 值的进一步增加,Y 值会减 少,那么相关性分析就没有用了。您可能会得到一个较低的 r 值,即使这两个变量具有很强的相关性。相关系数只能量化线性协方差。
X 和 Y 是否按高斯分布分布?
要接受标准(皮尔逊)相关性的 P 值,X 值和 Y 值必须分别从服从高斯分布的人群中采样。斯皮尔曼非参数相关性则不做此假设。
|