下面这四幅图是安斯康姆(1)绘制的,用来说明观察数据的重要性。这四组数据,也就是安斯康姆的四重奏,都有 11 个点。一眼就能看出,这些数据大相径庭。令人惊讶的是,对这四组数据的分析在很多方面是相同的。在进行线性回归分析时,四幅图的所有这些值都是相同的:
•X 和 Y 的平均值
•斜率和截距
•r2
•斜率和截距的标准误差和置信区间
•残差(sy.x)的标准偏差
•检验斜率确实为 0.0(水平)这一零假设时的 F 比值和 P 值。
•斜率和截距之间的协方差(由 Prism 的非线性回归分析计算得出)

线性回归中出现的差异是
•下图黄色显示的置信带在四幅图中有三幅是相同的,但在第四幅图中有所不同(第四幅图的 X 值不同)
•游程检验线性的结果
•残差的正态性检验
1.F.J. Anscombe,《统计分析中的图形》,《美国统计学家》,27(1973 年 2 月),17-21 页。