该图显示了一段时间内飓风的数量。左侧窗格显示了每年飓风的数量,跳跃的幅度很大。为更容易发现趋势,右图显示了滚动平均值。每年绘制的数值是当年飓风数量加上前八年的平均值。通过这种平滑处理,您可看到明显的趋势。
但存在一个问题。这些不是真实的数据。取而代之的是,在左侧窗格中绘制的值是随机选择的(从泊松分布中,平均值为10)。不存在模式。每个值均是随机生成的,与之前(或之后)的值无关。
通过确保将任何大的随机波动放大到高值或低值,同时抑制年比变异,运行平均值的创建会产生趋势的印象。
不得使用线性或非线性回归将模型拟合到滚动平均数据,或计算相关系数。任何此类结果均将无效且具有误导性。问题是回归假设每个值均独立于其他值,但滚动平均值并不相互独立。相反,每个值均作为相邻值的一部分包含在内。
该示例改编自Briggs(2008)。