
图中显示的是飓风数量随时间变化的情况。左侧面板显示的是每年的飓风数量,跳动很大。为了更容易发现趋势,右图显示了滚动平均值。每年绘制的数值是当年飓风数量加上前八年飓风数量的平均值。这种平滑方法可以让你看到一个清晰的趋势。
但有一个问题。这些并非真实数据。相反,左侧面板中绘制的数值是随机选择的(来自泊松分布,均值为 10)。没有规律可循。每个值都是随机生成的,没有考虑之前(或之后)的值。
创建运行平均值的方法是,确保任何高值或低值的大幅随机变异性被放大,而年与年之间的变异性被弱化,从而给人一种趋势的印象。
您不应使用线性和非线性回归对滚动平均值数据进行模型拟合,或计算相关系数。任何此类结果都是无效的,而且会产生误导。问题在于,回归假设每个值都独立于其他值,但滚动平均值根本不是相互独立的。相反,每个值都是相邻值的一部分。
本示例改编自Briggs (2008)。