Pandas移动平均线

本文概述

  • 介绍
  • 总结
介绍 移动平均值(也称为滚动平均值或移动平均值)用于通过计算完整数据集不同子集的平均值来分析时间序列数据。由于它涉及对一段时间内的数据集取平均值, 因此也称为移动平均值(MM)或滚动平均值。
滚动平均的计算方法有很多种, 但一种方法是从完整的数字序列中提取固定的子集。通过对数字的第一个固定子集求平均值来计算第一个移动平均值, 然后通过向前移动到下一个固定子集(包括子组中的将来值, 同时从序列中排除前一个数字)来更改子集。
移动平均数通常与时间序列数据一起使用, 以捕获短期波动, 同时关注较长的趋势。
时间序列数据的一些例子可以是股票价格, 天气预报, 空气质量, 国内生产总值, 就业等。
【Pandas移动平均线】通常, 移动平均线使数据平滑。
移动平均值是许多算法的基础, 其中一种算法是自回归综合移动平均值模型(ARIMA), 它使用移动平均值进行时间序列数据预测。
有多种类型的移动平均线:
简单移动平均线(SMA):简单移动平均线(SMA)使用滑动窗口来获取设定时间段内的平均值。它是先前n个数据的均等加权平均值。
为了进一步理解SMA, 让我们举一个n值的序列为例:
Pandas移动平均线

文章图片
那么n个数据点的平均加权滚动平均值实质上就是前M个数据点的平均值, 其中M是滑动窗口的大小:
Pandas移动平均线

文章图片
同样, 为了计算后续的滚动平均值, 会将新值添加到总和中, 并且将删除先前的时间段值, 因为你具有先前时间段的平均值, 因此不需要每次都进行完全求和:
Pandas移动平均线

文章图片