概述
同学们大家好,经过一个愉快但似乎有点格外漫长的寒假,大家是不是已经压抑不住心中的学习热情了呢?别急,小研从本周起即恢复每周推送,为依然还在持续的寒假带来满满的知识和干货,那么就让我们一起来看看本周的主角——ARIMA模型吧~
01
简介
ARMA移动平均自回归模型(Autoregressive Moving Average Model,简记ARIMA),是研究时间序列的重要方法,由自回归模型(AR模型)与移动平均模型(MA模型)为基础“混合”构成。常用于具有季节变动特征的销售量、市场规模的预测等。ARIMA模型相对ARMA模型,仅多了差分操作。
02
相关概念
(1)自回归模型(AR)
在时序分析中,描述时间序列{Xt}自身某一时刻和前p个时刻之间相互关系的模型称自回归模型,其形式为:
Xt = a1Xt-1 + a2Xt-2 + ... + apXt-p + εt
其中,aj 为参数,{εt} 为白噪声,它反映了所有其它随机因素的干扰,其中p为模型阶次,即Xt由前p个值决定。
(2)移动平均模型(MA)
它将时间序列{Xt}看成白噪声序列的线性组合,为什么误差能描述模型呢?假设某个值可通过之前N个值的平均值预测,稍作变化,即实际值可以通过前一值的预测值加误差得到.因此实际值可用多个误差值的累加来表示.其形式为:
Xt = μ + εt − θ1εt−1 − ⋯ − θqεt−q
(3)自回归移动平均模型(ARMA)
简单地说,AR模型是建立当前值和历史值之间的联系,MA模型是计算AR部分累积的误差。ARMA是两个维度的和。
(4)差分(ARIMA中的“I”)
差分是将数据进行移动之后与原数据进行比较得出的差异数据,这里的移动是指上移或者下移。简单的说,比如对某支股票的价格数据做一阶差分,就是将每日价格减去前一天的价格。差分之后,更容易去掉时间序列趋势,均值趋于0,有助于分析其它特征。
03
模型应用步骤
(1)做时序图观察基本的趋势和周期。
(2)分析平稳性、正态性、周期性,并对数据进行转换。
ARMA要求被分析的数据呈正态分布、平稳、零均值。平稳性一般是指:均值为常数,方差为常数,且自协方差为常数。比如说上升的趋势中,均值就不是常数;如果震荡幅度越来越大,则方差不是常数。
如果仅是均值非0的情况,可减去均值;如果趋势可用线性拟合,可以减去拟合后的趋势;另外还可以用差分,或者季节性差分的方法使之平稳;对于非正态分布,可使用对数处理。
(3)做自相关和偏自相关图,确定模型阶次,包括差分阶数d,自回归阶数p,以及移动平均阶数q(这就是ARIMA模型的三个重要参数)。
做图可通过常见统计软件实现,具体方法在此不赘述。观察图片,如果自相关系数拖尾(按指数形式或正弦形式有规律地衰减),偏自相关系数p阶截尾(在某个值后截止为0),则使用p阶的AR模型。如果自相关系数q阶截尾,偏自相关系数拖尾,则使用q阶的MA模型。如果自相关函数和偏自相关函数均拖尾,则使用ARMA模型,由于AR和MA相互影响,阶数需要从小到大逐步尝试。
(4)模型检验。
第一,用模型对训练数据做拟合,用观察或者计算误差的方式,查看二者差异,差异越小越好。
第二,残差的自相关函数应该没有可识别的结构。
第三,AIC信息准则,是衡量统计模型拟合优良性的一种标准,AIC值越小越好,AIC值也可通过常见统计软件获得。
以上即是本期对ARIMA模型的简介,感兴趣的小伙伴可以在网络上查找更多的资料进一步了解,也可以找一些数据和案例进行实践操作,这样有利于透彻掌握这些看似复杂的数理模型。疫情当前,沉迷学习的同时希望大家注意身体健康,做好疾病防控工作,健康充实开心地过完这个寒假,我们下期见~
| 文字:王铷州
| 美编:王铷州
| 责编:都欣
最后
以上就是闪闪黑夜为你收集整理的时间序列的截尾和拖尾_干货分享 | 时间序列回归预测模型——ARIMA的全部内容,希望文章能够帮你解决时间序列的截尾和拖尾_干货分享 | 时间序列回归预测模型——ARIMA所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复