概述
时序预测规则
A. 时间序列规则
由过去推测未来,是典型的时间序列问题,如:支付数据、客流量数据、交通数据等,具有明显的周期性(周/月)。从预测的角度来说,周期性是核心,当数据呈周期性波动的时候,预测的核心任务就是准确的提取这种周期。
周期性因子分析非缺点是没有考虑节假日和突发事件等。
基于周期因子的时间序列预测
Step1:获得周期因子
法一:
- 数据除以周均值,得到一个比例
- 按列取中位数 ->得到一组鲁棒的周期因子
- 做预测的时候,只要将周期因子,乘以一个base,就可以做下一周的预测了
法二:
- 季节指数的计算方式
- 获得每日(工作日或周末)均值,再除以整体均值
Step2:预测
见法一2.1
优化:
- 针对周期因子的优化
- 按列取中位数是一种简单而有效的提取周期因子的方法。
- 中位数十分鲁棒,不受极端值的影响,但是中位数损失了很多信息。
- 实践中,可以在此基础上进一步优化,比如提取一个均值和一个中位数,然后将均值和中位数融合,融合的比例按照测试集的表现来确定,也可以根据与预测周的时间距离来赋予不同的权重。
- 针对base的优化
- 直接使用最后一周的数据作为base并不一定是最好的办法,也许最后三天或五天的均值能够更好的反映最新的情况,但是我们不能直接对最后三天的数值取均值(因为可能存在最后三天是周末的情况,这样取的base就会偏大或者偏小)。
- 需要去掉周期性因素后,再取均值,具体做法就是用最后三天的真实数据除以周期因子(即周期因子的中位数)。
- 这样再取最后三天数据的平均值作为base
https://www.jianshu.com/p/31e20f00c26f 时间序列规则法快速入门
B. 时间序列模型
a. 模型概述
-
时间序列的不同分类
时间序列是按照时间顺序排列的、随时间变化且相互关联的数据序列。时间序列根据所研究的依据不同,可有不同的分类:
- 按所研究的对象的多少分,有一元时间序列和多元时间序列
- 按时间的连续性可将时间序列分为离散时间序列和连续时间序列
- 按序列的统计性特征分,有平稳的时间序列和非平稳的时间序列。如果一个时间序列的概率分布与t无关,则称该序列为严格的(狭义的)平稳时间序列;如果序列的一、二阶距存在,而且对任意时刻t满足:
- 均值为常数
- 协方差为时间间隔T的函数。则称该序列为宽平稳时间序列,也叫广义平稳时间序列。我们以后所研究的时间序列主要是宽平稳时间序列
- 按时间序列的分布规律来分,有高斯型时间序列和非高斯型时间序列
-
确定性时间序列分析方法概述
时间序列预测技术就是通过对预测目标自身时间序列的处理,来研究其变化趋势。一个时间序列往往是以下几类变化形式的叠加或耦合。我们常认为一个时间序列可以分解为以下四大部分:
- 长期趋势变动。它是指时间序列朝着一定的方向持续上升或下降,或停留在某一水平上的倾向,它反映了客观事物的主要变化趋势。
- 季节变动
- 循环变动。通常是指周期为一年以上,由非季节因素引起的涨落起伏波形相似的波动。
- 不规则变动。通常它分为突然变动和随机变动
-
三种时间序列模型
如果在预测时间范围以内,无突然变动且随机变动的方差 较小,并且有理由认 为过去和现在的演变趋势将继续发展到未来时,可用一些经验方法进行预测。
https://blog.csdn.net/qq_29831163/article/details/89440215 时间序列模型 (一):模型概述
最后
以上就是简单刺猬为你收集整理的DW数据挖掘学习笔记-02时序预测规则及模型时序预测规则的全部内容,希望文章能够帮你解决DW数据挖掘学习笔记-02时序预测规则及模型时序预测规则所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复