时间序列模型及应用案例
通过分析折线图,可知,出口净值在在春季和秋季
最高,说明春季和秋季是旺季。 从走势来看,出口净值总体保持上升。
(4)参数配置
对于Microsoft时序算法有几个参数比较重要,需要单独配置,
这里我们介绍一下 PERIODICITY_HINT:该参数提供了有关数据模式重复频率的 算法信息。简单点讲就是时间序列的重复迭代时间间隔,比 如本篇文章中用到的时间轴就是为每个月更改一次,且周期 为年为单位,所以我们将这个参数设置成12,意思是每十二 个月重复一次。
了解时序模型的结构
时序模型具有表示该模型及其元数据的单一父节点。
根据用于创建该模型的算法的不同,在该父节点下面有 一个或两个时序树。
如果创建混合模型,则两个单独的树会添加到该模型中, 一个适用于 ARIMA 算法,另一个适用于 ARTxp 算法。 如果选择仅使用 ARTxp 算法和 ARIMA 算法中的一个, 则将拥有对应于所选算法的单个树。 可以通过设置 FORECAST_METHOD 参数来指定要使用的算法。
时序模型的数据要求
单个键时间列 每个模型都必须包含一个用作事例序列的数值
或日期列,该列定义了该模型将使用的时间段。 可预测列 每个模型都必须至少包含一个可预测列,算法将 根据这个可预测列生成时序模型。可预测列的数据类型必须 具有连续值。 可选序列键列 每个模型可包含一个附加的键列,该列包含 标识序列的唯一值。可选序列键列必须包含唯一值。
算法的原理
在 SQL Server 2008 中,Microsoft 时序算法同时使用 ARTxp 算
法和另一种算法 ARIMA。ARTXp 算法针对短期预测进行了优 化,因此可预测序列中下一个可能的值。ARIMA 算法针对长 期预测进行了优化。 默认情况下,Microsoft 时序算法在分析模式和进行预测时混 合使用这两种算法。该算法使用相同的数据为两个单独的模 型定型:一个模型采用 ARTxp 算法,另一个模型采用 ARIMA 算法。然后,该算法结合这两个模型的结果来产生可变数量 时间段的最佳预测。
时间序列模型
提纲
一.时序的基本概念
二.时序的构成
三.时序的预测 四.时序的应用
一.时序的基本概念
某种现象某一个统计指标
在不同时间上的各个数值,
按时间先后顺序排列而形
成的序列。
按照时间序列所 得的观测值
时序模型建立的目的是为了描述时间序
列中产生数据的随机机制与趋势,以此 模型来判断在某一时间或随机机制下会 发生的数据达到预测和控制的目的。时 间序列可分为平稳的时间序列和非平稳 的时间序列。
简而言之,要求分析数据序列必须含有时间序列,并且
序列值为连续,要求分析数据序列存在唯一标示值,其 实也就说传统意义上面的主键。
处理过程:
(1)新建解决方案,然后数据源,然后数据源视图
(2)预览数据,分析源数据结构内容 这里我们需要对要分析的数据进行分析,先看看里面有那些
内容,是不是满足时序算法的数据要求条件。 (3)新建挖掘结构 在选择数据挖掘技术时选择Microsoft时序
季节成份S
• 一年内的规则变化
不规则成分I
• 随机项/残差
乘法模型 • Y=T*S*C*I
加法模型 • Y=T+S+C+I
三.时序的预测
简单预测
• 简单算法 • 回归模型算法
包含趋势与 季节的预测 参数化的时 序预测
• 乘法模型
• • • •
AR模型---自我回归 MA模型---均值滑动 AR-MA混合模型 SARIMA—季节循环型时序模型
然后我们就需要部署、处理该挖掘模型了。然后下
一步我们进行结果分析。
上面的图就是Microsoft时序算法出来的结果图了,挖掘模型
查看器为这种算法提供了两个面板查看,一个是图表、另一 个是模型,下面我们将以此详细分析,平常最常用的就是图 表模型查看器,图标区分为两块,如上图,前半部分模型历 史分析数据,后面模糊区为推测区域,右侧一个序列筛选的 下拉选项框,从横轴中我们可以看到,图中的实线是输入的 历史数据,通过虚线区域可以观察到模型算法对未来时间线 的预测,以及它们的波动范围。
※
• 对序列的未来趋势做预测
※
• 分解序列的主要趋势成分,季节变化成分 • 对理论性模型与数据进行拟合度检验,以 讨论模型能够正确表示所观测的对象
※
二.时序的构成
趋势成份T
• 长期因素导致的变动,如人口的变动,技术的进步
周期成份C
• 连续观测值规则地落在趋势线的上方或者下方 • 超过一年的有规则的模型都属于时序的周期成分
四.时序的应用
Microsoft 时序算法提供了一些针对连续值(例 如一段时间内的产品销售额)预测进行了优化 的回归算法。虽然其他 Microsoft 算法(如决策 树)也能预测趋势,但是他们需要使用其他新 信息列作为输入才能进行预测,而时序模型则 不需要。时序模型仅根据用于创建该模型的原 始数据集就可以预测趋势。进行预测时还可以 向模型添加新数据,随后新数据会自动纳入趋 势分析范围内。