预测原理和方法
响应变量y是作为两个以上预测变量的线性函数来建 y 模的。假设因变量y与自变量 y
x 1 , x 2 (k=2,3, , … , xk
4,…)之间有线性关系,一般多元线性回归模型为
y = β 0 + β 1 x1 + β 2 x 2 + … + β k xk+ u
其中β 0 , β 1 , β 2 , …, βk 是回归系数,u为随机误差项。
α = 0.3
α = 0.3
600 620 648 683 694 695 705 725 722 750
600 660 732 812 808 776 783 818 782 847
600 680 768 860 836 781 789 833 780 868
600 618 652 700 732 745 757 775 777 798
n
时间序列预测
Mt =
t − n +1
②计算二次移动平均值序列
Yt + Yt −1 + ⋯ + Yt − n +1 n
Yt +T = at + bt T ③进行预测 由右边的式子可以求得 a t 和 b t
at = 2Yt − M t 2(Yt − M t ) bt = n −1
Page 13
时间序列预测
对Q分别对a和b求微分:
i =1
i =1
n ∂Q = − 2 ∑ ( y i − a − bx i ) ∂a i =1 n ∂Q = − 2 ∑ (( y i − a − bx i ) * x i ) ∂b i =1
令微分方程为零(使总误差最小),解方程组得到a 和 b 的计算式
b = [∑( xi − x )( yi − y)] /[∑( xi − x ) 2 ]
工作年数x 年薪y(单位:1000美元) 3 30 8 57 9 64 13 72 3 36 100 6 43 11 59 21 90 1 20 16 83
解:给定以上数据,计算出
x = 9.1
y = 55.4
年
b=
将这些值代入最小二乘法的回归系数公式, 得到 (3−9.1)(30−554) +…+(16−9.1)(83−554) . .
i =1 i =1
n
n
a = y − bx 式中x, y分别是变量x,y的n个样本的平均值
Page 5
一元回归分析—— 最小二乘法 一元回归分析
例 表2.1给出了一组成对的数据。其中,x表示大学毕业后工作的年数,而y是对 应的年薪。这些二维数据可以用散点图,如图2.2所示。该图暗示两个变量之间存 在线性关系。用方程 y = a + bx 对年薪和工作年数之间的关系建模。
① 计算一次指数平滑值序列 ② 计算二次指数平滑值序列 ③ 进行预测
Yt = αYt + (1 − α )Yt −1
M t = αYt + (1 − α ) M t −1
Yt +T = at + bt T
at = 2Yt − M t
Page 15
α (Yt − M t ) bt = 1−α
时间序列预测
Page 7
多元回归分析
最小二乘法
对于多元线性回归模型,可以通过矩阵计算参数 β : 式中 β = {β0 , β1 , β2 ,⋯, βk },X 和Y是所给抽样数据集的输入和输出矩阵。识 差平方和 也可以用矩阵表示如下: 优化后得
Y = β ·X + U
SS E = (Y − βX )T (Y − βX )
最小二乘法
ˆ 对应于每一个 xi ,y i 是所给数据集的真实输出值,而 yi 是从模型中得出的 响应值。为了计算方便,以误差的平方和最小 误差的平方和最小为标准确定回归模型: 误差的平方和最小 n n 2 ˆ Q = ∑ ( y i − y i ) = ∑ ( y i − a − bx i ) 2
时间序列预测
平滑法预测——移动平均法 平滑法预测
1、基本思想 它是根据时间序列,逐项移动,依次计算包括一定项数的序列平均数,形成一个序 列平均数的时间序列。 2、基本计算步骤 ①计算第一次移动平均值序列。设移动间隔为n(1<n<t),则第t期的一次移动平均 数为 Y +Y +⋯+Y
Yt =
t
t −1
Page 11
时间序列预测
平滑法预测 如果序列中只含有随机成分,用平滑法进行预测比较合适。 主要有移动平动法和指数平滑法等。 此类方法是通过对时间序列进行平滑以消除其随机波动,因而称为平滑 法。 平滑法既可用于短期预测,也可以用于对时间序列进行平滑以描述序列 的趋势(包括线性趋势和非线性趋势)。
Page 12
季节多元回归模型 季节自回归模型 分解预测 线性趋势推测 非线性趋势推测 自回归模型预测
趋势预测方法
回归分析
定义:分析一个变量与其他一个或几个变量之间的相关关系 相关关系的 相关关系 统计方法就称为回归分析。 回归分析的步骤 统计方法 回归分析的步骤:
第一步 确定因变量 和影响因素 自变量) (自变量) 第二步 绘制散点图, 绘制散点图, 观察变量的 大致关系 第三步 求回归系数, 求回归系数, 并建立回归 模型
x1 = x ,
x2 = x 2, x3 = x 3 , x4 = x 4
情况下,高次多项式可以更好地变量之间的关系,此时先把 方程转换成线性方程,需要定义如下几个新变量: 代入原先的多项式方程,得到
y = c 0 + c1 x1 + c 2 x 2 + c3 x3 + c 4 x 4
多项式回归问题就转化为一个多元线性回归问题,这样就可 以用最小二乘法来解决问题。
2 2
80
薪 60
40 20 0 0 5 10 15 20 25 工作年数
(3−9.1) + …+(16−9.1) a =554−(3.5)(9.1)≈ 236 . .
最小二乘直线的方程估计为
Page 6
≈ 3.5
y = 23.6 + 3.5 x
多元回归分析
多元线性回归是直线回归 扩展 直线回归的扩展 多个预测变量。 直线回归 扩展,涉及多个 多个
Page 14
时间序列预测
平滑法预测——指数平滑法 平滑法预测
1、基本思想 用t期实际值 Y t与t期预测值 Ft的加权平均值作为第t+1期的预测值。该方 法是加权平均的一种特殊形式。通过加权平均而给最近的观察值以较大的 权数,而对于离现在较远的观察值则给予较小的权数,也就是更重视最近 的观察值。根据平滑次数的不同,有一次指数平滑,二次指数平滑及高次 指数平滑等。 2、二次指数平滑法的基本计算步骤
Sum=3.985
Hale Waihona Puke 季节指数(×1.0037) 1.0037)
0.7922
1.0424
1.2752
0.8902
由于计算过程不可避免误差,需要对计算出的季节变动平均数加以调整
Page 19
调整系数 = 4/3.985 = 1.0038
平滑法预测——指数平滑法 指数平滑法 平滑法预测
例 某企业的销售额的一次和二次指数平滑值
一次指数平滑值 月份 1 2 3 4 5 6 7 8 9 10
Page 16
二次指数平滑值
α = 0.4
实际销售额(万元) 600 800 900 1000 800 700 800 900 700 1000
α = 0.1
Page 17
时间序列预测
分解预测
例:根据啤酒生产 企业2000-2005年 各季度的销售量数 据,采用分解法预 测2000-2005年各 季度的啤酒销售量, 并预测2006年各季 度的啤酒销售量。
年/季度 2000-1 2 3 4 2001-1 2 3 4 2002-1 2 3 4 2003-1 2 3 4 2004-1 2 3 4 2005-1 2 3
Page 18
4
时间序列预测
分解预测
为计算各比值的平均值和季节指数,需要将上表的比值再按季度重新排列
年份
2000 2001 2002 2003 2004 2005 平均
季度
1 — — 0.8989 0.8056 0.7767 0.7205 0.7447 0.7892 2 — — 1.1014 1.0365 1.0000 1.0275 1.0269 1.0385 3 1.2082 1.2043 1.3029 1.3035 1.3333 — — 1.2704 4 0.8125 0.8602 0.9091 0.9397 0.9129 — — 0.8869
第五步 应用回归模 型对变量进 行预测
第四步 检验回归模型
Page 3
回归分析——一元回归分析 一元回归分析
一元线性回归是描述两个变量之间线性相关关系的最简单的 回归模型. 回归模型.
y
y = a + bx
其中,y的方差假定为常数;
a和 b
Page 4
都是回归系数.
0
散点图
x
一元回归分析—— 一元回归分析
时间序列预测 季节性预测——分解预测 季节性预测
1、基本思想 分解预测是先将时间序列的各个成份依次分解出来,然后再进行预测。采用分 解法进行预测时,需要先找出季节成分并将其从序列中分离出去,然后建立预 测模型再进行预测
Yt = Tt × S t × C t × I t
其中,趋势(T)、季节变动(S)、循环波动(C)和不规则波动(I) 2、基本计算步骤 第1步:确定并分离季节成分;计算季节指数。 第2步:建立预测模型并进行预测。 第3步:计算出最后的预测值;用预测值乘以的季节指数,得到最终的预测值。