当前位置:
文档之家› 电力负荷预测第七章 回归分析预测法
电力负荷预测第七章 回归分析预测法
●预测区间 ——在一定的显著性水平上,依据数理统计方法计算出包含 预测未来真实值的某一区间范围,~。,即:
y 0 t (n 2)S 0 2
1 ( x 0 x) 2 S 0 1 Sy 2 n ( xi x) 2
Sy ˆ ˆ y a y b x y
第七章 回归分析预测法
一.概述 二.一元线性回归模型预测 三.多元线性回归模型预测 四.虚拟变量回归模型预测 五.非线性回归模型预测 六.自回归模型预测
教学要求
●清楚回归分析预测法的适用对象; ●清楚回归分析与相关分析的区别;
●掌握一元线性回归模型的参数估计与检验;
●了解多元线性回归模型的参数估计与检验; ●了解带虚拟变量的回归模型的应用条件; ●清楚非线性回归模型的建模方法;
线性 关系
Y X
● OLS估计
残差
ˆ E Y Y
ˆ Y XB
最小二乘法
Min{E ' E} Min{(Y Y ) '(Y Y )}
求导
EE (Y XB )(Y XB ) B B (Y Y 2Y BX ) XB XB B 2(Y ) 2( X ) B 0 X X
(4)检验相关系数的显著性
(5)预测 计算估计标准误差
三.多元线性回归预测模型 1.多元线性回归模型 2.多元线性回归模型的检验 3.预测区间 4.算例 5.采用excel的求解
1.多元线性回归模型——多个影响因素的影响问题
yi 1 2 xi 2 ...... imxim i
●相互联系——先相关分析,后回归分析。
相 关 分 析
判断关联关系
初级
回 归 分 析
可建模推算预测
高级
●相关分析是回归分析的基础;
●序列相关并不一定能建立回归模型;
4.相关分析与回归分析的作用
●对数量关系的研究分析,深入认识现象之间 的相互依存关系。 ●通过对回归模型,进行预测和预报。
●用于补充缺少的资料。
( yi y )
2
1
( yi yi)2 ˆ ( yi y )2
R——为可决系数的平方根,是一元线性方程中衡量两个
变量之间相关程度的重要指标。
( yi y ) 2 ˆ
i 2
R2
( y y) ( y y) ( x x)( y y ) ] ( x x) [ ( x x) ( y y) [ ( x x)( y y )] ( x x) ( y y )
2
2
为0, 证明(略)
2
( yi y i ) ( yi y ) 2 ( yi yi )( yi y ) ( yi y i ) 2 ( yi y ) 2 Q1 Q2
Q1 ( yi y i ) 2 剩余离差(或残差平方和) Q2 ( yi y ) 2 回归离差(或回归平方和)
●方法 ——相关系数检验法(适用于一元线性回归方程)
●问题描述 ——相关系数的绝对值大到什么程度时?才能认为两
变量之间的相关关系是显著的,回归模型用来预测是 有意义的。
●检测标准 ——与观测值的个数有关;(n) ——与不同树枝的显著性水平有关;(α )
●步骤
step1:计算R; Step2:由回归模型的自由度(n-2)和给定的显著性水平 α,从相关系数表中查出临界值Rα( n-2); Step3:判断。 若│R│ ≥ Rα( n-2),说明两变量之间线性相关
na b xi yi a xi b xi xi yi
2
ˆ n xiyi xi yi b n xi 2 ( xi ) 2
y b. x ˆ ˆ a
i
i
n
n
3.相关系数——选择主要因素作模型的自变量的依据
●离差平方和的分解
离差——在一元线性回归模型中,观察值yi的取值是上下波动的,
● │R│<0.3或 R2 <0.09
说明自变量对x的变动对总离差的影响低于9%。低度相关;
● 0.3 ≤ │R│<0.7
说明自变量对x的变动对总离差的影响在9%~50%之间。中度相关;
4.显著性检验
●目的 ——检查所建立的一元线性方程,是否符合变量之间
的客观规律性,两变量之间是否具有显著的线性相关 关系?
2 i
i i 2 i 2 i i i i 2 2 2 i i
[a bxi a bx ]2
2 2
b 2 ( xi x ) 2 ( yi y ) 2
yi y b xi x
R
ˆ ( x x )( y y ) (x x ) ( y y)
R=0
说明回归离差为0,即自变量x的变动对总离差毫无影响。零相关;
●
│R│ =1
说明回归离差等于总离差,即总离差的变化完全由自变量变化所引 起的。完全相关(退化成函数关系)
●
0< │R│ <1
说明自变量对x的变动对总离差有部分影响。普通相关;
● │R│ >0.7或 R2 >0.49
说明自变量对x的变动对总离差的影响占一半以上。高度相关;
这种波动现象,~。
原因——自变量变动的影响,即x取值的不同;
其它因素的影响(包括观察和实践中产生的误差等);
对1个观察值,离差为 yi y 2 对n个观察值,离差为 ( yi y ) 记Lyy ( yi y )2 为总离差
Lyy ( yi y )
2
[( yi y i ) ( y i y )]
离差项的物理含义:
Q1——由客观和实验中产生误差以及其它未加控制因素
引起的(未解释部分)。即:由那些未被考虑的
随机因素的影响产生的,且无法因回归方程的
建立而消失。
Q2——由于选择自变量x并建立线性回归方程而产生的,
可用回归模型的建立加以说明(已解释部分)
●可决系数R2
回归离差 R 总离差
y
趋势线
1978 x y 20 195
1979 20 210
1980 26 244
1981 35 264
1982 52 294
1983 56 314
1984 81 360
1985 131 432
1986 149 481
1987 163 567
1988 232 655
1989 202 704
解:
(1)绘制散点图; ˆ ˆ ˆ (2)建立一元线性回归模型 y 0 a bx 0 ; (3)计算回归系数
5.回归分析模型的种类
●自变量多少 : 一元与多元 ●模型线性性:
线性与非线性
●含虚拟变量:
普通回归与虚拟变量回归
(自变量为数量变量和品质变量)
●含滞后量:
无自回归、自回归
二. 一元线性回归预测模型
●定义: 对两个具有线性关系的变量,配合线性回归模型,根 据自变量的变动来预测因变量的平均发展趋势的方法,为 一元线性回归预测法。
2.相关关系的概念
●函数关系:严格的依存关系,有数学表达式。
●相关关系:非严格的,不确定的依存关系。
确定性问题 (函数关系)
不确定性问题 (相关关系)
相关关系的特点
●现象之间确定存在数量上的客观内在关系。
表现在:一个现象发生数量上的变化,要影响另一现象也相应
地发生数量上的变化。
●现象之间的依存关系不是确定的,具有一定的随机性。 表现在:给定自变量的一个数值,因变量晖有若干数值和它对
关系显著,检验通过,回归模型可用于预测;
若 │R│ < Rα( n-2),说明两变量之间线性相关 关系不显著,检验不通过,不能用于预测,需重新 加以处理;
5.预测值与预测区间
●预测值 ˆ ˆ ˆ ——在一元线性回归模型 y 0 a bx 0 中,代入给定的自变 ˆ 量x0,可求的一个对应的回归预测值 y 0 ,有时称之为 点估计值;
ˆ b--直线yi的斜率,表示自变量增加(或减少)一个单位,因 ˆ 变量yi的相应增加(或减少)多少; b>0,x与y正相关;b<0,x与y负相关;
2.OLS参数估计(Ordinary Least Square )
●基本思想:
通过数学模型,配合一条较为理想的趋势线, 使得 原序列的观察值与估计值的离差平方和为最小;
( yi yi ) 2 min ˆ
t 1
n
●推导
ˆ Q ( yi yi ) ( yi a bxi ) 2
2 t 1 t 1
n
n
n Q 2 ( yi a bxi ) 0 a t 1 n Q 2 ( yi a bxi ) xi 0 b t 1
总体 方差
yi:预测目标,由于受随机因素的影响,是一个以回归直 线上对应值为中心的正态随机变量,即y~N(a+bx, σ 2 );
ˆ yi a bxi
——为一组观察值(xi,yi)的 散点状态的估计式;
ˆ yi --yi的估计值,对应与每一个自变量xi , 都可得到一估计值;
ˆ a--直线yi 在y轴上的截距,它是xi =0时,yi的估计值;
ˆ B ( X ) 1 X X Y
矩阵求导, 参看线性代数
所以
2. 多元线性回归模型的检验(R、F、t、DW)
(1)R检验
——通过复相关系数检验一组自变量X1,X2,…,Xm变 与因变量y之间的线性相关程度的方法,~。也称复相 关系数检验法。