当前位置:文档之家› 第三章 回归分析预测方法

第三章 回归分析预测方法


ˆ b0 b1x y

其中, b0是估计的回归直线在y轴上的截距,b1是直线的 斜率。
二、参数b0和b1的最小二乘估计

对例3-1中两个变量的数据进行线性回归, 就是要找到一条直线来适当地代表图中的那 些点的趋势。 用数据寻找一条直线的过程也叫做拟合 一条直线。

1200 1000 800 600 400 200 0
回本章目录
一、一元线性回归模型


一元线性回归(Linear regression),只研究一个 自变量与一个因变量之间的统计关系。 对于只涉及一个自变量的简单线性回归模型可表 示为:
y b0 b1 x e

其中,b0和b1称为模型的参数;e是随机误差项, 又称随机干扰项,有 2
e
N 0,
b 1:
b1
n xy x y n x ( x )
2 2
,
b0
y x b n
1
n
例3-2:已知某种商品的销售量同居民的可支配 收入有关,现有如下表的统计数据,试建立回归 方程,并求出相应参数的最小二乘估计值。
年份
实际可支配 收入 x(单 位:10元) 522
539
三、回归模型的种类



(1)根据自变量的多少,回归模型可以分为一元回归模 型和多元回归模型。 (2)根据模型中自变量与因变量之间是否线性,可以分 为线性回归模型和非线性回归模型。 (3)根据回归模型是否带有虚拟变量,回归模型可以分 为普通回归模型和带虚拟变量的回归模型。
应用回归分析预测需满足条件:
商品的销售 量(单位: 件) 6700
7136
年份
实际可支配 收入x(单 位:10元) 741
769
商品的销 售量(单 位:件) 8158
8683
1983
1984
1991
1992
1985
1986 1987 1988 1989 1990
577
613 644 670 695 713
7658
7784 8108 7583 8002 8442
2 3 4 5 6 7 8 9 10
厂家 1
投入
产出
20
30
40
60
20
40
30
60
10
30
10
40
20
40
20
50
20
30
30
70
3、回归分析的基本思路

回归分析是研究某一随机变量(因变量)与其 他一个或几个普通变量(自变量)之间的数量变 动的关系。其基本思路是:从一组样本数据出 发,确定变量之间的数学关系式,对这些关系 式的可信程度进行各种统计检验,并从影响某 一特定变量的诸多变量中找出哪些变量的影响 显著,哪些不显著。然后利用所求的关系式, 根据一个或几个变量的取值来预测或控制另一 个特定变量的取值,并给出这种预测或控制的 精确程度。
0
-3
2
4
6
8
-2
-1
0 x
1
2
3
(a)
(b)
2
1
0
y
-1
y
-1
0
1
2
正相关
-2 -1 x 0 1 2
-2
不相关
-3
-2
-1 x
0
1
2
(c)
-2
(d)
2
1
y
0
y
-1
2
4
6
8
相关但无 线性关系
-3 -2 -1 0 x 1 2 3
-2
-2
-1
0 x
1
2
负相关
0
2、回归分析与相关分析
研究和测度两个或两个以上变量之间关系的方 法有回归分析和相关分析。
最小二乘法

离差与离差平方
ˆt 离差:et yt y
ˆt ) 0 离差和: et ( yt y
t 1 t 1 n n
12
y6
10 8
e
ˆt ) 2 离差平方和 ei ( yt y
2 t 1 t 1
n
n
ˆ6 y
6
e
最小 拟合程度最好
4 2
0 1 2 3 4 5 6 7
最小二乘原理
Hale Waihona Puke 简单讲,使历史数据到拟合直线上的离差平方和最小,从而 求得模型参数的方法。
法国数学家勒让德于1806年首次发表最小二乘理论。事实上, 德国的高斯于1794年已经应用这一理论推算了谷神星的轨道, 但迟至1809年才正式发表。 最小二乘法也是数理统计中一种常用的方法,在工业技术和 其他科学研究中有广泛应用。
第一节 引言
本章学习目的与要求:
通过本章的学习,了解回归分析预测法 的概念,掌握回归分析中各系数的计算方法 及回归预测方法,能够运用Excel工具来进行 预测。
回本章目录
案例:

有20户家庭,冬天 的取暖费用与3个因素 有关:日间户外的平均 温度,阁楼绝缘层的厚 度,以及炉子的使用年 数。如果某一家庭的平 均户外温度是F30度, 阁楼绝缘层的厚度为5 英寸,炉子已使用过10 年,它的冬天取暖费用 为多少?



设有两个变量x和y,y与x一起变化并完全依 赖于x,当x取某个数值时,y依确定的关系取 相应的值,则称y是x的函数,记作y=f(x)。 如,企业的原材料消耗金额y与产量x1、单位 产量消耗x2、原材料价格x3之间的关系可表示 为y=x1x2x3。例:圆面积对于半径的依存关 系,正方形的面积对于边长的依存关系等等。 变量间的函数关系是一一对应的确定关系。
1993
1994 1995 1996 1997 1998
801
855 842 860 890 920
9317
9675 8542 8584 9612 9719
第一步:绘制散点图
10000 9500
二、回归分析和相关分析


1、变量之间的关系 现实世界中,每一事物都与它周围的事 物相互联系、相互影响,反映客观事物运动 的各种变量之间也就存在着一定的关系。变 量之间的关系可以分成两类:函数关系和相 关关系。
(1)函数关系。函数关系反映客观事物之 间存在着严格的依存关系,是一种确定 性关系,亦即当其它条件不变时,对于 某一自变量或几个自变量的每一数值, 都有因变量的一个的确定值与之相对应, 并且这种关系可以用一个确定的数学表 达式反映出来。
相关分析 事物之间相互依存关系的两个不可分割的方面。在 联 实际工作中,一般先进行相关分析,由相关系数的 大小决定是否需要进行回归分析。在相关分析的基 系 回归分析 础上建立回归模型,以便进行推算、预测。

相关分析
相关关系 完全相关(R=±1) (即线性相关) 正相关 负相关
线性相关
非线性相关
不相关(R=0)
正相关
负相关

相关系数——对变量之间关系密切程度的度量
r

( x x )( y y ) ( x x ) * ( y ) ( y )
i i 2 2 i i i
2
完全相关 /完全正相关 /完全负相关 /不存在线性相关关 系 /负相关 /正相关 一般,︱r︱>0.7为高度相关;︱r︱<0.3为低度相关; 0.3< ︱r︱<0.7 为中度相关。




设简单线性回归模型 y b0 b1 x e 中, b0和b1是b0和b1 的估计值。则y的估计值用 y ˆ b0 b1x 表示。 我们要求出这样的待估参数b0和b1,使因变量的观察值与估 计值之间的离差平方和达到最小,即使 2 2 Q yi y e i2 yi b0 b1 x 极小。为此,分别 求Q对b0和b1的偏导,就可以求出符合要求的待估参数b0和
(2)相关关系
相关关系。反映事物之间的非严格、不确定的线性依存
关系。有两个显著的特点: ①事物之间在数量上确实存在一定的内在联系。表现在一 个变量发生数量上的变化,要影响另一个变量也相应地 发生数量上的变化。 例: 劳动生产率 成本 ②事物之间的数量依存关系不是确定的,具有一定的随机 性。表现在给定自变量一个数值,因变量会有若干个数 值和它对应,并且因变量总是遵循一定规律围绕这些数 值平均数上下波动。其原因是影响因变量发生变化的因 素不止一个。 例:影响工业总产值的因素除了职工数外,还有固定资产 原值、流动资金和能耗等因素。
相关分析。研究两个或两个以上随机变量之
间线性依存关系的紧密程度。通常用相关系 数表示,多元相关时用复相关系数表示。
回归分析。研究某一随机变量(因变量)与
其他一个或几个普通变量(自变量)之间的 数量变动的关系。
相关分析 研究变量都是随机变量,不分自变量与因变量
区 别
回归分析
明确的自变量和因变量,自变量是确定的普通变量, 因变量是随机变量。
例如:
施肥量
农作物亩产量 降雨量 气温

在研究某一社会经济现象的发展变化 规律时,经过分析可以找到影响这一现 象变化的原因。在回归分析中,把某一 现象称为因变量,它是预测的对象,把 引起这一现象变化的因素称为自变量, 它是引起这一现象变化的原因。而因变 量则反映了自变量变化的结果。

回归分析预测方法就是从各种经济 现象之间的相互关系出发,通过对与预 测对象有联系的现象变动趋势的分析, 推算预测对象未来状态数量表现的一种 预测方法。
1.数据量不能太少(以多于20个较好); 2.预测对象与影响因素之间必须存在相关关系;
第二节 一元线性回归预测法
相关主题