第三章 一元线性回归
一元线性回归分析的对象是两个变量的单向因果关系,模型的核心是两变量线性函数,分析方法是回归分析。
一元线性回归是经典计量经济分析的基础。
第一节
一元线性回归模型
一、变量间的统计关系
社会经济现象之间的相互联系和制约是社会经济的普遍规律。
在一定的条件下,一些因素推动或制约另外一些与之联系的因素发生变化。
这种状况表明在经济现象的内部和外部联系中存在着一定的因果关系,人们往往利用这种因果关系来制定有关的经济政策,以指导、控制社会经济活动的发展。
而认识和掌握客观经济规律就要探求经济现象间经济变量的变化规律。
互有联系的经济变量之间的紧密程度各不相同,一种极端的情况是一个变量能完全决 定另一个变量的变化。
比如:工业企业的原材料消耗金额用y 表示,生产量用1x 表示,单位产量消耗用2x 表示,原材料价格用3x 表示,则有:123y x x x =。
这里,y 与123,,x x x ,是一种确定的函数关系。
然而,现实世界中,还有不少情况是两个变量之间有着密切的联系,但它们并没有密切到由一个可以完全确定另一个的程度。
例如:某种高档费品的销售量与城镇居民的收入;粮食产量与施肥量之间的关系;储蓄额与居民的收入密切相关。
从图示上可以大致看出这两种关系的区别:一种是对应点完全落到一条函数曲线上;另一种是并不完全落在曲线上,而有的点在曲线上,有的点在曲线的两边。
对于后者这种不能用精确的函数关系来描述的关系正是计量经济学研究的重要内容。
二、一元线性回归模型 1.模型的建立
一个例子,见教材66页:
总体回归模型:01i i i Y X ββε=++ 理解:(1)误差的随机性使得Y 和X 之间呈现一种随机的因果关系;(2)Y i 的取值由两部分组成,一类是系统内影响,一类是系统外影响。
样本回归直线:01i i Y X ββ=+
样本回归模型:01i i i Y X e ββ=++
2.模型的假设
(1) 误差项i ε的数学期望无论I 取什么值都是零。
(2) 误差项i ε的方差为常数2
σ
(3) 误差项i ε对于I 的取值不同,不相关。
(4) 解释变量X 是确定性的变量,而非随机变量。
(5) 误差项i ε服从正态分布。
第二节
参数估计
一、回归参数的最小二乘估计 ?怎么样才算拟合的较好呢
最小二乘法,得到正规方程组的一般形式,解出01,ββ
的值。
写出正规方程组的离差形式。
二、一个实例:
书上76页。
请同学上来做题。
课堂练习:我国税收预测模型。
如下表,列出了我国1985~1998年期间税收收入Y 和国内生产总值(GDP )X 的统计资料,试利用EVIEWS 软件求出一元线性回归直线的表达式,并对此表达式对以经济说明。
我国税收与GDP 统计资料 年份 税收 GDP 年份 税收 GDP 1985 1986 1987 1988 1989 1990 1991 2 041 2 091 2 140 2 391 2 727 2 822 2 990
8 964 10 201 11 963 14 928 16 909 18 548 21 618
1992 1993 1994 1995 1996 1997 1998
3 297
4 25
5 5 127
6 038 6 910 8 234 9 263
26 638 34 634 46 759 58 478 67 885 74 463 79 396
作业:
1、第103页1——4题。
2、下表列出了我国城镇居民家庭1998年平均每人全年消费性支出与可支配收入X 的统计资料,试利用EVIWES 软件,估计我国的城镇居民消费函数(一元线性)。
我国城镇居民家庭1998年收支状况 收入等级 人均消费支出Y 人均可支配收入X 困难户 最低收入户 低收入户 中等偏下户 中等收入户 中等偏上户 高收入户 最高收入户
2 214.47 2 397.60 2 979.27
3 503.2
4 4 179.64 4 980.88 6 003.21 7 593.95
2 198.88 2 476 375
3 303.17
4 107.26
5 118.99
6 370.59
7 877.69 10 962.16
3、下面给出的是A 企业在10年中总成本和产量水平的中间结果
777X ∑=,Y ∑=1 657,132938XY ∑=,270903X ∑=,2277119Y ∑= (1)试估计其线性成本函数0
1i i Y X ββ''=+(2)试表示平均可变成本、边际成本和平均总成本。
第三节 最小二乘估计量的性质
一、参数估计量的评价标准
1. 无偏性 2. 有效性 3. 一致性
二、高斯——马尔可夫定理及估计量的一致性证明
第四节 回归拟合度评价和决定系数
一、回归拟合度评价的意义
二、离差的分解和可决系数的计算
作业:
1、根据最小二乘原理,所估计的模型已经使得拟合误差达到最小,为什么还要讨论模型的拟合优度问题呢?
2、对于古典回归模型,证明: (1)01()i i E Y X ββ=+ (2)2()i D Y σ=
(3)(,)0()i j Cov Y Y i j =≠ 3、证明高斯-马尔可夫定理。
第五节
统计推断
一、被估参数的分布和标准化
2
112
22002
~[,
]
()~[,
]
()i i
i
i
i i
N X X X N n X X σββσββ--∑∑∑
可以构建标准化的随机变量。
二、被估参数的方差和相应统计量的构建 无偏估计:
222
i
i
e
S n =
-∑
进而对0ˆβ,1
ˆβ 构建自由度为(n-2)的t 统计量。
三、参数的置信区间和假设检验 1.1β的100(1-α)%的置信区间为: (1β -12
()t S αβ ,1β +12
()t S αβ
)
以上面的例子来计算01,ββ的置信区间。
2.模型参数的显著性检验,是检验模型参数是否明显异于0,是其中基本的一种假设检验。
第六节 回归方程的应用——预测和控制 一、点预测
二、点预测的性质
22
2
1()~(,[1])()
i I
X X Y N Y n X X σ***-++-∑ 这是进一步做预测分析的重要基础。
三、区间估计
2
t λ≤
一个实例:
如下表,列出了我国1985~1998年期间税收收入Y 和国内生产总值(GDP )X 的统计资料。
(单位:亿元人民币)
我国税收与GDP 统计资料 年份 税收 GDP 年份 税收 GDP 1985 1986 1987 1988 1989 1990 1991
2 041 2 091 2 140 2 391 2 727 2 822 2 990
8 964 10 201 11 963 14 928 16 909 18 548 21 618
1992 1993 1994 1995 1996 1997 1998
3 297
4 25
5 5 127
6 038 6 910 8 234 9 263
26 638 34 634 46 759 58 478 67 885 74 463 79 396
(1) 估算出税收收入与国内生产总值的函数表达式。
(2) 构建被估参数
0β,1β置信度为99%的置信区间。
(3) 对模型参数进行显著性检验。
显著性水平为5%。
(4) 假设1999年GDP 为82 310,对1999年税收收入做点预测和区间预测。
(置信度为
95%)
作业:1、第103页5~7题。
2、古典回归模型的基本假定有哪些?违背基本假定的模型是否就不可以估计了呢?
3、为什么要进行解释变量的显著性检验?
4、一元线性回归模型有时采用如下形式:
1i i i Y X βε=+ 模型中的截矩项为零,叫做过原点的回归模型。
试证这种模型中:
(1)12i i i
X Y X
β=
∑∑
(2)2
12
()i Var X σβ=∑。