当前位置:
文档之家› 第3章(一元线性回归模型)3 (1)
第3章(一元线性回归模型)3 (1)
地 区 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 城市居民家庭 平均每人每年 消费支出(元) 城市居民人均年 i 可支配收入 (0 元) 城市居民人均年 Y ui (3.1.13) 地 区i 均每人每年消费 1X 可支配收入(元) 城市居民家庭平 支出(元)
16460.26 13422.47 9086.73 8806.55 10828.62 11231.48 9729.05 8622.97 19397.89 11977.55 15158.3 9524.04 12501.12 8717.37 图3.1.1 11006.61 8837.46 24724.89 9477.51 湖 北 19422.53 9945.52 湖 南 i 13441.09 15527.97 广 东 13119.05 9627.4 广 西 14432.55 9408.48 海 南 14392.69 11146.8 重 庆 i i 12829.45 9679.14 四 川 11581.28 8349.21 贵 州 26674.9 9076.61 云 南 18679.52 8323.54 西 藏 1 22726.66 9772.07 陕 西 12990.35 8308.62 甘 肃 17961.45 8192.56 青 海 12866.44 9558.29 宁 夏 样本数据的散点图和样本回归直线 16305.41 8669.36 新 疆 13231.11
i j , i, j 1, 2,
,N
以上这些对随机扰 动项的假定是由德国数 学家高斯(Gauss)最 早提出的,也称为线性 回归模型的经典假定或 高斯假定,满足上述假 定的线性回归模型,称 为经典线性回归模型
(3.1.5)
《计量经济学》,王少平、杨继生、欧阳志刚主编
二、普通最小二乘法(OLS)
《计量经济学》,王少平、杨继生、欧阳志刚主编
ˆ) E ( i i
即
ˆ ,E ˆ E 0 0 1 1
《计量经济学》,王少平、杨继生、欧阳志刚主编
高斯-马尔可夫定理
由以上分析可以看出,普通最小二乘估计量(ordinary least squares estimators)在经典假定下具有线性性、无偏性 和最小方差性等性质,称具有这些性质的估计量为最优线性无 偏估计量( best linear unbiased estimator ,BLUE)。
3.2.1
《计量经济学》,王少平、杨继生、欧阳志刚主编
一、总离差平方和的分解
已知由一组样本观测值 ( X i , Yi ) (i 1, 2, ˆ ˆX ˆ Y i 0 1 i
, N ) 得到如下样本回归直线:
(3.2.1)
Y的第 i 个观测值与样本均值的离差 yi Yi Y 可分解为两部分之和
假定4:零均值假定
假定5:同方差假定
E (ui | X i ) 0,
i 1, 2,
,N
假定6:无自相关假定
(3.1.3)
即
Var (ui | X i ) E[ui E (ui | X i )]2 E (ui 2 ) 2
i 1, 2, , N
(3.1.4)
即
Cov(ui , u j ) 0
第三章 一元线性回归模型
§3.1 §3.2 §3.3 一元线性回归模型参数的估计 拟合优度 回归参数的区间估计和假设检验
§3.4 § 3.5
例子:中国消费函数 对最小二乘估计量统计性质的直观认识---蒙特卡洛模拟
本章小结
《计量经济学》,王少平、杨继生、欧阳志刚主编
§3.1 一元线性回归模型参数的估计
i
2 i 2 i 2 i 2 i
x y (X
i i
i
X )(Yi Y ) 1 X i Yi N
X iYi
(3.1.11)
于是,估计量(3.1.9)可以表示为离差形式: ˆ x y x (3.1.12)
i i 1
ˆ ˆ 0 Y 1 X
其中 Y为 13152.86 i 13821.16 城市居民家庭平均每人每年消费支出;X 为城市居民人均 19732.86 年可支配收入。使用这组样本数据,对(3.1.13)做最小二乘 14146.04 12607.84 估计,结果为 14367.55 ˆ 725.3459+0.6647X (3.1.14 Y ) 12633.38
Cov( X i , ui ) E[ui E (ui )][ X i E ( X i )] 0
i 1, 2, , N
(3.1.2)
即模型对变量和函数形式没有设定偏误, 它的确切含义将在第5章中讨论。 《计量经济学》,王少平、杨继生、欧阳志刚主编
2、对随机扰动项的假定
即在给定解释变量的条件下,随机扰动 项的条件均值为零
在第二章,我们以人为设计的收入 与消费数据,讨论了总体回归模型与样 本回归模型。本章分析一元线性回归模 型的经典假定,以及经典假设下的最小 二乘估计方法和估计量的统计性质、区 间估计、假设检验,并运用蒙特卡洛模 拟直观认识和验证最小二乘估计量的统 计性质。
《计量经济学》,王少平、杨继生、欧阳志刚主编
归函数可知,边际消费倾向 增加1元,消费平均增加0.6647元。
ˆ 0.6647 从样本回 , 也就是说收入每
11758.76 13250.22 12481.51 12857.89 10969.41 11640.43 12931.53 11432.1
样本点紧密散布在样本回归直线周围,有的样本点 数据来源:《中国统计年鉴2009》 落在样本回归直线上,但是大多数样本点不在样本回归 请回答:我国宏观经济中的边际消费倾向是多少? 直线上,而是在直线上方或者下方,那么这条样本回归 直线“逼近”了总体回归直线吗?为什么要用普通最小 二乘法?如何度量样本回归模型对样本观测值的拟合程 度?要回答这些问题,我们必须学习估计量的统计性质和 模型的拟合优度等概念。
0 1
(3.1.8) 正则方程
第二步 对残差平方和求两个系数的偏导数 (一阶条件)
N N N N 2 X i Yi X i Yi X i i 1 i 1 i 1 ˆ i 1 ˆX Y 0 1 N N 2 2 N X i ( X i ) i 1 i 1 N N N N N Yi X i Yi X i (Yi Y )( X i X ) ˆ i 1 i 1 i 1 i 1 N 1 N N N X i2 ( X i ) 2 (Xi X ) 2 i 1 i 1 i 1 (3.1.9) (3.1.9)式即为OLS估计量
y
可以证明
2 i
2
i
ˆi 2 u ˆi 2 2 y ˆi u ˆi y
i i
(3.2.3)
记
ˆu ˆ 0 所以 y , ˆ u ˆ y y y (Y Y ) TSS
2 2 i i
(3.2.5) (3.2.4)
2
2
i
i
ESS称为回归平方和(explained sum of squares,ESS),反映由模 型中解释变量所解释的那部分离差的大小。 2 2 ˆ ˆ (3.2.6) y ( Y Y ) ESS i i RSS称为残差平方和(residual sum of squares,RSS),反映样本观测值 与估计值偏离的大小,也是模型中解释变量未解释的离差。
《计量经济学》,王少平、杨继生、欧阳志刚主编
6
第一步 构造含有待估计系数的残差平方和 并对其求最小
N Q ˆ ˆ X )0 2 ( Y i 0 1 i ˆ N N 0 i 1 2 ˆ ˆ X )u ˆ ˆi min Q u ( Y i i 0 1 i ˆ ˆ N , 1 i 1 Q i2 ˆ ˆ X )X 0 (Y i 3.1.70 i ( ) 1 i ˆ i 1 1
《计量经济学》,王少平、杨继生、欧阳志刚主编
对第二步的进一步演算 在(3.1.9)式中,令 xi X i X , yi Yi Y 和分别称为Xi和Yi的离差形式, 也可称为对Xi和Yi的中心化处理。为方便,我们 以下分析过程中,将和号 简写为 。容易证明: x 0 x (X X ) 1 (3.1.10) X ( X ) N
一元线性回归模型是指模型中只有一个解释变量的模型,也称为简单 线性回归模型,其一般形式是:
Yi 0 1 X i ui
i 1, 2,
,N
(3.1.1)
Y为被解释变量,X为解释变量。因为模型中共有两个变量,所以,模 型(3.1.1)也被称为双变量线性回归模型,β 0与β 1为待估参数,ui为随机 误差项或随机扰动项。
基于假定3,我们对模型(3.1.1)取条件期望,则有: ( i i 0 1 i 3.1.6)
E (Y X ) X
即:
Yi E (Yi X i ) u i
Yi的变化可以分为两部分,一部分是可以由Xi的变化解释 的,另一部分来自随机扰动。Yi向Xi所解释的“平均水平”回 归,这就是“回归”的含义。而斜率系数β 1是指,Xi每变化一 个单位,Yi平均变化β 1个单位。β 0是样本回归直线的截距。
2 i
ˆ ˆ 在计量经济学中,往往以小写字母表示对均值的离差。由于 和 是从最小二乘原理推导出来的,故称为普通最小二乘估计量。将样本数据 代入估计量的计算公式(3.1.12)即可求得参数的估计值。
0
1
《计量经济学》,王少平、杨继生、欧阳志刚主编
我们设定 例3.1.1 题目 解答 思考 样本回归模型 表3.1.1 2008年中国各地区城市居民人均年消费支出和可支配收入