当前位置：文档之家› 第3章(一元线性回归模型)3 (1)

第3章(一元线性回归模型)3 (1)

地区北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南城市居民家庭平均每人每年消费支出(元) 城市居民人均年 i 可支配收入 (0 元) 城市居民人均年 Y ui (3.1.13) 地区i 均每人每年消费 1X 可支配收入(元) 城市居民家庭平支出(元)
16460.26 13422.47 9086.73 8806.55 10828.62 11231.48 9729.05 8622.97 19397.89 11977.55 15158.3 9524.04 12501.12 8717.37 图3.1.1 11006.61 8837.46 24724.89 9477.51 湖北 19422.53 9945.52 湖南 i 13441.09 15527.97 广东 13119.05 9627.4 广西 14432.55 9408.48 海南 14392.69 11146.8 重庆 i i 12829.45 9679.14 四川 11581.28 8349.21 贵州 26674.9 9076.61 云南 18679.52 8323.54 西藏 1 22726.66 9772.07 陕西 12990.35 8308.62 甘肃 17961.45 8192.56 青海 12866.44 9558.29 宁夏样本数据的散点图和样本回归直线 16305.41 8669.36 新疆 13231.11
i j , i, j 1, 2,
,N
以上这些对随机扰动项的假定是由德国数学家高斯（Gauss）最早提出的，也称为线性回归模型的经典假定或高斯假定，满足上述假定的线性回归模型，称为经典线性回归模型
（3.1.5）
《计量经济学》，王少平、杨继生、欧阳志刚主编
二、普通最小二乘法（OLS）
《计量经济学》，王少平、杨继生、欧阳志刚主编
ˆ) E ( i i
即
ˆ ,E ˆ E 0 0 1 1

《计量经济学》，王少平、杨继生、欧阳志刚主编
高斯-马尔可夫定理
由以上分析可以看出，普通最小二乘估计量（ordinary least squares estimators）在经典假定下具有线性性、无偏性和最小方差性等性质，称具有这些性质的估计量为最优线性无偏估计量（ best linear unbiased estimator ，BLUE）。
3.2.1
《计量经济学》，王少平、杨继生、欧阳志刚主编
一、总离差平方和的分解
已知由一组样本观测值 ( X i , Yi ) (i 1, 2, ˆ ˆX ˆ Y i 0 1 i
, N ) 得到如下样本回归直线：
（3.2.1）
Y的第 i 个观测值与样本均值的离差 yi Yi Y 可分解为两部分之和
假定4：零均值假定
假定5：同方差假定
E (ui | X i ) 0,
i 1, 2,
,N
假定6：无自相关假定
（3.1.3）
即
Var (ui | X i ) E[ui E (ui | X i )]2 E (ui 2 ) 2
i 1, 2, , N
（3.1.4）
即
Cov(ui , u j ) 0
第三章一元线性回归模型
§3.1 §3.2 §3.3 一元线性回归模型参数的估计拟合优度回归参数的区间估计和假设检验
§3.4 § 3.5
例子：中国消费函数对最小二乘估计量统计性质的直观认识---蒙特卡洛模拟
本章小结
《计量经济学》，王少平、杨继生、欧阳志刚主编
§3.1 一元线性回归模型参数的估计
i
2 i 2 i 2 i 2 i
x y (X
i i
i
X )(Yi Y ) 1 X i Yi N
X iYi
（3.1.11）
于是，估计量（3.1.9）可以表示为离差形式： ˆ x y x （3.1.12）
i i 1
ˆ ˆ 0 Y 1 X
其中 Y为 13152.86 i 13821.16 城市居民家庭平均每人每年消费支出；X 为城市居民人均 19732.86 年可支配收入。使用这组样本数据，对(3.1.13)做最小二乘 14146.04 12607.84 估计，结果为 14367.55 ˆ 725.3459+0.6647X （3.1.14 Y ） 12633.38
Cov( X i , ui ) E[ui E (ui )][ X i E ( X i )] 0
i 1, 2, , N
（3.1.2）
即模型对变量和函数形式没有设定偏误，它的确切含义将在第５章中讨论。《计量经济学》，王少平、杨继生、欧阳志刚主编
2、对随机扰动项的假定
即在给定解释变量的条件下，随机扰动项的条件均值为零
在第二章，我们以人为设计的收入与消费数据，讨论了总体回归模型与样本回归模型。本章分析一元线性回归模型的经典假定，以及经典假设下的最小二乘估计方法和估计量的统计性质、区间估计、假设检验，并运用蒙特卡洛模拟直观认识和验证最小二乘估计量的统计性质。
《计量经济学》，王少平、杨继生、欧阳志刚主编
归函数可知，边际消费倾向增加1元，消费平均增加0.6647元。
ˆ 0.6647 从样本回，也就是说收入每
11758.76 13250.22 12481.51 12857.89 10969.41 11640.43 12931.53 11432.1
样本点紧密散布在样本回归直线周围，有的样本点数据来源：《中国统计年鉴2009》落在样本回归直线上，但是大多数样本点不在样本回归请回答：我国宏观经济中的边际消费倾向是多少？直线上，而是在直线上方或者下方，那么这条样本回归直线“逼近”了总体回归直线吗？为什么要用普通最小二乘法？如何度量样本回归模型对样本观测值的拟合程度?要回答这些问题，我们必须学习估计量的统计性质和模型的拟合优度等概念。
0 1
（3.1.8）正则方程
第二步对残差平方和求两个系数的偏导数（一阶条件）
N N N N 2 X i Yi X i Yi X i i 1 i 1 i 1 ˆ i 1 ˆX Y 0 1 N N 2 2 N X i ( X i ) i 1 i 1 N N N N N Yi X i Yi X i (Yi Y )( X i X ) ˆ i 1 i 1 i 1 i 1 N 1 N N N X i2 ( X i ) 2 (Xi X ) 2 i 1 i 1 i 1 （3.1.9）（3.1.9）式即为OLS估计量
y
可以证明
2 i
2
i
ˆi 2 u ˆi 2 2 y ˆi u ˆi y
i i
（3.2.3)
记
ˆu ˆ 0 所以 y ， ˆ u ˆ y y y (Y Y ) TSS
2 2 i i
（3.2.5) （3.2.4）
2
2
i
i
ESS称为回归平方和（explained sum of squares，ESS），反映由模型中解释变量所解释的那部分离差的大小。 2 2 ˆ ˆ （3.2.6) y ( Y Y ) ESS i i RSS称为残差平方和（residual sum of squares，RSS），反映样本观测值与估计值偏离的大小，也是模型中解释变量未解释的离差。
《计量经济学》，王少平、杨继生、欧阳志刚主编
6
第一步构造含有待估计系数的残差平方和并对其求最小
N Q ˆ ˆ X )0 2 ( Y i 0 1 i ˆ N N 0 i 1 2 ˆ ˆ X )u ˆ ˆi min Q u ( Y i i 0 1 i ˆ ˆ N , 1 i 1 Q i2 ˆ ˆ X )X 0 (Y i 3.1.70 i （） 1 i ˆ i 1 1
《计量经济学》，王少平、杨继生、欧阳志刚主编
对第二步的进一步演算在（3.1.9）式中，令 xi X i X ， yi Yi Y 和分别称为Xi和Yi的离差形式，也可称为对Xi和Yi的中心化处理。为方便，我们以下分析过程中，将和号简写为。容易证明： x 0 x (X X ) 1 （3.1.10） X ( X ) N
一元线性回归模型是指模型中只有一个解释变量的模型，也称为简单线性回归模型，其一般形式是：
Yi 0 1 X i ui
i 1, 2,
,N
（3.1.1）
Y为被解释变量，X为解释变量。因为模型中共有两个变量，所以，模型（3.1.1）也被称为双变量线性回归模型，β 0与β 1为待估参数，ui为随机误差项或随机扰动项。
基于假定3，我们对模型（3.1.1）取条件期望，则有：（ i i 0 1 i 3.1.6）
E (Y X ) X
即：
Yi E (Yi X i ) u i
Yi的变化可以分为两部分，一部分是可以由Xi的变化解释的，另一部分来自随机扰动。Yi向Xi所解释的“平均水平”回归，这就是“回归”的含义。而斜率系数β 1是指，Xi每变化一个单位，Yi平均变化β 1个单位。β 0是样本回归直线的截距。
2 i
ˆ ˆ 在计量经济学中，往往以小写字母表示对均值的离差。由于和是从最小二乘原理推导出来的，故称为普通最小二乘估计量。将样本数据代入估计量的计算公式（3.1.12）即可求得参数的估计值。
0
1
《计量经济学》，王少平、杨继生、欧阳志刚主编
我们设定例3.1.1 题目解答思考样本回归模型表3.1.1 2008年中国各地区城市居民人均年消费支出和可支配收入

e商务文档

第3章(一元线性回归模型)3 (1)

相关文档推荐：