当前位置:文档之家› 第2讲_工具变量法最终版.ppt

第2讲_工具变量法最终版.ppt

• 假定真实的总体模型设定为:Y = X β + Wγ + u • 但是由于不可观察的原因,我们无法得到W的
数据,这样回归模型就成为:
Y = X β + ε ,其中 ε = Wγ + u
• 如果X中的某个或某几个解释变量,如Xk与W 相关,就将导致Cov(xk ,ε ) ≠ 0 ,从而出现内生的 解释变量问题
唯一
..........
4
假设3
• 随机扰动项同方差、无自相关 Var(y|X)=²I
• 含义
– y的条件方差为纯量协方差矩阵 – 由于 ²为常数,与x无关,所以条件方差等价于
无条件方差 – 该假设等价于Var(u|X)= ²,即同方差
Var(ui)= ²,无序列相关Cov(ui,uj)=0
..........
13
解释变量的外生性
• 解释变量外生性是古典线性回归模型的一 个基本假定,也是保证线性模型成为结构 模型的前提
• 该假定的பைடு நூலகம்本内容是指扰动项关于解释变 量的条件期望等于零 :
E(u|X ) = 0
– 解释变量X产生机制与随机扰动项u无关


可以推出:Cov( Xjk , ui ) = 0 和E(x′k u) = 0
..........
12
联立性
• 所谓联立性是指,两个变量之间的因果关 系不是单方向的,它们之间相互影响
• 在单方程模型中,如果至少一个解释变量 同时由被解释变量y部分决定,模型就出现 了联立性问题
• 联立性问题很多情况下,是由于变量遗漏 造成的。
• 在出现联立性的模型中,E(u|X)≠0
..........
如果z与x无关,则β₀=β ,但通常的情况下,z与x相 关,从而 ₀≠
..........
8
• 遗漏变量
– 被遗漏的变量q进入到随机扰动项中, u=rq+v,OLS估计不一致,教材P63例
• 解决的办法
– 代理变量 – 工具变量法
– panel data
..........
9
• 教育回报的例子
– 正确的模型设定 log(wage)= 0+ 1exp+ 2exp²+ 3edu+abil+v
– 能力ability通常观察不到,成为遗漏变量,模型 成为 log(wage)= 0+ 1exp+ 2exp²+ 3edu+u
– 通常ability受到教育的影响 abil=₀+₃edu+r,
E(r|exp,exp²)=0 – 从而E(b3)= 3+ 3,b3不仅是有偏的,而且在大
..........
2
假设1
• 条件期望线性与外生性假设
y = E(y|X)+u
= 0 + 1X1 + 2X2 + . . . kXk + u
• 定义: u = y − E(y|X),则假设1意味E(u|X)=0,这 又成为X严格外生性的假设
– 如果E(u|X)=0成立,线性模型就能够解释x与y之间的因 果关系,并成为结构模型
5
假设4
• (yi, xi)为随机样本,i=1,2,⋯,n
..........
6
对模型假设的讨论
• 线性条件期望不成立的情形 E(y|X)≠X’,E(u|X)≠0
• 来源
– 模型设定的错误 misspecification – 变量的误差 – 联立性
..........
7
模型的设定错误
• 函数形式的错误
..........
15
内生解释变量的产生
• 内生解释变量产生的原因基本上可以分为 四种:
– 遗漏变量 – 观测误差 – 联立偏差 – 样本选择问题 (sample selection)
..........
16
遗漏变量
• 当被遗漏的变量与引入模型的其他解释变量相 关,被遗漏的变量进入到随机扰动项时,就会 导致解释变量与扰动项相关
– 同时E(u|X)= 0是E(X’u)=0的充分条件,E(X’u)=0是 OLS估计的依据。
– E(u|X)= 0还意味着Cov(X,u)=0
..........
3
假设2
• 样本矩阵满列秩 rank(X)=K<n
• 含义
– 要求有足够多的观测值,n>k
– 变量之间不存在线性组合 – 保证X‘X可逆,满秩,非奇异,从而估计结果
大样本条件下的渐进无关性:p lim(
1 n
X ku)
0
..........
14
一个说明
• E(x′k u) = 0 表示Xk与u在小样本情形下无关

但是当
E(x′k u)

0
时,p lim(
1 n
X ku)
0
仍然有
可能成立,即在大样本条件下,Xk与u满足
渐近无关性。此时,OLS估计量仍然能够
保持良好的大样本性质
第二讲:
内生的解释变量与工具变量法
..........
1
单方程线性模型
• 如果我们在经验分析中采用一个单方程线 性模型来研究x 对y 的影响,并得到相关的 政策结论,那么则要求方程
y = 0 + 1X1 + 2X2 + . . . kXk + u
能够反映X与y之间的因果关系,而不是单 纯的统计相关关系
样本中也是不一致的。
– 特别是,如果3>0,b3会高估教育对工资的影响
..........
10
变量的测量误差
• 被解释变量的测量误差 • 真实的模型设定
y*=X’+u
• y*没有被准确观察到,观察到的是y
– y= y*+v,v为测量误差 – 模型变为:y=X’ +u+v – 如果E(v|X)=0,假设1没有被破坏 – 如果E(v|X)≠0,假设1不成立,OLS有偏且不
– 非参数设定来解决
• 包含了多余变量
– 如果多加的变量与其它的解释变量无关,OLS估计仍然 是无偏,一致,但不有效
– 如果多加的变量与其它的解释变量有关,OLS估计有偏 – 例:研究新生儿体重y与母亲在孕期的食品摄入量x的关
系,如果考虑家庭收入z。正确的模型设定为: E(y|x,z)=x。如果加入z,模型变为E(y|x,z)=₀x+γz
一致
..........
11
• 解释变量的测量误差
• 真实的模型设定 y=X’β+z*+u
– z*含有测量误差,观察到 z=z*+v, E(z|x, z*)=z*,
– 实际的回归方程为: y = X’+z+ (u-v)=X’+z+ε
– 这时,由于 ε =u-v与z=z*+v相关,所以 E(ε|X,z)≠0,假设1不成立
..........
17
观测误差
• 不论是通过现场调查还是二手数据,我们 都不可能避免“观测误差”问题
• 当观测误差进入到随机扰动项中,并与某 个或某些解释变量相关时,就出现了内生 解释变量
相关主题