当前位置:文档之家› 计量经济学9-基于多元回归的评估研究

计量经济学9-基于多元回归的评估研究


遗漏变量可观测时遗漏变量偏差的解决办法

一方面,遗漏变量可能导致遗漏变量偏差;另一方 面,包含不属于回归的的变量会降低其他回归系数估 计量的精确度。
• •
遗漏变量可观测时遗漏变量偏差的解决办法

遗漏变量不可观测时遗漏变量偏差的解决办法

7
1) 在回归中识别出感兴趣的关键系数。 2) 确定该回归中最有可能的重要遗漏变量偏差来源于何 处? 3) 利用第2步中确定的其他可疑变量改进基础设定形式并检 验其系数为零的假设。如果附加变量的系数统计显著,或者 加入这个变量后,感兴趣系数的估计值发生相当大的变化, 则回归中应当保留这个变量,于是需要修改基础设定形式。 反之,应该从回归中去掉这些变量。 4) 用表格形式概括结果。
22
23
24
4
班级规模减少2人时成绩预测
利用 Mass 成绩与 STR 为线性关系模型预测:
TestScore = 744.0 – 0.64STR – 0.437PctEL – 0.582LunchPct (21.3) (0.27) (0.303) (0.097)
结果比较 • 对数形式与 STR 的三次多项式比较? • TestScore-STR 是否为非线性关系? • HiEL 和 STR 间交互作用显著么?

9
10
3. 变量有测量误差

由于自变量测量不精确使OLS估计量中含有变 量的测量误差偏差。该偏差取决于测量误差的 性质,且当样本容量较大时依然存在。如果测 量变量等于真实值加上一个零均值、独立同分 布的误差项,则一元回归的OLS估计量偏向于 零,其概率公式为
ˆ p→ β1 ⎯⎯
2 2 σX +σ w 2 σX
ˆ 由于 X i 与 vi 相关,因此 β1 是有偏的。
变量的测量误差偏差的解决办法
1. 建立测量误差的数学模型,用得到的公式调整估计值。 2. 工具变量回归。
cov( X i , vi ) = cov( X i ,β1(Xi – X i ) + ui) = β1cov( X i ,Xi – X i ) + cov( X i ,ui) = β1[cov( X i ,Xi) – var( X i )] + 0 ≠ 0 一般情况而言, cov( X i ,Xi) ≠ var( X i ).
Massachusetts 数据
数据比较
• 220 个公立学区 • 测试成绩: 1998 MCAS test – fourth grade total (Math + English + Science) • 变量: STR, TestScore, PctEL, LunchPct, Income
21
假设总体回归方程 Yi = β0 + β1Xi + ui 满足三个 OLS 基本假设。 令
β1
9.2
Xi = X 的无法度量的真值
X i = X 的非准确度量值
11 12
2
总体回归方程右侧加上β1 X i ,同时减去β1 X i , Yi = β0 + β1Xi + ui = β0 + β1 X i + [β1(Xi – X i ) + ui] 或者写为: Yi = β0 + β1 X i + vi , 其中 vi = β1(Xi – X i ) + ui
• •
多元分析的内部有效性威胁
1. 遗漏变量偏差 2. 回归函数形式的误设 3. 变量有测量误差 4. 样本选择偏差 5. 双向因果关系 偏差来源是因为总体回归中的回归变量与误差项相关,从而 违反了 E(ui|X1i,…,Xki) ≠ 0 这一最小二乘假设。
5
6
1
1. 遗漏变量偏差
存在遗漏变量偏差要同时满足以下两个条件: (i) 对 Y 有影响; (ii) 该遗漏变量与至少与其他一个回归变量相关。
29 30
5
测试成绩与班级规模分析其他内部有效性威胁
遗漏变量偏差? 该分析控制了以下因素: • 区位特征(与收入有关) • 一些学生特征 漏掉了什么因素么? • 其他学生特征(例如学生天生能力) • 外部的学习机会 • 教师的能力(低学生/教师比的学校对教师更加具有吸引 力)。
31
遗漏变量偏差(续)
25
– 3.07Income + 0.164Income2 – 0.0022Income3 (2.35) (0.085) (0.0010) • 估计的效应 = -0.64×(-2) = 1.28 • 标准误差 = 2×0.27 = 0.54
ˆ ˆ 注意: var(aY) = a2var(Y); SE(a β1 ) = |a|SE( β1 )
• 前述分析中已经控制了很多可能存在遗漏变量偏差的因 素。 • The nature of this omitted variable bias would need to be similar in California and Massachusetts to be consistent with these results; • In this application we will be able to compare these estimates based on observational data with estimates based on experimental data – a check of this multiple regression methodology.
Chapter 9
基于多元回归的评估研究
• 是否有对回归分析进行系统的评估的方法?我们已经了 解线性回归分析的优点,然而其有何潜在的不足呢? • 以上问题在班级规模对测试成绩的影响这个例子中又是 如何体现呢?
2
评价统计分析或计量经济学研究的一般 框架:内部有效性和外部有效性•Βιβλιοθήκη 内部有效性的条件•
如果有关因果效应的统计推断对研究总体是正 确的,则称该统计分析是内部有效的 (internally valid)。 如果从研究总体及其环境中得到的相关推断和 结论可推广到其他总体及其环境中,则称该分 析是外部有效的(externally valid)。
• 加入反映学生和学区特征的变量后,班级规模对成绩的效 应都下降。 • 班级规模对成绩的影响都是统计上显著的。 • 班级减少 2 人时,估计效应相似。Estimated effect of a 2student reduction in STR is quantitatively similar for CA, MA. • 均没有标明 STR – PctEL 间交互作用显著。 • Some evidence of STR nonlinearities in CA data, but not in MA data. • 一些证据表明 CA 存在非线性关系,而 MA 不是。
8
遗漏变量不可观测时遗漏变量偏差的解决办法 法一:利用同一观测个体在不同时间点上的观 测数据。 • 法二:利用工具变量。 • 法三:利用研究设计,即利用随机对照研究感 兴趣的效应。

2. 回归函数形式的误设
函数形式误设是在估计出的回归函数泛函数与 回归函数泛函数形式不同时产生的。若函数形 式设定有误,则某个变量变化的偏效应估计估 计量通常是有偏的。 • 函数形式误设往往可通过观察数据和回归函数 估计图发现,并采用另一种不同的函数形式机 型修正。
ˆ • 因此 β1 是有偏和不一致。

OLS标准误差非一致的原因

Yi = β0 + β1Xi + ui Xi = γ0 + γ1Yi + vi
• ui 大意味着 Yi 大,而这又意味着 Xi 较大(当γ1>0)
例如:假定学生/教师比到测试成绩的因果关系,且政府主 动对测试成绩差的学区雇佣教师给予资助,则因果关系是 双向的。即低学生/教师比会带来高测试成绩,同时由于政 府资助计划使低测试成绩导致了的学生/教师比。
关于Massachusetts的结论
• 加入反应学生和学区特征的变量后,STR 的 系数从–1.72 降到 –0.69,说明初始的估计中包括遗漏变量偏差。 • 加入其它控制变量后,班级规模的系数在 5%显著水平下 是显著的。 • 在 5%显著水平下,学生/教师比与测试成绩为线性的原假 设,在检验中不能被拒绝。 • 没有显著统计证据表明学生/教师比与学区内英语学习者百 分率高低的二元变量间有交互作用。
17
标准误差计算不准确同样是内部有效性的威 胁。当误差异方差时采用同方差适用标准误差 是不正确的。如果变量在不同观测间不独立, 如在面板数据和时间序列数据中,则需要对标 准误差公式作进一步修正才能得到正确的标准 误差。
18
3
利用回归进行预测时的内部和外部有效性
• 进行预测与估计因果效应有很大区别。 • 对预测而言: • R 2 大小具有相当重要的作用。 • 遗漏变量偏差不是一个问题。 • 预测时关心的重点不是对系数进行解释,而是关心模 型是否能得到可靠的预测值。 • 回归模型被用于预测时,模型的外部有效性是很重要 的,即指模型是稳定的,且数量上适用于待预测的场 合。
13 14
4 . 样本选择偏差
当抽样过程影响数据的可得性且与因变量有关 时就产生了样本选择偏差。样本选择偏差导致 一个或多个回归变量与误差项相关,因此使 OLS估计量有偏且非一致。 • 如:对流水线上的产品抽样,每隔95个产品抽5 个样本.这个过程看似合理,但如果一共有20个操 作人员,每个操作人员每次提交5个产品,依次进 行.那么该所抽到的产品就永远是那个操作人员 提交的.这样也就产生了养本选择偏差.

15
5. 双向因果关系偏差

除了X到Y的因果关系外,如果还存在Y到X的 因果关系,则在Y对X的回归中产生了双向因果 关系偏差,也称联立方程偏差,这一反向的因 果关系使总体回归中的X和误差相关。 解决办法
相关主题