虚拟变量回归模型
= 1 + Xi = 1 + 2 + Xi = 1 + 3 + Xi
东北财经大学数量经济系
第四节 包含一个定量变量,两个定性变量的模型(1)
例11.2 : 研究大学教师的年薪是否受到性别、 学历的影响。性别和学历是两个不同的标准。按 性别标准教师可以分成男、女两类,应该引入一 个虚拟变量;按学历标准大学教师可以分为大学 本科学历、硕士学历、博士学历三类,应该引入 两个虚拟变量,共引入三个虚拟变量:
计量经济学
Econometrics
王维国
东北财经大学
第六讲 虚拟变量回归模型
第一节 虚拟变量的性质 第二节 包含一个定量变量,一个定性变量模型 第三节 定性变量有多种分类的情况 第四节 包含一个定量变量,两个定性变量模型 第五节 回归模型中的结构稳定性:虚拟变量法 第六节 虚拟变量在季节分析中的应用 第七节 在合并数据中使用虚拟变量 第八节 虚拟变量方法的一些技术问题
3. 被分配0的类别或级别通常被用于比较的基础。 4. 虚拟变量的系数可称为级差截距系数,表明取值1
的类别截距项与基底类的截距项的差距。
东北财经大学数量经济系
第二节 包含一个定量变量,一个定性变量模型(4)
例11.1: 库存对利率敏感吗?
I/S = 1.269 - 0.3615C + 0.0215Se - 0.0227 S – 0.2552 U+0.0734DUM
东北财经大学数量经济系
第二节 包含一个定量变量,一个定性变量模型(2)
35
薪金Y
35
30
^ ^
Y
=
^ 1
+
^2
X
(男性)
25
20
Y^ = ^’1+ ^’2X (女性)
15
男性
女性
X
10 0
1
2
3
4
5
6
7
8 教龄
模型: Y男 = 1 + 2 X男 + u男 (男性模型)
8
Y女 = ’1 + ’2 X女 + u女(女性模型)
女教授
男教授
东北财经大学数量经济系
第二节 包含一个定量变量,一个定性变量模型(1)
Yi= 1 + 2 Di + Xi + ui
Yi= 教授的薪金 Xi = 教龄 Di = 1 ,如果是男性
= 0 ,如果是女性
模型的意义: E(Yi|Xi,Di=0) = 1 + Xi E(Yi|Xi,Di=1) = 1 + 2 + Xi
(19.6) (-2.2)
(5.7)
(-2.4)
(-2.4) (4.8)
R2=0.71
d=1.91
I/S=库存占销售的比重(不变价计算) C=实际利率(4月至6月的利率减一年来消费品生产价格指数的增长率)
Se=当期预期销售额 DUM为虚拟变量,74年第一季度前取0,之后为1.
U=销售的不确定性
东北财经大学数量经济系
东北财经大学数量经济系
第八节 在虚拟变量方法的一些技术问题
避免虚拟变量陷阱的另一种方法 Y i = a2 D2i + a3 D3 i+ bXi+ +ui
但需注意的是在零截距模型中,通常的R2并不是 总是有意义。
虚拟变量与异方差 虚拟变量与自相关
东北财经大学数量经济系
进一步研究的问题
随机或可变参数模型 转换回归模型 非均衡模型
东北财经大学数量经济系
第六节 虚拟变量在季节分析中的应用
经济时间序列多数呈现季节波动性,为了反映 变量之间的关系,往往先消除季节变动的影响,然 后再建立模型。消除季节波动的过程统称为季节调 整,季节调整的方法很多,虚拟变量的应用就是常 用方法之一。
例11.3:美国制造业的利润—销售行为
利润t=a1+ a2D2t + a3D3t + a4D4t + b*销售t+ ut
东北财经大学数量经济系
第五节 回归模型中的结构稳定性:虚拟变量法
Yi= 1 + 1 Xi + u1i 1946—1954年
Yi= 2 + 2Xi + u2i 1955—1963年
Yi= 储蓄 Xi =收入 可能的回归情形:
模型结构性变化是指 函数参数发生变化。
1.重合回归
2.平行回归
3.汇合回归
4.相异回归
模型:
东北财经大学数量经济系
第二节 包含一个定量变量,一个定性变量模型(3)
此模型的特点:
1. 为了区分两个类别,男性和女性,只引进了一个虚 拟变量Di。一般规则是:如果一个定性变量有m个 属性值,则仅引入m-1个虚拟变量。
2. 虚拟变量0,1值的分配可以是任意的,但解释模型 时一定注意1,பைடு நூலகம்是怎样分配的。
22 19 18 21.7 18.5 21 20.5 17 17.5 21.2
性别 (男=1,女=0)
1 0 0 1 0 1 1 0 0 1
东北财经大学数量经济系
第一节 虚拟变量的性质(3)
薪 金
Yi = 18 + 3.28 Di
t =(57.74) (7.439)
ˆ 18 R2=0.8737
ˆ 3.28
第三节 定性变量有多种分类的情况
Yi= 1 + 2 D2 i + 3 D3 i + Xi + ui
D2 = 1 ,如果是高中教育 D3 = 1 ,如果是大学教育
= 0 , 不然的话
= 0 , 不然的话
Yi= 保健年度支出
Xi = 年度收入
E(Yi|Xi,D2=0, D3=0) E(Yi|Xi,D2=1,D3=0) E(Yi|Xi,D2=0,D3=1)
东北财经大学数量经济系
利用虚拟变量技巧或邹氏检验,可以发 现两个投资函数的差异。
东北财经大学数量经济系
第七节 在合并数据中使用虚拟变量(2)
第二,可以对每一年估计一个横截面回归。 第三,可以把全部观测值合并起来,用以估计回归模型。
Y it = a1 + a2X2t+ a3 X3t+b Dit+uit 通用汽车Dit =1,否则取值为0。 例15.8 通用汽车与西屋电气公司的投资函数 教材518页
1 男教师 D2 0 女教师
1 硕士 D3 0 其他
1 博士 D4 0 其他
东北财经大学数量经济系
第四节 包含一个定量变量,两个定性变量的模型(2)
令Y代表年薪, X代表教龄,建立模型:
Yi B0 + B1Xi + B2D2i + B3D3i + B4D4i + ui
可以看出基准类是本科女教师,B0为刚参加工作 的本科女教师的工资;B1为参加工作时间对工资 的影响;B2是性别差异系数;B3和B4为学历差异系 数,B3是硕士学历与本科学历的收入差异,B4是 博士学历与本科学历的收入差异;通过上述分析 ,我们可以确定Bi的符号。
东北财经大学数量经济系
第一节 虚拟变量的性质(1) 1. 只取0或1数值的变量称为虚拟变量。 2. 虚拟变量表示两分性质,即“是”或 “否”, “男”或“女”等。
东北财经大学数量经济系
第一节 虚拟变量的性质(2)
按性别划分的教授薪金
序号
1 2 3 4 5 6 7 8 9 10
起薪,Y (千美元)
D2 =1 如果是第二季度 D3 =1 如果是第三季度 D4 =1 如果是第四季度
=0 否则
=0 否则
=0 否则
东北财经大学数量经济系
第七节 在合并数据中使用虚拟变量(1)
对于时间序列与横截面数据并用的混合回归来说, 为了研究Y与两个解释变量之间的关系,可采用以 下 三种方式进行:
第一,分别对每一厂商做如下时间序列回归: 通用汽车: Yt = a1 + a2 X2t+ a3 X3t+ut 西屋电气: Yt = a1, + a2,X2t+ a3 ,X3t+ut,
东北财经大学数量经济系
第四节 包含一个定量变量,两个定性变量的模型(3)
在这个问题中,一共有六个类别,但是我们只引 入了三个虚拟变量,而不是五个。
在就多个标准引入虚拟变量时,应该注意每一标 准下引入虚拟变量个数应该是这一标准下类别数目减 一,所以我们在本例中只引入三个虚拟变量而不是五 个。如果引入五个虚拟变量就会陷入虚拟变量陷阱。