当前位置:文档之家› 庞浩 计量经济学8第八章 虚拟变量回归

庞浩 计量经济学8第八章 虚拟变量回归


0, X t X * Dt * 1 , X X t
当X t X *时, Yt 1 1 X t ut 当X t X *时, Yt (1 2 X * ) ( 1 2 ) X t ut
23
说 明
1. 2 的显著性说明了在所设定的解释变量临界水 平X*处是否存在突变。 2.2段线性回归设置1个虚拟变量; k段线性回归设置k-1个虚拟变量。
21
分段线性回归
适合于社会经济现象会在解释变量达到某个临界值时 发生突变,考虑下述模型: Yt 1 1 X t 2 ( X t X * ) Dt ut
0, X t X * Dt * 1 , X X t
当X t X *时, Yt 1 1 X t ut 当X t X *时, Yt 1 1 X t 2 ( X t X * ) ut
8
第二节 虚拟解释变量的回归
在计量经济模型中,加入虚拟解释变量,有两种 基本类型:加法类型和乘法类型。 一、用虚拟变量表示不同截距的回归——加法类 型 二、用虚拟变量表示不同斜率的回归——乘法类 型
9
一、用虚拟变量表示不同截距的回归—— 加法类型
解释变量只有一个分为两种相互排斥类型的定性
变量,而无定量变量的回归 解释变量包含一个定量变量和一个分为两种类型 定性变量的回归 解释变量包含一个定量变量和一个两种以上类型 的定性变量的回归 解释变量包含一个定量变量和两个定性变量的回 归
Yi 1 1 X i ui 改革开放前:
改革开放后: Yi (1 2 ) ( 1 2 ) X i ui
20
以乘法方式引入虚拟变量做回归模型比较 的优点
用一个回归替代了多个回归,简化了分析过程;
可以方便地对模型结构的差异做各种假设检验;
合并了的回归增加了自由度,提高了参数估计 的精确性。
解释变量包含一个定量变量和一个分为两 种类型定性变量的回归
研究城乡居民的消费函数: Ci 1 2 Di 1 X i ui
农村居民的消费函数:
Ci 1 1 X i ui E (Ci | Di 0) 1 1 X i
0, 农村居民 Di 1, 城镇居民
第八章
第一节 第二节 第三节 第四节
虚拟变量回归
虚拟变量 虚拟解释变量的回归 虚拟被解释变量 案例分析
1
第一节 虚拟变量
一、虚拟变量的基本概念
二、虚拟变量的设置规则 三、虚拟变量的作用
2
一、虚拟变量的基本概念
定量因素:指那些可直接测度的数值型因素。 定性因素:也称为属性因素,指不能直接测度的,说 明某种属性或状态存在与否的非数值型因素。 虚拟变量:也称为属性变量、双值变量、类型变量、 定性变量、二元型变量等。指人工构造的取值为0和 1的作为属性因素代表的变量,一般用字母D或DUM来 表示。(D=0,表示某种属性或状态不出现或不存在; D=1,表示某种属性或状态出现或存在) 例如:wagei 1 1educi 2 Di ui 0, 表示女性 Di 3 1, 表示男性
25
本章小结
虚拟变量的概念 虚拟变量的设置规则 加法类型引入虚拟变量 乘法类型引入虚拟变量
26
二、虚拟变量的设置规则
1.虚拟变量个数的设置规则 若定性因素有m个相互排斥的类型(或属性、水 平),则: 在有截距项的模型中,只能引入m-1个虚拟变 量,否则会陷入“虚拟变量陷阱”(即:出 现完全的多重共线性); 在无截距项的模型中,可以引入m个虚拟变量, 不会导致完全的多重共线性。
4
例如:研究城乡居民的可支配收入对居民住房消费支 出的影响 C Y D u i 1 1 i 2 i i
18
二、用虚拟变量表示不同斜率的回归—— 乘法类型
回归模型的比较——结构变化检验
分段线性回归
19回归模ຫໍສະໝຸດ 的比较——结构变化检验研究改革开放前后(1950-2004),储蓄与收入的关系: Yi 1 2 Di 1 X i 2 ( Di X i ) ui
( 1950 1977) 0, 改革开放前 Di ( 1978 2004) 1, 改革开放后
0.0
1.0 2.0 0.4 0.7
6.0
18.0 20.0 12.0 14.0
0
0 1 0 0
7
8 9 10
0.3
3.2 2.8 0.0
10.0
40.0 32.0 7.0
0
1 1 0
17
18 19 20
1.5
1.6 0.6 0.6
15.0
16.0 15.0 14.0
1
1 0 0
16
4
3
Y
2
1
0 0 10 20 X
(1 2 X * ) ( 1 2 ) X t ut
22
案 例
某公司为了激励公司的销售人员,按其销售额的 一定比例计提奖励,但是销售额在某一目标水 平X*以下和以上时,计提奖励的比例不同。
Yt 1 1 X t 2 ( X t X * ) Dt ut
Yi 1 2 Di 1 X i ui
0, 租房户 Di 1, 有房户
15
i 1
Y 1.0
X 20.0
D 0
i 11
Y 0.3
X 9.0
D 0
2
3 4 5 6
1.3
0.7 0.8 0.5 2.4
24.0
12.0 16.0 11.0 32.0
0
0 0 0 1
12
13 14 15 16
24
3段分段线性回归举例
研究中国的货币流通量,从建国到现在历经了三 个时期: 从建国初期到1960年,增加速度比较快; 从1961年到1978年,由于处于经济困难和文化 革命时期,增加速度明显减缓; 从1978年改革开放往后,进入社会主义市场经 济时期,增加速度明显增加。 试建立中国的货币流通量的趋势模型。
例如:研究政府某项经济政策的施行与否对被解 释变量的影响
( 该项经济政策未施行 ) 0, 基础类型 Di ( 该项经济政策施行了 ) 1, 比较类型
6
练 习
将定性因素“学历”(分为:大专及以上、高中、 初中、小学及以下)作为解释变量引入下面的 模型中。 Yi 1 1 X i ui
0, 其他 D2 i 1, 初中 0, 其他 0, 其他 D4 i D3 i 1, 大专及以上 1, 高中
Yi 1 1 X i 2 D2i 3 D3i 4 D4i ui
7
三、虚拟变量的作用
虚拟变量可以作为下列因素的代表: 属性因素 非精确计量的数量因素 偶然因素或政策因素 时间序列分析中的季节(或月份)因素 用于分段回归
17
30
40
50
ˆ 0.3204 0.8273 D 0.0675 X Y i i i t ( 5.2) (16.9) (11.0) R 2 0.99
ˆ 0.3204 0.0675 X 租房户: Y i i
ˆ 0.5069 0.0675 X 有房户: Y i i
13
大专及以上:Yi (1 3 ) 1 X i ui
解释变量包含一个定量变量和两个定性变 量的回归
研究城乡居民卷烟需求量受居民可支配收入和性别的 影响: Yi 1 2 D2i 3 D3i 1 X i ui
0, 农村居民 D2 i 1, 城镇居民 0, 女性 D3 i 1, 男性
0, 表示农村居民 Di 1, 表示城镇居民
若引入两个虚拟变量,则:
Ci 1 1Yi 2 D2i 3 D3i ui
0, D2 i 1, 其他 城镇居民 0, D3 i 1, 其他 农村居民
5
2.虚拟变量0和1的选取原则
虚拟变量取“0”,通常代表基础类型; 虚拟变量取“1”,通常代表与基础类型相比较 的类型。
城镇居民的消费函数: Ci (1 2 ) 1 X i ui
E (Ci | Di 1) (1 2 ) 1 X i
12
解释变量包含一个定量变量和一个两种以 上类型的定性变量的回归
研究居民的年医疗保健费用支出受可支配收入和居民 受教育程度的影响(受教育程度可分为:高中以下、 高中、大专及以上三个级别):
农村女性: Yi 1 1 X i ui 农村男性: Yi (1 3 ) 1 X i ui 城镇女性: Yi (1 2 ) 1 X i ui
城镇男性: Yi (1 2 3 ) 1 X i ui
14
案例
随机调查美国旧金山地区20个家庭的储蓄情况, 拟建立年储蓄额对年收入的回归模型,通过样 本的散点图发现,这20个家庭中,有房户和租 房户的储蓄额有较明显的区别,故在模型中加 入一个定性变量,以区别有房户和租房户。
10
解释变量只有一个分为两种相互排斥类型 的定性变量,而无定量变量的回归
假定文化程度、职业、性别等不变,研究农村居 民与城镇居民的年平均可支配收入是否有差异。
Yi 1 1 Di ui
0, 农村居民 Di 1, 城镇居民
1 表示农村居民的年平均可支配收入;
1 表示城镇居民与农村居民年平均可支配收入的 差异。 城乡居民年均可支配收入之间是否有差距,可通 过的 Di 显著性判断。 11
Yi 1 2 D2i 3 D3i 1 X i ui
0, 其他 D2 i 1, 高中 0, 其他 D3 i 1, 大专及以上
相关主题