当前位置:
文档之家› 第五章1 虚拟变量模型PPT课件
第五章1 虚拟变量模型PPT课件
——教育程度的变化对收入的影响是固定不变的,即:教育程度每提升一个 等级,所带来的收入的变动均为β2 ◦ 显然,对于大多数实际情况而言,这种假定存在明显的不合理性
问题:建模过程中如何使用定性变量?
Copyright©princebf,2008-2009,YNUFE
3. 正确应用定性变量的方式
【例】:对于上例,设置如下两个变量:
Copyright©princebf,2008-2009,YNUFE
2. 直接使用定性变量的不合理性
【例】:考虑教育程度(E)、工龄(X)和收入(Y)的关系。
Y i01 X i2 E ii
其中:E:1-本科;2-硕士;3-博士
◦ 模型中系数 β2 的经济意义是什么? ◦ 注意到 β2 是一个常数,这意味着什么?
虚拟变量:
E1
1 0
硕士 其它
1 博士
E
2
0
其它
E1=1 E2=0 E1=0
E2=0 :硕士 E2=1 :博士 E2=0 :本科
例2:
男
定性变量: 性别
女
1 男
虚拟变量: S
0
女
Copyright©princebf,2008-2009,YNUFE
2. 虚拟变量的设置说明
(1)这一规则适用于模型中包含一个或多个定性变量的情形。即如果模 型存在多个定性变量,则需要设置多组虚拟变量,每组虚拟变量的 个数取决于对应的定性变量所具有的类别数。
• 实质上,虚拟变量是定性变量的一种“量化”工具,用以反映观测在定 性变量上所属的类别或所具有的属性。 • 虚拟变量可以类似于定量变量一样直接引入模型,而不丧失模型的合理 性,因此:正确应用定性变量的一种方式是通过设置“虚拟变量”引入定 性变量。 • 由此,包含虚拟变量的模型称之为虚拟变量模型
※ 问题:如何正确地设置虚拟变量?
(2)定性变量的分类中,不指定其虚拟变量的类别(组)称为基准组 (base)或参照组(reference)。 • 如上例:本科教育程度组即为基准组或参照组 • 在基准组上,所有对应的虚拟变量的取值均为0 • 实际问题中,基准组或参照组的选择完全取决于研究者。 • 一旦选定基准组,分析中,所有其它组都将与基准组进行比较。
第五章 经典单方程计量经济学模型专门问题
§5.1 虚拟变量模型 §5.2 滞后变量模型
Copyright©princebf,2008-2009,YNUFE
§5.1 虚拟变量模型
一、虚拟变量的含义 二、虚拟变量的设置 三、虚拟变量的引入
Copyright©princebf,2008-2009,YNUFE
Copyright©princebf,2008-2009,YNUFE
【分析】: 假定我们有6个观测值,其中2个硕士、1个博士、3个本科生 考虑模型的设计矩阵X:
1 X 1 1 0 0
1
X2
1
ห้องสมุดไป่ตู้
0
0
1 X
X3
0
1
0
1 X 4 0 0 1
1 1
X5 X6
0 0
0 0
1 1
显然,矩阵X是不满秩的,产生了“完全的多重共线性”!
一、虚拟变量的含义
•一种人为构造的、取值仅为“1”或“0”的变量
Copyright©princebf,2008-2009,YNUFE
1. 定量变量和定性变量
定量变量:测度等级为间距(interval)或比率(ratio)尺度的变量, 如需求量、价格、收入、产量等
◦ 其取值为具有实际含义的数据 ◦ 可以在建模过程中直接使用这些变量及其数据
此即所谓的“虚拟变量陷阱”!
Copyright©princebf,2008-2009,YNUFE
1. 虚拟变量的设置原则
对每个定性变量而言,所引入的虚拟变量的个数应该比该变量的类别数 少1,即:如果某个定性变量具有m个类别,则只需在模型中引入(m-1) 个虚拟变量。
例1:定性变量:教育程度E:1-本科;2-硕士;3-博士
Copyright©princebf,2008-2009,YNUFE
4. 虚拟变量的含义
• 虚拟变量(dummy variable):一种人为构造的、取值仅为“1”或 “0”的变量,又称示性变量(indicator variable)。
• “1”表示属于某个类别或具备某种属性
• “0”表示不属于该类别或不具备该属性
对于硕士生,其收入为:E ( Y i | E 1 = 1 , E 2 = 0 ) 0 1 X i 2 对于博士生,其收入为:E ( Y i | E 1 = 1 , E 2 = 0 ) 0 1 X i 3
※ 教育程度的变动带来的影响分别是β2(本-硕)和(β3-β2)(硕- 博),模型合理性得到改进!
1 硕士
E1
0
其它
这意味着:对于某个硕士生:E1=1 E2=0 对于某个博士生:E1=0 E2=1
1 博士
E
2
0
其它
对于某个本科生:E1=0 E2=0
建立如下模型: Y i0 1 X i2 E 1 i+ 3 E 2 ii
于是:对于本科生,其收入为:E ( Y i| E 1 = 0 , E 2 = 0 ) 01 X i
1 硕士
E1
0
其它
这意味着:
1 博士
E
2
0
其它
1 本科
E
3
0
其它
对于某个硕士生:E1=1 E2=0 E3=0 对于某个博士生:E1=0 E2=1 E3=0 对于某个本科生:E1=0 E2=0 E3=1
相应的模型:
Y i 0 1 X i 2 E 1 i + 3 E 2 i 4 E 3 i i
定性变量:测度等级名义(nominal)或顺序(ordinal)尺度的变量, 如性别、教育程度等
◦ 其取值为类别或顺序,可用数值表示,但数值不具有实际含义,仅是表示 类别或序次的代码
性别(1-男;0-女)、教育程度(1-小学、2-初中、3-高中、4-大学)
◦ 实际建模中,考虑定性变量的影响是必要的,但直接使用定性变量的取值 则具有不合理性
Copyright©princebf,2008-2009,YNUFE
二、虚拟变量的设置
• 虚拟变量的个数为定性变量类别数-1 • 注意参照类的设置 • 注意虚拟变量陷阱
Copyright©princebf,2008-2009,YNUFE
# 对例题的思考
【思考】:上例中,为什么不用三个虚拟变量表示三种教育程度?