当前位置:文档之家› 第五讲-虚拟变量模型

第五讲-虚拟变量模型

第七讲 经典单方程计量经济学模型:专门问题
虚拟变量模型
学习目标:
1. 了解什么是虚拟变量以及什么是虚拟变量模型;
2. 理解虚拟变量的设置原则;
3. 掌握虚拟变量模型的两种基本引入方式(加法方式和乘法方式);
4. 能够自行设计虚拟变量模型,并能够解释其中蕴含的经济意义;
教学基本内容

一、 虚拟变量
许多经济变量是可以定量度量,例如:商品需求量、价格、收入、产量等;
但有一些影响经济变量的因素是无法定量度量。例如:职业、性别对收入的影响,
战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等。
定性变量:把职业、性别这样无法定量度量的变量称为定性变量。
定量变量:把价格、收入、销售额这样可以可以定量度量的变量称为定量变
量。
为了能够在模型中能够反映这些因素的影响,提高模型的精度,拓展回归模
型的功能,需要将它们“量化”。 这种“量化”通常是通过引入“虚拟变量”
来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常
称为虚拟变量(dummy variables) ,记为D。 虚拟变量只作为解释变量。

例如:反映性别的虚拟变量女男;0;1D

反映文化程度的虚拟变量


非本科学历本科学历;0;1D

一般地,基础类型和肯定类型取值为1;比较类型和否定类型取值为0。
二、 虚拟变量的设置原则

设置原则:
每一定性变量(qualitative variable)所需的虚拟变量个数要比该定性变量的状
态类别数(categories)少1。即如果有m种状态,只在模型中引入m-1个虚拟变量。
例如,冷饮的销售量会受到季节变化的影响。季节定性变量有春、夏、秋、
冬4种状态,只需要设置3个虚拟变量:
其他春季;0;11D 其他夏季;0;12D 


其他秋季;0;13D

错误设置:
其他春季;0;11D 其他夏季;0;12D 其他秋季;0;13D 


其他冬季;0;14D

如果设置第4个虚变量,则出现“虚拟变量陷井”(Dummy Variable Trap)问
题。
三、 虚拟变量模型

1. 概念
虚拟变量模型:同时含有一般解释变量与虚拟变量的模型称为虚拟变量模
型,也称方差分析(analysis-of variance: ANOVA)模型。
2. 例子
一个以性别为虚拟变量考察企业职工薪金的模型:

iiiiDXY210




女男;0;1D

其中:Yi为企业职工的薪金;Xi为工龄; Di=1,代表男性,Di=0,代表女性。
四、 虚拟变量的引入方式

虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。
1. 加法方式—考察截距的变化
上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式,即模型中将
虚拟变量以相加的形式引入模型。

iiiiDXY210




女男;0;1D

为了进行进一步的分析,深刻理解这种引入方法的内涵,假定E(i)=0,我
们将该模型化为:
男职工的平均薪金:

iiiiXDXYE120
)()1,|(
女职工的平均薪金:

iiiiXDXYE10
)0,|(
假定2>0,则两个函数有相同的斜率,但有不同的截距。这意味着,男女职
工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差2。
可以通过对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平
是否有显著差异。
如图1所示对比图:

图 1
经济意义:男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金
水平却不一样,相差2,这也是生活中比价常见的现象,一般男性的基本工资要
高于女性,符合经济现实。
思考题:
将上例中的性别换成教育水平,教育水平考虑三个层次:高中以下、高中、
大学及其以上。如何建立虚拟变量模型?

iiiuDDXY231210



其他高中;0;11D 

其他大学及以上;0;12D

高中以下的平均薪金:
iiiXDDXYE1021
)0,0,|(
高中的平均薪金:

iiiXDDXYE12021
)()0,1,|(
大学及以上的平均薪金:

iiiXDDXYE13021
)()1,0,|(

Y 大学及其以上
高中
高中以下

0 X
图2 不同教育程度人员薪金水平示意图

年薪Y 男职工
女职工

工龄X
2. 乘法方式——考察斜率的变化
在许多情况下,我们需要考察斜率的变化,此时可以通过乘法的方式引入虚
拟变量来测度。
例1:根据消费理论,收入决定消费,即消费水平C主要取决于收入水平X。
但是,在自然灾害、战争等反常年份,消费倾向往往发生变化。这种消费倾向的
变化可通过在收入的系数中引入虚拟变量来考察。

设: 1;0;tD农村居民城镇居民

消费模型建立如下:
ttttuXDXC210t

同样,我们把该函数分解来进行分析,可化为:
正常年份:

ttttXDXCE)()1,|(210



反常年份:

ttttXDXCE10
)0,|(
如图3所示对比图:

图 3
经济意义:无论是在正常年份还是反常年份人们首先必须解决衣食住行等
温饱问题,这是基本的生活开支。但是到了有战争、自然灾害、金融危机等反常
年份,人们的消费倾向就会下降。
例2:中国农村居民的边际消费倾向会与城镇居民的边际消费倾向不同?
这种消费倾向的差异可通过在收入的系数中引入虚拟变量来考察。

设:
1;0;iD农村居民
城镇居民

消费模型建立如下:
iiiiuXDXC210i

农村居民:

iiiiXDXCE)()1,|(210


城镇居民:
iiiiXDXCE10
)0,|(
3. 混合方式——同时考查截距与斜率的变化
当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量。
课后习题

如果在服装需求函数模型中必须包含3个定性变量:季节(4种状态)、性
别(2种状态)、职业(5种状态),自行设计一虚拟变量模型。

相关主题