当前位置:
文档之家› 第7章 虚拟变量回归模型-案例
第7章 虚拟变量回归模型-案例
是用作解释变量。
例如:一个以性别为虚拟变量来考察职工薪金的模型如下:
Yi = b0 b1 X i b2 Di mi
其中 (7-1)
Yi ——为职工的薪金; X i ——为职工工龄;
Di =1 ——代表男性 Di =0 ——代表女性
§7.2 虚拟变量的引入
虚拟变量做为解释变量引入模型有两种基本方式:
1 D1 = 0 高中 其他 1 D2 = 0 大学及其以上 其他
模型可设定如下:
Yt = b 0 b 1 X t b 2 D1 b 3 D2 m t
在E(mt)=0 的初始假定下,高中以下、高中、大 学及其以上教育水平下个人保健支出的函数: 高中以下: 高中:
E(Yt | X t , D1 = 0, D2 = 0) = b 0 b1 X t
(2)乘法类型
例7.1.6 随着收入水平的提高,家庭教育费用支出的边际消费倾向
可能会发生变化。为了反映定性因素对斜率的影响,可以用乘法方式 引入虚拟变量,将家庭教育费用支出函数取成:
图7.1.2 虚拟变量对斜率的影响
如,设
1 正常年份 消费模型可建立如下: Dt = 0 反常年份
Ct = b 0 b1 X t b 2 Dt X t m t
对某些产品(如冷饮)销售的影响等。
为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将 它们人为地“量化”,这种“量化”通常是通过引入“虚拟变量”来完成的。
这种用两个相异数字来表示对被解释变量有重要影响而自身又 没有观测数值的一类变量,称为虚拟变量(dummy variables)。
虚拟变量也称为哑变量或定性变量。
yt = b0 b1 xt a xt x Dt ut
t
临界指标的虚拟变量的引入 在经济发生转折时期,可通过建立临 界指标的虚拟变量模型来反映。
当截距与斜率发生变化时,则需要同时引入加 法与乘法形式的虚拟变量。
OLS法得到该模型的回归方程为
则两时期进口消费品函数分别为:
当t<t*=1978年,
一个以性别为虚拟变量考察企业职工薪金的模型:
Yt = b 0 b 1 X t b 2 Dt m t
其中:Yt为企业职工的薪金,Xt为工龄, Dt=1,若是男性,Dt=0,若是女性。
虚拟变量模型
同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型。
在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要
β2 β0
收入
还可将多个虚拟变量引入模型中以考察多种 “定性”因素的影响。
如在上述职工薪金的例中,再引入代表学历 的虚拟变量D2:
1 本科及以上学历 D2 = 0 本科以下学历
职工薪金的回归模型可设计为:
Yt = b 0 b 1 X t b 2 D1 b 3 D2 m t
于是,不同性别、不同学历职工的平均薪 金分别为:
•女职工本科以下学历的平均薪金: E(Yt | X t , D1 = 0, D2 = 0) = b 0 b 1 X t
•男职工本科以下学历的平均薪金:
E(Yt | X t , D1 = 1, D2 = 0) = ( b 0 b 2 ) b 1 X t
•女职工本科以上学历的平均薪金:
E(Yt | X t , D1 = 0, D2 = 1) = ( b 0 b 3 ) b 1 X t
许多经济变量是可以定量度量的,如:商品需求量、价格、 收入、产量等, 但也有一些影响经济变量的因素无法定量度量,如:职业、 性别对收入的影响,战争、自然灾害对GDP的影响,季节 对某些产品(如冷饮)销售的影响等等。 为了在模型中能够反映这些因素的影响,并提高模型的精 度,需要将它们“量化”。
这种“量化”通常是通过引入“虚拟变量”来完成 的。根据这些因素的属性类型,构造只取“0”或“1”的人工 变量,通常称为虚拟变量(dummy variables),记为D。
双值变量、类型变量、定性变量、二元型变量、名义变量等,习惯上用字母D表
示。例如
虚拟变量
为什么要引入“虚拟变量” ??
许多经济变量是可格、收入、产量等
但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测
如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节
影响,1978年前后,y和x
例如,进口消费品数量Y主要取决于国民收入 X的多少,中国在改革开放前后,Y对X的回归关 系明显不同。 这时,可以t*=1978年为转折期,以1978年 的国民收入Xt*为临界值,设如下虚拟变量:
1 Dt = 0
t t* t t*
则进口消费品的回归模型可建立如下:
加法方式 所设定的计量经济模型中加入适当的虚拟变量,此
时虚拟变量与其他解释变量在设定模型中是相加关 系。其作用是改变了设定模型的截距水平。
乘法方式
在所设定的计量经济模型中,将虚拟解释变量与其
他解释变量相乘作为新的解释变量出现在模型中,
以达到其调整设定模型斜率系数的目的。
§7.2 虚拟变量的引入
加法方式引入虚拟变量,考察:截距的不同, 许多情况下:往往是斜率就有变化,或斜率、截距同时发 生变化。 斜率的变化可通过以乘法的方式引入虚拟变量来测度。
例:根据消费理论,消费水平C主要取决于收入水平Y,但 在一个较长的时期,人们的消费倾向会发生变化,尤其是在自 然灾害、战争等反常年份,消费倾向往往出现变化。这种消费 倾向的变化可通过在收入的系数中引入虚拟变量来考察。
2.引入虚拟变量的作用
引入虚拟变量的作用,在于将定性因素或属性因素对因变 量的影响数量化。
(1)可以描述和测量定性(或属性)因素的影响;
(2)能够正确反映经济变量之间的相互关系,提高模型的精 度;
(3)便于处理异常数据。设置虚拟变量 (即将异常数据作为
一个特殊的定性因素)。例如:
§7.1 虚拟变量的基本含义
年薪 Y 男职工 女职工
b0+a
b0
工龄 X
7.2.虚拟变量的引入
虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。
1. 加法方式
1 男性 yt = b0 b1 xt aDt ut , D = 0 女性
E ut = 0 ,则:
为什么下面这样的写法?
上述职工薪金模型(7-1)中性别虚拟变量的引入就采取了加法方式, 在该模型中,如仍假定
例如:
1)表示性别的虚拟变量可取为
D1=
1 0
男性 女性
4)表示消费心理的虚拟变量可取为
2)表示文化程度的虚拟变量可取为 D2= 1 本科及以上学历
D4=
1 0
喜欢某种商品 不喜欢某种商品
0
本科以下学历
5)表示天气变化的虚拟变量可取为
3)表示地区的虚拟变量可取为 D3=
1
0
城市
农村
D5=
1 0
晴天 雨天
图7-1 男女职工平均薪金示意图
a。
可以通过传统的回归检验,对 a 的统计显著性进行检验, 以判断男女职工的平均薪金水平是否显著差异。
例7.1.4 居民家庭的教育费用支出除了受收入水平的影 响之外,还与子女的年龄结构密切相关。如果家庭中 有适龄子女(6-21岁),教育费用支出就多。因此,为了 反映“子女年龄结构”这一定性因素,设置虚拟变量:
E(Yt | X t , D1 = 1, D2 = 0) = ( b 0 b 2 ) b 1 X t
大学及其以上:E(Yt | X t , D1 = 0, D2 = 1) = ( b 0 b 3 ) b1 X t
假定b3>b2,其几何意义:
大学教育 保健 支出
β3
高中教育 低于中学教育
第7章 虚拟变量回归模型
§7.1 虚拟变量的基本含义 §7.2 虚拟变量的引入 §7.3 案例分析
第7章 单方程回归模型的几个专门问题
7.1 虚拟变量
7.1.1 虚拟变量的概念及作用
1.虚拟变量的内涵 在计量经济学中,我们把反映定性(或属性)因素变化,取值为0和1的人工 变量称为虚拟变量(Dummy Variable),或称为哑变量、虚设变量、属性变量、
图7.1.1表明,在相同的收入水平情况下,有适龄子女家庭的教育费用平均要 比无适龄子女家庭的教育费用多支a出个单位。
图7.1.1 虚拟变量对截距的影响
又例:在横截面数据基础上,考虑个人保健支出对 个人收入和教育水平的回归。 教育水平考虑三个层次:高中以下, 高中, 大学及其以上 这时需要引入两个虚拟变量:
•男职工本科以上学历的平均薪金: E(Yt | X t , D1 = 1, D2 = 1) = ( b 0 b 2 b 3 ) b1 X t
2、乘法方式
在所设定的计量经济模型中,将虚拟解释变量与其他解释变
量相乘作为新的解释变量出现在模型中,以达到其调整设定 模型斜率系数的目的。
乘法形式引入虚拟解释变量的主要作用:①两个回归模型之间的比较; ②因素之间的交互影响分析;③提高模型对现实经济现象的描述精度。
建立企业年薪模型:yt=b0+b1xt+aD+ut
企业女职工的薪金模型:yt=b0+b1xt+ut 企业男职工的薪金模型:yt=(b0+a)+b1xt+ut
几何意义:
yt=b0+b1xt+aD+ut
男女职工的年薪对工龄的函数具有相同 斜率b1,表明随着工龄的增长,男女职工 工资的增长幅度相同;截距不同,说明男 女职工的初始年薪不同。这种虚拟变量只 影响截距不影响斜率的模型为加法模型。
例如,反映文程度的虚拟变量可取为: 1, 本科学历 D= 0, 非本科学历 一般地,在虚拟变量的设置中: