当前位置:文档之家› 计量经济学:第八章 虚拟变量回归

计量经济学:第八章 虚拟变量回归

第八章 虚拟变量回归第一节 虚拟变量的概念一、问题的提出计量经济学模型对变量的要求——可观测、可计量。

但在现实经济问题中,存在定性影响因素,比如1、属性(品质)因素的表达。

在经济活动中,有的经济变量的变动要受到属性因素(或品质因素)的影响。

如收入在形成过程中,不同的性别所得到的收入是不一样的;在城乡、不同地区等收入存在差距;再比如,在我国,经济的发展水平对于不同的区域有不同的表现。

2、异常值现象。

当经济运行过程中,可能会受到突发事件的影响,那么,其值有可能出现异常,偏离正常轨迹很远,对这类现象需要加以修正。

3、季节因素的影响。

有的经济现象存在明显的季节特征,如啤酒的消费。

那么,在建模过程中,季节变动这一因素怎样考虑?4、离散选择现象的描述。

如公共交通与私人交通的选择、商品购买与否的决策、求职者对职业的选择等。

第1、2、3种情况属于解释变量为定性变量,第4情况为被解释变量属于定性变量。

称前一种情况为虚拟解释变量,后一种为虚拟被解释变量。

本章主要介绍虚拟解释变量的内容。

二、虚拟变量的定义1、定义。

设变量D 表示某种属性,该属性有两种类型,即当属性存在时D 取值为1;当属性不存在时D 取值为0。

记为⎩⎨⎧=不具有该属性具有某种属性01D2、虚拟变量引入的规则。

(1)在模型里存在截距项的条件下,如果一个属性存在m 个相互排斥类型(非此即彼),则在模型里引入m-1个虚拟变量。

否则,会出现完全的多重共线性。

但要注意,在模型无截距项的情况下,如果一个属性存在m 个类型,即便引入m 个变量,不会出现多重共线性问题。

( 请思考为什么?)(2)虚拟变量取值为0,意味着所对应的类型是基础类型。

而虚拟变量取值为1,代表与基础类型相比较的类型,称为比较类型。

例如“有学历”D 为1,“无学历”D 为0,则“无学历”就是基础类型,“有学历”为比较类型。

(3)当属性有m 个类型时,不能把虚拟变量的取值设成如下情况D=0, 第一个类型;D=1, 第二个类型;……D=m-1, 第m 个类型。

原因是上述情况没有反映出属性类型的相互排斥性。

第二节 虚拟解释变量的回归一、加法引入规则1、加法引入规则,虚拟解释变量与别的解释变量以相加的关系出现在模型里。

加法引入虚拟变量对模型产生的结果是只改变截距项。

设模型为123i i i iY X D u βββ=+++ 式中,i D 为虚拟变量,它与其它解释变量是相加的关系。

如果虚拟变量按这种方式引入模型,则称虚拟变量按加法类型引入。

2、加法引入虚拟变量的应用。

(1)模型中只有一个定性解释变量。

设模型形式为12i i i Y D u ββ=++ n i ,,3,2,1 =其中,i D 为具有两个属性类型的定性变量,如在教材第217页,设i Y 为居民的年可支配收入,i D 为虚拟变量,其取值表示为:i D =1表示城镇居民;i D =0表示农村居民。

即1,0i D ⎧=⎨⎩城镇居民,农村居民,1,2,3,,i n =该方程的意义在于,在其它因素不变的条件下,城镇居民与农村居民的收入是否具有显著性差异。

由此得到城镇居民的年平均收入:12(|1)i i E Y D ββ==+。

农村居民的年平均收入为:1(|0)i i E Y D β==为了检验城镇居民和农村居民的差异对年平均收入的影响是否具有显著性,可构造假设:0212:0;:0H H ββ=≠ 对上述模型进行回归,利用样本统计量对假设作出判断(t 检验)。

只有一个定性解释变量往往可用于检验一个属性因素对被解释变量的影响是否显著性存在。

(2)模型中有一个定量解释变量和一个定性解释变量。

设模型形式为123i i i iY X D u βββ=+++ 式中,i Y 为消费支出;i X 为收入;i D 为虚拟变量,即1,0i D ⎧=⎨⎩城镇居民,农村居民,1,2,3,,i n =上述表达式的意义在于,在收入不变的条件下,研究城镇居民和农村居民对消费的不同影响,即判断城乡居民在消费上是否存在显著性差异。

农村居民年平均消费:12(,|,0)i i i i E Y X D X ββ==+城镇居民年平均消费:122(,|,1)()i i i i E Y X D X βββ==++可以看出,城镇居民和农村居民两种收入类型的斜率系数一样,但截距不同。

说明两种类型的居民在收入的水平上存在2β的规模差异。

这一假定也可通过对2β的显著性检验来判断。

(3)模型中有一个定量解释变量和一个定性解释变量,但有多个属性类型。

设模型形式为12233i i i i i Y D D X u αααβ=++++ 式中,i Y 为年医疗保健费支出;i X 为居民年可支配收入;如果将受教育程度分为三种类型:高中以下、高中、大专及大专以上,则引入虚拟变量为如下两个231,0,i i D D ⎧=⎨⎩⎧=⎨⎩1,高中及高中以上0,其他大专及大专以上其他高中以下的年平均医疗保健费支出:231(|,0,0)i i i i i E Y X D D X αβ===+高中的年平均医疗保健费支出:2312(|,1,0)()i i i i i E Y X D D X ααβ===++大专及大专以上年平均医疗保健费支出:2313(|,0,1)()i i i i i E Y X D D X ααβ===++对于模型12233i i i i i Y D D X u αααβ=++++ 有(4)模型中有一个定量解释变量和两个以上定性解释变量,每个定性解释变量有两个或以上属性类型。

设模型形式为12233i i i i i Q D D Y u αααβ=++++式中,i Q 为卷烟需求量;i Y 为居民可支配收入,考虑两种不同属性:不同区域的居民,即城镇居民与农村居民;不同性别,即男与女。

因此各引入一个虚拟变量231,01,0,i i D D ⎧=⎨⎩⎧=⎨⎩城镇居民,农村居民男性女性农村女性居民:231(|,0,0)i E Q Y D D Y αβ===+农村男性居民:2313(|,0,1)()i E Q Y D D Y ααβ===++城镇女性居民:2312(|,1,0)()i E Q Y D D Y ααβ===++城镇男性居民:23123(|,1,1)()i E Q Y D D Y αααβ===+++(5)对模型中存在异常值的修正。

设模型形式为12t t t Y X u ββ=++由于某种突发因素的干扰,使得在0t t =时刻随机误差产生系统性偏离,即000,()(0),t t t E u c c t t ≠⎧=⎨≠=⎩这时,可引入虚拟变量000,1,t t t D t t ≠⎧=⎨=⎩则12t t t t Y X cD v ββ=+++其中,t t t v u cD =-,对t v 求数学期望,有()()0t t t E v E u c D=-= 表明新的随机误差项t v 满足零均值假定,从而可用OLS 法对引入虚拟变量的模型求参数的估计。

当0t t =时,12(|,1)()t t t t E Y X D c X ββ==++当0t t ≠时,12(|,0)t t t t E Y X D X ββ==+还有一种情况,研究消费行为,认为消费水平C 主要受到收入水平Y 的影响,但对于正常年份和反常年份,消费行为的表现是不同的,这时可考虑引入虚拟变量1,0t D ⎧=⎨⎩正常年份,反常年份则012t t t t C Y D u ααα=+++有当正常年份时,021(|,1)()t t t t E C Y D Y ααα==++当反常年份时,01(|,0)t t t t E C Y D Y αα==+进一步对参数估计,利用样本统计量对总体参数2α作检验,从而可判断正常年份消费行为与反常年份消费是否存在差异。

(6)对季节因素的修正。

假设i Y 是具有某种季节特征的消费行为(如啤酒、汗衫等商品的消费),这时需要对季节波动进行调整,下面介绍利用虚拟变量来调整季节变化。

设模型形式为1t t tY X u αβ=++ 季节为属性因素,按自然属性有4个不同的季节(春、夏、秋、冬),即4个属性类型。

因此,在有截距项的前提下,可引入3个虚拟变量,即2341,11,21,3,0,0,0,t t t D D D ⎧⎧⎧===⎨⎨⎨⎩⎩⎩季度季度季度,其它其它其它引入季节虚拟变量的模型为1223344t t t t t t Y D D D X u ααααβ=+++++第1季度,23412(|,1,0)()t t t t t t E Y X D D D X ααβ====++第2季度,32413(|,1,0)()t t t t t t E Y X D D D X ααβ====++第3季度,42314(|,1,0)()t t t t t t E Y X D D D X ααβ====++第4季度,2341(|,0)t t t t t t E Y X D D D X αβ====+二、乘法引入规则1、以乘法形式引入虚拟变量,是在所设定的模型里,将虚拟解释变量与其它解释变量用乘积作为新的解释变量。

乘法引入虚拟解释变量将改变模型中的斜率系数。

设模型为12()t t t t t Y X X D u ααβ=+++或者1212()t t t t t Y X D D u ααβ=+++其中,t X 为定量解释变量,12,,t t t D D D 均为虚拟变量。

按上述形式引入虚拟变量即为乘法引入。

2、乘法引入虚拟解释变量的应用。

(1)检验模型的结构是否发生了变化。

设模型形式为1212()t t t t t t Y D X D X u ααββ=++++ 式中,t Y 为储蓄总额,t X 为收入总额,t D 为虚拟变量,即1,0,t D ⎧=⎨⎩改革开放前改革开放后 改革开放后,平均储蓄额为11(|,0)t t t t E Y X D X αβ==+改革开放前,平均储蓄额为1212(|,1)()()t t t t E Y X D X ααββ==+++在上式中2α被称为截距差异系数,2β被称为斜率差异系数,它们分别代表改革开放前后储蓄函数的截距与斜率存在的差异。

结构变化的专门检验——邹氏检验(在EViews 里的记号为CHOW 检验,该内容自学)。

(3)交互效应。

在实际经济活动中,多个定性解释变量对被解释变量的影响可能存在一种交互影响,即一个变量的边际效应可能要依赖于另外变量的变动(即由于变量间的交互作用而对解释变量的影响)。

这时可用乘法引入虚拟变量的方法来表示。

设模型形式为i i i i i u X D D Y ++++=βααα33221其中 ,i Y 为农副产品生产总收益,i X 为农副产品生产投入,i D 2为油菜籽生产虚拟变量,i D 3为养蜂生产虚拟变量。

相关主题