§5.5 含有虚拟变量的回归模型 1.带虚变量的回归预测
前述变量均是用某种意义明确的尺度加以定量的变数。
暂时性影响:经济行为受特定因素的影响,因而促使一期或数期变数与其他各期有明显的差异。
虚拟变量:用来表现暂时性影响的变量,或者说,表明某种“品质”或属性是否存在的的变量。
2.基本概念
(1)水平:当自变量以虚拟变量的形式出现时,虚拟变量的出现形式称为“水平”。
(2)反应:用
()k j i
,δ表示第i 个样本第j 个自变量取第k 个水平的反应:
()k j i ,δ=⎩
⎨
⎧否则个水平时个自变量取第
个样本第当第01k j i
(3)反应表:将各样本的资料排列得到的表格称为反应表。
(4)反应矩阵:把反应表中的反应()k j i
,δ写成矩阵形式,称为反应矩阵。
记为
X=
(
()k j i
,δ)。
3.基本方法
(1)建模原则:
如果一个属性变数有m 个类型,只引入m —1个虚拟变量。
否则,会陷入所谓的虚拟变数陷阱之中,出现完全多重共线性的情况。
在解释采用虚拟变量的模型结果时,要弄清楚水平值是如何确定的。
指定取值为0的类型或组通常用来指明基础类型、控制类型、对比类型或被省略的类型。
附属于虚拟变量D 的系数
α1
称为不同的截距系数,它说明D 取值为1的那种类型的截距项
与基础类型的截距系数的数值差异有多大。
(2)建立数学模型:将虚拟变量视为普通变量,建立回归模型。
(3)对参数作出估计。
(4)进行预测。
(5)一般情况:指模型自变量中同时含有虚拟变量和普通变量。
4.应用实例
研究1958年第四季度到1971年第二季度期间英国的失业率和职务空缺率之间的关系。
原始
作出散点图
解释:1966年第四季度起,失业—职位空缺的关系发生变化,表示两者之间关系的曲线在该季度开始上移。
这种上移的含义是指对于一定的职位空缺率来说,1966年第四季度比以前有更多的失业者。
其原因是1966年10月(即第四季度),当时的英国政府通过以统一收费率和(以前的)有关救济金收入的混合制度,取代短期失业救济的统一收费率制度,从而放宽了国民保险条例,这明显地增加了失业救济金的水平。
如果增加了失业救济金,则失业者可能会以较长的时间去寻找工作,因此对于任何一个给定的职位空缺率来说,就会反映出较高的失业量。
建立模型:
()u V DT V DT UN t
t
t
t
t
t
++++=ββαα2
1
1
UN=失业率,%; V=职位空缺率,%;
DT=1,在1966年四季度开始的时期; DT=0,在1966年四季度以前的时期; T =时间,以季度计。
模型解释:
注意:如果存在着严重的异方差性,则虚拟变量是不适用的。
(指两个分段函数)
()()
()
()
⎪⎩⎪⎨
⎧++++++=农村居民的消费函数城镇居民的消费函数u u X X Y 21
012110βαββαα。