当前位置:
文档之家› 计量经济学——虚拟解释变量模型
计量经济学——虚拟解释变量模型
5
当然,把哪种情况取0,哪种情况取1要视 研究情况而定。0和1只是一个符号而已,不 代表他们有高低的意义。我们可以把男性设 为1,也可以设为0,得到的结果是一致的。 这样就可以把量化的质量变量引入经济计量 模型中,以便进一步进行数学处理。
6
需要指出的是,虚拟变量主要是 用来代表质的因素,但是有些情况下也 可以用来代表数量因素。例如在建立储 蓄函数时,“收入”显然是一个重要解 释变量,虽然是“数量”因素,但是为 了方便也可以用虚拟变量表示。
影响被解释变量,它有个m特征,我们就 要引入m-1个虚拟变量;
20
如果回归方程没有截距项,那么这个 质的因素有多少个特征就要设多少个虚 拟变量,这就是虚拟变量的使用原则。 如果虚拟变量设定不当,会使最小二乘 法无解,称这种情况为虚拟变量陷阱。
21
下面就用线性代数中的知识来说明这一 点。同样用例8.1,引入两个虚拟变量对有 截距项和没有截距项的情况分别讨论。
计量经济学——虚拟解释变量模 型
在经济计量模型中除了有量的因 素外还有质的因素,质的因素包括被解释 变量为质的因素和解释变量为质的因素。 如果被解释变量为质的因素,主要是逻辑 回归要涉及的内容。本章就解释变量为质 的因素也就是存在虚拟解释变量时如何进 行参数估计等一系列问题进行讨论。
1
第一节 引
言
43
而在1979年以后, 物资逐渐丰富, 商 品的买卖也取消了票证的限制, 消费 者储蓄的主要目的之一是购买高档耐 用消费品,储蓄不再具有“被迫”的 性质。
;
4. 若 β1=0,β3≠0,则为斜率变动模型,
这种情况在现实中出现得不是很多。
37
ቤተ መጻሕፍቲ ባይዱ
下面,以我国的农村和城市的消费 样本为例,实际体会虚拟变量模型从建模 到检验再到估计参数最后下结论的全过程。
【例8.2】已有数据资料为我国城镇居
民家庭1955年至1985年人均收入和人均储
蓄。根据经验,也就是先验信息,再通过
11
【例8.1】假设有一个包括正常年 份和非正常年份(亚洲金融危机或SARS的 影响)居民消费的样本,并打算用这些数 据估计消费函数。由于在正常年份和非正 常年份居民在消费水平上存在明显差异, 所以一些外界的影响是一个重要的解释变 量。
12
用一个虚拟变量来表示这个质的因素 ,消费函数为
Yi 0 1D 2 X i ui (8.1)
D2t 0
其他
1 第三季度
D3t 0
其他
这里,第四季度为基础类型,其截距项
为β0 。而其它三个季度的截距项分别为 β0+ β1,β0+ β2 ,β0+ β3 。β1,β2 , β3 代表季节变动引起的消费差异。
32
四个季度的回归模型分别为
第一季度 第二季度 第三季度 第四季度
Yt Yt Yt Yt
(8.21)
β1和 β3 分别表示城镇居民家庭
和农村居民家庭的消费函数在截
距和斜率上的差异。
36
我们一般通过t 检验来判定它们之间是否
有差异。
1. 若β1≠0 ,β3≠0,则为截距和斜率同 时变动模型;
2. 若 β1≠0,β3=0,则为截距变动模型; 3. 若 β1=0,β3=0, 则表示城镇居民家庭 和农村居 民家庭有着完全相同的消费模式
0 0 0 0
1 4Xt 2 4Xt 3 4Xt 4Xt ut
ut ut ut
(8.15) (8.16) (8.17) (8.18)
33
(四)截距和斜率同时变动模型 在多数情况下,质的因素不但对
回归模型的截距有影响,而且还会改变 模型的斜率。例如城镇居民和农村居民 的消费函数不但在斜率上有差异,在截 距上也是有可能不一致的,将两个问题 同时考虑进来,我们可以得到回归方程
如果只有一个质的因素,且具有m个特 征,那么如果是含有截距项的,就要引入 m-1个虚拟变量;不含有截距项的, 应该 引入m个虚拟变量,这就是虚拟变量的设 定原则。
10
一 、截距变动模型和斜率变动模型
(一)包含一个虚拟变量的截距变动模型 首先从最简单的例子入手,假设只有
一个定性因素影响被解释变量的变化,而且 这个因素仅有两种特征,这时候只需要引入 一个虚拟变量。
34
Yi 0 1D 2 X i 3 (DX i ) ui
(8.19 式中,Yi=第个)家庭的消费水平,Xi=第个 家庭的收入水平,
D
1 0
城镇居民家庭 农村居民家庭
35
式(8.19)可以表示为
D 1 Yi 0 1 (2 3 )X i ui (8.20)
D 0 Yi 0 2 X i ui
24
(2)对没有截距的情况,我们如果设两个 虚拟变量,
Yi 1D1i 2D2i 3 Xi ui (8.10)
显然模型(8.10)中,解释变量D1,D2和X 之间无完全的多重共线性。可以使用普通最小 二乘法估计式(8.10)的参数。
25
(二)斜率变动模型 在实际问题中,斜率单独变动出
现的情形一般比较少,它指的是改变了变 动的速率也就是弹性。 例如城镇居民家 庭与农村居民家庭的消费函数, 在边际 消费倾向(斜率)上可能会有所不同,假 设它们的消费函数在截距项没有区别。
(1)对有截距项的情况,我们如果设两 个虚拟变量,则回归模型为
Yi 0 1D1i 2 D2i 3 X i ui (8.7)
22
1 D1i 0
正常年份 非正常年份
1 非正常年份 D2i 0 正常年份
式(8.7)也可表示
为
Yi 0 X1i 1 X 2i 2 X 3i 3 X i ui (8.8)
D 0 时 正常年份 E(Y) i 0 2Xi D 1 时 非正常年份 E(YI ) 0 1 2Xi
如果我们绘制图形,得到的结果仍
然是一样的。此时,β1<0,非正常年份
的线低于正常年份的线,代表非正常年份 的消费水平低于正常年份的消费水平。
18
2.虚拟变量D=0所代表的特 性或状态通常称为基础类型。和其它特征 或状态比较的意义上说,基础类型为对比 的基础,在式(8.2)和式(8.3)中, 非正常年份就是基础类型,而在式(8.5) 和式(8.6)中,正常年份就是基础类型。
其中,X1i 1, X 2i D1i , X 3i D2i
式成立。
X 1i X 2i X 3i
,显然如下等 (8.9)
23
式(8.9)表明模型(8.8)即原模型 (8.7)中有完全的多重共线性,将导致最小 二乘估计无解。我们称该情景为掉入虚拟变 量陷阱。所以,在有截距项的情况下,如果 一个质的因素有多少个特征就引入多少个虚 拟变量是行不通的。
在经济计量分析中, 经常会 碰到所建模型的被解释变量不仅受诸 如收入、产量、价格、 成本、需求、 投资等数量变量的影响,而且也受到 诸如战争、自然灾害、国际环境、季 节变动以及政府经济政策变动等质量 变量的影响。建立经济计量模型若不 考虑这些质量变量的影响作用,显然 是不适宜的。
2
所以,在建立经济计量模型时, 即要考虑数量变量,也要考虑质量变量 。但是,质量变量和数量变量不同,数 量变量可以在事前规定好的尺度上,用 不同的数值表现出来,质量变量却只能 以属性、种类的不同具体形式表现出来 。
16
通过例8.1,我们可以找出虚拟变量 模型的一些特征。
1.用“1”来代表质的因素的哪个特 征是可以任意设定的。我们一般认为, “1”代表具有某些特征,但没有具体规定 。在上例中,也可以指定D=1时为非正常年 份,而D=0就必然为正常年份。在这种情况 下,正常年份和非正常年份的消费函数分 别为
17
模型中的系数β0 为基础类型的截距项, 称为公共截距项;系数β1 称为差别截距
系数,指的是D取1时截距系数和基础类型 的截距系数的差异。
19
3.如果一个回归模型有截距项,而 且这个质的因素又有两种特征,也就是 将其分两类,则我们只需要引入一个虚 拟变量。如我们的例8.1所示。如果一个 回归方程有截距项,只有一个质的因素
30
例如,我们用季度资料研究各种商 品消费额在季节上有没有什么区别?可以 建立模型如下:
Yt 0 1D1t 2 D2t 3 D3t 4 X t ut
(8.14 其中,Yt=季)度的消费,Xt=季度的收入, 对于四个季度,我们引入了三个虚拟变量:
31
1 第一季度
D1t 0
其他
1 第二季度
7
第二节 虚拟解释变量的设定
虚拟解释变量模型的设定因为 质的因素的多少和这些因素特征的多少 而引入的虚拟变量也会不同。
8
以一个最简单的虚拟变量模型为例, 如果只包含一个质的因素,而且这个因 素仅有两个特征,则回归模型中只需引 入一个虚拟变量。如果是含有多个质的 因素, 自然要引入多个虚拟变量。
9
26
那么回归模型可记为
Yi 0 1 X i 2 (DX i ) ui (8.11 )
其中,Yi=第个家庭的消费水平, Xi=第个家庭的收入水平,
D
1 0
城镇居民家庭 农村居民家庭
27
式(8.11)可以表示为
D 1, Yi 0 (1 2)Xi ui D 0, Yi 0 1Xi ui
14
式(8.2)和式(8.3)分别为正常 年份和非正常年份的居民消费水平。二 者具有相同的斜率,但是截距不同。
15
利用最小二乘法对式(8.1)进行估计,可得到
Yˆi ˆ 0 ˆ1D ˆ 2 Xi (8.4)
对 β1 作t 检验,若 β1 显著地不为
0,我们就认为正常年份和非正常年份居民 在消费行为上的差异是明显的。若 β1 >0 ,则正常年份的居民消费水平高于非正常 年份的居民消费水平。
41
1979年以后,我国居民的收入水平 大幅度提高,同时,居民储蓄也在大 幅度增长。从这些可以看出来,1979 年前后两个时期,我国居民的边际储 蓄倾向有显著性差异。