当前位置:文档之家› 计量经济学8第八章 虚拟变量回归new

计量经济学8第八章 虚拟变量回归new

GENR SMPL GENR D1=0 9 16 D1=1 输入虚拟变量的值 样本期调为1999年 输入虚拟变量的值
25
SMPL 1 16 GENR XD=X*D1 LS Y C X D1 XD 估计结果为: 操作演示
t统计量
样本期调至1998~1999年 生成XD的值 利用混合样本估计模型
R2的值
单位:亿元
城乡居民人 民币储蓄存 款增加额 (YY)
年 份
城乡居 民人民 国民总收 币储蓄 入 (GNI) 存款年 底余额 (Y ) 7206.7 8989.1 10201.4 11954.5 14922.3 16917.8 18598.4 1214.7 1622.6 2237.6 3073.3 3801.5 5146.9 7119.8
YY
NA 70.4 118.5 124.2 151.7 217.1 1991 1992 1993 1994 1995 1996
城乡居民人 民币储蓄存 国民总收 款年底余额 入 (GNI) (Y ) 21662.5 26651.9 34560.5 46670 57494.9 66850.5 9241.6 11759.4 15203.5 21518.8 29662.3 38520.8
第三节 虚拟变量的特殊应用
一、调整季节波动 例如,用季度数据分析某公司利润y与销售 收入x之间的相互关系时,为研究四个季度的季 节性影响,引入三个虚拟变量(设第1季度为基 础类型): 第i+1季度 i=1,2,3 1 Di 其他季度 0 利润函数可取为 : Yi=a+bxi+ α 1D1i+ α 2D2i + α 3D3i + ε i
计量经济学
第八章
虚拟变量回归
1
引子:男女大学生消费真有差异吗?
在对在校学生的消费行为进行的调查中,发现在校
生的消费行为呈现多元化的结构。人际交往消费、
手机类消费、衣着类消费、化妆品类消费、电脑类 消费、旅游类消费占有较大的比例;而食品类消费、 学习用品类消费不突显。 显然,男女生在消费上存在差异。为了了解男、女
二、检验模型结构的稳定性 设根据两个样本估计的回归模型分别为: 样本1: Yi=a1+b1xi +ε i 样本2: Yi=a2+b2xi +ε i 1 样本2 设置虚拟变量: D 0 样本1
估计模型:Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+ε 其中,XDi=xi*Di。
21
1 设虚拟变量为: D 0
三、分段回归
x>x* x<x*
分段回归模型设置成: Yi= a+bxi+β (xi-x*)Di+ε i 其中,x*是已知的临界水平(分段点)。 这样各段的函数为: Yi= a +bxi+ε i x<x* Yi= (a-β )+(b+β )xi+ε i x>x*
6
第二节 虚拟变量的设定
一、虚拟变量的引入方式 (1)加法方式 Yi=a+bxi+α Di+ε i a+α 等价为: 当Di =0时:Yi=a+bxi+ε i a 当Di =1时:Yi=(a+α )+bxi+ε i
D=1 α D=0
以加法方式引入,反映定性因素对截距的影响
(2)乘法方式
Yi=a+bxi+β XDi+ε i 其中:XDi=Xi*Di, 上式等价于: a 当Di =0时:Yi=a+bxi+ε i 当Di =1时:Yi=a+(b+β )xi+ε
1 农村居民 D1 0 城镇居民
城市低收入家庭 城市高收入家庭 农村低收入家庭 农村高收入家庭
1 高收入家庭 D2 0 低收入家庭
(D1=0,D2=0) (D1=0,D2=1) (D1=1,D2=0) (D1=1,D2=1)
这样可以反映各类居民家庭的住房消费情况:
思考:若是多因素、多个属性水平的问题,如何设置?
调整的R2值
26
第四节 案例分析
为了考察改革开放以来中国居民的储蓄存款与收 入的关系是否已发生变化,以城乡居民人民币储 蓄存款年底余额代表居民储蓄( Y ),以国民总
收入GNI代表城乡居民收入,分析居民收入对储
蓄存款影响的数量关系,并建立相应的计量经济
学模型 。
27
表8.1
国民总收入与居民储蓄存款
城乡居民 人民币储 年 蓄存款增 份 加额( )
单位:亿元
城乡居民 人民币储 蓄存款增 额 (YY) 2121.8 2517.8 3444.1 6315.3 8143.5 8858.5
年 份
城乡居民 国民总收 人民币储 蓄存款年 入 (GNI) 底余额 (Y) 3624.1 4038.2 4517.8 4860.3 5301.8 5957.4 210.6 281 399.5 532.7 675.4 892.5
1 D 0
政策紧缩
政策宽松
1 D 0
本科以上学历
本科以下学历
变量的划分应遵循穷举与互斥原则。
5
二、作用
⑴可以描述和测量定性因素的影响。
⑵能够正确反映经济变量之间的相互关系,提高模 型的精度。 ⑶便于处理异常数据。 即将异常数据作为一个特殊的定性因素
1 D 0
异常时期 正常时期
生的消费支出结构差异,应当如何建立模型?
面临的问题:如何把男女生这样的非数量变量引
入方程?
2
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要
影响。例如,研究某个企业的销售水平,产业属性
(制造业、零售业)、所有制(私营、非私营)、
地理位置(东、中、西部)、管理者的素质、不同
的收入水平等是值得考虑的重要影响因素,但这些 因素共同的特征是定性描述的。 如何对非定量因素进行回归分析? 采用“虚拟变量”对定性变量进行量化一种思路。
为比较两年的消费函数是否有显著差异,设置虚拟 变量: 1 1999年
D 0
1998年
并且合并两年的数据,估计以下模型: Yi= a1 +b1xi+α Di+β XDi +ε i 其中α =a2-a1 ,β =b2-b1。
24
使用EViews软件的估计过程如下: CREATE U 16 建立工作文件 DATA Y X (输入1998、1999年消费支出和收入的数据,1~8期 为1998年资料,9~16期为1999年资料) SMPL 1 8 样本期调为1998年
1978 1979 1980 1981 1982 1983
数据来源:《中国统计年鉴2004》,中国统计出版社。表中“城乡居民人民币 储蓄存款年增加额”为年鉴数值,与用年底余额计算的数值有差异。 28
表8.1
国民总收入与居民储蓄存款 (续)
城乡居 民人民 币储蓄 存款增 加额 (YY ) 322.2 407.9 615 835.7 728.2 1374.2 1923.4
使用虚拟变量能如 实描述不同阶段的 经济关系,又未减 少估计模型时样本 容量,保证了估计 精度。
22
四、混合回归 能否将变量的时序数据和横截面数据混合建模 【例】现有我国城镇居民1998年、1999年全年人均消 费支出和可支配收入的统计资料。试使用混合样本 数据估计我国城镇居民消费函数。 设1998年、1999年我国城镇居民消费函数分别为: 1998年:Yi=a1+b1xi +ε i 1999年:Yi=a2+b2xi +ε i
9
观察相关图
从相关图可以看出, 前3 个样本点与后 5 个样 本点存在较大差异,因 此,可设置虚拟变量反 映“收入层次”:
1 D 0
中高收入家庭 低收入家庭
10
将我国城镇居民的彩电需求函数设成: Yi=a+bxi+α Di+β XDi+ε i DATA D1 (由于D是EViews软件的保留字,所以将虚拟变量取 名为D1;另外,此时也可以用SMPL和GENR命令直 接生成D1变量) GENR XD=X*D1 生成变量XD LS Y C X D1 XD 估计需求函数 结果如下图所示:
1 本科 D1 0 其他
1 研究生 D2 0 其他
而将年薪模型取成(假设以加法方式引入):
Yi=a+bxi+α 1D1i+α 2D2i +ε 其等价于:
i
Yi=a+bxi+ε i Yi=(a+α 1)+ bxi+ε Yi=(a+α 2)+ bxi+ε
i i
大专以下(D1=D2=0) 本科(D1=1,D2=0) 研究生(D1=0,D2=1)
i
20
第(1)种情况下模型结构是稳定的, 利用t检验判断D、XD系数的显著性,得到四种 其余情况都表明模型结构不稳定。 重合回归检验结果: (1)a2=a1,b2=b1,两个回归模型没有显著差异。 (2)a2≠a1 ,b2=b1 ,两个回归模型之间的差异仅仅 平行回归 表现在截距上。 (3)a2=a1 ,b2≠b1 ,两个回归模型的截距相同,但 汇合回归 斜率存在显著差异。 (4)a2≠a1,b2≠b1,表明两个回归模型完全不同。 相异回归
年 份
国民总收入 (GNI)
城乡居民人 民币储蓄存 款年底余额 (Y )
1984 1985 1986 1987 1988 1989 1990
1997 1998 1999 2000 2001 2002 2003
73142.7 76967.2 80579.4 88254 95727.9 103935.3 116603.2
相关主题