当前位置:
文档之家› 计量经济学第八章 虚拟变量回归
计量经济学第八章 虚拟变量回归
计量经济学
第八章
虚拟变量回归
1
第八章 虚拟变量回归
本章主要讨论:
●虚拟变量
●虚拟解释变量的回归
2
本章的教学目标
(1)深刻理解定性因素在计量经济分析中的 背景和含义; (2)明确虚拟变量在建立和估计计量经济模 型中的意义和作用; (3)熟练掌握引入和应用虚拟变量的基本思 想和方法; (4)能够运用虚拟变量模型作相应的经济实 证分析方面的应用; (5)掌握Eviews软件中相关内容的操作方法。
这表明三个时期居民储蓄增加额的回归方程在统计 意义上确实是不相同的。1996年以前收入每增加1 亿元,居民储蓄存款的平均增加0.1445亿元;在 2000年以后,则为0.4133亿元,已发生了很大变化。
20
上述模型与城乡居民储蓄存款与国民总收入之间 的散布图是吻合的,与当时中国的实际经济运行 状况也是相符的。 需要指出的是,在上述建模过程中,主要是从教 学的目的出发运用虚拟变量法则,没有考虑通货 膨胀因素。而在实证分析中,储蓄函数还应当考
单位:亿元
城乡居民 人民币储 蓄存款增 额 (YY) 2121.8 2517.8 3444.1 6315.3 8143.5 8858.5
年 份
城乡居民 国民总收 人民币储 蓄存款年 入 (GNI) 底余额 (Y) 3624.1 4038.2 4517.8 4860.3 5301.8 5957.4 210.6 281 399.5 532.7 675.4 892.5
(1,0) 天气阴 如:(D1 ,D2)= (0,1) 天气雨 (0,0) 其 他
29
虚拟变量数量的设置规则
1.若定性因素具有 m 个 (m 2) 相互排斥属性(或 几个水平),当回归模型有截距项时,只能引入
m -1个虚拟变量;
2.当回归模型无截距项时,则可引入 m 个虚拟变 量;否则,就会陷入“虚拟变量陷阱”。
0.5602 GNIt -88254.00 D2t
19
YYt -830.4045 0.1445GNIt 1t t 1996 YYt YYt 18649.8312 - 0.1469GNIt 2t 1996 t 2000 YY - 30790.0596 0.4133GNI t 2000 t 3t t
年 份
国民总收入 (GNI)
城乡居民人 民币储蓄存 款年底余额 (Y )
1984 1985
1986 1987 1988 1989 1990
7206.7 8989.1
10201.4 11954.5 14922.3 16917.8 18598.4
1214.7 1622.6
2237.6 3073.3 3801.5 5146.9 7119.8
本章关键词
定性 因素 虚拟 变量 0 1
虚拟变量个数的设置规则
属性 类型
虚拟变量 引入方式
加法方式
改变截距 改变斜率
结构变化分析 交互效应分析 分段回归分析
乘法方 式
综合应用
本节课前思考题
8.1 回顾微观经济学中的需求函数或者供给函数,您认为影响 商品需求(供给)的因素除了价格、收入(成本)这些可以用 数据精确计量的定量变量外,还有哪些无法用数据精确计量的 定性因素?各种定性因素都有哪些属性?如何在模型中反映定 性因素的影响?影响企业销售水平的定性因素可能有哪些?
数据来源:《中国统计年鉴2004》,中国统计出版社。表中“城乡居民人民币 储蓄存款年增加额”为年鉴数值,与用年底余额计算的数值有差异。 12
表8.1
国民总收入与居民储蓄存款 (续)
城乡居 民人民 币储蓄 存款增 加额 (YY )
单位:亿元
城乡居民人 民币储蓄存 款增加额 (YY )
年 份
城乡居 民人民 国民总收 币储蓄 入 (GNI) 存款年 底余额 (Y )
7759 7615.4
6253 4976.7 9457.6 13233.2 16631.9
13
为了研究1978—2003年期间城乡居民储蓄存款随收入的 变化规律是否有变化,考证城乡居民储蓄存款、国民总收 入随时间的变化情况,如下图所示:
14
从上图中,尚无法得到居民的储蓄行为发生明显改变 的详尽信息。若取居民储蓄的增量( YY),并作时序 图(见左下图):
城乡居民人 民币储蓄存 国民总收 款年底余额 入 (GNI) (Y ) 21662.5 26651.9 34560.5 46670 57494.9 66850.5 9241.6 11759.4 15203.5 21518.8 29662.3 38520.8
1978 1979 1980 1981 1982 1983
思考:受教育程度、企业所有制、季节的虚拟变 量“0”和“1”如何设置?
27
对于某个模型,如果选择一个虚拟变量 :
答:隐含的假定是大专及大专以上的人数和高中以下的人数是相等的, 显然这是不合理的。
属性的状态(水平)数与虚拟变量数量的关系 定性因素的属性既可能为两种状态,也可能为多种 状态。例如,性别(男、女两种)、季节(4种状 态),地理位置(东、中、西部),行业归属,所 有制,收入的分组等。
25
“0”和“1”选取原则
虚拟变量取“1”或“0”的原则,应从分析问题的目 的出发予以界定。
从理论上讲,虚拟变量取“0”值通常代表比较的基 础类型;而虚拟变量取“1”值通常代表被比较的类 型。 (1)“0”代表基期(比较的基础,参照物),或表 示某种属性或状态的类型或水平不出现或不存在; (2)“1”代表报告期(被比较的效应),或表示某 种属性或状态的类型或水平出现或存在。
31
Yi = 0 + 1 X i + 1D1 + ui
(2)
若对两个相互排斥的属性 “居民属性” ,仍然 引入 m 2 个虚拟变量,则有
1 城镇居民 D1i = 0 农村居民
课前思考题参考答案
8.2 虚拟变量为何只选 0、1,选 2、3、4 行吗?为什么?
答:虚拟变量是非此即彼的问题,一般情形下,虚拟变量的
取值为 0 和 1。当虚拟变量取值为 0 时,表示某种属性或
状态的类型或水平不出现或不存在;当虚拟变量取值为 1 时,表示某种属性或状态的类型或水平出现或存在。取值一 般不选 2、3、4,否则对回归系数的分析带来不便。
其中:
1 t 2000年以后 1 t 1996年以后 D2t D1t 0 t 2000年及以前 0 t 1996年及以前
17
对上式进行回归后,有:
18
YYt -830.4045 0.1445GNIt - 0.2914 GNIt - 66850.50 D1t se 172.1626 t - 4.8234 se t 0.0057 25.1700 0.0401 13.9581 0.0272 -10.7192
8.1 什么是虚拟变量?它在模型中有什么作用? 答:虚拟变量是人工构造的取值为 0 或 1 的作为属性变量代表 的变量。 虚拟变量的作用主要有: (1)可以作为属性因素的代表,如性别、所有制等; (2)作为某些非精确计量的数量因素的代表,如受教育程度、 管理者素质等; (3)作为某些偶然因素或政策因素的代表,如战争、灾害、改 革前后等; (4)可以作为时间序列分析中季节的代表; (5)可以实现分段回归,研究斜率、截距的变动,或比较两个 回归模型的结构差异。
322.2 407.9
615 835.7 728.2 1374.2 1923.4
1997 1998
1999 2000 2001 2002 2003
73142.7 76967.2
80579.4 88254 95727.9 103935.3 116603.2
46279.8 53407.5
59621.8 64332.4 73762.4 86910.6 103617.7
10
第三节 案例分析
为了考察改革开放以来中国居民的储蓄存款与收 入的关系是否已发生变化,以城乡居民人民币储 蓄存款年底余额代表居民储蓄( Y ),以国民总
收入GNI代表城乡居民收入,分析居民收入对储
蓄存款影响的数量关系,并建立相应的计量经济
学模型 。
பைடு நூலகம்11
表8.1
国民总收入与居民储蓄存款
城乡居民 人民币储 年 蓄存款增 加额(YY) 份 NA 70.4 118.5 124.2 151.7 217.1 1991 1992 1993 1994 1995 1996
26
例如,比较收入时考察性别的作用。当研究男性收入是否 高于女性时,是将女性作为比较的基础(参照物),故有 男性为“1”,女性为“0”。
例1
(1)
1 男 D= 0 女
1 改革开放以后 (2) D = 0 改革开放以前
1 天气阴 1 天气雨 ( 3) D1 = ( 4) D2 = 0 其 他 0 其 他
8.2 什么是虚拟变量?它在模型中有什么作用?
8.3 虚拟变量的取值为何只选 0和1,选 2、3、4 行吗?为什 么?
8.4 当1个定性因素有2个排斥的属性时,虚拟变量个数取多少 个?当1个定性因素有3个相互排斥的属性时,虚拟变量个数 又该取多少个?您是否能总结出虚拟变量个数的设置规则?
课前思考题参考答案
23
虚拟变量的定义
计量经济学中,将取值为0和1的人工变量称为虚 拟变量。虚拟变量也称:哑元变量、定性变量等 等。通常用字母D或DUM加以表示(英文中虚拟 或者哑元Dummy的缩写)。 对定性变量的量化可采用虚拟变量的方式实现。
24
二、虚拟变量设置规则
虚拟变量的设置规则涉及三个方面: 1.“0”和“1”选取原则 2.属性(状态、水平)因素与设置虚拟变量 数量的关系--容易混淆 3.虚拟变量在回归分析中的角色以及作用等 方面的问题