第8章-虚拟变量回归
(政府经济政策不变)时模型的截距。当Dt=1时,
Yt=a0+a1+ Xt+ut,这里的(a0+a1)为比较类型(政 府经济政策变动)时模型的截距,为与基础类型相
比较的差异截距系数。
.
14
例如,比较收入时考察性别的影响。当研究男
性收入是否高于女性时,是将女性作为比较的基
础(基础类型,参照物),故有男性为“1”,女
.
8
一、基本概念
定量因素:可直接测度、数值型的因素,GDP、
M2。
定性因素:属性因素,是不能直接测定的、表征
某种属性或状态存在与否的非数值性的因素,如男性
或女性、城市居民或非城市居民、高中低收入群体。
基本思想:
直接在回归模型中加入定性因素存在诸多的困难,
是否可将这些定性因素进行量化,以达到定性因素能
.
4
问题的一般性描述
在实际的经济分析中,这些定性因素有时具有不 可忽视的重要作用。
例如,研究某个企业的销售水平,产业属性(制 造业、零售业)、所有制(私营、非私营)、地理位 置(东、中、西部)、管理者的素质等是值得考虑的 重要影响因素,但这些因素共同的特征是表示某种属 性的(是定性描述的),不能直接用数据精确描述的 变量。
.
10
虚拟变量的定义
➢ 通常虚拟变量的取值为0 和1;
➢ 当虚拟量取值为0,即D=0时,表示某种属性或
状态不出现或不存在,即不是某种类型;
➢ 当虚拟变量取值为1,即D=1时,表示某种属性或
状态出现或存在,即是某种类型;
➢ 例如,构造政府经济政策人工变量,当经济政策
不变时,虚拟变量取值为0,当经济政策改变时,
(0,1)
(0, 0)
天气阴 天气雨 其他
(3)
D1
=
1 0
天气阴 其他
(4)
D2
=
1 0
天气雨 其他
.
16
虚拟变量数量的设置规则
若定性因素具有m个(m≥2)相互排斥属性(水平): 1、当回归模型有截距项时,只能引入m-1个虚拟变 量;否则,就会陷入“虚拟变量陷阱”,产生完全共线 性。 2、当回归模型无截距项时,则可引入m个虚拟变量, 不会导致完全共线性,该情形下虚拟变量参数的估计结 果,实际上是D=1时的被解释变量样本均值。(为什么? 见相关参考教材)
.
3
问题的一般性描述
在前面各章的分析中,被解释变量主要是受可以 直接度量的定量因素的影响,如收入、产出、商品需 求量、价格、成本、人数等。
但现实经济生活中,影响被解释变量变动的因素, 除了可以直接观测数据的定量变量外,可能还包括一 些本质上为定性因素的影响,例如性别、种族、职业、 季节、文化程度、战争、自然灾害、政府经济政策的 变动等。
.
13
例如,比较政府经济政策变动对居民收入X与消
费Y关系的影响。此时是在政府经济政策不变的基
础上进行比较,模型和虚拟变量可以设定为
Yt 0 1Dt Xt ut
(1)
D
=
0 1
,基础类型(政府经济政策不变) ,比较类型(政府经济政策变动)
当Dt=0时,Yt=a0+ Xt+ut,这里的a0为基础类型
计量经济学
第八章 虚拟变量回归
.
1
引子:定性因素对房地产价格有显著影响吗?
不断走高的房地产价格已经成为人们关注的重点。 很多研究认为,影响商品房价格的因素有多个方面。
有关研究表明,影响商品房价格的因素可分为两 类:一类是比较容易量化的定量因素。例如:成本费 用因素、房地产供求因素、经济因素、人口因素等。
.
5
本章要研究的主要问题是: 1.如何将作为解释变量的定性因素引入回 归模型? 2.这些定性解释变量在回归模型中有何特 殊的作用?
.
6
第八章 虚拟变量回归
本章主要讨论:
●虚拟变量 ●虚拟解释变量的回归 ●虚拟被解释变量的回归(选讲,不包括)
.
7
第一节 虚拟变量
本节基本内容:
●基本概念 ●虚拟变量设置规则
性为“0”。
(2)
D
=
1 0
男 女
问题: 为何只选0、1,选2、3、4行吗?为什么?
.
15
属性的状态(水平)数与虚拟变量数量的关系
定性因素的属性既可能为两种状态,也可能为多 种状态。例如,性别(男、女两种)、季节(4种状 态),地理位置(东、中、西部),行业归属,所
有制,收入的分组等。
(1,0)
如:(D1,D2)=
.
17
一个例子(虚拟变量陷阱)
研究居民住房消费支出Yi和居民可支配收入Xi之间 的数量关系。回归模型的设定为:
Yi = 0 + 1Xi +ui
(1)
现在要考虑城镇居民和农村居民之间的差异,如
何办?为了对 “城镇居民”、“农村居民”进行区
分,分析各自在住房消费支出Yi上的差异,设 Di=1为 城镇居民; Di=0为农村居民,则模型为
另一类则是不易量化的定性因素。例如:社会因 素、区域因素、个别因素、房地产投机因素、自然因 素等。
这些因素的基本特征则是不易量化的定性因素。
.
2
引子:定性因素对房地产价格有显著影响吗?
显然,在研究房地产价格影响机理(用模型)时, 需要分析那些不易量化的定性因素对房地产价格是否 真的有显著影响。
能否把定性的因素也引入计量经济模型中呢? 怎 样才能在模型中有效地表示这些定性因素的作用呢?
与定量因素有着相同作用之目的。
.
9
虚拟变量的定义
计量经济学中,将取值为0和1的人工变量(人为 构造)称为虚拟变量,也称哑元变量、定性变量。
通常用字母D或DUM表示(英文中虚拟或哑元 Dummy的缩写)。
对定性变量的量化可采用虚拟变量的方式实现。 定性因素通常具有若干类型或水平,需要选用适 当数量的虚拟变量加以描述。
.
12
“0”和“1”选取原则
虚拟变量取“1”或“0”的原则,应从分析问 题的目的出发予以界定,要注意区分所代表的 是基础类型还是比较类型。
从理论上讲,虚拟变量取“0”值通常代表比较 的基础类型;而虚拟变量取“1”值通常代表被 比较的类型。
“0”代表基期(比较的基础,参照物);
“1”代表报告期(被比较的效应)。
虚拟变量取值为1;
➢ 这种做法实际上是一种变换或映射,将不能精确
计量的定性因素的水平或状态变换为用 0 和 1 来
定量描述。
.
11
二、虚拟变量设置规则
在计量经济学模型中引入虚拟变量,可以使我 们同时兼顾定量因素和定性因素的影响和作用。但 是,虚拟变量的设置需遵循以下三个规则:
1、“0”和“1”选取原则; 2、属性(状态、水平)因素与设置虚拟变量 数量的关系; 3、虚拟变量在回归分析中的角色以及作用等 方面的问题;