当前位置:文档之家› 第八章虚拟变量的建模

第八章虚拟变量的建模

第八章 虚拟变量的建模
背景

定类与定序变量统称为定性变量 在经济领域,许多重要因素都需要使用定性数 据加以刻画:
经济体制(改革前-改革后)、所有制形式(国有-集体 -外资等等)、区域(东-中-西)、性别(男-女)、信 用等级

自变量采用定性数据,在量化与解释上要十分 注意,因变量如果采用定性数据,会给模型的 估计与解释带来更大的困难。
1、二值变量的量化方法
2)
体制变量X 1,X 2: X 1:改革前 X 2:改革后 1是 0 否 观察值: t X1 1978 1 1979 1 1985 0 2003 0 X2 0 0 1 1
1、二值变量的量化方法
3)
体制变量X: 2 改革后 1 改革前 观察值: t X 1978 1 1979 1 1985 2 2003 2
2 3
system 0 ˆ ˆ ˆ ˆ P 0 1region 1capital 两者之差: ˆ ˆ ˆ 0 2 region 3capital
4、含虚拟变量模型的其他变化 Nhomakorabea交互项的引入实际意味着非虚拟变量的 斜率是不一致的。
profit 0 0 system 1capital 2 system* capital u profit 0 0 system 1 2 system* capital u system 0 system 1 profit0 0 1capital u profit1 0 0 1 2 capital u


4、含虚拟变量模型的其他变化
profit 0 0 system 1region 1capital 2 system* region 3 system* capital u system 1 ˆ ˆ ˆ ˆ ˆ P 0 0 1region 1capital ˆ ˆ region capital
背景

本章的研究对象是定性变量
无论是定类还是定序,处理方法是一致的 但,当定序变量的水平很多时,可以当定量变 量处理 例:大学排名

背景

定性变量的水平可以是自然的,也可以是人为 规定的 自然的:性别 人为规定: 规定水平:相貌对工资的影响 合并水平(计量等级的退化): 地区差异对人均收入的影响 大学排名对最初工资的影响
0 E profit system 1,capital E profit system 0,capital
如果E u system,capital 0
2、回归系数的含义

虚拟变量回归系数的基本含义: 不同属性模型之间的截距移动
ˆ ˆ ˆ 三资企业: profit 0 0 1capital
ˆ 斜率 1
profit
ˆ 0
ˆ 0
ˆ ˆ 国有企业: profit 0 1capital
capital
2、回归系数的含义



虚拟变量回归系数可以解释为:在其他 因素水平相同的情况下,不同属性的平 均差异 以前数据为例,虚拟变量回归系数为67, 意味着在资本水平相同的情况下,三资 企业的平均利润要高于国有及国有控股 企业67亿元。 在解释时,一定要注意谁是基组(取0)
2、回归系数的含义
profit 0 0 system 1capital u

类似模型都蕴含有一个假定: 斜率是一致的,即无论对于哪一组(按 虚拟变量属性划分),其它变量对因变 量的影响都是一样的
4、含虚拟变量模型的其他变化

考虑交互影响的模型
ˆ P profit 58.75 67.03system 0.11capital

在交互模型中,虚拟变量前的回归系数 只表示在资本为0情况下,三资企业与国 有企业的利润差距
4、含虚拟变量模型的其他变化

交互模型中虚拟变量前回归系数的经济 含义不好,可以采用如下方法解决:
P 0 0 system 1capital 2 system* capital C u

显然,资本水平不同,利润会有不同, 三资企业和国有企业的差异也不会都是 67亿元。
4、含虚拟变量模型的其他变化
P 0 0 system 1capital 2 system* capital u ˆ P 35.79 34.31system 0.09capital 0.04system* capital
4、含虚拟变量模型的其他变化

判断是否需要交互项,可通过相应系数 的t检验来进行;
要注意到:是否需要交互项等价于检验斜率是 否相等;
(二)多值变量的建模

多值变量意味着虚拟变量有3个以上取值, 如考虑季节的影响,则季节有四个水平。
春 0 夏 1 S 2 秋 冬 3
(二)多值变量的建模

正确量化方法
1 春天为真 Sspring 0 春天不为真 1 夏天为真 Ssum m er 0 夏天不为真 1 秋天为真 Sautum n 0 秋天不为真
(二)多值变量的建模
主要内容
一、定性变量作为自变量的建模方法 虚拟变量法
二、定性变量作为因变量的建模方法
一、定性变量作为自变量的建模
(一)二值变量的建模 1、二值变量的量化方法 2、回归系数的含义 3、多个虚拟变量的建模与解释 4、含虚拟变量模型的其他变化 5、Chow检验 (二)多值变量的建模
(一)二值变量的建模
1、二值变量的量化方法

使用虚拟变量(dummy variable)的基 本原则
0,1只是代号 用0,1代入,会有较好的经济含义 二值变量,只需设置一个虚拟变量,否 则会出现完全共线性问题(有截距项)


2、回归系数的含义

较正式的表述:
profit 0 0 system 1capital u system 0,国有企业 profit0 0 1capital u system 1,三资企业 profit1 0 0 1capital u
背景

有时,自变量的影响有如下模式:在某 个区间内的变动,不会显著影响因变量, 但区间外与区间内的不同则会有显著影 响。此时直接用原始变量效果不好,则 可将变量转换为水平较少的定性变量进 行建模
定量变量的系数不显著,有时将其退化为定性 变量就会显著。
背景

定性变量有些来自于不得已

有些来自于主动

基本原则:
只用0,1来量化,0,1只表示真或不真 只需设置比水平数少一个的虚拟变量


(二)多值变量的建模

基本解释
每个虚拟变量前的系数都表示和基组 (不专设虚拟变量的组)相比,在因变 量上的平均差异。
(二)多值变量的建模

对于定序变量而言,由于水平之间的差 值依然没有意义,所以,上述方法仍然 适用。
所谓二值变量,是指变量只有两种可能取 值,是某种属性或者不是 二值变量可以是自然的,也可以是人为规 定的 人为规定:所有制:国有企业-非国有企业

1、二值变量的量化方法
可以有三种量化方法 1)体制变量X:

1 改革后 0 改革前 观察值: 1978 0 1979 1985 2003 0 1 1
(二)多值变量的建模

有时,某定性因素的多个虚拟变量在统 计上都不显著,但这并不意味着该因素 就一定是不显著的,此时联合检验将发 挥关键作用。
要点

自变量中定性变量的回归系数,在解释 上与定量变量有很大不同,此时判定系 数含义,主要不使用导数,而是依靠将 定性变量代入,计算不同方程之间的差 别。
相关主题