当前位置:文档之家› 8第八章虚拟变量回归new

8第八章虚拟变量回归new


三类年薪函数的差异情况如下图所示:
年薪 α1
α2 -α1
研究生 本科 大专以下
工龄
设置虚拟变量D或增设D3行吗?
2 D= 1
0
博士研究生
硕士研究D生 2
本科及以下
1 0
研究生 其他
(2)多个因素各两种类型
如果有m个定性因素,且每个因素各有两个不 同的属性类型,则引入 m 个虚拟变量。
例如,研究居民住房消费函数时,考虑到城乡 的差异以及不同收入层次的影响,将消费函数取成: yi=a+bxi+α1D1i+α2D2i +εi
【例】现有1998年我国城镇居民人均收入与彩 电每百户拥有量的统计资料。
9
观察相关图
从相关图可以看出, 前3个样本点与后5个样 本点存在较大差异,因 此,可设置虚拟变量反 映“收入层次”:
D
1 0
中高收入家庭 低收入家庭
10
将我国城镇居民的彩电需求函数设成:
Yi=a+bxi+αDi+βXDi+εi DATA D1
其中y ,x分别是居民住房消费支出和可支配收 入,虚拟变量设为:
1 农村居民 D1 0 城镇居民
1 高收入家庭 D2 0 低费情况:
城市低收入家庭 城市高收入家庭 农村低收入家庭 农村高收入家庭
(D1=0,D2=0)
(D1=0,D2=1) (D1=1,D2=0) (D1=1,D2=1)
政策紧缩 政策宽松
D
1 0
本科以上学历 本科以下学历
变量的划分应遵循穷举与互斥原则。
5
二、作用
⑴可以描述和测量定性因素的影响。
⑵能够正确反映经济变量之间的相互关系,提高模 型的精度。
⑶便于处理异常数据。
即将异常数据作为一个特殊的定性因素
D
1 0
异常时期 正常时期
6
第二节 虚拟变量的设定
一、虚拟变量的引入方式
89.48 0.003xi
此例说明了三个问题: ①如何设置和在模型中引入虚拟变量; ②如何测量定性因素(即收入层次)的影响; ③如何区分不同类型的模型(即需求函数)。
13
二、虚拟变量的设置原则
⑴ 一个因素多个类型
对于有m个不同属性的定性因素,应该设置m-1个 虚拟变量来反映该因素的影响。
例如,设公司职员的年薪与工龄和学历有关。 学历分成三种:大专以下、本科、研究生。为反映 “学历” 的影响,应该设置两个虚拟变量:
计量经济学
第八章 虚拟变量回归
1
引子:男女大学生消费真有差异吗?
在对在校学生的消费行为进行的调查中,发现在校 生的消费行为呈现多元化的结构。人际交往消费、 手机类消费、衣着类消费、化妆品类消费、电脑类 消费、旅游类消费占有较大的比例;而食品类消费、 学习用品类消费不突显。 显然,男女生在消费上存在差异。为了了解男、女 生的消费支出结构差异,应当如何建立模型?
(由于D是EViews软件的保留字,所以将虚拟变量取 名为D1;另外,此时也可以用SMPL和GENR命令直 接生成D1变量)
GENR XD=X*D1
生成变量XD
LS Y C X D1 XD 估计需求函数
结果如下图所示:
11
对应的t统 计量值
R2的值 调整的R2值 SE的值
我国城镇居民彩电需求函数的估计结果为:
(1)加法方式
Yi=a+bxi+αDi+εi
a+α
等价为:
当Di =0时:Yi=a+bxi+εi a 当Di =1时:Yi=(a+α)+bxi+εi
D=1
α D=0
以加法方式引入,反映定性因素对截距的影响
(2)乘法方式
Yi=a+bxi+βXDi+εi
D=1
其中:XDi=Xi*Di, 上式等价于:
a
二、检验模型结构的稳定性
设根据两个样本估计的回归模型分别为:
样本1: Yi=a1+b1xi +εi 样本2: Yi=a2+b2xi +εi
设置虚拟变量:
D
1 0
样本2 样本1
估计模型:Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+εi 其中,XDi=xi*Di。
当Di =0时:Yi=a+bxi+εi
β
D=0
当Di =1时:Yi=a+(b+β)xi+εi
以乘法方式引入,可反映定性因素对斜率的影 响,系数β描述了定性因素的影响程度。
8
(3)一般方式 同时用加法与乘法方式引入虚拟变量,然后再利
用t检验判断α 、β是否显著的不等于零,进而确 定虚拟变量的具体引入方式。
思考:若是多因素、多个属性水平的问题,如何设置?
第三节 虚拟变量的特殊应用
一、调整季节波动
例如,用季度数据分析某公司利润y与销售 收入x之间的相互关系时,为研究四个季度的季 节性影响,引入三个虚拟变量(设第1季度为基 础类型):
1 Di 0
第i+1季度 其他季度
利润函数可取为 :
i=1,2,3
Yi=a+bxi+ α1D1i+ α2D2i + α3D3i + εi
面临的问题:如何把男女生这样的非数量变量引 入方程?
2
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要 影响。例如,研究某个企业的销售水平,产业属性 (制造业、零售业)、所有制(私营、非私营)、 地理位置(东、中、西部)、管理者的素质、不同 的收入水平等是值得考虑的重要影响因素,但这些 因素共同的特征是定性描述的。 如何对非定量因素进行回归分析? 采用“虚拟变量”对定性变量进行量化一种思路。
3
第八章 虚拟变量回归
本章主要讨论:
●虚拟变量及其作用 ●虚拟变量设定 ●虚拟解释变量的回归 ●虚拟被解释变量的回归(选讲,不包括)
4
第一节 虚拟变量及其作用
一、定义
反映品质指标变化、数值只取0和1的人工变量,
用符号D来表示。
如:
1 D 0
城镇居民 农村居民
1 D 0
销售旺季 销售淡季
1 D 0
yˆi 57.61 0.0119xi 31.8731Di 0.0088XDi
结果表明不同收入家庭对彩电的消费需求,在 截距和斜率上都存在着明显差异。
12
低收入家庭:
yˆi (57.61 31.8731) (0.0119 0.0088)xi yˆi 57.61 0.0119xi
中高收入家庭:
1 本科 D1 0 其他
1 研究生 D2 0 其他
而将年薪模型取成(假设以加法方式引入):
Yi=a+bxi+α1D1i+α2D2i +εi 其等价于:
Yi=a+bxi+εi Yi=(a+α1)+ bxi+εi Yi=(a+α2)+ bxi+εi
大专以下(D1=D2=0) 本科(D1=1,D2=0) 研究生(D1=0,D2=1)
相关主题