当前位置:文档之家› 第八章 包含虚拟变量的回归模型

第八章 包含虚拟变量的回归模型


大学毕业生的初职年薪的期望为:
E(Yi | Di = 1) = B1 + B2 (1) = B1 + B2 K(9 − 3)
用OLS法很容易检验零假设:大学教育没有 任何益处(既B2=0),并可根据t检验值判定 b2是否统计显著。
5
例9.1 大学毕业生和非大学毕业生 的初职年薪
6
例9.1 大学毕业生和非大学毕业生 的初职年薪
14
9.2 包含一个定量变量:一个两分 定性变量的回归模型
(2)虚拟变量的赋值是任意的。 (3)赋值为0的一类常成为基准类 (base)、对比类(benchmark)、控 制类(control)、遗漏类(omitted category) (4)虚拟D的系数成为差别截距系数, 表明取值为1的类的截距值与基准类截距 值的差距。
17
例9.3 实例一则:教师年薪与教龄、 性别的关系。
根据(9-10)的回归结果,可以推导出男女 教师的平均年薪函数: 女教师平均年薪: ˆ Yi = 17 .969 + 1.3707 X i K (9 − 11a ) 男教师平均年薪: ˆ Yi = (17 .969 + 3 . 3336 ) + 1 .3707 X i = 21 .3026 + 1 .3707 X i K (9 − 11 b ) 图9-2描绘了上述回归结果。
9
9.2 包含一个定量变量:一个两分定性 变量的回归模型
一个ANCOVA模型: Yi=B1+B2Di+B3Xi+ui (9-6) 其中,Yi—大学教师的年薪
1, 男教师 Di= 0,女教师
10
Xi—教龄
9.2 包含一个定量变量:一个两分定 性变量的回归模型
对模型(9-6)的解释如下: 假定E(ui)=0,则 女教师平均年薪: E(Yi|Xi, Di=0)=B1+B3Xi 男教师平均年薪: E(Yi|Xi, Di=1)=(B1+B2)+B3Xi
18
例9.4 不同规模报酬对产出的影响
19
9.3 虚拟变量有多种分类的情况
假定根据横截面数据,我们想要做个人 假期旅游的年支出对其收入与受教育水 平的回归。 假定教育水平有如下几等:未达到中学 水平,中学水平,大学水平。我们引入 两个虚拟变量来表示三种不同的教育水 平。
20
9.3 虚拟变量有多种分类的情况
虚拟变量的技术可以推广到解释变量中有不 止一个定性变量的情形。如:在模型(9-6) 中引入肤色变量,可将(9-6)重写为:
Yi=B1+B2D2i+B3D3i+B4Xi+ui (9-18) 式中,Yi—年薪 Xi—教龄 D2i=
1, 男教师 0,女教师
D3i=
1,白种 0,非白种
26
32
9.6 回归模型中的结构稳定性:虚拟 变量法
回归方程(9-23)和(9-24)有四种可 能的结果:(参见图9-4) (1)A1=B1,A2=B2;称为一致回归。 (2)A1<>B1,A2=B2;称为平行回归。 (3)A1=B1,A2 <> B2;称为并发回归。 (4)A1 <> B1,A2 <> B2;称为相异回归。
假定教育水平不同的三个群体有相同的斜率, 但截距不同,我们用下面的模型: Yi =B1 +B2D2i +B3D3i+B4Xi+u (9-13) 式中,Yi—用于假期旅游的年支出 Xi—年收入
1, 中学教育 D2 = 0,其他
1 , 大学教育 D3 = 0 ,其他
21
9.3 虚拟变量有多种分类的情况
2
9.1 虚拟变量的性质
虚拟变量(dummy variable): 定性变量。一般取值为0,1。用符号D表示。 方差分析模型(ANOVA): 解释变量仅是虚拟变量的模型。 协方差模型(ANCOVA): 回归模型中的解释变量有些是定量的,有 些是定性的。
3
9.1 虚拟变量的性质
我们来看下面的一个例子: Yi=B1+B2Di+ui (9-1)
7
例9.2 工作权利对工会会员的 影响
为了研究工作权利法的效果(该法使工 会的劳资谈判合同合法化),Brennan等 人建立了工会会员(属于工会的工人占 所有工人的百分比)对工作权利法 (1980年)的函数模型。这项研究包括 了50个州,其中19个州制定了工作权利, 31个州允许有工会会员制度。
8
第九章 包含虚拟变量的回归模型
9.1 虚拟变量的性质 9.2 包含一个定量变量:一个两分定性变 量的回归模型 9.3 虚拟变量有多种分类的情况 9.4 包含一个定量变量:两个定性变量的 回归模型
1
第九章 包含虚拟变量的回归模型
9.5 9.6 法 9.7 9.8 模型的推广 回归模型中的结构稳定性:虚拟变量 虚拟变量在季节分析中的应用 小结
13
9.2 包含一个定量变量:一个两分 定性变量的回归模型
若设定两个虚拟变量,则模型(9-6)可写为:
Yi = B1 + B2X1i + B3D1i + B4D2i + Ui K(9 − 9)
1, 男教师 D1i = 0,女教师
1, 女教师 D 2i = 0,男教师
显然: D1=(1-D2)或D2=(1-D1) 也即D1 、D2完全共线性。此时无法得到参数的唯 一估计值,陷入虚拟变量陷阱。
se=(0.2694) (0.0147) (0.1708) (0.3956) t=(-4.7738) (11.7280) (-0.3982) (1.1304) p值=(0.000) (0.000) (0.3490) (0.1412) R2=0.9965
25
9.4 包含一个定量变量:两个定 性变量的回归模型
22
9.3 虚拟变量有多种分类的情况
23
例9.5 假设一例(旅游支出与收入和 教育的关系)
24
例9.5 假设一例(旅游支出与收入 和教育的关系)
为了解释模型(9-13),我们来看表93给出的数据。根据这些假设的数据得 到下面的回归结果:
ˆ Yi = −1.2860+ 0.1722Xi − 0.0680D2i + 0.4472D3i K(9 −17)
白种男教师平均年薪:
E(Yi|Xi, D2=1,D3=1)=(B1+B2+ B3)+B4Xi (9-22)
27
9.5 模型的推广
可以将模型推广到包含多个定量变量 和多个定性变量的情形。
28
例9.6 政党对竞选活动的资助
Wilhite和Theilmann在研究1982年政党对 国会选举的资质中,得到如下回归结果, 见表9-4。在这个回归方程中,应变量是 PARTY$(政党对当地候选人的资 助),$GAP,VGAP和PU是三个定量变量, OPEN,DEMOCRAT 和COMM是三个定性 变量,每一个定性变量分为两类。
9.4 包含一个定量变量:两个定 性变量的回归模型
假定E(ui)=0,则: 非白种女教师平均年薪:
E(Yi|Xi, D2=0,D3=0)=B1+B4Xi (9-19)
非白种男教师平均年薪:
E(Yi|Xi, D2=1,D3=0)=(B1+B2)+B4Xi (9-20)
白种女教师平均年薪:
E(Yi|Xi, D2=0,D3=1)=(B1+B3)+B4Xi (9-21)
在表7-6的基础上,我们增加了虚拟变量,见 表9-5,根据模型(9-25),利用表9-5提供的 数据得到下面的回归结果:
ˆ Yt = 1.02 + 152.48Dt + 0.0803Xt − 0.0655(Dt Xt )K(9 − 28) se=(20.16) (33.08) (0.0145) (0.0159) t=(0.05) (4.61) (5.54) (-4.10) p值 =(0.960) (0.0000)* (0.0000)* (0.0000)*
式(9-26)和(9-27)分别是萧条前和萧条后的 (平均)储蓄函数。
36
9.6 回归模型中的结构稳定性:虚 拟变量法
Yt =C1 +C2Dt +C3Xt +C4(DtXt)+ut (9-25)
在式(9-25)中,C2是差别截距。 C4是差别斜率。
37
例9.7 1970—1995,美国储蓄— 收入关系
假定E(u)=0,从(9-13)的回归结果可得: 未达到中学水平的平均旅游支出: E(Yi|D2=0,D3=0,Xi)=B1+B4Xi (9-14) 中学水平的平均旅游支出: E(Yi|D2=1,D3=0,Xi)=(B1+B2)+B4Xi (9-15) 大学毕业的平均旅游支出: E(Yi|D2=0,D3=1,Xi)=(B1+B3)+B4Xi (9-16) 图9-3描绘了上述三条回归直线(根据例9.5中的数据)
图9-2 描绘了这两种不同的情况。(为了说 明的方便,假定B1>0).
11
9.2 包含一个定量变量:一个两分 定性变量的回归模型
12
9.2 包含一个定量变量:一个两分 定性变量的回归模型
虚拟变量的一些性质: (1)一个虚拟变量足可以区分两个不同 的种类。 一般的规则是:如果一个定性的变 量有m类,则要引入(m-1)个虚拟变 量。
15
例9.3 实例一则:教师年薪与教龄、 性别的关系。
16
例9.3 实例一则:教师年薪与教龄、 性别的关系。
为了说明ANCOVA模型,我们来看表9-2 中数据。 根据数据,得到的OLS回归结果如下:
Yi =17.969+1.3707Xi +3.3336Di se=(0.1919) (0.0356) (0.1554) t=(93.6120) (38.454) (21.455) R2=0.9933 (9-10)
相关主题