虚拟变量回归模型
3 00
上表给出的是美国51个不同州(外加哥伦比亚特区)公
立学校教师的平均工资水平和每个学生平均支出的状况。现
在的问题是:将不同州分成“中东北、南部和西部”三个不
同地区,分析不同州教师的工资是否存在显著差异?
11
安徽大学经济学院
计量经济学讲义
6.3 包含一个定量变量+一个多分定性变量模型
现考虑下列模型: AASi = B1 + B2*D2i + B3*D3i + ui 其中,AAS=公立教师平均工资 D2=1,中东北;0,其它地区 D3=1,南部地区;0,其它地区 由于定性变量“地区”是三分类,所以需要两 个虚拟变量,西部作为基准类。
(6.15)
Y i B 1 B 2 * D 2 i B 3 * D 3 i B 4 * D 2 i D 3 i B 5 * X i u i
非白种人/非西班牙女性比非白种人/非西班牙男性工资
低。即定性变量D2和D3之间存在交互影响,它们对Y的影 响不像方程(6.13)那样简单,而是倍增的。
计量经济学讲义
虚拟变量回归模型
1
安徽大学经济学院
计量经济学讲义
2
安徽大学经济学院
计量经济学讲义
3
安徽大学经济学院
计量经济学讲义
6.1 虚拟变量回归模型-引入
Yˆi 3176.833503.1667Di
(6.1)
se (233.0446)(329.5749)
t (13.6318)(1.5267)
计量经济学讲义
6.3 包含一个定量变量+一个多分定性变量模型
问题:哪个模型更好些?
ASSˆi 261.5682173.443D 32i 326.641D 53i t (23.15)9(1.207)(82.177) 6 p(0.00)0*(0.23)3**(0.034)*9 R2 0.0901
(6.11)
14
安徽大学经济学院
计量经济学讲义
6.3 包含一个定量变量+一个多分定性变量模型
将学生的公共教育支出PPS引入模型,得到以下回归
模型:
ASˆi 132.169 167 .5D 32i 114 .2D 43i 3.29 PPi (6S.12) t(9.511 )*(5 2.088 )*(9 1.328 )**6 (10 .353 )*9 R20.726 ,*p 60.0; 5**p0.05
B4称为差别斜率系数(或斜率漂移),它表示了不同性 别或两种分类下收入变量系数的差异有多大。
22
安徽大学经济学院
计量经济学讲义
6.6 定量与定性变量交互影响的模型
根据差别截距系数B2和差别斜率系数B4的统计显著性, 可以区分女性与男性食品支出函数是截距不同还是斜率不同, 或是都不同。
Y
Y
B2=0 B4=0
9
安徽大学经济学院
计量经济学讲义
6.3 包含一个定量变量+一个多分定性变量模型
实际生活中定性变量的概念并不陌生,例如“男与 女”,“是与否”,“好与坏”等等,这些都是二分定性 变量。“定性”的含义只是表示变量的性质,不反映变量 的程度。
除二分定性变量外,还有多分定性变量,也称之为多 分类变量,例如“中、东、西”、“高、中、低”、“富 裕、小康、温饱、贫困”等。
E ( Y i|D i 1 ) B 1 B 2 ( 1 ) B 1 B 2 (6.4)
截距B1表示男性食品平均支出,“斜率”系数B2表示 女性与男性食品支出差异,B1+B2表示女性食品支出。B2 不再称之为斜率,而是称为差别截距系数。
5
安徽大学经济学院
计量经济学讲义
6.2 一个定量变量+一个定性变量模型
回归结果解释:(1)基准类是白种和男性/或西班牙男 性;(2)如果教育水平和种族为常量,则女性小时收入比 男性大约少2.36美元;如果教育水平和性别为常量,则非白 种人/非西班牙人小时收入平均比基准类大约少1.73美元; (3)如果不考虑性别和种族影响,则受教育年限每增加一 年,平均工资提高约0.8美元。
19
安徽大学经济学院
计量经济学讲义
6.5 多个定性变量的交互影响
虚拟变量的乘积称为交互影响虚拟变量,它给出了两个 定性变量的联合影响。
E ( Y i|D 2 i 1 , D 3 i 1 ) ( B 1 B 2 B 3 B 4 ) B 5 * X i(6.16)
方程(6.16)表示非白种人/非西班牙女性的平均小时工资函 数。其中, B2=女性的差别效应 B3=非白种人/非西班牙人的差别效应 B4=非白种人/非西班牙人女性的差别效应 还可以对方程(6.16)进行统计检验,看统计检验是否显著。
10
安徽大学经济学院
计量经济学讲义
6.3 包含一个定量变量+一个多分定性变量模型
州 教师工资Pay 学生支出PPS 地区 D2 D3
ME
19583
3346
1 10
NH
20263
3114
1 10
MD
27186
4349
2 01
DC
33990
5020
2 01
CA
29132
3608
3 00
WY
27224
5440
多个不同属性的定性变量作为解释变量引入回归模型:
Yi B1 B2 *D2i B3 *D3i B4 *Xi ui 其中,Y 小时工资(美元) X 教育(受教育年限) D2 1(女性), 0(男性) D3 1(非白种人和非西班)牙 , 0(人 其他)
(6.13)
17
安徽大学经济学院
计量经济学讲义
4
安徽大学经济学院
计量经济学讲义
6.1 虚拟变量回归模型-引入
考虑一般虚拟变量的回归方程:
Y i B 1B 2D i u i
(6.2)
其中,Y=年食品支出(美元),Di=1,女性; Di=0,男性。
男性食品支出的期望:
E ( Y i|D i 0 ) B 1 B 2 ( 0 ) B 1
(6.3)
女性食品支出的期望:
(6.6)
6
安徽大学经济学院
计量经济学讲义
6.2 一个定量变量+一个定性变量模型
回归模型结果分析: (1)在方程(6.1)中,虚拟变量系数是统计不显著的, 而这里显著; (2)方程(6.6)是一多元回归模型,当收入为常数时, 男性平均食品支出为1506美元;女性为1506-229=1277美 元,且两个均值显著不同; (3)如果不考虑性别差异,则收入系数为0.0589,表 示无论男女收入增加一美元,食品支出增加6美分,即边际 食品消费倾向为6美分。
20
安徽大学经济学院
计量经济学讲义
6.6 定量与定性变量交互影响的模型
对含有一个定量与一个二分定性变量模型: Y i B 1 B 2 D i B 3 X i u i
上述模型的修正模型为:
(6.5)
Y i B 1 B 2 D i B 3 X i B 4 ( D i X i ) u i (6.17)
(6.10)
共同截距B1表示虚拟变量赋值为0的地区平均ASS。差别 斜率B2和B3表示不同地区AAS均值差异。既然西部地区是 基准类,因此所有工资比较都与西部有关。
13
安徽大学经济学院
计量经济学讲义
6.3 包含一个定量变量+一个多分定性变量模型
ASSˆi 261.5682173.443D 32i 326.641D 53i t (23.15)9(1.207)(82.177) 6 p(0.00)0*(0.23)3**(0.034)*9 R2 0.0901
r2 0.1890
回归结果显示:男性平均食品支出大约为3177美元,女 性平均食品支出大约为3177-503=2674美元。从数值上看 两者差别为503美元,差异比较明显。但是估计的Di不是统 计显著的,因为t值仅为-1.5267,由此对应的p值为15%。 这意味着男女食品支出的数值存在差异,但差异并不显著。 这一结果有意义吗?
比较回归结果(6.11)和(6.12)得到两个相反的结论:如果 PPS不变,则中东北地区与西部地区ASS均值存在显著差异, 西部高出1674美元;而西部与南部地区ASS没有显著差异。
斜率系数3.29表示,每个学生的公共教育支出每增加1 美元,则公立学校教师平均工资提高约3.29美元。
15
安徽大学经济学院
利用(6.17)模型得到如下回归结果:
(6.11)
*表示在5%的水平下统计显著;**表示在5%的水平下 不是统计显著的。
回归结果表明:西部平均ASS约为26159美元。D2i的 差别截距系数不是统计显著的,即中东北部平均ASS比西 部是统计无差异的。D3i的差别截距系数是统计显著的,即 南部地区平均ASS比西部低3265美元。
虚拟变量仅仅指出了差异的存在,但并未表明导致差异 性的原因。
食品支出差异只与性别决定的吗?显然不是!考 虑下列模型:
Y i B 1 B 2 D i B 3 X i u i
(6.5)
其中,Y=年食品支出(美元),X=收入(美元), D=1,女性;D=0,男性。
Yˆi 1506.244288.9868Di 0.0589Xi se (188.0096)(107.0582)(0.0061) t (8.0115)(2.1388)(9.6417) p (0.0000)(0.0611)(0.0000) R2 0.9284
ASˆi 132.169 167 .5D 32i 114 .2D 43i 3.29 PPi S (6.12) t(9.511 )*(5 2.088 )*(9 1.328 )**6 (10 .353 )*9 R20.726 ,*p 60.0; 5**p0.05
16
安徽大学经济学院
计量经济学讲义