当前位置：文档之家› 计量经济学10(1)

计量经济学10(1)

计量经济学10(1)
l 方差分析模型（Analysis of variance models，ANOVA）：仅包含定性变量或虚拟变量的回归模型，其形式如下：
Yi=B1+B2Di+ui l 假定Y：每年食品支出（美元）；Di=1表示
女性；Di=0表示男性，则： l 男性食品支出的期望：E(Yi|Di=0)=B0 l 女性食品支出的期望： E(Yi|Di=0)=B0+B1
• D2=1表东北和中北部地区，D2=0为其它地区; • D3=1表南部地区，D3=0为其它地区
Ÿ 这是将西部地区看成是基准类。
计量经济学10(1)
¡ 再考虑政府机构用于每个学生的花费和地区对教师平均年薪水的影响： AASi=B1+B2D2i+B3D3i+B4PPSi
¡ 对模型的解释：
l D2显著，而D3不显著，表明原模型存在设定误差； l PPS的系数的含义
计量经济学10(1)
l 上述模型的含义： l 截距B1表示男性平均食品支出，斜率系数
B2表示女性平均食品支出与男性的差异， B1 + B2表示女性平均食品支出。 l 对这类模型，零假设为：H0:B2=0
¡ 表示男女平均食品支出没有差异。我们可根据t 检验判定是否统计显著。
计量经济学10(1)
l 例10-1(P213)：性别差异对食品消费支出的影响
X 0.0803
5.54
DX -0.065
-4.096
1970-1995 C 62.423
4.89
X 0.0376
8.89
1970-1981 C 1.016
X 0.0803
1982-1995 C 153.49(1.016+152.479)
X 0.0148(0.0803-0.0655)
计量经济学10(1)
l 收入每增加1美元，获得房贷的概率大约增加0.03 l 实际中：房贷的概率随收入水平以固定增速线性增
加，与实际不符
计量经济学10(1)
l 例：借贷市场上的歧视
¡ 应变量Y为二分变量，通过贷款申请赋值为1，否则为0；
¡ 研究目的是为了判断是否由于性别、种族和其他一些定性因素导致了贷款市场上的歧视行为。
的差距。
计量经济学10(1)
l 几个问题：
3. 虚拟变量陷阱（完全共线性）或多重共线性
l 在解释变量存在完全共线性的情形下，不可能得到参数的惟一估计值。
l 例如前例： Yi=B1+B2D2i+B3D3i+ui 其中，D2=0,D3=1;D2=1,D3=0
l 避免“陷阱”的一般原则：如果模型有共同的截距项，且定性变量有m种分类，则需引入m-1个虚拟变量。
¡ 误差项将是异方差的； ¡ 由于Y仅取值0和1，惯用的R2没有实际意义了
计量经济学10(1)
l 对上述问题的解决：
¡ 随着样本容量的扩大，二项分布收敛于正态分布；
¡ 异方差有其处理方法； ¡ 估计的Y可能在0～1区间之外：
l 实践中有一个简单的处理方法（在0～1区间之外的 Y值不太多时）
• Ŷ为负则取0； Ŷ大于1，则取1.
计量经济学10(1)
l 例10－2(P215)：工会化程度与工作权利法
¡ 本例研究工作权利法（是否通过）对私营部分的工会化程度的影响
计量经济学10(1)
二、协方差分析模型（ANCOVA）——：包含一个定量变量和一个两分定性变量的回归 l 例：考虑可支配收入（定量变量）与性别
食品消费支出对的回归模型
¡ 回归模型如公式10－8，10－9 ¡ 对模型的解释：
l 虚拟变量的统计显著； l 常数统计显著； l 对定量变量回归统计的解释。
¡ 对比没有虚拟变量的模型
计量经济学10(1)
例：一个以性别虚拟变量考察企业职工薪水的模型：
Yi=B1+B2Xi+B3Di+ui
其中：Yi为企业职工的薪金，Xi为工龄， Di=1，若是男性，Di=0，若是女性。
l 为了在模型中能够反映这些因素的影响，并提高模型的精度，需要将它们“量化”。
计量经济学10(1)
l 定性变量通常表示为具备或不具备某种性质，如男性或女性；黑人或白人；党员或非党员等。
l 把定性因素“定量化”的一个方法是建立人工变量（也称为虚拟变量，Dummy variable），并赋值０和１：
l 结果：P221
l 对模型的解释：
¡ 本例的基准类是白种或西班牙男性； ¡ 两个回归系数的含义； ¡ 不考虑性别和种族的影响，则受教育年限每增
加一年，平均小时工资提高约80美元。
计量经济学10(1)
l 交互影响：即不同虚拟变量之间存在的交互影响
l 对于上例而言，我们可以考虑如下模型：
l Yi=B1+B2D2i+B3D3i+B4(D2iD3i)+B5Xi+ui l 其中，
t值未给出 4.69* -5.74* 0.78** -1.84* -1.75* -3.52* 0.74** 0.23** -0.134
*：p值等于或低于5%；** ： p值大于5% 计量经济学10(1)
Байду номын сангаас结
l 虚拟变量的作用：“数据分类器” l 应用虚拟变量应注意的地方：
¡ 如果回归模型包含了一个常数项，则虚拟变量的个数必须比每个定性变量的分类数少一；
¡ 公式：10－4 or 10－5
计量经济学10(1)
l 几个问题：
1. 基准类（基础类，参照类或比较类）：取值为 0的那类变量
¡ 基准类的选择根据研究目的而定 ¡ 来自于社会学、心理学等研究的需要 2. 虚拟变量D的系数称为差别截距系数
(differential intercept coefficient)， ¡ 表明了取值为1的类的截距值与基准类截距值
¡ 虚拟变量系数的解释与基准类有关； ¡ 若模型包含多个定性变量，且每个定性变量有
多种分类，则引入模型的虚拟变量将消耗大量的自由度，故应权衡进入模型中虚拟变量的个数以免超过样本观察值的个数。
计量经济学10(1)
¡ 回归的结果：
计量经济学10(1)
解释变量截距 AI（收入） XMD（债务减抵押贷款支出） DF（性别） DR（种族） DS（婚否） DA（房屋年限） NNWP（领居中非的种人的比例） NMFI NA （邻居房屋的平均年限）
系数 0.501 1.489 -1.509 0.140 -0.266 -0.238 -1.426 -1.762 0.150 -0.393
Yi=B1+B2Di+B3Xi+B4(DiXi)+ui
l 给定Di=0，并对上式两端取均值，得男性平均食品支出函数：
E(Yi|D=0,Xi)=B1+B3Xi
l 给平定均D食i=品1支，出并函对数上：式两端取均值，得女性
E(Yi|D=1,Xi)=(B1+B2)+(B3+B4)Xi
l 我们称B2为差别截距系数，B4为差别斜率系数
计量经济学10(1)
三、包含一个定量变量、一个多分定性变量的回归
l 例：考查学生支出和地区差异（三个地区，分别是东北和中北部（21）、南部（17）和西部（13））对教师薪水的影响
¡ 先考虑地区差异模型如下： AASi=B1+B2D2i+B3D3i+ui
l 其中，AAS为公立学校老师平均年薪水；Di为虚拟变量，且
¡ 例10－3：政党对竞选活动的资助 ¡ 应变量：
l PARTY（政党对当地候选人的资助）；
¡ 自变量：
l 定量变量：GAP（资助）,VGAP（以往获胜次数）,PU（政党忠诚度）
l 定性变量：OPEN（公开竞争否）,DEMOCRAT（民主党）,COMM（共和党）
计量经济学10(1)
回归的比较
l 对于模型：
六、虚拟变量在季节分析中的应用
l 例：冰箱的销售量与季节性 l Yt=B1+B2D2t+B3D3t+B4D4t+ut l 其中，
¡ Yt: 冰箱销售量（千台） ¡ D2,D3,D4分别表示每年的第二、第三和第四季
度取值为1，第一季度值为0，即第一季度作为基准季度。
计量经济学10(1)
l 关于公式10－30的回归模型的说明：
l Logit model & Probit model
计量经济学10(1)
l 例：考虑食品支出与税后收入、性别和年龄的关系（数据见表10-10）
Yi=B1+B2Xi+u ¡ 其中：Y=1表示申请到了房贷，否则为0; X表
示年家庭收入
¡ 估计结果：
Ŷi=-0.9456+0.0255Xi (相应的t值和R2见P232） ¡ 对模型的解释：
l 例10-4：美国1970～1995储蓄－收入关系。由于1982年以来的经济衰退，有两种方法可考查衰退对储蓄的影响。
¡ 法一：分两个时期来作回归； ¡ 法二：引入虚拟变量，将两个回归模型统一成
一个。
计量经济学10(1)
模型的比较
1970-1995 C 1.016
0.05
D 152.48
4.61
计量经济学10(1)
l 根据差别截距系数和差别斜率系数的统计显著性，可以辨别出女性和男性食品支出函数是截距为同还是斜率不同，或是都不同：
计量经济学10(1)
Y
Y
a) 一致回归
X
b) 平均回归
X
Y
Y
c) 并发回归
X
d) 相异回归
X
计量经济学10(1)
l 模型的选择：对于模型10-1; 10-8; 10-23

e商务文档

计量经济学10(1)

相关文档推荐：