当前位置:文档之家› 3.6 虚拟变量模型 计量经济学PPT课件

3.6 虚拟变量模型 计量经济学PPT课件

• 例如,反映文程度的虚拟变量可取为:
– D=1,本科学历 – D=0,非本科学历
• 虚拟变量能否取1、0以外的数值?
2、虚拟变量模型
• 同时含有一般解释变量与虚拟变量的模型称为 虚拟变量模型或者方差分析(analysis-of variance: ANOVA)模型。
• 例如,一个以性别为虚拟变量考察企业职工薪 金的模型:
• 由变量显著性检验得到:在10%的显著性水平下,Di和 DiXi1是显著的,而DiXi2不显著。因此: – 2013年农村居民的平均消费支出要比城镇居民少 1573.9元;
– 在其他条件不变的情况下,农村居民与城镇居民的工 资收入都增加100元时,农村居民要比城镇居民多支出 19元用于生活消费;
– 农村居民与城镇居民在其他收入方面有相同的增加量 时,两者增加的消费支出没有显著差异。
错误模型
Y (X,D)α β μ
1 X11 X k1 1 0 0 0
1 X12 X k2 0 1 0 0
(X, D) 1 X13
X k3
0
0
1
0
1 X14 X k4 0 0 0 1
1 X16 X k6 1 0 0 0
解释变 量完全 共线性
• 如果在服装需求函数模型中必须包含3个定性 变量:季节(4种状态)、性别(2种状态)、 职业(5种状态),应该设置多少虚变量?
1 秋季
D1 0 其它 D2 0 其它 D3 0 其它
• 如果设置第4个虚变量,则出现“虚拟变量陷井” (Dummy Variable Trap)。为什么?
• 例如:包含季节变量的正确模型:
Yt 0 1 X 1t k X kt 1D1t 2 D2t 3 D3t t
Yt 0 1 X1t k X kt 1D1t 2 D2t 3 D3t 4 D4t t
男职工本科以上学历的平均薪金: E(Yi | X i , D1 1, D2 1) (0 2 3 ) 1 X i
2、乘法方式
• 加法方式引入虚拟变量,考察:截距的不同。 • 许多情况下,斜率发生变化,或斜率、截距同时
发生变化。
• 斜率的变化可通过以乘法的方式引入虚拟变量来 测度。
• 例如,根据消费理论,收入决定消费。但是, 农村居民和城镇居民的边际消费倾向往往是不 同的。这种消费倾向的不同可通过在消费函数 中引入虚拟变量来考察。
– 模型含常数项
– 模型不含常数项
讨论:定序定性变量可否按照状态赋值?
• 例如:表示居民对某种服务的满意程度,分5种状态: 非常不满意、一般不满意、无所谓、一般满意、非常 满意。在模型中按照状态分别赋值0、1、2、3、4或 者-2、-1、0、1、2。
• 被经常采用,尤其在管理学、社会学研究领域。
• 正确的方法:
高中以下
E(Yi | X i , D1 1, D2 0) (0 2 ) 1 X i E(Yi | X i , D1 0, D2 1) (0 3 ) 1 X i
高中 大学及以上
• 在上例中同时引入性别和教育水平:
1 男 D1 0 女
1 大学及以上 D2 0 大学以下
Yi 0 1 X i 2 D1 3 D2 i

回1归(1,D且issi2mila2r
,即两个回归完全不同,称为相异 Regressions)。
4、例题
• 判断中国农村居民与城镇居民的消费行为是否 有显著差异。
– 被解释变量:居民家庭人均生活消费支出Y – 解释变量:居民家庭人均工资收入X1、其他收入
X2 – 样本:2013年31个地区农村居民与城镇居民人均数
年薪 Y
2 0
男职工 女职工
工龄 X
• 将上例中的性别换成教育水平,教育水平考虑 三个层次:高中以下、高中、大学及其以上。
1 高中 D1 0 其他
1 D2 0
大学及其以上 其他
Yi 0 1 X i 2 D1 3 D2 i
E(Yi | X i , D1 0, D2 0) 0 1 X i
• 对于一元模型,有两组样本,则有可能出现下 述四种情况中的一种:
– 1=1 ,且2=2 ,即两个回归相同,称为重合回 归(Coincident Regressions);
– 11 ,但2=2 ,即两个回归的差异仅在其截距, 称为平行回归(Parallel Regressions);
– 称1=为汇1 合,回但归2(Co2n,cu即rre两nt个R回eg归re的ss差ion异s)仅;在其斜率,
模型的精度,需要将它们“量化”。 • 这种“量化”通常是通过引入“虚拟变量”来完
成的。根据这些因素的属性类型,构造只取“0” 或“1”的人工变量,通常称为虚拟变量,记为D。 • 虚拟变量只作为解释变量。
• 一般地,在虚拟变量的设置中:
– 基础类型、肯定类型取值为1; – 比较类型,否定类型取值为0。
女职工本科以下学历的平均薪金:
E(Yi | X i , D1 0, D2 0) 0 1 X i
男职工本科以下学历的平均薪金: E(Yi | X i , D1 1, D2 0) (0 2 ) 1 X i
女职工本科以上学历的平均薪金: E(Yi | X i , D1 0, D2 1) (0 3 ) 1 X i
E(Yi | X i , Di 1) ( 0 2 ) 1 X i E(Yi | X i , Di 0) 0 1 X i
– 假定2>0,则两个函数有相同的斜率,但有不同的截距。 意即,男女职工平均薪金对工龄的变化率是一样的,但 两者的平均薪金水平相差2。
– 可以通过对2的统计显著性进行检验,以判断企业男女 职工的平均薪金水平是否有显著差异。
1 Di 0
农村居民 城镇居民
Ci 0 1 X i 2 Di X i i
农村居民: 城镇居民:
E(Ci | X i , Di 1) 0 (1 2 )X i E(Ci | X i , Di 0) 0 1 X i
3、同时引入加法与乘法形式的虚拟变量
• 当截距与斜率发生变化时,则需要同时引入加 法与乘法形式的虚拟变量。
– 设置多个虚拟变量,理论上正确,带来自由度损失。 – 以定性变量为研究对象,构造多元排序离散选择模型,然后
以模型结果对定性变量的各种状态赋值。但需要更多的信息 支持。
• 赋值的方法等于是对虚变量方法中的各个虚变量的参 数施加了约束,而这种约束经常被检验为错误的。
Yi 0 1 X i 2 Di i
其中:Yi为企业职工的薪金;Xi为工龄; Di=1, 若是男性,Di=0,若是女性。
二、虚拟变量的引入
1、加法方式
• 虚拟变量作为解释变量引入模型有两种基本方 式:加法方式和乘法方式。
• 上述企业职工薪金模型中性别虚拟变量ቤተ መጻሕፍቲ ባይዱ引入 采取了加法方式。
– 在该模型中,如果仍假定E(i)=0,则企业男、女职 工的平均薪金为:
三、虚拟变量的设置原则
• 每一定性变量(qualitative variable)所需的虚 拟变量个数要比该定性变量的状态类别数 (categories)少1。即如果有m种状态,只在模 型中引入m-1个虚拟变量。
• 例如,季节定性变量有春、夏、秋、冬4种状 态,只需要设置3个虚变量:
1 春季
1 夏季

– 虚拟变量Di:农村居民取值1,城镇居民取值0
总体回归模型
样本回归函数
Yi 0 0 Di 1 X i1 1 (Di X i1 ) 2 X i2 2 (Di X i2 ) i
Yˆi 2599.11573.9Di 0.486Xi1 0.190Di Xi1 0.602Xi2 0.006Di Xi2
§3.6 含有虚拟变量的多元线性回归 模型
一、含有虚拟变量的模型 一、虚拟变量的引入 二、虚拟变量的设置原则
一、含有虚拟变量的模型
1、虚拟变量(dummy variables)
• 许多经济变量是可以定量度量。 • 一些影响经济变量的因素是无法定量度量。 • 为了在模型中能够反映这些因素的影响,并提高
相关主题