当前位置:文档之家› 第八章 虚拟变量模型分析

第八章 虚拟变量模型分析


◆某旅行社为了提高旅游业务 收入,希望通过建立个人旅游 支出模型,找出影响个人旅游 支出的关键因素,从而作出针 对性的旅游宣传。 根据实际经济理论,个人的旅 游支出往往与个人的收入、职 业、受教育程度、性别等有密 切关系,其中职业、教育、性 别因素不是我们前面章节常用 的定量变量,而是定性变量。 职业有教师、工程师、银行职 员等,教育程度可以分为大学 教育和非大学教育,同样性别 因素可以考虑是男是女。将这 样的定性变量作为自变量考虑 进旅游支出模型,模型如何建 立?有怎样的结果和意义?
E Yi | D1i 1 E 0 1 g 1 i 0 1
从上述的结果可以得知,模型截距 0 表示未
3、根据income变量构造虚拟变量d2,用1表示月收入 大于等于10000元的高收入者,0表示月收入小于10000 元的中低收入者。在命令窗口中输入:series d2=(sex="male"),点击回车键,得到虚拟变量d1。
二、虚拟变量作为自变量

在实际经济模型中,因变量不仅会受到定量变 量的影响,同时也会受到定性变量的影响。如个人 的月支出水平往往受到月收入、性别、职业、婚姻 状况等因素的影响,其中月收入为定量变量,性别、 职业、婚姻状况为定性变量。可见这些定性变量也 是影响因变量的重要因素,所以我们有必要将其量 化成虚拟变量后加入到模型中。在回归分析模型中, 我们假设模型自变量为非随机变量。而虚拟变量的 取值为0、1,说明虚拟变量是非随机变量。因此, 对于自变量中含有一个或多个虚拟变量的回归模型, 回归系数的普通最小二乘估计法以及模型检验方法 同样适用。
下面我们建立含有虚拟变量为自变量的回归模型。
1.方差分析模型(ANOVA模型) 在回归分析中,虚拟变量与定量变量一样 可以作为模型的回归元。一个回归模型的自 变量只有虚拟变量,这样的模型称为方差分 析模型(analysis of variance,ANOVA)。为 说明方差分析模型,我们看下面一个只含有 一个虚拟变量的ANOVA模型,含有多个虚拟 变量的ANOVA模型原理相似不再赘述。
一、虚拟变量的含义
一个定性变量,它的可能值只有两个,也就是说出现或 不出现某种属性。 如性别是男性或女性;受过高等教育或没有接受高等教 育;职业是教师或非教师;已婚或未婚;健康或不健康等。 如果要将这样的变量加入到计量模型中,首先需要人为地量 化定性变量。一般地,用1表示出现某种属性,用0表示没有 出现该属性。如对于性别变量,用1表示男性,用0表示女性; 或者用1表示受过高等教育,用0表示没有接受高等教育。 那么,像这样取值只为0、1的变量称为虚拟变量或哑变 量,并用符号表示,从而与常用符号区别开。我们把赋值为 0的一类称为基准类。需要注意的是虚拟变量的赋值是人为 的、任意的,根据人们的习惯而定。如前所提到的性别变量, 也可以用1表示女性,用0表示男性。
Yi 0 1D1i i ,
i 1, 2,L , n.
0,未婚
,已婚 1 Y D1i = 其中 i为个人月支出;
误差项且 E i =0 未婚者的月期望支出为:
已婚者的月期望支 0 E 0 1 g0 i 0

那么对于某些具有大于两个可能值的定性变量,又该如何量 化呢?如职业变量的可能取值为教师、工程师或其他职业。 这样的多分类定性变量在加入计量模型前,同样需要量化成 虚拟变量。但不同的是一个多分类定性变量需要引入多个虚 拟变量,引入的虚拟变量个数要比多分类定性变量的分类个 数少一。即一个具有个属性的定性变量,需要引入个虚拟变 量。如果引入个虚拟变量,这些虚拟变量之间将会产生完全 多重共线性。如票选结果有三种分类:赞同、不赞同、弃权, 此时需量化成两个虚拟变量,分别为:
项目8
虚拟变量模型
【学习目标】
1.知识目标:虚拟变量的含义;虚拟变
量作为自变量的方差分析模型、协方差模 型;虚拟变量作为因变量的离散选择模型 包括线性概率模型;二元概率模型及其参 数估计;二元逻辑模型及其参数估计。 2.能力目标:理解虚拟变量的含义;了 解虚拟变量分别作为自变量、因变量的模 型建立,包括方差分析模型、协方差模型、 线性概率模型;掌握二元概率模型及其参 数估计;掌握二元逻辑模型及其参数估计。
1,赞同 D1 = 0,其他
1,不赞同 D2 = 0,其他
变量以弃权为基准类。
【相关链接】 构造虚拟变量 Eviews6.0软件操作步骤(附图): 1、输入变量名和样本数据如下图,其中包括性别变量 “sex”和月收入变量“income”。
2、根据sex变量构造虚拟变量d1,用1表示男 性“male”,0表示女性“female”。在命令窗口中输入: series d1=(sex="male"),点击回车键,得到虚拟变量d1。

在运输经济学中,我们想要预 测某人在上下班时是否选择坐 公交,这个结果与个人的收入、 职业、上班地点与居住处之间 的距离、公交费用等诸多因素 有关。那么此时我们建立的模 型因变量是只有两个可能值的 定性变量,即选择坐公交和其 他交通工具。对于这样的模型 又该如何建立?
第一节:虚拟变量模型概述

前面我们研究的计量模型无论是因变量还是自变量均为定量 变量,是可以被度量的变量,例如收益率、面积、收入、成 本、价格等。但是实际运用中所研究的问题往往涉及很多不 可被度量的定性变量,比如性别、职业、国籍、受教育程度、 健康情况等。这些定性变量可能是某些问题的影响因素,如 工薪族的收入常与职业、教育等有关。另外,一些定性变量 也可能是需要预测研究的问题,如高中生是否继续接受高等 教育;贷款人的贷款申请能否被允许;大学毕业生是否回家 乡工作;一项科学研究能否成功等。这些定性变量同定量变 量一样可以作为模型的因变量与自变量,本章我们将考虑这 种类型模型的建立与参数估计问题。
相关主题