当前位置:
文档之家› 第十章 定性选择模型(计量经济学,潘省初)
第十章 定性选择模型(计量经济学,潘省初)
0.19 0.003 0.0053 0.13
t-Statistic
-2.65 3.25 3.08 0.02
p-Value
0.01 0.00 0.00 0.98
Observations:30 R 2 = 0.58 2 Adjusted R = 0.53 Residual Sum of Squares =3.15 F-statistic = 11.87
尽管因变量在这个二元选择模型中只能取两个值: 0或1,可是该学生的的拟合值或预测值为0.8。我们 将该拟合值解释为该生决定读研的概率的估计值。因 此,该生决定读研的可能性或概率的估计值为0.8。 需要注意的是,这种概率不是我们能观测到的数字, 能观测的是读研还是不读研的决定。 对斜率系数的解释也不同了。在常规回归中,斜 率系数代表的是其他解释变量不变的情况下,该解释 变量的单位变动引起的因变量的变动。而在线性概率 模型中,斜率系数表示其他解释变量不变的情况下, 该解释变量的单位变动引起的因变量等于1的概率的 变动。
如表10-2所示,INCOME的斜率估计值为正,且 在1%的水平上显著。年龄和性别不变的情况下,收入 增加1000元,选择候选人甲的概率增加0.0098。 AGE的斜率估计值也在1%的水平上显著。在收入 和性别不变的情况下,年龄增加1岁,选择候选人甲的 概率增加0.016。MALE的斜率系数统计上不显著,因 而没有证据表明样本中男人和女人的选票不同。 我们可以得出如下结论:年老一些、富裕一些的选 民更喜欢投票给候选人甲。 表10-3给出CAND1的拟合值,每个大于等于0.5的 拟合值计入CAND1为1的预测,而小于0.5的拟合值则 计入CAND1为0的预测。
CAND1i 0 1INCOMEi 2 AGEi 3MALEi ui ( 10.6) 其中: 1 如果第i个选民投候选人甲的票
CAND1i 0 如果第i个选民不投候选人甲的票
INCOME i 第i个选民的家庭收入(单位:千美元)
AGEi 第i个选民的年龄
结合(10.9)式,对于logit模型,有: k pi log 0 ij X ij 1 pi j 1 上式的左端是机会(odds)的对数,称为对数机 会比率(log-odds ratio),因而上式表明对数机会 比率是各解释变量的线性函数,而对于线性概率模 型, pi为各解释变量的线性函数。 如果(10.9)式中 ui 服从正态分布,我们得到的 是probit模型(或normit模型),在这种情况下,累 积分布函数为: zi / 1 t2 F ( zi ) exp( )dt (10.12) 2 2
其中:
1 Yi 0
(10.2)
第i个学生拿到学士学位后三年内去读研 该生三年内未去读研
GPAi 第i个学生本科平均成绩
INCOMEi 第i个学生家庭年收入(单位:千美元)
设回归结果如下(所有系数值均在10%水平统计 上显著):
ˆ 0.7 0.4GPA 0.002 INCOME Y i i i
(10.9)式中F的函数形式取决于有关扰动项u的假 设,如果 ui 的累积分布是logistic分布,则我们得到 的是logit模型。在这种情况下,累积分布函数为:
exp( zi ) F ( zi ) 1 exp( zi )
因此
(10.11)
F ( zi ) log zi 1 F ( zi )
线性概率模型存在的问题
(1)线性概率模型假定自变量与Y=1的概率之间存 在线性关系,而此关系往往不是线性的。 (2)拟合值可能小于0或大于1,而概率值必须位于 0和1的闭区间内。 回到有关读研的例子。假设学生乙的GPA为4.0, 家庭收入为20万美元,则代入(10.3)式,Y的拟合 值为
ˆ 0.7 0.4 4.0 0.002 200 1.3 Y
(4)此外,线性概率模型存在异方差性。扰动项 的方差是 p(1 p) ,这里 p 是因变量等于1的概率, 此概率对于每个观测值不同,因而扰动项方差将不 是常数,导致异方差性。可以使用WLS法,但不是 很有效,并且将改变结果的含义。
(5)最后一个问题是在线性概率模型中,R 2以及 R 2 不再是合适的拟合优度测度。事实上,此问题不仅是 线性概率模型的问题,而是所有定性选择模型的问题。 较好一点的测度是模型正确预测的观测值的百分比。 首先,我们将每一预测归类为1或0。如果拟合值大于 等于0.5,则认为因变量的预测值为1。若小于0.5,则 认为因变量的预测值为0。然后,将这些预测值与实际 发生的情况相比较,计算出正确预测的百分比:
( 10.3)
对每个观测值,我们可根据(10.3)式计算因变量 的拟合值或预测值。在常规OLS回归中,因变量的拟 合值或预测值的含义是,平均而言,我们可以预期的 因变量的值。但在本例的情况下,这种解释就不适用 了。假设学生甲的平均分为3.5,家庭年收入为5万美 元,Y的拟合值为
ˆ 0.7 0.4 3.5 0.002 50 0.8 ( Y 10.4)
正确预测的观测值数 正确预测观测值的百分比 100 观测值总数
需要指出的是,这个测度也不是很理想,但预测结 果的好坏,并非定性选择模型唯一关心的事,这类模 型常被用于研究影响人们进行某个决策的因素。让我 们来看一个竞选的例子。假设候选人甲和乙二人竞选 某市市长,我们可以用一个二元选择模型来研究影响 选民决策的因素,数据见表10-1,模型为:
无论是probit模型还是logit模型,极大似然函数 (10.10)都伴随着非线性估计方法,目前很多计量 经济分析软件已可用于probit和logit分析,用起来很 方便。 由于累积正态分布和累积logistic分布很接近, 只是尾部有点区别,因此,我们无论用(10.11)还 是(10.12),也就是无论用logit法还是probit法, 得到的结果都不会有很大不同。可是,两种方法得 到的参数估计值不是直接可比的。由于logistic分布 2 的方差为 3 ,因此,logit模型得到的的估计值必 须乘以 3 ,才能与probit模型得到的估计值相比较 (正态分布标准差为1)。
* Y 从(10.8)式可看出, i 乘上任何正数都不会改 * 变 Yi,因此这里习惯上假设 Var(ui) = 1,从而固定 Yi
的规模。由(10.7)和(10.8)式,我们有
Pi Pr ob(Yi 1) Pr ob[ui ( 0 j X ij )]
j 1
k
1 F [( 0 j X ij )]
若Yi* 0 其它
( 10.8)
这就是Probit和Logit方法的思路。Probit模型和 Logit模型的区别在于对(10.7)式中扰动项u的分布 的设定,前者设定为正态分布,后者设定为logistic分 布。
(10.7)式与线性概率模型的区别是,这里假设潜 变量的存在。例如,若被观测的虚拟变量是某人买车 还是不买车, Yi * 将被定义为“买车的欲望或能力”, 注意这里的提法是“欲望”和“能力”,因此(10.7) 式中的解释变量是解释这些元素的。
第二节 Probit模型和Logit模型
一.Pro另一类方法假定回归模型为
Yi 0 j X ij ui
* j 1
k
(10.7)
这里 Yi 不可观测,通常称为潜变量(latent variable)。我们能观测到的是虚拟变量:
*
1 Yi 0
1 男性 MALEi 0 女性
表10-2 两候选人选举线性概率模型回归结果 Dependent variable:CAND1
Variable
Constant INCOME AGE MALE
Coefficient
-0.51 0.0098 0.016 0.0031
Standard error
从表10-3可看出,30个观测值中,27个(或90%) 预测正确。选甲的14人中,12人(或85.7%)预测正 确。选乙的16人中,15人(或93.8%)预测正确。 是0.58,表明模型解释了因变量的58%的变动, 这与 90%的正确预测比例相比,低了不少。注意表10 R2 -3中有一些拟合值大于1或小于0。这是我们前面指 出的这类模型的缺点之一,这些拟合值是概率的估计 值,而概率永远不可能大于1或小于0。
(10.1)
这看上去与典型的OLS回归模型并无两样,但区 别是这里Y只取0和1两个值,观测值可以是个人、公 司、国家或任何其他横截面个体所作的决定。解释变 量中可以包括正常变量和虚拟变量。
下面用一个关于是否读研究生的例子来说明如何 解释线性概率模型的结果。模型为:
Yi 0 1GPAi 2 INCOMEi ui
j 1
k
其中F是u的累积分布函数。 如果u的分布是对称的,则 1 F ( z ) F ( z ) ,我们 可以将上式写成
P i F ( 0 j X ij )
j 1 k
(10.9)
我们可写出似然函数:
L P i (1 P i)
Yi 1 Yi 0
(10.10)
第一节 线性概率模型
二元选择模型如何估计呢?由于它看上去象是一 个典型的OLS回归模型,因而一个简单的想法是采用 OLS法估计。当然,对结果的解释与常规线性回归模 型不同,因为二元选择模型中因变量只能取两个预定 的值。线性概率模型(LPM)一般形式如下:
Yi 0 1 X1i 2 X 2i k X ki ui
( 10.5)
从而得到一个不可能的结果(概率值大于1)。假设 另有一个学生丙的GPA为1.0,家庭收入为5万元,则 其Y的拟合值为 -0.2,表明读研的概率为负数,这也 是一个不可能的结果。
解决此问题的一种方法是,令所有负拟合值都等 于0,所有大于1的拟合值都等于1。但也无法令人十 分满意,因为在现实中很少会有决策前某人读研的 概率就等于1的情况,同样,尽管某些人成绩不是很 好,但他去读研的机会仍会大于0。线性概率模型倾 向于给出过多的极端结果:估计的概率等于0或1。 (3) 另一个问题是扰动项不是正态分布的。事实 上,线性概率模型的扰动项服从二项分布。