当前位置:文档之家› 第六章 二元选择模型

第六章 二元选择模型

第六章 二元选择模型
第一节 线性概率模型模型
第二节 二元Logit离散模型 第三节 二元Probit离散模型模型 第四节 受限Tobit模型
二元离散选择模型的经济背景 实际经济生活中,人们经常遇到二元选择问题。 研究家庭是否购买住房。 由于购买住房行为要受到许多因素的影响,不 仅有家庭收入、房屋价格,还有房屋的所在环境、 人们的购买心理等,所以人们购买住房的心理价位 很难观测到,但我们可以观察到是否购买了住房, 1 购买住房 即 Yi 0 不购买住房
Logit模型的另一种表述为:
三、Probit模型
在最终的效用模型
* Y X i ui * i
中,假定ui*的分布为标准正态分布,则该模型称为 Probit模型。 Probit模型的另一种表述为:
P(Yi 1) P(Yi* 0) P(ui* X i ) 1 ( X i )
( X i )
X i

1 2
e dz
z2
2
五、 Extreme 模型 在最终的效用模型
* Y X i ui * i
中,假定ui*的分布为极值分布,则该模型称为
Extreme模型。
第二节
二元离散选择模型最大似然估计
下面我们来构造二元离散选择模型的似然函数。这
分析公司员工的跳槽行为。 员工是否愿意跳槽到另一家公司,取决于薪 资、发展潜力等诸多因素的权衡。员工跳槽的成本 与收益是多少,我们无法知道,但我们可以观察到 员工是否跳槽,即
1 跳槽 Yi 0 不跳槽
对某项建议进行投票。 建议对投票者的利益影响是无法知道的,但可 以观察到投票者的行为只有三种,即
U i1 X i 1 ui1 (1) 将(1)-(2),得 0 0 0 (2) U i X i ui 1 0 1 0 1 0 Ui Ui X i ( ) (ui ui ) 记
Yi* Ui1 Ui0 , 1 0 , ui* ui1 ui0
ˆ 具有渐进正态分布,因此 由于超大样本条件下 j
ˆ ) / SE ( ˆ ) 渐进服从标准正态分布,其中 Z ( j j j ˆ ) 是 ˆ SE ( j j 的标准误差,对于给定的显著性水平
1 ,参数 j 的置信区间为 :
ˆ Z SE ( ˆ ), ˆ Z SE ( ˆ )) ( j 2 j j 2 j
ln L (1 Yi ) ln1 F ( X i ) Yi lnF ( X i )
i 1
N
二、 Probit模型、Extreme 模型的最大似然估计 如果是正态分布,则对数似然函数为
ln L (1 Yi ) ln1 ( X i ) Yi ln ( X i )
X i (1, X1i , X 2i ,, X ki )
( 0 , 1 ,, k )
Pi P(Yi 1) E(Yi ) X i
Yi的样本值是0或1 。
现在来分析线性概率模型随机干扰项ui的分布
Yi 0 1 X1i k X ki ui X i ui
(1)极大似然估计为一致估计,当样本容量很大
时,模型的参数估计值将比较接近真值; (2)极大似然估计为渐进有效的,当样本容量 增大时,参数估计的方差相对缩小,当样本容量 N 时,极大似然的方差不大于用其它方法得到的参 数估计的方差; (3)极大似然估计为渐进正态的,当样本容量较 大时,可以采用正态假设来构造模型参数的显著性 检验与估计参数的置信区间等。
e xp(x ) Λ( x )(1 Λ( x )) 密度函数 f ( x ) 2 (1 e xp(x ))
ln L N Yi Λ (X i )X i 0 带入(*)式,我们得到: i 1
然后运用迭代法来估计系数 。
Logistic回归参数的极大似然估计值有如下性质
0 P i E ( Y i ) X i 1 可 能 不 成 立
当用线性概率模型进行预测,预测值 X i 落在区间
[0,1]之内时,则没有什么问题;但当预测值 X i 落 在区间 [0,1] 之外时,则会暴露出该模型的严重缺点, 此模型由 James Tobin 1958年提出。 James Tobin 所以此时必须强令预测值(概率值)相应等于 0 或1 。 1981年获诺贝尔经济学奖。 因此,线性概率模型常常写成下面的形式
Yi 0 Yi 1
模型的似然函数为
L P(Y1,Y2, Yn ) [1 F ( X i )] F ( X i )
Yi 0
1 F ( X i )
i 1
N
1Yi
Yi 1
[F ( X i )]Yi
两边同时取自然对数,则
ln (1 Yi ) ln1 1 F ( X i ) Yi lnF ( X i ) Yi L 0Pi 1 0
0 X i 1 X i 1 X i 0
Y 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 0 5 10 15 20 25 X 30
效用模型 U i0 表示第 i个 用 U i1 表示第 i个个体选择1的效用, 个体选择0的效用。其效用均为随机变量,于是有
随机干扰项ui非正态且存在异方差性
由于随机干扰项具有异方差性。修正异方差 的一个方法就是使用加权最小二乘估计。但是加 ˆ 在 [0,1] 之间, 权最小二乘法无法保证预测值 Y i 这是线性概率模型的一个严重缺陷。
Yi 0 1 X1i k X ki ui X i ui
Yi 和Yi*的关系为:
1 Y i* 0 Yi * 0 Y i 0
Yi* X i ui*
1 Y i* 0 Yi * 0 Y i 0

P(Yi 1) P(Yi* 0) P(ui* X i ) 1 F ( X i )
P (Yi 1 ) * 其中 为机会概率比(简称机会比), P(Yi 1) P(Yi 0 ) P(ui* X i ) 1 F ( X i ) 1 P (Yi 1) e xp(X i ) 即事件发生与不发生所对应的概率之比。 F ( X i ) 1 e xp(X i )
1 X i ui Yi X i X i
Yi 1 Yi 0
E(ui ) 0 Xi 1 X i ui 随机干扰项ui的方差为 概率2 1-Pi 2 Pi 2 E(ui ) ( X i ) (1 P ) (1 X ) P i i i P i (1 P i)
i 1
N
如果是极值分布,则对数似然函数为
Probit模型、 Extreme 模型的最大似然估计就是使 上式有最大值时的 。具体求解过程这里不再赘 述。
需要指出的是,不同的分布假设虽然给参数估 计带来了很大的不同,但对于研究者,他们所感兴 趣的估计效应则没有太大的差别。
例1 考虑Greene给出的斯佩克特和马泽欧(1980) 的例子。
于是我们选择F不同的形式得到不同的经验模型
(*)
f ( X i ) Yi f ( X i ) ln L N (1 Yi ) Xi 1 F ( X i ) F ( X i ) i 1
(*)
一、 Logit模型的最大似然估计 对于Logit模型,我 们有: e xp(x ) Λ( x ) 分布函数 F ( x ) 1 e xp(x )
第一节 线性概率模型 一、线性概率模型形式 设家庭购买住房的选择主要受到家庭收入水平的影
响,则用如下模型表示
Yi 0 1 X i ui
i 1,2,, N
其中:Xi为家庭的收入水平,Yi为家庭购买住房的选择
1 已购买了住房 Yi 0 没有购买住房
Yi 0 1 X i ui
i 1,2,, N
Pi P (Yi 1) 令 那么 1 Pi P(Y i 0) 家庭选择购买住房的概率是解释变量 -家庭收入的一 个线性函数。我们称这一关系式为线性概率函数。 被解释变量 Yi 的分布为
Yi 概率 0 1-Pi 1 Pi
于是 E(Yi ) 1 P(Yi 1) 0 P(Yi 0) Pi 又因为 E (ui ) 0 所以
则有 Yi* X i ui* 格林称该模型为潜回归
* Y X i ui 作为研究对象的二元选择模型 * i
这是二元选择模型的切入点。称Yi*为潜在变量。
这个变量是不可观测的。
当效用差Yi*大于零,则Yi 应该选 “ 1 ”
当效用差Yi*不大于零,则Yi 应该选 “ 0 ”
i 1
N
概率
1-Pi
Pi
(1 Pi )
i
Pi
i
ln L (1 Yi ) ln1 F ( X i ) Yi lnF ( X i )
i 1
N
对数似然函数最大化的条件是
f ( X i ) Yi f ( X i ) ln L N (1 Yi ) Xi 1 F ( X i ) F ( X i ) i 1
是二元离散选择模型最关键的问题。 我们假设有以Y 轴为对称的概率密度函数f(.),则
P(Yi 1) 1 F ( X i ) F ( X i )
P(Yi 0) F ( X i ) 1 F ( X i )
于是模型的似然函数为
P(Y1,Y2, Yn ) [1 F ( X i )] F ( X i )
很明显,我们要得到事件发生的概率就必须知 道随机干扰项ui*的概率分布,通常假定ui*服从下列 二种分布,于是我们便得到了Logit 、 Probit模型: 逻辑分布
相关主题