当前位置：文档之家› tobit与选择性样本

tobit与选择性样本

模型形式为：
假定 yi* xii i ~N(0,2)
观察到：
yi
xii,当y*i
0,当y*i 0
0
2、y的条件期望
在截取的条件下，y的条件期望不再布
首先看一下
的概率：
Py ri (0|xi)Py ri* (0|xi)Pxri(i0|xi) Pri (xi)
。
第一类Tobit模型的估计
（在零值左截取的回归模型，是截取模型中最简单的一种情形）
1、ols估计有偏且不一致。
1.估1如计果，只正对确yi的 0模型应的该yi数为x据i进(行xi简)e单i 的OLS 若遗漏掉中间部分，则还会导致残差项与解
释变量相关，出现内生性问题。 1.2若对全部数据进行OLS估计，问题会更严
注意：若不考虑截取数据情况下的最大似然估计等价于最小二乘估计。对于实际的截取数据，如果采用OLS估计，将得到有偏的估计结果。
上述似然函数的假设：截取数据中不可观测的部分和可观测部分具有相同的分布。如果这一条件得不到满足，最大似然估计将遇到困难。这时可使用heckman两步估计。
3、Tobit 回归（也称为heckman两阶段法，或Heckit法，这种方法广泛运用于由于样本选择导致的断尾数据分析中）
重，因为x y之间的正确模型为：
E(yi|xi) x ixi(x i)
2、Tobit ML估计
ln L y i 0 2 1 ln (2) ln2 (y i 2 X i)2 y i 0 ln 1 X i
• 该似然函数由两部分组成，一部分对应于没有限制的观测值，是经典回归部分；一部分对应于受到限制的观测值。
Type IV tobit model
Type V Tobit model
“截取”变量的分布与密度函数
1、从下截取 ymayx *c(,) 已知
Py r ( c)c f(y)d y 1 F (c)
根据条件概率公式 PrA( |B)PrA( B) P rB()
F ( y |y c ) P Y r y ;Y ( c ) P c r Y ( y ) F ( y ) F ( c ) P Y r c )( P Y r c )( 1 F ( c )
• 这是一个非标准的似然函数，它实际上是离散分布与连续分布的混合。
若对上式进行再参数化,令/,1/
可得: lL n Y i 0 1 2 (l 2n ) l( n 2 (Y i X i )2 Y 0 l i 1 n ( ( X i ))
对上式极大化，应用牛顿法求解，然后求得原参数的估计量。
0(
xi
)xi
(
xi
)
3、 x k 对于y的边际影响
E(y| xk
x)(x/)k
结论：在数据存在截取的情况下，x k 对于y的
边际影响通过两个渠道产生作用：首先影
响 ( x ) ，即观测值是否被截取的概率，其次是通过影响y*的大小，从而影
响被观察到的y值的大小。(x当 ) 1
时，边际k 影响等于
式中：
E (y|yc)c y 1 fF (y ()c) d yc 1 yF (y f(c ))dy
对于从上截取的情形：
容E易(y|判y断c)出c ：yFE f((cy( ))y d|yy c ) E ( y ) E ( y |y c )
3、标准正态分布随机变量的截取期望
xi E(i
|i
xi)
xi
E(i
|
i
xi)
xi
(xi) 1(xi)
xi
(xi)
(xi)
xi
(xi)
(3) y i 的期望（不同于上面的条件期望。
有些文献中称为无条件期望，以区别于上
面的条件期望）
E(yi | x) Pr(y*0).E(yi | yi 0, xi)
Pr(y*0).E(yi | yi 0, xi)
Tobit模型与样本选择模型
Tobit模型
简单来说，当因变量在正值上连续但是还有很多机会取值为0，可以使用tobit模型。
文献中有把tobit模型分为五类的说法。
Type I Tobit
假设B*是预算约束下效用最大化得出的牛肉消费量
Type II Tobit
Type III tobit model
经验分析中随机扰动项经常被假定服从正态分布。
（1）当 x~N(0,1) 汇PE2(3x7|xc) (c)
1(c)
，证明过程见靳云
（2x）~N推(0,广2) 当
E(x|xc，)E(x|xc)1 (c()c)
E(x| xc) ((cc))
第I类Tobit模型：在零值左截取的回归模型
1、模型：James Tobin在1958年的文章 “estimation of relationships for limited dependent variables”中，以家庭耐用消费品为例，讨论了当因变量y在0 点被左截取的时候，如何估计x对y的影响。因此把在零值左截取的回归模型称为第I 类Tobit模型，是最简单的一种情形。
f(y| yc) f(y) F(c)
2、截取变量的条件期望
当不存在截取时，
E(y) yf(y)dy
当存在从下截取时，
E (y ) E (y |y c )P .y * r c ( ) E (y |y c )P .y * r c ( )
E (y |y c )P .y * r c ( ) c .Py * r c ( )
i~N (0,2) Pri (xi)P ri (x i)1 (x i) (x i)
即 Pri(y0|xi)(xi) Pryi(0|xi)1(xi)
（2）当 yi 0
时的条件期望
其中，
(.)
(.)
(.)
为逆米尔斯比（
Inverse Mills Ratio）
E(yi | yi 0,xi) E(xii | yi 0,xi)
密度函数为 f(y| yc) f(y) 1F(c)
根据
Py r ( c)c f(y)d y 1 F (c)
可以验证：c f (y|y c )d y c 1 fF (y () y )d y 1 1 F F ( (c c ) ) 1
（2）从上截取当 ymiyn*(c,)
F(y| yc)F(y) F(c)

e商务文档

tobit与选择性样本

相关文档推荐：