当前位置:文档之家› tobit与选择性样本

tobit与选择性样本

模型形式为:
假定 yi* xii i ~N(0,2)
观察到:
yi
xii,当y*i
0,当y*i 0
0
2、y的条件期望
在截取的条件下,y的条件期望不再布
首先看一下
的概率:
Py ri (0|xi)Py ri* (0|xi)Pxri(i0|xi) Pri (xi)

第一类Tobit模型的估计
(在零值左截取的回归模型,是截取模型中 最简单的一种情形)
1、ols估计有偏且不一致。
1.估1如计果,只正对确yi的 0模型应的该yi数为x据i进(行xi简)e单i 的OLS 若遗漏掉中间部分,则还会导致残差项与解
释变量相关,出现内生性问题。 1.2若对全部数据进行OLS估计,问题会更严
注意:若不考虑截取数据情况下的最大似然估计等 价于最小二乘估计。对于实际的截取数据,如果 采用OLS估计,将得到有偏的估计结果。
上述似然函数的假设:截取数据中不可观测的部分 和可观测部分具有相同的分布。如果这一条件得 不到满足,最大似然估计将遇到困难。这时可使 用heckman两步估计。
3、Tobit 回归(也称为heckman两阶段法, 或Heckit法,这种方法广泛运用于由于样 本选择导致的断尾数据分析中)
重,因为x y之间的正确模型为:
E(yi|xi) x ixi(x i)
2、Tobit ML估计
ln L y i 0 2 1 ln (2) ln2 (y i 2 X i)2 y i 0 ln 1 X i
• 该似然函数由两部分组成,一部分对应于没有限 制的观测值,是经典回归部分;一部分对应于受 到限制的观测值。
Type IV tobit model
Type V Tobit model
“截取”变量的分布与密度函数
1、从下截取 ymayx *c(,) 已知
Py r ( c)c f(y)d y 1 F (c)
根据条件概率公式 PrA( |B)PrA( B) P rB()
F ( y |y c ) P Y r y ;Y ( c ) P c r Y ( y ) F ( y ) F ( c ) P Y r c )( P Y r c )( 1 F ( c )
• 这是一个非标准的似然函数,它实际上是离散分 布与连续分布的混合。
若对上式进行再参数化,令/,1/
可得: lL n Y i 0 1 2 (l 2n ) l( n 2 (Y i X i )2 Y 0 l i 1 n ( ( X i ))
对上式极大化,应用牛顿法求解,然后求得原参数 的估计量。
0(
xi
)xi
(
xi
)
3、 x k 对于y的边际影响
E(y| xk
x)(x/)k
结论:在数据存在截取的情况下,x k 对于y的
边际影响通过两个渠道产生作用:首先影
响 ( x ) ,即观测值是否被截取的概率 ,其次 是通过 影响y*的大小,从而影
响被观察到的y值的大小。(x当 ) 1
时,边际k 影响等于
式中:
E (y|yc)c y 1 fF (y ()c) d yc 1 yF (y f(c ))dy
对于从上截取的情形:
容E易(y|判y断c)出c :yFE f((cy( ))y d|yy c ) E ( y ) E ( y |y c )
3、标准正态分布随机变量的截取期望
xi E(i
|i
xi)
xi
E(i
|
i
xi)
xi
(xi) 1(xi)
xi
(xi)
(xi)
xi
(xi)
(3) y i 的期望(不同于上面的条件期望。
有些文献中称为无条件期望,以区别于上
面的条件期望)
E(yi | x) Pr(y*0).E(yi | yi 0, xi)
Pr(y*0).E(yi | yi 0, xi)
Tobit模型与样本选择模型
Tobit模型
简单来说,当因变量在正值上连续但是还有 很多机会取值为0,可以使用tobit模型。
文献中有把tobit模型分为五类的说法。
Type I Tobit
假设B*是预算约束下效用最大化得出的 牛肉消费量
Type II Tobit
Type III tobit model
经验分析中随机扰动项经常被假定服从正态 分布。
(1)当 x~N(0,1) 汇PE2(3x7|xc) (c)
1(c)
,证明过程见靳云
(2x)~N推(0,广2) 当
E(x|xc,)E(x|xc)1 (c()c)
E(x| xc) ((cc))
第I类Tobit模型:在零值左截取 的回归模型
1、模型:James Tobin在1958年的文章 “estimation of relationships for limited dependent variables”中,以家 庭耐用消费品为例,讨论了当因变量y在0 点被左截取的时候,如何估计x对y的影响 。因此把在零值左截取的回归模型称为第I 类Tobit模型,是最简单的一种情形。
f(y| yc) f(y) F(c)
2、截取变量的条件期望
当不存在截取时,
E(y) yf(y)dy
当存在从下截取时,
E (y ) E (y |y c )P .y * r c ( ) E (y |y c )P .y * r c ( )
E (y |y c )P .y * r c ( ) c .Py * r c ( )
i~N (0,2) Pri (xi)P ri (x i)1 (x i) (x i)
即 Pri(y0|xi)(xi) Pryi(0|xi)1(xi)
(2)当 yi 0
时的条件期望
其中,
(.)
(.)
(.)
为逆米尔斯比(
Inverse Mills Ratio)
E(yi | yi 0,xi) E(xii | yi 0,xi)
密度函数为 f(y| yc) f(y) 1F(c)
根据
Py r ( c)c f(y)d y 1 F (c)
可以验证:c f (y|y c )d y c 1 fF (y () y )d y 1 1 F F ( (c c ) ) 1
(2)从上截取 当 ymiyn*(c,)
F(y| yc)F(y) F(c)
相关主题