二元选择摸型如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。
在实际经济问题中,被解释变量也可能是定性变量。
如通过一系列解释变量的观测值观察人们对某项动议的态度,某件事情的成功和失败等。
当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型,统称离散选择模型。
这里主要介绍Tobit (线性概率)模型,Probit (概率单位)模型和Logit 模型。
1.Tobit (线性概率)模型 Tobit 模型的形式如下,y i = α + β x i + u i (1) 其中u i 为随机误差项,x i 为定量解释变量。
y i 为二元选择变量。
此模型由James Tobin 1958年提出,因此得名。
如利息税、机动车的费改税问题等。
设 1 (若是第一种选择) y i =0 (若是第二种选择)-0.20.00.20.40.60.81.01.2330340350360370380XY对y i 取期望,E(y i ) = α + β x i (2) 下面研究y i 的分布。
因为y i 只能取两个值,0和1,所以y i 服从两点分布。
把y i 的分布记为, P ( y i = 1) = p i P ( y i = 0) = 1 - p i 则E(y i ) = 1 (p i ) + 0 (1 - p i ) = p i (3) 由(2)和(3)式有p i = α + β x i (y i 的样本值是0或1,而预测值是概率。
) (4)以p i = - 0.2 + 0.05 x i 为例,说明x i 每增加一个单位,则采用第一种选择的概率增加0.05。
现在分析Tobit 模型误差的分布。
由Tobit 模型(1)有,u i = y i - α - β x i =⎩⎨⎧=--=--0,1,1i i i i y x y x βαβαE(u i ) = (1- α - β x i ) p i + (- α - β x i ) (1 - p i ) = p i - α - β x i 由(4)式,有E(u i ) = p i - α - β x i = 0因为y i 只能取0, 1两个值,所以,E(u i 2) = (1- α - β x i )2 p i + (- α - β x i )2 (1 - p i )= (1- α - β x i )2 (α + β x i ) + (α +β x i )2 (1 - α - β x i ), (依据(4)式) = (1- α - β x i ) (α + β x i ) = p i (1 - p i ) , (依据(4)式) = E(y i ) [1- E(y i ) ]上两式说明,误差项的期望为零,方差具有异方差。
当p i 接近0或1时,u i 具有较小的方差,当p i 接近1/2时,u i 具有较大的方差。
所以Tobit 模型(1)回归系数的OLS 估计量具有无偏性和一致性,但不具有有效性。
假设用模型(4)进行预测,当预测值落在 [0,1] 区间之内(即x i 取值在[4, 24] 之内)时,则没有什么问题;但当预测值落在[0,1] 区间之外时,则会暴露出该模型的严重缺点。
因为概率的取值范围是 [0,1],所以此时必须强令预测值(概率值)相应等于0或1(见图1)。
线性概率模型常写成如下形式,图11, α + β x i ≥ 1p i = α + β x i , 0 < α + β x i < 1 (5) 0, α + β x i ≤ 0然而这样做是有问题的。
假设预测某个事件发生的概率等于1,但是实际中该事件可能根本不会发生。
反之,预测某个事件发生的概率等于0,但是实际中该事件却可能发生了。
虽然估计过程是无偏的,但是由估计过程得出的预测结果却是有偏的。
由于线性概率模型的上述缺点,希望能找到一种变换方法,(1)使解释变量x i 所对应的所有预测值(概率值)都落在(0,1)之间。
(2)同时对于所有的x i ,当x i 增加时,希望y i 也单调增加或单调减少。
显然累积概率分布函数F (z i ) 能满足这样的要求。
采用累积正态概率分布函数的模型称作Probit 模型。
用正态分布的累积概率作为Probit 模型的预测概率。
另外logistic 函数也能满足这样的要求。
采用logistic 函数的模型称作logit 模型。
-4-22400.20.40.60.810510********0.20.40.60.81累积正态概率分布曲线 logistic 曲线2.Probit (概率单位)模型,仍假定 y i = α + β x i , 而 p i = F ( y i ) =⎰∞--iy t dt e2221π(6)累积概率分布函数曲线在p i = 0.5附近的斜率最大。
对应y i 在实轴上的值,相应概率值永远大于0、小于1。
显然Probit 模型比Tobit 模型更合理。
Probit 模型需要假定y i 服从正态分布。
3.logit 模型该模型是McFadden 于1973年首次提出。
其采用的是logistic 概率分布函数。
其形式是 p i = F (y i ) = F (α + β x i ) =iy e-+11=)(11i x eβα+-+ (7)对于给定的x i ,p i 表示相应个体做出某种选择的概率。
Probit 曲线和logit 曲线很相似。
两条曲线都是在p i = 0.5处有拐点,但logit 曲线在两个尾部要比Probit 曲线厚。
利用(6)和(7)式得到的概率值见表1。
表1 Probit 模型和logit 模型概率值y i正态分布函数-y t 2逻辑概率分布p i =1-2.0 0.0228 0.1192 -1.5 0.0668 0.1824 -1.0 0.1587 0.2689 -0.5 0.3085 0.3775 0.0 0.5000 0.5000 0.5 0.6915 0.6225 1.0 0.8413 0.7311 1.5 0.9332 0.8176 2.0 0.9772 0.8808 3.00.9987 0.9526图2 Probit 曲线、logit 曲线比较示意图logit 曲线计算上也比较方便,所以Logit 模型比Probit 模型更常用。
对上式作如下变换,p i (1+ i y e -) = 1 (8) 对上式除以p i ,并减1得e -y i = i p 1-1 = i i p p -1取倒数后,再取对数,y i = log (i i p p-1)所以 log (iip p -1) = y i = α + β x i (9) 由上式知回归方程的因变量是对数的某个具体选择的机会比。
logit 模型的一个重要优点是把在 [0,1] 区间上预测概率的问题转化为在实数轴上预测一个事件发生的机会比问题。
logit 累积概率分布函数的斜率在p i = 0.5时最大,在累积分布两个尾端的斜率逐渐减小。
说明相对于p i = 0.5附近的解释变量x i 的变化对概率的变化影响较大,而相对于p i 接近0和1附近的x i 值的变化对概率的变化影响较小。
对于Logit 模型使用极大似然法估计参数是一个很好的选择。
首先分析含有两个参数(α 和β)的随机试验。
假设被估计的模型如下p i =)(11i x e βα+-+=iy e -+11(10)在样本中p i 是观测不到的。
相对于x i 的值,只能得到因变量y i 取值为0或1的信息。
极大似然估计的出发点就是寻找样本观测值最有可能发生条件下的α 和 β 的估计值。
从样本看,如果第一种选择发生了n 次,第二种选择发生了N -n 次。
设采取第一种选择的概率是p i 。
采取第二种选择的概率是(1- p i )。
重新将样本数据排列,使前n 个观测值为第一种选择,后N -n 个观测值为第二种选择(观测值是0,1的,但相应估计的概率却各不相同)。
例1 (file:case5)南开大学国际经济研究所1999级研究生考试分数及录取情况见数据表(N = 95)。
定义变量SCORE :考生考试分数;Y :考生录取为1,未录取为0;虚拟变量D1:应届生为1,非应届生为0。
-0.20.00.20.40.60.81.01.2100200300400SC OR EY-0.20.00.20.40.60.81.01.2-0.20.00.20.40.60.81.01.2D 1Y图1 样本观测值(file:logit1)得Logit 模型估计结果如下(EViews 命令:Quick, estimate equation 分别选Probit 或Logit ):注:Akaike information criterion = -2T L log + 2TkSchwarz criterion = -2TL log + k T T Ln )(Hannan-Quinn criterion = -2TL log + 2 k T LnT Ln )(Average Log likelihood function = TLlog其中k 为被估参数个数,T 为样本容量。
McFadden R-squared = 1-)ˆ(log )~(log ββL L 因为D1的系数没有显著性。
说明“应届生”和“非应届生”不是决定是否录取的重要因素。
剔除D1。
得Logit 模型估计结果如下p i = F (y i ) =)6794.07362.243(11i x e +--+ 拐点坐标 (358.7, 0.5)注意:表达式中指数的写法。
-0.20.00.20.40.60.81.01.2100200300400SC OR EYFLOGI图2 Logit 模型预测值,拐点坐标 (358.7, 0.5)在估计Probit 模型过程中,D1的系数也没有显著性。
剔除D1,Probit 模型最终估计结果是p i = F (y i ) = F (-144.456 + 0.4029 x i ) 拐点坐标 (358.5, 0.5)-0.20.00.20.40.60.81.01.2100200300400SC OR EY FPR OB图3 Probit 模型预测值,拐点坐标 (358.5, 0.5)两种估计模型的若干预测结果如下表,Probit模型Logit模型score Y p i Y p i350 -3.44 0.0003 -5.95 0.0026355 -1.43 0.0764 -2.55 0.0738359 0.00 0.5000 0.00 0.5000360 0.59 0.7224 0.85 0.7032365 2.60 0.9953 4.24 0.9858370 4.62 0.9999 7.64 0.9995表2 数据表obs Y SCORE D1 obs Y SCORE D1 obs Y SCORE D11 1 401 1 34 0 332 1 67 0 275 02 1 401 0 35 0 332 1 68 0 273 03 1 392 1 36 0 332 1 69 0 273 14 1 387 0 37 0 331 1 70 0 272 15 1 384 1 38 0 330 1 71 0 267 06 1 379 0 39 0 328 1 72 0 266 17 1 378 0 40 0 328 1 73 0 263 18 1 378 0 41 0 328 1 74 0 261 19 1 376 1 42 0 321 1 75 0 260 010 1 371 0 43 0 321 1 76 0 256 011 1 362 0 44 0 318 1 77 0 252 012 1 362 1 45 0 318 0 78 0 252 113 1 361 1 46 0 316 1 79 0 245 114 0 359 1 47 0 308 0 80 0 243 115 0 358 1 48 0 308 1 81 0 242 016 1 356 1 49 0 304 0 82 0 241 017 0 356 1 50 0 303 1 83 0 239 118 0 355 1 51 0 303 1 84 0 235 019 0 354 1 52 0 299 1 85 0 232 020 0 354 0 53 0 297 1 86 0 228 121 0 353 1 54 0 294 0 87 0 219 122 0 350 0 55 0 293 1 88 0 219 123 0 349 0 56 0 293 1 89 0 214 124 0 349 0 57 0 292 0 90 0 210 125 0 348 1 58 0 291 1 91 0 204 126 0 347 1 59 0 291 1 92 0 198 027 0 347 1 60 0 287 1 93 0 189 128 0 344 1 61 0 286 1 94 0 188 1例3:农户劳动力的非农业就业模型(file:logitzhou)。