当前位置：文档之家› 完整版逻辑回归模型分析见解

完整版逻辑回归模型分析见解

1.逻辑回归模型1.1逻辑回归模型考虑具有p个独立变量的向量■',设条件概率卩;上二•丨门二广为根据观测量相对于某事件发生的概率。

逻辑回归模型可表示为：「（ 1.1）上式右侧形式的函数称为称为逻辑函数。

下图给出其函数图象形式。

其中-" I' 1 c' ■-..【•。

如果含有名义变量，则将其变为dummy 变量。

一个具有k个取值的名义变量，将变为k-1个dummy 变量。

这样，有—I （ 1.2）这个比值称为事件的发生比（the odds of experie ncing an event）,0<p<1,故odds>0 。

对odds取对数，即得到线性函数，h ■y —: j島一，厲-5 —+兀匸护9一 Q讣1 p 上】（1.5）假设有n个观测样本，观测值分别为设' 」I ■■-为给定条件下(1.3)简称为odds。

因为定义不发生事件的条件概率为那么，事件发生与事件不发生的概率之比为1.2极大似然函数得到I 的概率。

在同样条件下得到-- 的条件概率为丨：一"。

得到一个观测值的概率为因为各项观测独立，所以它们的联合分布可以表示为各边际分布的乘积。

(1.7)上式称为n个观测的似然函数。

我们的目标是能够求出使这一似然函数的值最大的参数估譏备心)(」' (1.10 是，◎ )*(1 ¥严(1.6 )i-l计。

于是，最大似然估计的关键就是求出参数：- ，使上式取得最大值。

对上述函数求对数— (1.8)上式称为对数似然函数。

为了估计能使亠取得最大的参数的值。

对此函数求导，得到p+1个似然方程。

Ei 片 n：—E L尹—心肿一时(1.9 )^叶切迄尸，j=1,2,..,p.上式称为似然方程。

为了解上述非线性方程，应用牛顿-拉斐森进行迭代求解。

(Newto n-Raphs on) 方法1.3 牛顿-拉斐森迭代法对-八•求二阶偏导数，即Hessian矩阵为如果写成矩阵形式，以H表示Hessian矩阵，X表示(1.11 )(2.1 )得牛顿迭代法的形式为对H 进行cholesky 分解。

最大似然估计的渐近方差（asymptotic 阵（information matrix ）的逆矩阵估计出来。

而信息矩阵实际上是匚…—二阶导数的负值,表示为。

估计值的方差和协方差表示为 -'_■',也就是说，估计值，二的方差为矩阵I 的逆矩阵的对角线上的值，而估计值 ’】和厂的协方差为除了对角线以外的值。

然而在多数情况，我们将使用估计值■〔的标准方差，表示为2 .显著性检验下面讨论在逻辑回归模型中自变量?；［是否与反应变量显著相关的显著性检验。

零假设 ‘二，：■' = 0 （表示自变量 F 对事件发生可能性无影响作用）。

如果零假设被拒绝，说明事件发生可能性依赖于"的变化。

2.1 Wald test对回归系数进行显著性检验时，通常使用Wald 检验，其公式为r-儿a-曹:（i(1.12 )则H=X TVX 。

再令 L 1九■■■“然方程的矩阵形式。

>i -兀i >2 - %■丹■①」（注：前一个矩阵需转置），即似(1.13 )注意到上式中矩阵H 为对称正定的，求解b'U 即为求解线性方程HX = U 中的矩阵X 。

varianee ）和协方差（covarianee ）可以由信息矩 for j=0,1,2. …,p (1.14 )4貝A.其中，■''匸•为二的标准误差。

这个单变量Wald 统计量服从自由度等于1的■-分布。

如果需要检验假设’'-：| ：I = 0,计算统计量(2.2 )4 宀其中，厂为去掉'-所在的行和列的估计值，相应地, 准误差。

这里， Wald 统计量服从自由度等于 p 的」分布。

如果将上式写成矩阵形式,^ = (QMQ^^)QT\QA) (2.3) 矩阵Q 是第一列为零的一常数矩阵。

例如，如果检验然而当回归系数的绝对值很大时，这一系数的估计标准误就会膨胀，于是会导致统计值变得很小，以致第二类错误的概率增加。

也就是说，在实际上会导致应该拒绝零假设时却未能拒绝。

所以当发现回归系数的绝对值很大时，就不再用 Wald 统计值来检验零假设, 而应该使用似然比检验来代替。

2.2似然比(Likelihood ratio test )检验在一个模型里面，含有变量①与不含变量山的对数似然值乘以-2的结果之差，服从分布。

这一检验统计量称为似然比（likelihood ratio ），用式子表示为L y 不纸似然、G7哙科麝（2.4）计算似然值采用公式（1.8 ）。

倘若需要检验假设’‘一：八一 -4 = 0,计算统计量讥『2＞讣饵.“—"歸-十恥H m "HdfUWXl /cu 、“ (2.5 )上式中，"表示门=0的观测值的个数，而匸表示门=1的观测值的个数，那么 n 就表示所有观测值的个数了。

实际上，上式的右端的右半部分■■ 1_'- ' "■ 一‘ ' 表示只含有的似然值。

统计量 G 服从自由度为p 的■「分布 2.3 Score 检验在零假设"-'?= 0下，设参数的估计值为'1 :,即对应的 J = 0。

计算Score 统计量的公式为A J TS4--为去掉’k 所在的行和列的标Wald5甩尸厂）（如刃（如〕(2.6 )上式中，’L-表示在=0下的对数似然函数（1.9 ）的一价偏导数值，而''"：■ ：|表示在匚=0下的对数似然函数（1.9 ）的二价偏导数值。

Score 统计量服从自由度等于1的'■ 分布。

2.4模型拟合信息模型建立后，考虑和比较模型的拟合程度。

有三个度量值可作为拟合的判断根据。

(1) -2LogLikelihood】-乂 (2.7)(2) Akaike 信息准则(Akaike In formation Criterio n. 血=_25亂+ 2住+小（28）其中K 为模型中自变量的数目， S 为反应变量类别总数减1, 对于逻辑回归有 S=2-仁1 -2LogL 的值域为0至，其值越小说明拟合越好。

当模型中的参数数量越大时，似然值也就越大，-2LogL 就变小。

因此，将2 （K+S ）加到AIC 公式中以抵销参数数量产生的影响。

在其它条件不变的情况下，较小的 AIC 值表示拟合模型较好。

（3）Schwarz 准则这一指标根据自变量数目和观测数量对 -2LogL 值进行另外一种调整。

SC 指标的定义为犯=-2比就+2也+心恤@）（2.9）其中ln （n ）是观测数量的自然对数。

这一指标只能用于比较对同一数据所设的不同模型。

在其它条件相同时，一个模型的 AIC 或SC 值越小说明模型拟合越好。

3. 回归系数解释 3.1发生比（1）连续自变量。

对于自变量J j:，每增加一个单位，odds ration 为OR(3.1)简写为AIC ）odds=[p/(1-p)]3，即事件发生的概率与不发生的概率之比。

而发生比率(odds ration).odds.⑵二分类自变量的发生比率。

变量的取值只能为0或1，称为dummy variable 。

当取值为1，对于取值为0的发生比率为- ：' (3.2)亦即对应系数的幕。

(3)分类自变量的发生比率。

如果一个分类变量包括m个类别，需要建立的dummy variable 的个数为m-1,所省略的那个类别称作参照类(referenee category) 。

设dummy variable 为八;：，其系数为，■，对于参照类，其发生比率为丁、。

3.2逻辑回归系数的置信区间对于置信度1 -二，参数「的100% (1 -「)的置信区间为玄土益X曲並" (3.3 )上式中，亠为与正态曲线下的临界乙值(critical value ), =为系数估计的标准误差，‘’和- '两值便分别是置信区间的下限和上限。

当样本较大时，匚=0.05水平的系数"的95%置信区间为&±1,92 込兀(3.4 )4. 变量选择4.1前向选择(forward selection ):在截距模型的基础上，将符合所定显著水平的自变量一次一个地加入模型。

具体选择程序如下(1 )常数(即截距)进入模型。

(2 )根据公式(2.6 )计算待进入模型变量的Score检验值，并得到相应的P值。

(3)找出最小的p值，如果此p值小于显著性水平-,则此变量进入模型。

如果此变量是某个名义变量的单面化(dummy) 变量，则此名义变量的其它单面化变理同时也进入模型。

不然，表明没有变量可被选入模型。

选择过程终止。

(4) 回到(2)继续下一次选择。

4.2后向选择(backward selection ):在模型包括所有候选变量的基础上，将不符合保留要求显著水平的自变量一次一个地删除。

具体选择程序如下(1) 所有变量进入模型。

(2) 根据公式(2.1 )计算所有变量的Wald检验值，并得到相应的p值。

(3) 找出其中最大的p值，如果此P值大于显著性水平，则此变量被剔除。

对于某个名义变量的单面化变量，其最小p值大于显著性水平，则此名义变量的其它单面化变量也被删除。

不然，表明没有变量可被剔除，选择过程终止。

(4) 回到(2)进行下一轮剔除。

4.3 逐步回归(stepwise selection)(1)基本思想：逐个引入自变量。

每次引入对Y影响最显著的自变量，并对方程中的老变量逐个进行检验，把变为不显著的变量逐个从方程中剔除掉，最终得到的方程中既不漏掉对Y影响显著的变量，又不包含对Y影响不显著的变量。

⑵筛选的步骤：首先给出引入变量的显著性水平-和剔除变量的显著性水平J ,然后按下图筛选变量。

Y亠―"I J厂巨二匸罠"J、、-iI 乳IJ ______ _十审谛丘至(3)逐步筛选法的基本步骤逐步筛选变量的过程主要包括两个基本步骤：一是从不在方程中的变量考虑引入新变量的步骤；二是从回归方程中考虑剔除不显著变量的步骤。

假设有p个需要考虑引入回归方程的自变量.①设仅有截距项的最大似然估计值为「。

对p个自变量每个分别计算Score检验值，设有最小p值的变量为'r-,且有2 " 1 ' J ^',对于单面化(dummy)变量，也如此。

若" …，则此变量进入模型，不然停止。

如果此变量是名义变量单面化(dummy)的变量，则此名义变量的其它单面化变量也进入模型。

其中=•・;为引入变量的显著性水平。

e商务文档

完整版逻辑回归模型分析见解

相关文档推荐：