当前位置:文档之家› 数学建模专题汇总-离散模型

数学建模专题汇总-离散模型

离散模型§ 1 离散回归模型一、离散变量如果我们用0,1,2,3,4,…说明企业每年的专利申请数,申请数是一个离散的变量,但是它是间隔尺度变量,该变量类型不在本章的讨论的被解释变量中。

但离散变量0和1可以用来说明企业每年是否申请专利的事项,类似表示状态的变量才在本章的讨论中。

在专利申请数的问题中,离散变量0,1,2,3和4等数字具有具体的经济含义,不能随意更改;而在是否申请专利的两个选择对象的选择问题中,数字0和1只是用于区别两种不同的选择,是表示一种状态。

本专题讨论有序尺度变量和名义尺度变量的被解释变量。

二、离散因变量在讨论家庭是否购房的问题中,可将家庭购买住房的决策用数字1 表示,而将家庭不购买住房的决策用数字0表示。

10yes x no⎧=⎨⎩ 如果x 作为说明某种具体经济问题的自变量,则应用以前介绍虚拟变量知识就足够了。

如果现在考虑某个家庭在一定的条件下是否购买住房问题时,则表示状态的虚拟变量就不再是自变量,而是作为一个被说明对象的因变量出现在经济模型中。

因此,需要对以前讨论虚拟变量的分析方法进行扩展,以便使其能够适应分析类似家庭是否购房的问题。

因为在家庭是否购房问题中,虚拟因变量的具体取值仅是为了区别不同的状态,所以将通过虚拟因变量讨论备择对象选择的回归模型称为离散选择模型。

三、线性概率模型现在约定备择对象的0和1两项选择模型中,下标i 表示各不同的经济主体,取值0或l 的因变量i y 表示经济主体的具体选择结果,而影响经济主体进行选择的自变量i x 。

如果选择响应YES的概率为(1/)i p y =i x ,则经济主体选择响应NO的概率为1(1/)i i p y -=x ,则(/)1(1/)0(0/)i i i i i i E y p y p y =⨯=+⨯=x x x =(1/)i i p y x =。

根据经典线性回归,我们知道其总体回归方程是条件期望建立的,这使我们想象可以构造线性概率模型(1/)(/)i i i i i p y x E y x '===x β011i k ik i x x u βββ=++++描述两个响应水平的线性概率回归模型可推知,根据统计数据得到的回归结果并不一定能够保证回归模型的因变量拟合值界于[0,1]。

如果通过回归模型式得到的因变量拟合值完全偏离0或l 两个数值,则描述两项选择的回归模型的实际用途就受到很大的限制。

为避免出现回归模型的因变量预测值偏离0或1的情形,需要限制因变量的取值范围并对回归模型式进行必要的修正。

由于要对其进行修正,那么其模型就会改变,模型改变会导致似然函数改变,这就是我们下面要讨论的。

现在我们讨论的模型与判别分析的目的是一样的,但有区别。

§ 2 二元离散选择模型一、效用函数为了使得二元选择问题的有进一步研究可能,首先建立一个效用函数。

在讨论家庭是否购房的问题中,可将家庭购买住房的决策用数字1 表示,而将家庭不购买住房的决策用数字0表示。

用1i U 表示第i 个人选择买房的效用,0i U 表示第i 个人选择不买房的效用。

其效用均为随机变量,于是有11110000(1)(2)i i i i U u U u αα'⎧=++⎪⎨'=++⎪⎩i i X βX β (1)将(1)-(2),得()10101012()()i i i i U U u u αα'-=-+-+-i X ββ记:*10i i i y U U =-*12ααα=-*10=-βββ *10i i i u u u =-则有 ****i i Y u α'=++i X β,格林称该模型为潜回归。

这是二元选择模型的切入点。

称*i Y 为过渡变量(潜在的),这个变量是不可观测的。

当效用差*i Y 大于零,则应该选“1”,即购房;当效用差*i Y 小于零,则应该选“0”,即不购房。

故()****(1)(0)()1i i i p Y p Y P u F αα**''==>=>-=--i i X βX β-- ()****(0)(0)()i i i p Y p Y P u F αα**''==≤=≤-=-i i X βX β--此处已经通过*i Y ,将自变量与事件发生的概率联系起来了。

为概率提供了一个潜在的结构模型。

现在的问题是()F ⋅服从何种分布?()F ⋅既然是分布函数,则必须满足分布函数的条件.二、两类常用的模型根据以上的分析,我们的问题已经转化为作为()F ⋅有什么形状,即密度函数f 具有什么样的函数形式。

采用累积标准正态概率分布函数的模型称作Probit 模型,或概率单位模型,用正态分布的累积概率作为Probit 模型的预测概率。

另外logistic函数也能满足这样的要求,采用logistic 函数的模型称作logit 模型,或对数单位模型。

注:分布在此时是以y 轴为对称。

(一)Logit 模型 因为()******(1)(0)()()i i i i p Y p Y P u P u F ααα***'''==>=>-=<+=+i i i X βX βX β-如果我们取F (.)为逻辑函数(LOGIT ),即1()()11xx xe x F x e e-Λ===++(满足分布函数的条件),有 ()*********1(1)()11i ii i iep Y F eeααααα'+*''--+''==+=Λ+==++X βi X βX βX βX β为了更简化模型 ****i iu Y +'+=βX i α,我们令**α⎛⎫= ⎪⎝⎭ββ,()121i i i ik x x x '=x ,*i i u u =则 *i i i Y u '=+x β有 ()*F α*'+i X β=exp()()1exp()i i i ''Λ='+x βx βx β(1/)i i p y x ==exp()()1exp()i i i ''Λ='+x βx βx β exp()(1/)1exp()i i i i p y x '=='+x βx β[]1exp()(1/)exp()i i i i p y x ''+==x βx β(1/)(1/)exp()exp()i i i i i i p y x p y x ''=+==x βx β (1/)exp()(1/)exp()i i i i i i p y x p y x ''==-=x βx β(1/)exp()(1/)exp()i i i i i i p y x p y x ''==-=x βx β(1/)exp()1(1/)i i i i i p y x p y x ='=-=x β(非线性)(1/)ln 1(1/)i i i i i p y x p y x ='=-=x β (广义非线性)(1)ln1(1)i i i i p y u p y ='=+-=x β (2)称(2)式为逻辑斯蒂回归模型。

(二)PROBIT 模型更为一般的情形,如果选择F (.)是标准正态分布,则产生PROBIT 回归模型。

(1/)i i i p p y x ===21())2i i t dt '-∞'Φ=-⎰x βx β1()i i p -'Φ=x β (3)称(3)式为PROBIT 回归模型。

注 Probit 曲线和logit 曲线很相似。

标准正态概率分布曲线logistic 分布曲线使用哪个分布是一个很自然的问题,logit 曲线除了在尾部比正态分布厚得多以外,两条曲线都是在p i = 处有拐点,logit 曲线更接近一个自由度为7的t 分布(格林书认为自由度是4的t 分布)。

所以,对于'x β的中间值(比如到之间)来说,两种分布会给出类似的概率,但是当'x β非常小时,逻辑斯蒂回归模型比PROBIT 回归模型倾向于给出0y =(*0y ≤)较大的概率值,而在'x β非常大时,倾向于给出0y =(*0y ≤)较小的概率值。

利用函数式可以得到的概率值见表一。

表一 Probit 模型和logit 模型概率值y i正态分布函数 p i =⎰∞--iy t dt e2221π逻辑概率分布 p i =iy e-+11特点尾薄尾厚§ 3 二元离散选择模型最大似然估计下面我们来构造二元离散选择模型的似然函数。

这是二元离散选择模型最关键的问题。

因为 *(1)(0)()i i i i p Y p Y P u '==>=>-x β *(0)(0)()i i i i p Y p Y P u '==≤=≤x β- 我们假设有以Y 轴为对称的概率密度函数f(.),则*(1)(0)(0)i i i i p Y p Y p u '==>=+>x β()i i P u '=>x β-1()i i P u '=-≤x β-1()()i i F F ''=-=x βx β-*(0)(0)()()1()i i i i i i p Y p Y P u F F '''==≤=≤==-x βx βx β--于是模型的似然函数为[]1201(,,,)1()()i i n i i Y Y P Y Y Y F F ==''=-∏∏x βx β[][]111()()iinY Y i i i L F F -=''=-∏x βx β两边同时取自然对数,则[][]{}1ln ln ()(1)ln 1()ni i i i i L Y F Y F =''=+--∑x βx β对数似然函数最大化的条件是0X βi =⎥⎦⎤⎢⎣⎡---+=∂∂∑=ni i i i ii i F f Y F f Y L1)1()1(ln (4) 一、对数单位模型的似然函数将()()1e F e ''''=Λ=+X βX βX βX β和()()2()()[1()]1d e d e '''Λ''==Λ-Λ'+X βX βX βX βX βX β代入(4),则似然方程为[]1ln ()0ni i i i L y =∂'=-Λ=∂∑X βX β。

相关主题