计量经济学 复习资料一、虚拟变量:(20分)(给出实际经济问题,根据目标设计虚拟变量,写出模型。
考察一种群体异质。
完整考察如何设计,如何运用到模型中。
)注意事项:(1)注意虚拟变量陷阱是指一般在引入虚拟变量时要求如果有m 个定性变量,在模型中引入m-1个虚拟变量。
否则,如果引入m 个虚拟变量,就会导致模型解释变量间出现完全共线性的情况。
我们一般称由于引入虚拟变量个数与定性因素个数相同出现的模型无法估计的问题,称为"虚拟变量陷阱"。
(2)虚拟变量的应用分为两种情况:虚拟变量做解释变量和虚拟变量做被解释变量(定性相应模型)。
(3)要掌握虚拟变量引入模型的三种方法,即加法模型、乘法模型和既加又乘模型。
1、举例说明如何引进加法模式、乘法模式和既加且乘模型建立虚拟变量模型。
答案:设Y 为个人消费支出;X 表示可支配收入,定义(1)如果设定模型为虚拟变量单独做解释变量,此时模型仅影响截距项,差异表现为截距项的和,因此也称为加法模型。
(2)如果设定模型为tt t t t t t u X D B X D B X D B B Yt ++++=4433221虚拟变量与一个数值变量相乘后做解释变量,此时模型仅影响斜率,差异表现为截距项的和,因此也称为乘法模型。
(3)如果设定模型为此时模型不仅影响截距项,而且还影响斜率项。
差异表现为截距和斜率的双重变化,因此也称为既加且乘模型。
例题1 考虑下面的模型:其中,Y 表示大学教师的年薪收入,X 表示工龄。
为了研究大学教师的年薪是否受到性别、学历的影响。
按照下面的方式引入虚拟变量:(10分)1. 基准类是什么?2. 解释各系数所代表的含义,并预期各系数的符号。
3. 若B4>B3,你得出什么结论?答案:(1)基准类是本科学历的女教师。
(2)B0表示刚参加工作的本科学历女教师的收入,所以B0的符号为正。
B1表示在其他条件不变时,工龄变化一个单位所引起的收入的变化,所以B1的符号为正。
B2表示男教师与女教师的工资差异,所以B2的符号为正。
B3表示硕士学历与本科学历对工资收入的影响,所以B3的符号为正。
B4表示博士学历与本科学历对工资收入的影响,所以B4的符号为正。
(3)若B4>B3,说明博士学历的大学教师比硕士学历的大学教师收入要高。
例题2 性别因素可能对年薪和工龄之间的关系产生影响。
试问这种影响可能有几种形式,并设定出相应的计量经济模型。
性别因素可能对年薪和工龄之间的关系的影响有三种方式。
第一种,性别只影响职工的初始年薪,设定模型为:例题3 考虑下面的模型:其中,Y——MBA毕业生收入,X——工龄。
所有毕业生均来自清华大学,东北财经大学,沈阳工业大学。
(1)基准类是什么?基准类是东北财经大学MBA 毕业生。
你预期各系数的符号如何?预期B1的符号为正;B2的符号为正;B3的符号为负。
(1)如何解释截距B2 、B3? 截距B2反应了清华大学MBA 毕业生相对于东北财经大学MBA 毕业生收入的差别;截距B3反应了沈阳工业大学MBA 毕业生相对于东北财经大学MBA 毕业生收入的差别。
)(2)若B2>B3,你得出什么结论?(3)如果B2>B3,我们可以判断清华大学MBA 毕业生的收入平均高于沈阳工业大学MBA 毕业生的收入。
二、异方差和自相关问题(25分)(一)异方差问题模型,如果出现,对于不同的样本点,随机扰动项的方差不再是常数,而且互不相同,则认为出现了异方差。
在现实经济中,异方差性经常出现,尤其是采用截面数据作样本的计量经济学问题。
例如:工业企业的研究与发展费用支出同企业的销售和利润之间关系的函数模型;服装需求量与季节、收入之间关系的函数模型;个人储蓄与个人可支配收入之间关系的函数模型等。
检验异方差的主要思路就是检验随机扰动项的方差与解释变量观察值的某种函数形式之间是否存在相关性。
1. 异方差的三大后果:一是最小二乘估计不再是有效估计量,最小二乘法做出的估计量是无偏、线性但不是有效估计量;二是相关参数的t 检验、模型F 检验失效;三是估计量的方差是有偏的,参数或因变量预测的置信区间的估计精度下降(甚至这种区间估计是失效的)。
2、异方差的检验识别:异方差的产生机制:截面数据的异方差是由解释变量决定的,因此要找到解释变量与残差方差之间的函数关系,即)(2i ix g =σWhite 检验的具体步骤如下。
以二元回归模型为例,y t = β0 +β1 x t 1 +β2 x t 2 + u t (1)①首先对上式进行OLS 估计参数,求残差t uˆ。
②做如下辅助回归式,(包括截距项、一次项、平方项、交叉项)2ˆt u= α0 +α1 x t 1 +α2 x t 2 + α3 x t 12 +α4 x t 22 + α5 x t 1 x t 2 + v t (2) 即用2ˆt u对原回归式(1)中的各解释变量、解释变量的平方项、交叉积项进行OLS 回归。
求辅助回归式(2)的拟合系数R 2。
③White 检验的零假设和备择假设是 H 0: (1)式中的u t 不存在异方差, H 1: (1)式中的u t 存在异方差④在不存在异方差假设条件下构造LM 统计量LM=n R 2 ~ χ 2(5)其中n 表示样本容量,R 2是辅助回归式(2)的OLS 估计式的拟合系数。
nR 2属于LM 统计量。
⑤判别规则是若 n R 2 ≤ χ2α (5), 接受H 0 (u t 具有同方差) 若 nR 2 > χ2α (5), 拒绝H 0 (u t 具有异方差)说明:(1)white 检验本质上是一个大样本检验,如果实证样本较少(100-300),由于nR 2渐进服从χ2分布,white 检验的可信度不佳,计量经济学暂时没有好办法;(2)在多元回归中,为了节省自由度,white 检验可以省略交叉项,当x>4、n 在(100-300)之间时省略交叉项。
3、 异方差的消除(WLS :加权最小二乘估计)由于异方差使OLS 被破坏,不是有效估计量,因此使用WLS 。
加权最小二乘法是通过模型变换控制异方差。
WLS 的思想:假设回归方程i i i X Y εββ++=10 var(i ε)=i 2σ已知记ii w σ1=同乘以方程两边,i i i i i i i w X w w Y w εββ++=10记作**10*i i i i X w Y εββ++= 而ii i i i w σεεε==*var(*i ε)1)var(1)var()var(2*====i i i i i εσσεε 异方差消除因此对上式进行OLS 估计10ββ和是BLUE 。
如果i2σ未知(通常情况下,i2σ都是未知的,此时用i ε进行估计,用||1i ε进行加权)记⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=Ω||1||11n εε对角阵 εβΩ+Ω=ΩX Y注:(1)由于2i ε仅仅是cov (i ε)的估计,因此用||1i ε进行加权,可能加权后依然存在异方差,此时继续做二次加权;(2)对于界面数据频发的异方差,且var(i ε)=i2σ已知时同方差:ols 等价于WLS异方差:WLS 好于OLS故可以直接用WLS (但是不推荐)最好先用OLS 估计,计算如果存在异方差,再用WLS(二)自相关问题 残差相关问题1. 定义:经典回归假设中i ε是一个白噪声,即残差时零均值、同方差和无序列相关的。
如果cov (j i εε,)≠0,即残差相关。
2. 产生原因线性回归模型中随机误差项存在序列相关的原因很多,但主要是经济变量自身特点、数据特点、变量选择及模型函数形式选择引起的。
(1)经济变量惯性的作用引起随机误差项自相关 (2)经济行为的滞后性引起随机误差项自相关 (3)一些随机因素的干扰或影响引起随机误差项自相关 (4)模型设定误差引起随机误差项自相关 (5)观测数据处理引起随机误差项序列相关 3. 产生的影响(与异方差相似)(1)最小二乘估计不再是有效估计量,最小二乘法做出的估计量是无偏、线性但不是有效估计量;(2)相关参数的方差失真,导致相关参数的t 检验失效; 4. 残差相关的生成机制(时序数据)时序数据的自相关 (原因)的影响(结果)受到上一期1-t εεt 建立P 阶自回归模型t p p 332211e ++⋯⋯+++=----t t t t t ερερερερε 时序数据有顺序,用时序刻画因果 5. 自相关的识别(1)DW 检验 德斌沃森检验 构造一个DW 统计量:)(1r -12)(221-=⋯⋯=-∑∑-t t tt t εεεεε 样本的相关系数DW 值在0-4之间 刻画自相关的程度德斌沃森用穷举法计算了不同的N 与解释变量X 下DW 统计量的两个临界值(D L 和D u )细节见附录表格DW 检验法的缺陷:(1)DW 只刻画了1-t εε和t 之间的关系,仅适用于一阶自相关,忽视了2-t εε和t 这种跳跃式的结构;(2)DW 对模型形式本身有要求,要求原始方程必须含有截距项,模型中不能含有之后被解释变量Yt -1(因变量之后刻画刚性,例如投资;工具变量经常引入因变量的滞后变量;政策分期效应)DW 的优点:在小样本情况下,DW 检验比较可靠。
(2)LM 检验 拉格朗日乘数检验(针对DW 的缺点提出)重点 思想:①用OLS 估计原模型的参数,得到t ε ②用t ε做一个辅助回归假定阶自相关存在P t ε,1p 2211---+⋯⋯++=p t t t ερερερε 代入原模型中 得到t p t t t t e X Y ++⋯⋯++++=---)(1p 221110ερερερββ ③假设0:p 210==⋯⋯==ρρρHTR 2服从)2(χ的分布 其中T 代表样本容量 R2是辅助回归的拟合优度进行显著性检验问题:P 的确定,制定的阶数P 只需要比真实的阶数高就可以了 小样本(500以内)P=4 大样本(大于500)P=6 关于LM 检验有点:适用于各种自相关(高阶),对模型无限制;LM 本质上是一个大样本检验,n 绩效的时候,LM 检验的势偏高。
此时用DW 。
6. 自相关的修正 GLS 广义最小二乘法 思想:原回归模型:t t t X Y εββ++=10假设存在一阶自相关t t t e +=-11ερε (1) t t t X Y εββ++=10 (2)11101---++=t t t X Y εββ(1)-ρ(2)得 111101)()1(-----+-+-=-t t t t t t t X X X Y Y ρεερββρρ 变换为t t t e X Y ++=*1*0*ββ满足经典假设用OLS 估计ρββ-=1*00 1β注:1. 自相关阶数P 的确定(推荐试错法)用试错法,先做一个一阶差分,判断拟差分后的方程是否存在自相关,若存在自相关,做二姐拟差分,再验证是否存在自相关……2. 系相关系数ρ的确定(迭代的思想)(1)用OLS 估计原模型参数,进而得到)1(t ε;(2)做一个P 阶自回归,t p p t t t e ++⋯⋯++=---22211)1(ερερερε=(3)用OLS 做估计得到)1(ρ(4)用ρ做GLS ,估计GLS 后的方程,得到β代入原方程,计算)2(t ε(5)重复(2)—(4),直到前后两次得到ρ高度接近,005.0||)1()(<--k k ρρ三、定性相应模型(LPM 模型 Logit 模型 Probit 模型)定性响应模型是虚拟变量做被解释变量的情形。