多重共线性一、单项选择题1、当模型存在严重的多重共线性时,OLS估计量将不具备()A、线性B、无偏性C、有效性D、一致性2、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF()A、大于B、小于C、大于5D、小于53、模型中引入实际上与解释变量有关的变量,会导致参数的OLS估计量方差()A、增大B、减小C、有偏D、非有效4、对于模型y t=b0+b1x1t+b2x2t+u t,与r12=0相比,r12=0.5时,估计量的方差将是原来的()A、1倍B、1.33倍C、1.8倍D、2倍5、如果方差膨胀因子VIF=10,则什么问题是严重的()A、异方差问题B、序列相关问题C、多重共线性问题D、解释变量与随机项的相关性6、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( )A 异方差B 序列相关C 多重共线性D 高拟合优度7、存在严重的多重共线性时,参数估计的标准差()A、变大B、变小C、无法估计D、无穷大8、完全多重共线性时,下列判断不正确的是()A、参数无法估计B、只能估计参数的线性组合C、模型的拟合程度不能判断D、可以计算模型的拟合程度二、多项选择题1、下列哪些回归分析中很可能出现多重共线性问题()A、资本投入与劳动投入两个变量同时作为生产函数的解释变量B、消费作被解释变量,收入作解释变量的消费函数C、本期收入和前期收入同时作为消费的解释变量的消费函数D、商品价格、地区、消费风俗同时作为解释变量的需求函数E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型2、当模型中解释变量间存在高度的多重共线性时()A、各个解释变量对被解释变量的影响将难以精确鉴别B、部分解释变量与随机误差项之间将高度相关C、估计量的精度将大幅度下降D、估计对于样本容量的变动将十分敏感E、模型的随机误差项也将序列相关3、下述统计量可以用来检验多重共线性的严重性()A、相关系数B、DW值C、方差膨胀因子D、特征值E、自相关系数4、多重共线性产生的原因主要有()A、经济变量之间往往存在同方向的变化趋势B、经济变量之间往往存在着密切的关联C、在模型中采用滞后变量也容易产生多重共线性D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确5、多重共线性的解决方法主要有()A、保留重要的解释变量,去掉次要的或替代的解释变量B、利用先验信息改变参数的约束形式C、变换模型的形式D、综合使用时序数据与截面数据E、逐步回归法以及增加样本容量6、关于多重共线性,判断错误的有()A、解释变量两两不相关,则不存在多重共线性B、所有的t检验都不显著,则说明模型总体是不显著的C、有多重共线性的计量经济模型没有应用的意义D、存在严重的多重共线性的模型不能用于结构分析7、模型存在完全多重共线性时,下列判断正确的是()A、参数无法估计B、只能估计参数的线性组合C、模型的判定系数为0D、模型的判定系数为1三、简述1、什么是多重共线性?产生多重共线性的原因是什么?2、什么是完全多重共线性?什么是不完全多重共线性?3、完全多重共线性对OLS估计量的影响有哪些?4、不完全多重共线性对OLS估计量的影响有哪些?5、从哪些症状中可以判断可能存在多重共线性?6、什么是方差膨胀因子检验法?四、判断(1)如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。
(2)在严重多重共线性下,OLS估计量仍是最佳线性无偏估计量。
(3)多重共线性问题的实质是样本现象,因此可以通过增加样本信息得到改善。
(4)虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。
(5)如果回归模型存在严重的多重共线性,可去掉某个解释变量从而消除多重共线性。
五、综合题1、考虑表6-1的数据表6-1Y -10 -8 -6 -4 -2 0 2 4 6 8 10X1 1 2 3 4 5 6 7 8 9 10 11X2 1 3 5 7 9 11 13 15 17 19 21假设你做Y对X1和X2的多元回归,你能估计模型的参数吗?为什么?2、表6-2给出了以美元计算的每周消费支出(Y),每周收入(X1)和财富(X2)的假想数据。
表6-2,每周收入(X1)和财富(X2)的假想数据(1)作Y对X1和X2的OLS回归。
(2)直观地判断这一回归方程中是否存在多重共线性?为什么?(3)分别作Y对X1和X2的回归,这些回归结果表明了什么?(4)作X2对X1的回归。
这一回归结果表明了什么?(5)如果存在严重的多重共线性,你是否会删除一个解释变量?为什么?3、将下列函数用适当的方法消除多重共线性。
(1)消费函数为C=b0+b1W + b2P +u其中C、W、P分别代表消费、工资收入和非工资收入,W与P可能高度相关,但研究表明b2= b1/2。
(2)需求函数为Q=b 0+b 1Y +b 2P+b 3P s +u其中Q 、Y 、P 、P s 分别为运动量、收入水平、该商品自身价格以及相关商品价格水平,P 与P s 可能高度相关。
4、某公司经理试图建立识别对管理有利的个人能力模型,他选取了15名新近提拔的职员作一系列测试,确定为交易能力(X 1)、与其他人联系的能力(X 2)及决策能力(X 3)。
每名职员的工作情况Y 对上述三个变量作回归,数据如表6-3。
请回答以下问题:(1) 建立回归模型Y=b 0+b 1 X 1 +b 2 X 2+b 3 X 3+u ,并进行回归分析。
(2) 模型是否显著?(3) 计算每个系数b i 的方差膨胀因子VIF ,并判断是否存在多重共线性。
答案:一、单项选择题DCABC CAD二、 多项选择题1、AC2、ACD3、ACD4、ABCD5、ABCDE6、ABC7、AB三、简述1、答:多重共线性是指解释变量之间存在完全或近似的线性关系。
产生多重共线性主要有下述原因:(1)样本数据的采集是被动的,只能在一个有限的范围内得到观察值,无法进行重复试验。
(2)经济变量的共同趋势例如,在做电力消费对收入和住房面积的回归时,总体中有这样的一种约束,即收入较高家庭的住房面积一般地说比收入较低的家庭住房面积大。
资本投入、劳动投入等,收入消费、投资、价格、就业等。
(3)滞后变量的引入例如消费不仅受当期可支配收入Xt 的影响,而且也受前期可支配收入Xt-1,Xt-2,…的影响。
当Xt ,Xt-1,Xt-2,…共同作为解释变量时,高度多重共线性就不可避免。
(4)模型的解释变量选择不当2、答:完全多重共线性是指对于线性回归模型1122k k Y X X ......X u βββ++++=若11j 22j k kj c X c X ...c X =0, j=1,2,...,n +++12k c c ...,c 0其中,,是不全为的常数则称这些解释变量的样本观测值之间存在完全多重共线性。
不完全多重共线性是指对于多元线性回归模型1122k k Y X X ......X u βββ++++=若11j 22j k kj c X c X ...c X +v=0, j=1,2,...,n +++12k c c ...,c 0v 其中,,是不全为的常数,为随机误差项则称这些解释变量的样本观测之间存在不完全多重共线性。
3、答:(1)无法估计模型的参数,即不能独立分辨各个解释变量对因变量的影响。
(2)参数估计量的方差无穷大(或无法估计)4、答:(1)可以估计参数,但参数估计不稳定。
(2)参数估计值对样本数据的略有变化或样本容量的稍有增减变化敏感。
(3)各解释变量对被解释变量的影响难精确鉴别。
(4)t 检验不容易拒绝原假设。
5、答:(1)模型总体性检验F 值和R 2值都很高,但各回归系数估计量的方差很大,t 值很低,系数不能通过显著性检验。
(2)回归系数值难以置信或符号错误。
(3)参数估计值对删除或增加少量观测值,以及删除一个不显著的解释变量非常敏感。
6、答:所谓方差膨胀因子是存在多重共线性时回归系数估计量的方差与无多重共线性时回归系数估计量的方差对比而得出的比值系数。
i 2i 1ˆVIF()=1-R β其中2i i R X -解释变量对其余解释变量回归的判定系数 若iˆVIF()=1β时,认为原模型不存在“多重共线性问题”; 若i ˆVIF()>1β时,则认为原模型存在“多重共线性问题”;若i ˆVIF()>5β时,则模型的“多重共线性问题”的程度是很严重的,而且是非常有害的。
四、判断1、错2、对3、对4、对5、错五、综合题1、答:不能。
因为X 1和X 2存在完全的多重共线性,即X 2=2 X 1-1,或X 1=0.5(X 2+1)。
2、答: (1)12ˆ24.3370.8720.035Y X X =+- T (3.875) (2.773) (-1.160) R 2=0.9682(2)可能存在多重共线性。
因为财富的系数解释是随着财富的增加,消费支出的金额在减少,这与经济理论不相符。
而且,财富的系数不显著。
因此可能是由于多重共线性引起的。
(3)1ˆ24.4550.509Y X =+ T (3.813) (14.243) R 2=0.9622ˆ26.4520.048Y X =+ T (3.132) (10.575) R 2=0.9332回归结果表明两个解释变量对消费支出的影响都是显著的,并且解释能力较强。
(4)213.36410.373X X =-+T (-0.046) (25.253) R 2=0.988回归结果表明每周的收入与财富是高度线性相关的,二者同时作为解释变量会产生严重的多重共线性。
(5)根据经济理论,自己讨论一下。
3、答:(1)利用参数之间的关系式,代模型中从而减少要估计的参数的个数,从而避免多重共线性。
(2)第一步计算Q 对Y 、P 的回归,计算残差,残差里只有相关商品价格和其它不重要因素的影响。
第二步,残差对相关商品价格回归,计算回归系数。
第三步,用Y *表示Y 减去残差的拟合值,即减去相关商品价格与第二步中的回归系数相乘的值。
第四步,计算Y *对其他变量回归。
最后,整理结果。
4、答:(1)123ˆ39.590.144 1.2520.683Y X X X =-+++ T (-1.304) (0.719) (2.533) (1.552)R 2=0.796拟合程度较高,只有X2是统计上显著的。
(2)F =14.288,经检验统计显著。
(3)方差膨胀因子分别为1.07,2.71,2.62。
因子不存在多重共线性。