当前位置:文档之家› 第二章回归分析中的几个基本概念

第二章回归分析中的几个基本概念

第四章一、练习题 (一)简答题1、多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用?2、多元线性回归模型与一元线性回归模型有哪些区别?3、某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为fedu medu sibs edu 210.0131.0094.036.10++-=R 2=0.214式中,edu 为劳动力受教育年数,sibs 为该劳动力家庭中兄弟姐妹的个数,medu 与fedu 分别为母亲与父亲受到教育的年数。

问(1)若medu 与fedu 保持不变,为了使预测的受教育水平减少一年,需要sibs 增加多少?(2)请对medu 的系数给予适当的解释。

(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少? 4、以企业研发支出(R&D )占销售额的比重为被解释变量(Y ),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:099.0)046.0()22.0()37.1(05.0)log(32.0472.0221=++=R X X Y其中括号中为系数估计值的标准差。

(1)解释log(X1)的系数。

如果X1增加10%,估计Y 会变化多少个百分点?这在经济上是一个很大的影响吗?(2)针对R&D 强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的假设。

分别在5%和10%的显著性水平上进行这个检验。

(3)利润占销售额的比重X2对R&D 强度Y 是否在统计上有显著的影响? 5、什么是正规方程组?分别用非矩阵形式和矩阵形式写出模型:i ki k i i i u x x x y +++++=ββββ 22110,n i ,,2,1 =的正规方程组,及其推导过程。

6、假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。

你通过整个学年收集数据,得到两个可能的解释性方程:方程A :3215.10.10.150.125ˆX X X Y +--= 75.02=R 方程B :4217.35.50.140.123ˆX X X Y -+-= 73.02=R 其中:Y ——某天慢跑者的人数1X ——该天降雨的英寸数 2X ——该天日照的小时数3X ——该天的最高温度(按华氏温度) 4X ——第二天需交学期论文的班级数请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?7、设货币需求方程式的总体模型为t t t ttRGDP r P M εβββ+++=)ln()ln()ln(210 其中M 为广义货币需求量,P 为物价水平,r 为利率,RGDP 为实际国内生产总值。

假定根据容量为n =19的样本,用最小二乘法估计出如下样本回归模型;1.09.0)3()13()ln(54.0)ln(26.003.0)ln(2==++-=DW R e RGDP r P M t t t tt其中括号内的数值为系数估计的t 统计值,t e 为残差。

(1)从经济意义上考察估计模型的合理性;(2)在5%显著性水平上.分别检验参数21,ββ的显著性; (3)在5%显著性水平上,检验模型的整体显著性。

(二)计算题1、下面给出依据15个观察值计算得到的数据:693.367=Y , 760.4022=X ,0.83=X ,269.660422=∑i y096.8485522=∑ix,0.28023=∑i x , 346.747782=∑iixy9.42503=∑iixy ,0.479632=∑i ix x其中小写字母代表了各值与其样本均值的离差。

要求:(1)估计三个多元回归系数;(2)估计它们的标准差;并求出2R 与2R ?(3)估计2β、3β95%的置信区间;(4)在%5=α下,检验估计的每个回归系数的统计显著性(双边检验); (5)检验在%5=α下所有的部分系数都为零,并给出方差分析表。

2、表3—1是以进出车站的乘客为主要服务对象的10家便利店的数据。

y 是日均销售额,1x 是店铺面积,2x 是作为选址条件的店铺距车站的距离。

(1)对多元回归模型εβββ+++=22110x x y 进行OLS 估计; (2)求决定系数2R 和自由度调整后的决定系数2R ;(3)假设其他条件不变,店铺面积增加1平方米,日均销售额能增加多少元?(4)假设其他条件不变,店铺距车站的距离比现在远100米,日均销售额会减少多少元? (5)假设有人想新建一个店铺K 店,计划店铺面积为80平方米,距车站300米,试预测其日均销售额K y。

3、已知线性回归模型U X Y +=B 式中~U (0,I 2σ),13=n 且3=k (n 为样本容量,k 为参数的个数),由二次型)()'(B B X Y X Y --的最小化得到如下线性方程组:3ˆˆ2ˆ321=++βββ 9ˆˆ5ˆ2321=++βββ 8ˆ6ˆˆ321-=++βββ要求:(1)把问题写成矩阵向量的形式;用求逆矩阵的方法求解之;(2)如果53='Y Y ,求2ˆσ; (3)求出βˆ的方差—协方差矩阵。

4、已知数据如下表:要求:(1)先根据表中数据估计以下回归模型的方程(只估计参数不用估计标准差):i i i u x y 1110++=αα i i i u x y 2220++=λλ i i i i u x x y +++=22110βββ(2)回答下列问题:11βα=吗?为什么?22βλ=吗?为什么? (三)证明题1、考虑下列两个模型:Ⅰ、i i i i u x x y +++=33221βββ Ⅱ、i i i i i u x x x y '+++=-332212)(ααα要求:(1)证明:1ˆˆ22-=βα ,11ˆˆβα= ,33ˆˆβα= (2)证明:残差的最小二乘估计量相同,即:i i u u'=ˆˆ (3)在何种情况下,模型Ⅱ的拟合优度22R 会小于模型Ⅰ拟合优度21R 。

2、对模型i ki k i i i u x x x y +++++=ββββ 22110应用OLS 法,得到回归方程如下:kik i i i x x x y ββββˆˆˆˆˆ22110++++= 要求:证明残差i i i yy ˆ-=ε与i y ˆ不相关,即:0ˆ=∑ii yε。

二、答案 (一)简答题1、多元线性回归模型的基本假定有:零均值假定、随机项独立同方差假定、解释变量的非随机性假定、解释变量之间不存在线性相关关系假定、随机误差项i u 服从均值为0方差为2σ的正态分布假定。

在证明最小二乘估计量的无偏性中,利用了解释变量与随机误差项不相关的假定;在有效性的证明中,利用了随机项独立同方差假定。

2、多元线性回归模型与一元线性回归模型的区别表现在如下几方面:一是解释变量的个数不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了“解释变量之间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计式的表达更复杂;3、(1)根据多元回归模型偏回归系数的含义,sibs 前的参数估计值-0.094表明,在其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时间,兄弟姐妹需增加1/0.094=10.6个。

(2)medu 的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会。

(3)首先计算两人受教育的年数分别为:10.36+0.131⨯12+0.210⨯12=14.452 10.36+0.131⨯16+0.210⨯16=15.816因此,两人的受教育年限的差别为15.816-14.452=1.364 4、(1)log(x1)的系数表明在其他条件不变时,log(x1)变化1个单位,Y 变化的单位数,即∆Y=0.32∆log(X1)≈0.32(∆X1/X1)=0.32⨯100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y 会增加0.32个百分点。

由此,如果X1增加10%,Y 会增加0.032个百分点。

这在经济上不是一个较大的影响。

(2)针对备择假设H1:01>β,检验原假设H0:01=β。

易知计算的t 统计量的值为t=0.32/0.22=1.468。

在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为1.699(单侧),计算的t 值小于该临界值,所以不拒绝原假设。

意味着R&D 强度不随销售额的增加而变化。

在10%的显著性水平下,t 分布的临界值为1.311,计算的t 值小于该值,拒绝原假设,意味着R&D 强度随销售额的增加而增加。

(3)对X 2,参数估计值的t 统计值为0.05/0.46=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y 在统计上没有显著的影响。

5、答:含有待估关系估计量的方程组称为正规方程组。

正规方程组的非矩阵形式如下:⎪⎪⎪⎩⎪⎪⎪⎨⎧=++++-=++++-=++++-=++++-∑∑∑∑∑∑∑∑0)ˆˆˆˆ(0)ˆˆˆˆ(0)ˆˆˆˆ(0)ˆˆˆˆ(221102221102122110122110ki ki k i i ki i i ki k i i i i i ki k i i i i kik i i i x x x x x y x x x x x y x x x x x y x x x y ββββββββββββββββ 正规方程组的矩阵形式如下:BˆX X '=Y X ' 推导过程略。

6、⑴方程B 更合理些。

原因是:方程B 中的参数估计值的符号与现实更接近些,如与日照的小时数同向变化,天长则慢跑的人会多些;与第二天需交学期论文的班级数成反向变化,这一点在学校的跑道模型中是一个合理的解释变量。

⑵解释变量的系数表明该变量的单位变化在方程中其他解释变量不变的条件下对被解释变量的影响,在方程A 和方程B 中由于选择了不同的解释变量,如方程A 选择的是“该天的最高温度”而方程B 选择的是“第二天需交学期论文的班级数”,由此造成2X 与这两个变量之间的关系不同,所以用相同的数据估计相同的变量得到不同的符号。

7、(1)该估计模型:反映了货币需求量随利率的升高而下降和随国民生产总值的增加而上升的关系,具有经济意义上合理性。

(2)查表有t 0.025(16)=2.120,从而)16(025.02t t ≥β,)16(025.03t t ≥β,知参数2β和3β显著。

相关主题