应用回归分析试题(一)1、对于一元线性回归y 0i X i i(i 1,2,..., n),E(J 0 , var( J cov( i, j) 0(i j),下列说法错误的是(A) 0,1的最小一乘估计?'0,?都是无偏估计;(B) 0,1的最小一乘估计?0,Q?对y,y2,... ,y n是线性的;(C) 0,1的最小一乘估计?,?之间是相关的;(D)若误差服从正态分布,0,1的最小二乘估计和极大似然估计是不一样的2、在回归分析中若诊断出异方差,常通过方差稳定化变化对因变量进行变换.如果误差方差与因变量y的期望成正比,则可通过下列哪种变换将方差常数化1(A) - ;(B) “ ;(C) ln( y 1) ;(D) In y.y 、3、下列说法错误的是(A) 强影响点不一定是异常值;(B) 在多元回归中,回归系数显着性的t检验与回归方程显着性的F检验是等价的;(C) 一般情况下,一个定性变量有k类可能的取值时,需要引入k-1个0-1型自变量;(D) 异常值的识别与特定的模型有关.4、下面给岀了4个残差图,哪个图形表示误差序列是自相关的(A) (B)(C) (D)5、下列哪个岭迹图表示在某一具体实例中最小二乘估计是适用的(A) (B)(C)(D)二、填空题(每空2分,共20分)2 21、考虑模型y X ,var( ) I n,其中X : n p,秩为p,0不一定已知,则 ? ________________ , var ( ?) _________ ,若服从正态分布,则2、下表给岀了四变量模型的回归结果:则残差平方和= ___________ ,总的观察值个数 = ___________ ,回归平方和的自由度 = ________ .3、已知因变量 y 与自变量X i ,X 2, X 3,X 4,下表给岀了所有可能回归模型的 AIC 值,则最优子集是 _______________________ .4、 在诊断自相关现象时,若DW 0.66,则误差序列的自相关系数的估计值= _______ ,若存在自相关现象,常用的处理方法有迭代法、 _____________ 、科克伦-奥克特迭代法.5、 设因变量y 与自变量X 的观察值分别为 y 「y 2,..., y n 和x 1, x 2 ,..., x n ,则以x *为折点的折 线模型可表示为 ________________________ .三、(共45分)研究货运总量y (万吨)与工业总产值x 1 (亿元)、农业总产值x 2 (亿元)、 居民非商品支岀X 3 (亿元)的线性回归关系.观察数据及残差值e i 、学生化残差SRE i 、删除 学生化残差SRE (i )、库克距离D i 、杠杆值ch ii 见表(nP)?2___________ ,其中?2是2的无偏估计已知t°.025(6) 2.447 , t°.025(7) 2.365 , FMQ) 4.76 , F°.05(4,7) 4.12,根据上述结果,解答如下问题:1、计算误差方差2的无偏估计及判定系数R2. (8分)2、对X i,X2,X3的回归系数进行显着性检验.(显着性水平0.05)(12分)3、对回归方程进行显着性检验.(显着性水平0.05)(8分)4、诊断数据是否存在异常值,若存在,是关于自变量还是关于因变量的异常值?(10分)5、写岀y关于X i,X2,X3的回归方程,并结合实际对问题作一些基本分析(7分)四、(共8分)某种合金中的主要成分为金属A与金属B,研究者经过13次试验,发现这两种金属成分之和X与膨胀系数y之间有一定的数量关系,但对这两种金属成分之和X是否对膨胀系数y有二次效应没有把握,经计算得y与X的回归的残差平方和为3.7,y与x、x2的回归的残差平方和为0.252,试在0.05的显着性水平下检验X对y是否有二次效应?(参考数据F°.05(1,10) 4.96,F°.05(2,10) 4.1 )五、(共12分)(1)简单描述一下自变量X1,X2,...,X p之间存在多重共线性的定义;( 2 分)2)多重共线性的诊断方法主要有哪两种?( 3)消除多重共线性的方法主要有哪几种?(应用回归分析试题(二)一、选择题1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为 y bx a ,已知:数据x 的平均值为 2,数据 y 的平均值为 3,则 (A )A .回归直线必过点(2, 3) B.回归直线一定不过点(2, 3) 0点(2, 3)在回归直线上方。
.点(2, 3)在回归直线下方2. 在一次试验中,测得(x, y )的四组值分别是 A (1,2),B (2,3),C (3,4),D (4,5) ,则丫与X 之间的回归直线方程为( A )A. y$ x 1 B . $ X 2c. y 2x 1 D. $ X 1 3. 在对两个变量x , y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释;②收集数据(X i 、y i ), i 1,2,…,n ;③求线性回归方程;④求未知参数;⑤根据所搜集的数据绘制散点图 如果根据可行性要求能够作出变量x, y 具有线性相关结论,则在下列操作中正确的是(D )A.①②⑤③④B .③②④⑤①C.②④③①⑤D.②⑤④③① 4. 下列说法中正确的是( B )A.任何两个变量都具有相关关系B.人的知识与其年龄具有相关关系C.散点图中的各点是分散的没有规律D.根据散点图求得的回归直线方程都是有意义的5. 给出下列结论:22(1) 在回归分析中,可用指数系数 R 的值判断模型的拟合效果, R 越大,模型的拟合效果越好; (2) 在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3) 在回归分析中,可用相关系数 r 的值判断模型的拟合效果, r 越小,模型的拟合效果越好;(4) 在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这 样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有(B )个.A. 1B. 2C. 3D. 4 6. 已知直线回归方程为 y 2 1.5x ,则变量x 增加一个单位时(C )A. y 平均增加 1.5 个单位B. y 平均增加 2 个单位C. y 平均减少 1.5个单位D. y 平均减少 2 个单位7. 下面的各图中,散点图与相关系数 r 不符合的是( B )8. 一位母亲记录了儿子3〜9岁的身高,由此建立的身高与年龄的回归直线方程为 ? 7.19x 73.93 ,据此可以预测这个孩子 10 岁时的身高,则正确的叙述是(D )A.身高一定是 145.83cmB .身高超过146.00cm C.身高低于145.00cmD •身高在145.83cm 左右 9. 在画两个变量的散点图时,下面哪个叙述是正确的 (B ) (A ) 预报变量在 x 轴上,解释变量在 y 轴上 (B ) 解释变量在x 轴上,预报变量在 y 轴上4 分) 6 分)(C)可以选择两个变量中任意一个变量在x轴上(D)可以选择两个变量中任意一个变量在y轴上210. 两个变量y与x的回归模型中,通常用R来刻画回归的效果,则正确的叙述是(D)A. R2越小,残差平方和小B. R2越大,残差平方和大C. R2于残差平方和无关D. R2越小,残差平方和大11. 两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是(A)2 2A.模型1的相关指数R为0.98B.模型2的相关指数R为0.802 2C.模型3的相关指数R为0.50D.模型4的相关指数R为0.2512. 在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是(B)A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R213. 工人月工资(元)依劳动生产率(千元)变化的回归直线方程为? 60 90x,下列判断正确的是(C)A.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元14. 下列结论正确的是(C )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①② E.①②③ C.①②④ D.①②③④15. 已知回归直线的斜率的估计值为 1.23,样本点的中心为(4,5),则回归直线方程为(C )A. $ 1.23x 4B. $ 1.23x 5 c. y 1.23x 0.08 D. $ 0.08x 1.23二、填空题16. 在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是甲.17. 在回归分析中残差的计算公式为列联表、三维柱形图、二维条形图___________ .18. 线性回归模型y bx a e (a和b为模型的未知参数)中,e称为______ .19. 若一组观测值(X1,y 1)(X2,y 2)•••(X n,y n)之间满足=bx「+a+e (i=1、2.…n)若恒为0,则R2为ei恒为0,说明随机误差对%贡献为0.三、解答题20. 调查某市出租车使用年限x和该年支出维修费用y (万元),得到数据如下:Ay bx a 1.23x 0.08 (2)当 x=10 时,y 1.23 10 0.08 12.38 (万元)即估计使用10年时维修费用是1238万元回归方程为:y 1.23x 0.08(2) 预计第10年需要支岀维修费用 12. 38万元.21.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画岀数据对应的散点图;(2 )求线性回归方程,并在散点图中加上回归直线; (3) 据(2)的结果估计当房屋面积为 150m 2时的销售价格. (4) 求第2个点的残差。
21.解析:(1)数据对应的散点图如图所示:-1 5 5 - 2(2) X — X i 109, l xx(X i x) 1570 ,5 i 1i 1设所求回归直线方程为y bx a ,则 b ®-308 0.1962l xx 15702(3)据(2),当x 150m 时,销售价格的估计值为:y 0.1962 150 1.8166 31.2466 (万元)必看经典例题1.从20的样本中得到的有关回归结果是:SSR=60 SSE=40要检验x 与y 之间的线性关系是否显着,即检验假设: H 。