一 选择题1、对于一元线性回归01+(1,2,,)i i i y x i n ββε=+=,()0i E ε=,2var()i εσ=,cov(,)0(i j)i j εε=≠,下列说法错误的( B C )(A) 01ββ,的最小二乘估计01ˆˆββ,都是无偏估计; (B) 01ββ,的最小二乘估计01ˆˆββ,对12,,n y y y ,是线性的;(C) 01ββ,的最小二乘估计01ˆˆββ,之间是相关的; (D) 若误差服从正态分布,01ββ,的最小二乘估计和极大似然估计是不一样的.2、下列说法错误的是 ( B ) (A)强影响点不一定是异常值; (B)在多元回归中,回归系数显著性的t 检验与回归方程显著性的F 检验是等价的;(C)一般情况下,一个定性变量有k 类可能的取值时,需要引入k-1个0-1型自变量;(D)异常值的识别与特定的模型有关.3、在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据{(x ,y )},i=1,2,,n i i ;③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图。
如果根据可行性要求能够作出变量, x,y 具有线性相关结论,则在下列操作中正确的是( D )A .①②⑤③④B .③②④⑤①C .②④③①⑤D .②⑤④③① 4、下列说法中正确的是(B )A.任何两个变量都具有相关关系 ;B.人的知识与其年龄具有相关关系 ;C .散点图中的各点是分散的没有规律 ;D .根据散点图求得的回归直线方程都是有意义的。
5、下面的各图中,散点图与相关系数r 不符合的是( B )6、下面给出了4个残差图,哪个图形表示误差序列是自相关的(B )7、下列哪个岭迹图表示在某一具体实例中最小二乘估计是适用的(D )8、在画两个变量的散点图时,下面哪个叙述是正确的 ( B ) (A) 预报变量在x 轴上,解释变量在y 轴上; (B) 解释变量在x 轴上,预报变量在y 轴上;(C) 可以选择两个变量中任意一个变量在x 轴上; (D) 可以选择两个变量中任意一个变量;9、一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为ˆ7.1973.93yx =+,据此可以预测这个孩子10岁时的身高,则正确的叙述是( D )A .身高一定是145.83cmB .身高超过146.00cmC .身高低于145.00cmD .身高在145.83cm 左右10、炼钢时钢水的含碳量与冶炼时间有( B )A.确定性关系B.相关关系C.函数关系D.无任何关系 11、对相关性的描述正确的是( C )A .相关性是一种因果关系B .相关性是一种函数关系C .相关性是变量与变量之间带有随机性的关系D .以上都不正确 12、∑=ni i i y x 1等于( D )A.121)(y x x x n +++B.121)(x y y y n +++C. ++2211y x y xD.n n y x y x y x +++ 2211 13、设有一个回归方程为x y 5.22-=,则变量x 增加一个单位时( C )A .y 平均增加2.5个单位 B.y 平均增加2个单位 C.y 平均减少2.5个单位 D.y 平均减少2个单位 14、x 与y 之间的线性回归方程a bx y +=必定过( D )A.(0,0)点B.(0,x )点C.(0,y )D.(y x ,)15、 某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8对观测值,计算得5281=∑=i ix,22881=∑=i iy,478812=∑=i ix,184981=∑=ii i yx ,则y 与x 的回归方程是( A )A.x y 62.247.11+=B.x y 62.247.11+-=C.62.247.11+=x yD.x y 62.247.11-=16、线性回归方程a bx y +=有一组独立的观测数据),(11y x ,),(,),,(22n n y x y x ,则系数b 的值为( C )A.∑∑==---ni ini i iy yy y x x121)())(( B.∑∑==--ni ini i ixy y x x121))((C.∑∑==---ni i ni i ix x y y x x121)())(( D.∑∑==--n i ini iy y x x1212)()(17、已知x 、y 之间的一组数据:则y 与x 的线性回归方程a bx y +=必过点( D )A .(2,2) B.(1.5, 0) C. (1, 2) D.(1.5, 4) 18、对于相关系数r ,叙述正确的是( C )A.r r ),,0(+∞∈越大,相关程度越大,反之,相关程度越小B.r r ),,(+∞-∞∈越大,相关程度越大,反之,相关程度越小C.1≤r ,且r 越接近于1,相关程度越大,r 越接近于0,相关程度越小D.以上说法都不对19、由一组样本数据),(11y x ,),(,),,(22n n y x y x 得到的回归直线方程a bx y +=,那么下面说法不正确的是( B )A .直线a bx y +=必经过点),(y xB .直线a bx y +=至少经过点),(11y x ,),(,),,(22n n y x y x 中的一个点C .直线a bx y +=的斜率为∑∑==--ni ini ii x n xyx n yx 1221D.直线a bx y +=和各点),(11y x ,),(,),,(22n n y x y x 的偏差[]∑=+-ni i i a bx y 12)(是该坐标平面上所有直线与这些点的偏差中最小的直线 20、下列说法中错误的是( B )A.如果变量x 与y 之间具有线性相关关系,则我们根据试验数据得到的点(i i y x ,)(=i 1,2,n , )将散布在某一条直线附近B. 如果变量x 与y 之间不具有线性相关关系,则我们根据试验数据得到的点(i i y x ,)(=i 1,2,n , )不能写出一个线性方程C. 设x 、y 是具有线性相关关系的两个变量,且y 关于x 的线性回归方程为a bx y +=,b 叫做回归方程的系数D. 为使求出的线性回归方程有意义,可先用画出散点图的方法来判断变量x 与y 之间是否具有线性相关关系 二 填空题6. 在下列各量与量的关系中,既不是相关关系,也不是函数关系的为 (3)和(5) .(只填序号)(1)正方体的体积与棱长间的关系; (2)一块农田的水稻产量与浇水量之间的关系; (3)人的身高与血型; (4)家庭的支出与收入; (5)A 、B 两户家庭各自的用电量. 7. 设两个变量x 和y 之间具有线性相关关系.它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵截距是a ,那么必有b 、r 符号相同 (填符号关系)因为∑∑==--=ni ini ii x n xyx n yx b 1221,∑∑∑===---=ni ni i ini ii y y x xyx n yx r 112221)()(8. 假设y 与x 之间具有如下的双曲线相关关系:x b a y +=1,作变换u =1y ,=v 1x,则模型可转化为线性回归模型:bv a u +=. 9. 已知具有线性相关关系的变量x 和y , 测得一组数据如下表:若已求得它们的线性回归方程中的系数为 6.5,则这条线性回归方程为5.25.6-=x y由题可知30 ,5==y x ,又已知5.6=b5.2 -=-=x b y a 所以, 所以 5.25.6-=x y10. 人的身高x (单位:cm)与体重y (单位:kg)满足线性回归方程712.85849.0-=x y ,若要找到体重为41.638kg 的人 不一定 是在身高150cm 的人中(填“一定”,“不一定”).根据线性回归直线方程,只能求出相应于x 的估计值y .因此填“不一定”. 11. 有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系;(2)曲线上的点与该点的坐标之间的关系;(3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系.其中有相关关系的是 (1)、(3)、(4) .判断两个变量间是否具有相关性,就是判断它们之间有没有科学的,真实的某种关系.易知(1)(3)(4)是具有相关性的,(2)是函数关系,(5)不具有相关性,因为学生与学号之间没有必然联系.12. 若施化肥量x 与水稻产量y 的回归直线方程为2505+=x y ,当施化肥量为80kg 时,预计的水稻产量为 650kg .13. 已知线性回归方程{}),19,13,7,5,1(455.1∈+=x x y 则=y 58.5 . 14. 对于线性回归方程25775.4+=x y ,当28=x 时,y 的估计值是 390 。
三简答题1、引起异常值消除的方法?答:2、自相关性带来的问题?3、叙述一元回归模型的建模过程?4、一元线性回归有哪些基本假定?5、用岭回归方法选择自变量应遵循哪些基本原则?6、回归模型中随机误差项ε的意义是什么?7、有同学认为当数据存在异方差时,加权最小二乘回归方程与普通最小二乘回归方程之间必然有很大的差异,异方差越严重,两者之间的差异就越大。
你是否同意这位同学的观点?说明原因。
8、试述逐步回归法的思想、方法。
9、具有严重多重共线性的回归方程能否用来作经济预测?四计算题略五综合分析题略。