§1回归分析1.1回归分析1.2相关系数一、基础过关1.下列变量之间的关系是函数关系的是() A.已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4acB.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩施用肥料量和粮食产量2.在以下四个散点图中,其中适用于作线性回归的散点图为()A.①②B.①③C.②③D.③④3.下列变量中,属于负相关的是() A.收入增加,储蓄额增加B.产量增加,生产费用增加C.收入增加,支出增加D.价格下降,消费增加4.已知对一组观察值(x i,y i)作出散点图后确定具有线性相关关系,若对于y=bx+a,求得b=0.51,x=61.75,y=38.14,则线性回归方程为()A.y=0.51x+6.65 B.y=6.65x+0.51C.y=0.51x+42.30 D.y=42.30x+0.515.对于回归分析,下列说法错误的是()A .在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B .线性相关系数可以是正的,也可以是负的C .回归分析中,如果r 2=1,说明x 与y 之间完全相关D .样本相关系数r ∈(-1,1)6. 下表是x 和y 之间的一组数据,则y 关于x 的回归方程必过( )A.点(2,3) B C .点(2.5,4)D .点(2.5,5)7. 若线性回归方程中的回归系数b =0,则相关系数r =________. 二、能力提升8. 某医院用光电比色计检验尿汞时,得尿汞含量(mg/L)与消光系数计数的结果如下:若y 与x 9. 若施化肥量x (kg)与小麦产量y (kg)之间的线性回归方程为y =250+4x ,当施化肥量为50 kg 时,预计小麦产量为________ kg.10.某车间为了规定工时定额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下:若加工时间y (1)求加工时间与零件个数的线性回归方程; (2)试预报加工10个零件需要的时间.11.在一段时间内,分5次测得某种商品的价格x (万元)和需求量y (t)之间的一组数据为:已知∑5i =1x i y i =62,∑5i =1x 2i =16.6. (1)画出散点图;(2)求出y 对x 的线性回归方程;(3)如果价格定为1.9万元,预测需求量大约是多少?(精确到0.01 t). 12.某运动员训练次数与运动成绩之间的数据关系如下:(1)作出散点图;(2)求出回归方程;(3)计算相关系数并进行相关性检验;(4)试预测该运动员训练47次及55次的成绩.三、探究与拓展13.从某地成年男子中随机抽取n个人,测得平均身高为x=172 cm,标准差为s x=7.6 cm,平均体重y=72 kg,标准差s y=15.2 kg,相关系数r=l xyl xx l yy=0.5,求由身高估计平均体重的回归方程y=β0+β1x,以及由体重估计平均身高的回归方程x=a+by.答案1.A 2.B 3.D 4.A 5.D 6.C 7.0 8.y =-11.3+36.95x 9.45010.解 (1)由表中数据,利用科学计算器得x =2+3+4+54=3.5, y =2.5+3+4+4.54=3.5,∑4i =1x i y i =52.5,∑4i =1x 2i =54, b =∑4i =1x i y i -4x y ∑4i =1x 2i -4x 2=52.5-4×3.5×3.554-4×3.52=0.7,a =y -b x =1.05,因此,所求的线性回归方程为y =0.7x +1.05.(2)将x =10代入线性回归方程,得y =0.7×10+1.05=8.05(小时),即加工10个零件的预报时间为8.05小时.11.解 (1)散点图如下图所示:(2)因为x =15×9=1.8,y =15×37=7.4,∑5i =1x i y i =62,∑5i =1x 2i =16.6, 所以b =∑5i =1x i y i -5x y ∑5i =1x 2i -5x 2=62-5×1.8×7.416.6-5×1.82=-11.5, a =y -b x =7.4+11.5×1.8=28.1, 故y 对x 的线性回归方程为y =28.1-11.5x .(3)y =28.1-11.5×1.9=6.25(t).所以,如果价格定为1.9万元,则需求量大约是6.25 t.12.解 (1)作出该运动员训练次数x 与成绩y 之间的散点图,如下图所示,由散点图可知,它们之间具有线性相关关系.(2)列表计算:次数x i 成绩y i x 2i y 2i x i y i 30 30 900 900 900 33 34 1 089 1 156 1 122 35 37 1 225 1 369 1 295 37 39 1 369 1 521 1 443 39 42 1 521 1 764 1 638 44 46 1 936 2 116 2 024 46 48 2 116 2 304 2 208 50512 5002 6012 550由上表可求得x =39.25,y =40.875, ∑8i =1x 2i =12 656,∑8i =1y 2i =13 731, ∑8i =1x i y i =13 180,∴b =∑8i =1x i y i -8x y ∑8i =1x 2i -8x 2≈1.041 5,a =y -b x =-0.003 88,∴线性回归方程为y =1.041 5x -0.003 88.(3)计算相关系数r =0.992 7,因此运动员的成绩和训练次数两个变量有较强的相关关系. (4)由上述分析可知,我们可用线性回归方程y =1.041 5x -0.003 88作为该运动员成绩的预报值. 将x =47和x =55分别代入该方程可得y =49和y =57.故预测该运动员训练47次和55次的成绩分别为49和57.13.解 ∵s x =l xyn ,s y =l xy n, ∴l xyn=r l xy n ·l yyn =0.5×7.6×15.2=57.76.∴β1=l xyn l xy n=57.767.62=1, β0=y -β1x =72-1×172=-100.故由身高估计平均体重的回归方程为y =x -100. 由x ,y 位置的对称性,得b =l xyn l xy n =57.7615.22=0.25,∴a =x -b y =172-0.25×72=154.故由体重估计平均身高的回归方程为x =0.25y +154.1.3 可线性化的回归分析一、基础过关1. 某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( )A .y =-10x +200B .y =10x +200C .y =-10x -200D .y =10x -200 2. 在线性回归方程y =a +bx 中,回归系数b 表示( )A .当x =0时,y 的平均值B .x 变动一个单位时,y 的实际变动量C .y 变动一个单位时,x 的平均变动量D .x 变动一个单位时,y 的平均变动量3. 对于指数曲线y =a e bx ,令u =ln y ,c =ln a ,经过非线性化回归分析之后,可以转化成的形式为 ( )A .u =c +bxB .u =b +cxC .y =b +cxD .y =c +bx4. 下列说法错误的是( )A .当变量之间的相关关系不是线性相关关系时,也能直接用线性回归方程描述它们之间的相关关系B .把非线性回归化为线性回归为我们解决问题提供一种方法C .当变量之间的相关关系不是线性相关关系时,也能描述变量之间的相关关系D .当变量之间的相关关系不是线性相关关系时,可以通过适当的变换使其转换为线性关系,将问题化为线性回归分析问题来解决5. 每一吨铸铁成本y c (元)与铸件废品率x %建立的回归方程y c =56+8x ,下列说法正确的是 ( )A .废品率每增加1%,成本每吨增加64元B .废品率每增加1%,成本每吨增加8%C .废品率每增加1%,成本每吨增加8元D .如果废品率增加1%,则每吨成本为56元 6. 为了考察两个变量x 和y 之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是() A.直线l1和l2有交点(s,t) B.直线l1和l2相交,但是交点未必是点(s,t)C.直线l1和l2由于斜率相等,所以必定平行D.直线l1和l2必定重合二、能力提升7.研究人员对10个家庭的儿童问题行为程度(X)及其母亲的不耐心程度(Y)进行了评价结果如下,家庭1,2,3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.下列哪个方程可以较恰当的拟合()A.y=0.771 1x+26.528 B.y=36.958ln x-74.604C.y=1.177 8x1.014 5 D.y=20.924e0.019 3x8.已知x,y之间的一组数据如下表:则y与x9.已知线性回归方程为y=0.50x-0.81,则x=25时,y的估计值为________.10.在一次抽样调查中测得样本的5个样本点,数值如下表:(1)建立y与xx 时,y大约是多少(2)当811.某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示:y关于x的回归方程.(保留三位有效数字)三、探究与拓展12.某商店各个时期的商品流通率y (%)和商品零售额x (万元)资料如下:散点图显示出x 与y y 决定于商品的零售额x ,体现着经营规模效益,假定它们之间存在关系式:y =a +bx .试根据上表数据,求出a 与b 的估计值,并估计商品零售额为30万元时的商品流通率.答案1.A 2.D 3.A 4.A 5.C 6.A 7.B 8.(1.16,2.4) 9.11.6910.解 画出散点图如图(1)所示,观察可知y 与x 近似是反比例函数关系.设y =k x (k ≠0),令t =1x,则y =kt .可得到y 关于t 的数据如下表:t 4 2 1 0.5 0.25 y1612521画出散点图如图(2)得:b =∑5i =1t i y i -5t y∑5i =1t 2i -5t2≈4.134 4,a =y -b t ≈0.791 7, 所以y =4.134 4t +0.791 7, 所以y 与x 的回归方程是y =4.134 4x+0.791 7. 11.解 对y =ab x e 0两边取对数,得ln y =ln a e 0+x ln b ,令z =ln y , 则z 与x 的数据如下表:由z =ln a e 0+x ln b 及最小二乘法公式,得ln b ≈0.047 7,ln a e 0≈2.38, 即z =2.38+0.047 7x ,所以y =10.8×1.05x . 12.解 设u =1x,则y ≈a +bu ,得下表数据:进而可得n =10,u ≈0.060 4,y =3.21,∑i =110u 2i -10u 2≈0.004 557 3, ∑i =110u i y i -10u y ≈0.256 35,b ≈0.256 350.004 557 3≈56.25, a =y -b ·u ≈-0.187 5,所求的回归方程为y =-0.187 5+56.25x.当x =30时,y =1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.。