18、统计18.4 线性回归方程及应用【知识网络】1.能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
2.了解线性回归的方法;了解用最小二乘法研究两个变量的线性相关问题的思想方法;会根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆系数公式)。
【典型例题】[例1](1)为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1、l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值为s与t,那么下列说法正确的是()A.直线l1和l2一定有公共点(s,t) B.直线l1和l2相交,但交点不一定是(s,t) C.必有直线l1∥l2D.直线l1和l2必定重合(2)工人工资(元)依劳动生产率(千元)变化的回归方程为ˆy=50+80x,下列判断正确的是()A.劳动生产率为1000元时,工资为130元B.劳动生产率提高1000元时,工资提高80元C.劳动生产率提高1000元时,工资提高130元D.当月工资250元时,劳动生产率为2000元(3)下列命题:①任何两个变量都具有相关关系;②圆的周长与该圆的半径具有相关关系;③某商品的需求与该商品的价格是一种非确定性关系;④根据散点图求得的回归直线方程可能是没有意义的;⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究。
其中正确的命题为()A.①③④B。
②④⑤C。
③④⑤D。
②③⑤(4)一家保险公司调查其总公司营业部的加班程度,收集了10周中每周加班工作时间y (小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是___________。
(5)上题中,若该公司预计下周签发新保单1000张,则需要加班的时间是。
[例2]其中x(血球体积,mm),y(血红球数,百万).①画出上表的散点图;②求出回归直线并且画出图形。
[例3]要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩(如下表):(2)若某学生入学数学成绩80分,试估计他高一期末数学考试成绩.[例出散点图;(2)商品零售额与商品流通费率具有线性相关关系吗?如果商品零售额是20万元,那么能否预测此时流通费率是多少呢?【课内练习】1. 下列两个变量之间的关系哪个不是函数关系 ( )A .角度和它的余弦值B 。
正方形边长和面积C .正n边形的边数和它的内角和D 。
人的年龄和身高 2. 下列变量之间的关系是函数关系的是 ( )A .已知二次函数c bx ax y ++=2,其中a ,c 是已知常数,取b 为自变量,因变量是这个函数的判别式ac b 42-=∆B .光照时间和果树的亩产量C .降雪量和交通事故发生率D .每亩用肥料量和粮食亩产量 3. 下列命题叙述正确的是 ( )A .任何两个变量都可以用一元线性回归关系进行合理的描述B .只能采用最小二乘法对一元线性回归模型进行参数估计C .对于一个样本,用最小二乘法估计得到的一元线性回归方程参数估计值是唯一的D .任何两个相关关系的变量经过变换后都可以化为一元线性回归关系4. 设线性回归直线方程ˆˆya bx =+,现将y 的单位由cm 变为m ,x 的单位由ms 变为s ,则在新的线性回归直线方程y ab x **=+中,( )A .0.1b b *= B .b b *= C .10b b *=D .100b b *=5. 若施肥量x 与水稻产量y 的线性回归直线方程ˆˆ2505yx =+,当施肥量为80Kg 时,预计水稻产量为___________.6. 某保险公司收集了10周中工作的加班时间y 与签订新保单数目x ,用最小二乘法求出线性回归方程为ˆˆ0.120.0036yx =+.若公司预签订新保单1000张,估计需加班 _________小时.7. 如果你想作一个反对抽烟的电视公益广告的播放次数与看电视的中学生戒烟率的数据散点图,作为x 轴的变量应为 。
8.试求出回归直线方程9.在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x之间相应的一组观求腐蚀深度y对腐蚀时间x的回归直线方程,并解释回归系数的意义.10.年底的四年里,该地区这种病的新发病人数总共多少?18、统计18.4 线性回归方程及应用A 组1. 设有一个直线回归方程为 ˆˆ32yx =- ,则变量x 增加一个单位时 ()A .y 平均增加 2个单位B 。
y 平均增加 3 个单位C .y 平均减少 2 个单位D 。
y 平均减少 3个单位2. 回归直线方程的系数a ,b 的最小二乘法估计使函数Q (a ,b )最小,Q 函数指 ( )A .21()niii y a bx =--∑ B 。
1niii y a bx=--∑C .i i y a bx --D 。
2()i i y a bx --3. 对于给定的两个变量的统计数据,下列说法正确的是 ( ) A .都可以分析出两个变量的关系 B .都可以用一条直线近似表示两者关系来估计总体的均值 C .都可以作出散点图 D .都可以用确定的表达式表示两者的关系4. 某种机器购置后运营年限x 与当年增加利润y 的统计分析知具备线性相关关系,回归方种为ˆˆ10.47 1.3yx =-,估计这种机器使用 年最合算。
5. 给出下列关系:①正方体的体积与棱长 ②角的度数和它的正弦值 ③单产为常数时,土地面积和总产量 ④日照时间与棉花亩产量 ⑤体重与身高 其中属于函数关系的有 。
6.问题物件的多寡,随机器运转的速度而变化,左面表格中的数据是几次试验的结果.那么当速度为10(转/秒)时,是否可以预知每小时生产有问题物件数呢?若实际生产中所允许的每小时最大问题物件数为10,那么机器的速度不得超过多少转/秒?7. 假设儿子身长与父亲身长适合一元线性回归模型,观察了10对英国父子身长(英寸)如下:8.我们知道营业税税收总额y与社会消费品零售总额x有关.为能从社会消费品零售总额去预测营业税税收总额,需要了解两者的关系.现收集如下11组全国相关数据(单位:亿元)(1)画出营业税税收总额y与社会消费品零售总额x间散点图;(2用最小二乘法求营业税税收总额y与社会消费品零售总额x之间线性回归直线方程.(3)试估计2005年社会消费品零售总额增长在12%~14%,营业税税收总额y大致会增长多少?18、统计18.4 线性回归方程及应用B 组1. 回归直线方程的系数a ,b 的最小二乘法估计使函数Q (a ,b )最小,则下列正确答案是 ( )A .1221ni ii nii x y nx yb xnx==-=-∑∑gB 。
1niii Q y a bx==--∑C .a y bx =+D 。
1221ni i i ni i n x y x y b n x x==-=-∑∑g2. 两个变量成负相关关系时,散点图的特征是 ( ) A .点散布特征为从左下角到右上角区域 B .点散布在某带形区域内 C .点散布在某圆形区域内 D .点散布特征为从左上角到右下角区域内3. 某考察团对全国10大声调进行职工人均平均工资x 与居民人均消费y 进行统计调查,y 与x 具有相关关系,回归方程为ˆˆ0.66 1.562y x =+(单位:千元)。
若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比为 ( )A .66%B 。
72.3%C 。
67.3%D 。
83% 4. 下列关系中: ①吸烟有害健康 ②粮食产量与施肥量 ③乌鸦叫,没好兆 ④名师出高徒 不具有相关关系的是 。
5. 现有一个身高预测体重的回归方程;体重预测值=4(磅/英寸) 身高-130磅.期中体重和身高分别以磅和英寸为单位。
如果将它们分别以kg 、cm 的单位(1英寸≈2.5cm ,1磅≈0.45kg ) .回归方程应该是____________________________________.6. 一个工厂在某年某月产品的总成本y (万元)与该月产量(万件)之间有如下数据:(1)画出散点图;(2)最小二乘法求月产品的总成本y (万元)与该月产量x (万件)之间线性回归直线方程.7. 试证明:①22211()nni i i i x x x nx ==-=-∑∑;②11()()n ni i i i i i x x y y x y nxy ==--=-∑∑。
8. 下栏的表格是某省20个县城2007年的一份统计资料,其中i x 表示第i 个县城在2007年建成的新住宅面积(单位:103m 2),y 表示第i 个县城在2007年的家具销售量(万元) 。
若此县城在2008年预计新建成的住宅面积为350×103m 2,则可以大体估计出此县城当年可销售家具多少万元?参考答案18.4 线性回归方程及应用【典型例题】[例1](1)A .提示:线性回归直线方程为ˆy=a +bx ,而a =y bx -,即a =t -bs ,t =a +bs .∴(s ,t )在回归直线上,即直线l 1和l 2必有公共点(s ,t )。
(2)B .提示:回归直线斜率为80,所以x 每增加1,ˆy增加80,即劳动生产率提高1千元时,工资提高80元。
(3)C .(4)x y003585.01181.0ˆ+=。
提示:10102111762,()129786010i i i i x x x x ====-=∑∑,4653))((,85.2101=--=∑=i i i y y x x y 。
(5)3.7小时。
提示:将x=1000代入上面公式即可。
[例2]①②10=x37.7)72.855.620.649.990.599.650.752.930.653.6(101=+++++++++=y12210.13ni ii nii x y nxyb xnx==-==-∑∑, 1.29a y bx =-=,所以所求回归直线的方程为ˆ0.13 1.29yx =+ .图形如下xx[例3](1)从入学成绩(x )与高一期末考试成绩(y )两组变量的散点图看,这两组变量尚具有线性关系.通过计算知76,70==y x ,∑∑===-=--1012101,2474)(,1894))((i i i ix x y y x x∑==-10122056)(i y y ,所以x b y a b -==,76556.041067.22=,因此所求的线性回归方程是yˆ=22.410 67+0.765 56x ;(2)若某学生入学数学成绩为80分,代入上式可求得,84≈y 分,即这个学生高一期末数学成绩预测值为84分.[例4] (1)散点图如图所示.(2)散点图显示出商品流通费率和商品零售额的变化关系并不是直线型,而是一条递减的双曲线型.两者之间不具有线性相关关系.但经济理论和实际经验都可说明,流通费率决定于商品零售额,体现着经营的规模效益,因此可以拟合一个以商品销售额为自变量(X ),流通费率为因变量(Y )的双曲线回归模型:Xb a Y1ˆ⨯+=,为了求模型中的a 和b 两个参数,令1X X'=,是上述模型转换为线性模型:ˆYa bX '=+,这样我们就可以运用线性回归的知识加以解决了. 将转化后的有关数据列表如下:代入公式得:4.60,4377.0=-=b a ,从而线性回归方程为ˆ0.437760.4Y X '=-+.将1X X '=回代得60.4ˆ0.4377YX=-+. 于是当X =20(万元)时,5823.2ˆ=Y (%).【课内练习】 1. D 。