新课标数学选修1-21.1回归分析的基本思想及其初步应用(教师用书独具)●三维目标1.知识与技能通过典型案例的探究,了解回归分析的基本思想,会对两个变量进行回归分析,明确解决回归模型的基本步骤,并对具体问题进行回归分析以解决实际应用问题.了解最小二乘法的推导,解释残差变量的含义,了解偏差平方和分解的思想,了解判断刻画模型拟合效果的方法——相关指数和残差分析.掌握利用计算器求线性回归直线方程参数及相关系数的方法.2.过程与方法通过收集数据作散点图,分析散点图,求回归直线方程,分析回归效果,利用方程进行预报.3.情感、态度与价值观培养学生利用整体的观点和互相联系的观点来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心,加强与现实生活的联系,以科学的态度评价两个变量的相互关系.●重点难点重点:回归分析的基本方法、随机误差e的认识、残差图的概念、用残差及R2来刻画线性回归模型的拟合效果.难点:回归分析的基本方法、残差概念的理解及拟合效果的判定、非线性回归向线性回归的转化.教学时要以残差分析为重点,突出残差表和R2的计算,通过举例说明相关关系与确定性关系的区别,说明回归分析的必要性及其方法.借助例题使学生掌握作散点图、求回归直线方程的方法,通过作残差图、计算R2让学生掌握拟合效果的判断方法.对于非线性回归问题重点在如何转换,引导学生分析总结转化方法和技巧,从而化解难点.(教师用书独具)●教学建议本节课建议教师采取探究式教学,把“关注知识”转向“关注学生”,在教学过程中,把“给出知识”的过程转变为“引起活动,让学生探究知识的过程”,把“完成教学任务”转向“促进学生发展”,让学生成为课堂上的真正主人.在教学中,知识点可由学生通过探索“发现”,让学生充分经历探索与发现的过程,并引导学生积极解决探索过程中发现的问题.教学中不要以练习为主,而是定位在知识形成过程的探索,例题的解答也要由学生探讨、教师点拨,共同完成.要注重数学的思想性,如统计思想、随机观念、函数思想、数形结合的思想方法等,引导学生体验数学中的理性精神,加强数学形式下的思考和推理能力.●教学流程创设问题情境,引出问题,引导学生探讨,从而引出回归分析、线性回归模型、刻画回归效果的有关概念及解决方法.利用填一填的形式,使学生自主学习本节基础知识,并反馈了解,对理解有困难的概念加以讲解.引导学生在学习基础知识的基础上分析回答例题1的问题,并总结规律方法,完成变式训练.引导学生分析例题2,根据图中的数据计算系数,求出回归方程,列出残差表,求出R2并判断拟合效果,完成变式训练.完成当堂双基达标,巩固所学知识及应用方法,并进行反馈矫正.归纳整理,进行课堂小结,整体认识本节所学知识,强调重点容和规律方法.通过老师启发引导,完成例题3,并要求学生借鉴例题3的解法完成变式训练.引导学生分析例题3,让学生作出散点图,观察相关性,引出问题,即如何使问题转化为相关关系并用线性回归分析二者关系.课标解读1.会用散点图分析两个变量是否存在相关关系.(重点)2.会求回归方程,掌握建立回归模型的步骤,会选择回归模型.(重点、难点)线性回归模型一台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生产出有缺陷的零件的统计数据如下:转速x(转/秒)1614128每小时生产有缺陷的零件数y(件)11985 1.【提示】2.从散点图中判断x和y之间是否具有相关关系?【提示】有.3.若转速为10转/秒,能否预测机器每小时生产缺陷的零件件数?【提示】可以.根据散点图作出一条直线,求出直线方程后可预测.(1)回归直线方程:y^=b^x +a^,其中:b^=∑i=1n(x i-x)(y i-y)∑i=1n(x i-x)2,a^=y-b^x,x=1n∑i=1nx i,y=1n∑i=1ny i.(2)变量样本点中心:(x,y),回归直线过样本点的中心.(3)线性回归模型:y=bx+a+e,其中e称为随机误差,a和b是模型的未知参数,自变量x称为解释变量,因变量y称为预报变量.刻画回归效果的方式残差对于样本点(x i,y i)(i=1,2,…,n)的随机误差的估计值e^i=y i-y^i,称为相应于点(x i,y i)的残差残差图利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图残差图法残差点比较均匀地落在水平的带状区域,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高残差平方和残差平方和为∑i=1n(y i-y^i)2,残差平方和越小,模型拟合效果越好相关指数R2R2=1-∑i=1n(y i-y^i)2∑i=1n(y i-y)2,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归的效果越好回归分析的有关概念①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系^=b^x+a^,可以估计和观测变量的取值和变化趋势;④因表示;③通过回归方程y为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是()A.1B.2C.3D.4【思路探究】可借助于线性相关概念及性质逐一作出判断.【自主解答】①反映的正是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程y^=b^x+a^的作用,故也正确.④是不正确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系.【答案】 C1.解答例1中④时,必须明确具有线性相关关系的两个变量间才能求得一个线性回归方程,否则求得的方程无实际意义.因此必须先进行线性相关性判断,后求线性回归方程.2.回归分析的过程:(1)随机抽取样本,确定数据,形成样本点;(2)由样本点形成散点图,判断是否具有线性相关关系;(3)由最小二乘法确定线性回归方程;(4)由回归方程观察变量的取值及变化趋势.关于变量y与x之间的回归直线方程叙述正确的是()A.表示y与x之间的一种确定性关系B.表示y与x之间的相关关系C.表示y与x之间的最真实的关系D.表示y与x之间真实关系的一种效果最好的拟合【解析】回归直线方程能最大可能地反映y与x之间的真实关系,故选项D正确.【答案】 D线性回归分析x 1416182022y 121075 3求y关于x【思路探究】回归模型拟合效果的好坏可以通过计算R2来判断,其值越大,说明模型的拟合效果越好.【自主解答】x=15(14+16+18+20+22)=18,y=15(12+10+7+5+3)=7.4,∑i=15x2i=142+162+182+202+222=1 660,∑i=15x i y i=14×12+16×10+18×7+20×5+22×3=620,所以b^=∑i=15x i y i-5x y∑i=15x2i-5x2=620-5×18×7.41 660-5×182=-1.15,a^=7.4+1.15×18=28.1,所以所求回归直线方程是y^=-1.15x+28.1.列出残差表:y i-y^i00.3-0.4-0.10.2y i-y 4.6 2.6-0.4-2.4-4.4所以∑i=15(y i-y^i)2=0.3,∑i=15(y i-y)2=53.2,R2=1-∑i=15(y i-y^i)2∑i=15(y i-y)2≈0.994,所以回归模型的拟合效果很好.1.回归直线方程能定量地描述两个变量的关系,系数a^,b^刻画了两个变量之间的变化趋势,其中b^表示x变化一个单位时,y的平均变化量.利用回归直线可以对问题进行预测,由一个变量的变化去推测另一个变量的变化.2.线性回归分析中:(1)残差平方和越小,预报精确度越高.(2)相关指数R2取值越大,说明模型的拟合效果越好.某运动员训练次数与运动成绩之间的数据关系如下:次数(x)3033353739444650成绩(y)3034373942464851(1)(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果;(4)计算R2,并说明其含义.【解】(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示.(2)可求得x=39.25,y=40.875,∑i=18x2i=12 656,∑i=18y2i=13 731,∑i=18x i y i=13 180,∴b^=∑i=18(x i-x)(y i-y)∑i=18(x i-x)2=∑i=18x i y i-8x y∑i=18x2i-8x2≈1.041 5,a^=y-b^x=-0.003 875,∴线性回归方程为y^=1.041 5x-0.003 875.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)相关指数R2=0.985 5.说明了该运动员的成绩的差异有98.55%的可能性是由训练次数引起的.非线性回归分析x 21232527293235y 711212466115325(1)作出(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x=40时y的值.【思路探究】(1)画出散点图或进行相关性检验,确定两变量x、y是否线性相关.由散点图得x、y之间的回归模型.(2)进行拟合,预报回归模型,求回归方程.【自主解答】(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1e c2x的周围,其中c1、c2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z=ln y,则有变换后的样本点应分布在直线z=bx+a,a=ln c1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x 21232527293235z 1.946 2.398 3.045 3.178 4.190 4.745 5.784 求得回归直线方程为z=0.272x-3.849,∴y^=e0.272x-3.849.残差如下表:y i711212466115325y^i 6.44311.10119.12532.95056.770128.381290.325 e^i0.557-0.101 1.875-8.9509.23-13.38134.6750.272x-3.849≈1 131.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1e c2x,我们可以通过对数变换把指数关系变为线性关系,令z=ln y,则变换后样本点应该分布在直线z =bx+a(a=ln c1,b=c2)的周围.有一个测量水流量的实验装置,测得试验数据如下表:i 1234567水高h(厘米)0.7 1.1 2.5 4.98.110.213.5 流量Q(升/分钟)0.0820.25 1.811.237.566.5134根据表中数据,建立Q与h之间的回归方程.【解】由表中测得的数据可以作出散点图,如图.观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q=m·h n(m,n是正的常数).两边取常用对数,则lg Q=lg m+n·lg h.令y=lg Q,x=lg h,那么y=nx+lg m,即为线性函数模型y=bx+a的形式(其中b=n,a=lg m).由下面的数据表,用最小二乘法可求得b^≈2.509 7,a^=-0.707 7,所以n≈2.51,m≈0.196.i h i Q i x i=lg h i y i=lg Q i x2i x i y i10.70.082-0.154 9-1.086 20.0240.168 32 1.10.250.041 4-0.602 10.001 7-0.024 93 2.5 1.80.397 90.255 30.158 30.101 64 4.911.20.690 2 1.049 20.476 40.724 2 58.137.50.9085 1.574 00.825 4 1.430 0 610.266.5 1.0086 1.822 8 1.017 3 1.838 5 713.5134 1.130 3 2.127 1 1.277 6 2.404 3∑ 4.022 5.140 1 3.780 7 6.642 于是所求得的回归方程为Q=0.196·h2.51.没有理解相关指数R 2的意义而致误关于x 与y 有如下数据:x 2 4 5 6 8 y3040605070为了对x 、y 两个变量进行统计分析,现有以下两种线性模型:甲模型y ^=6.5x +17.5,乙模型y ^=7x +17,试比较哪一个模型拟合的效果更好.【错解】 ∵R 21=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-1551 000=0.845.R 22=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-1801 000=0.82.又∵84.5%>82%,∴乙选用的模型拟合的效果更好.【错因分析】 没有理解R 2的意义是致错的根源,用相关指数R 2来比较模型的拟合效果,R 2越大,模型的拟合效果越好,并不是R 2越小拟合效果更好.【防措施】 R 2=1-∑i =1n(y i -y ^i )2∑i =1n (y i -y )2,R 2越大,残差平方和越小,从而回归模型的拟合效果越好.在线性回归模型中,R 2表示解释变量对于预报变量变化的贡献率,R 2越接近1,表示回归的效果越好(因为R 2越接近1,表示解释变量和预报变量的线性相关性越强).从根本上理解R 2的意义和作用,就可防止此类错误的出现.【正解】 R 21=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-1551 000=0.845,R 22=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2=1-1801 000=0.82,84.5%>82%,所以甲模型拟合效果更好.1.在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差e ^1,e ^2,…,e^n来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析.2.我们还可以用相关指数R2来反映回归的效果,其计算公式是:R2=1-∑i=1n(y i-y^i)2∑i=1n(y i-y)2.显然,R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率.1.已知x和y之间的一组数据x 012 3y 1357则y与x的线性回归方程y=b x+a必过点()A.(2,2)B.(32,0)C.(1,2) D.(32,4) 【解析】∵x=14(0+1+2+3)=32,y=14(1+3+5+7)=4,∴回归方程y^=b^x+a^必过点(32,4).【答案】 D2.(2013·高二检测)在下列各组量中:①正方体的体积与棱长;②一块农田的水稻产量与施肥量;③人的身高与年龄;④家庭的支出与收入;⑤某户家庭的用电量与电价.其中量与量之间的关系是相关关系的是()A.①②B.②④C.③④D.②③④【解析】①是函数关系V=a3;⑤电价是统一规定的,与用电量有一定的关系,但这种关系是确定的关系.②③④中的两个量之间的关系都是相关关系,因为水稻的产量与施肥量在一定围是正比、反比或其他关系,并不确定;人的身高一开始随着年龄的增加而增大,之后则不变化或降低,在身高增大时,也不是均匀增大的;家庭的支出与收入有一定的关系,在一开始,会随着收入的增加而支出也增加,而当收入增大到一定的值后,家庭支出趋向于一个常数值,也不是确定关系.【答案】 D3.下列命题正确的有________.①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观测的量;②残差平方和越小的模型,拟合的效果越好;③用R2来刻画回归方程,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,若带状区域宽度越窄,说明拟合精度越高,回归方程的预报精度越高.【解析】对于①随机误差e是一个不可观测的量,③R2越趋于1,拟合效果越好,故①③错误.对于②残差平方和越小,拟合效果越好,同理当残差点比较均匀地落在水平的带状区域时,拟合效果越好,故②④正确.【答案】②④4.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:(1)(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测技改后生产100吨甲产品比技改前少消耗多少吨标准煤.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【解】(1)如下图.(2)∑i=14x i y i=3×2.5+4×3+5×4+6×4.5=66.5,x=3+4+5+64=4.5,y=2.5+3+4+4.54=3.5,∑i=14x2i=32+42+52+62=86.b^=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a^=y-b^x=3.5-0.7×4.5=0.35,因此,所求的线性回归方程为y^=0.7x+0.35.(3)根据回归方程预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35(吨),故耗能减少了90-70.35=19.65(吨标准煤).一、选择题1.在画两个变量的散点图时,下面叙述正确的是()A.预报变量在x轴上,解释变量在y轴上B.解释变量在x轴上,预报变量在y轴上C .可以选择两个变量中任意一个变量在x 轴上D .可以选择两个变量中任意一个变量在y 轴上【解析】 结合线性回归模型y =bx +a +e 可知,解释变量在x 轴上,预报变量在y 轴上,故选B.【答案】 B2.(2013·高二检测)在回归分析中,相关指数R 2的值越大,说明残差平方和( )A .越大B .越小C .可能大也可能小D .以上均错【解析】 ∵R 2=1-∑i =1n(y i -y ^i )2∑i =1n (y i -y )2,∴当R 2越大时,∑i =1n(y i -y ^i )2越小,即残差平方和越小. 【答案】 B3.设变量y 对x 的线性回归方程为y ^=2-2.5x ,则变量x 每增加一个单位时,y 平均( )A .增加2.5个单位B .增加2个单位C .减少2.5个单位D .减少2个单位【解析】 回归直线的斜率b ^=-2.5,表示x 每增加一个单位,y 平均减少2.5个单位.【答案】 C4.(2012·高考)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不正确...的是( ) A .y 与x 具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg【解析】由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确.又线性回归方程必过样本中心点(x,y),因此B正确.由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确.当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确.【答案】 D5.在判断两个变量y与x是否相关时,选择了4个不同的模型,它们的相关指数R2分别为:模型1的相关指数R2为0.98,模型2的相关指数R2为0.80,模型3的相关指数R2为0.50,模型4的相关指数R2为0.25.其中拟合效果最好的模型是()A.模型1 B.模型2C.模型3 D.模型4【解析】相关指数R2能够刻画用回归模型拟合数据的效果,相关指数R2的值越接近于1,说明回归模型拟合数据的效果越好.【答案】 A二、填空题6.在研究身高和体重的关系时,求得相关指数R2≈________,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.【解析】结合相关指数的计算公式R2=1-∑i=1n(y i-y^i)2∑i=1n(y i-y)2可知,当R2=0.64时,身高解释了64%的体重变化.【答案】0.647.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y^=0.254x+0.321.由回归直线方程可知,家庭年收入每增对x的回归直线方程:y加1万元,年饮食支出平均增加________万元.^=0.254(x+1)+0.321,与y^=0.254x+0.321相【解析】以x+1代x,得y减可得,年饮食支出平均增加0.254万元.【答案】0.2548.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________.【解析】由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y^-5=1.23(x-4),即y^=1.23x+0.08.^=1.23x+0.08【答案】y三、解答题9.某省2013年的阅卷现场有一位质检老师随机抽取5名学生的总成绩和数学成绩(单位:分)如下表所示:(1)(2)对x与y作回归分析;(3)求数学成绩y对总成绩x的回归直线方程;(4)如果一个学生的总成绩为500分,试预测这个学生的数学成绩.【解】(1)散点图如图所示:(2)x =2 0125,y =3395,∑5i =1x 2i =819 794,∑5i =1y 2i =23 167,∑5i =1x i y i =137 760. ∴r =错误! ·错误!)=错误!≈0.989.因此可以认为y 与x 有很强的线性相关关系. (3)回归系数b^=∑5i =1x i y i -5 x y ∑5 i =1x 2i -5x2=0.132 452,a^=y -b ^x =14.501 315.∴回归方程为y ^=0.132 452x +14.501 315.(4)当x =500时,y ^≈81.即当一个学生的总成绩为500分时,他的数学成绩约为81分.10.(2012·高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元) 8 8.2 8.4 8.6 8.8 9 销量y (件)908483807568(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解】 (1)由于x =16(8+8.2+8.4+8.6+8.8+9)=8.5,y=16(90+84+83+80+75+68)=80,又b=-20,所以a=y-b x=80+20×8.5=250,从而回归直线方程为y^=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.11.在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:程;(2)求相关指数R2,并说明其含义;(3)给出37岁时人的脂肪含量的预测值.【解】(1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.设线性回归方程为y ^=b^x +a ^,则由计算器算得b^≈0.576,a ^≈=-0.448, 所以线性回归方程为y ^=0.576x -0.448. (2)残差平方和: ∑i =114e ^2i =∑i =114(y i -y ^i )2≈37.78.总偏差平方和:∑i =114(y i -y -)2≈644.99.R 2=1-37.78644.99≈0.941.R 2≈0.941,表明年龄解释了94.1%的脂肪含量变化.(3)当x =37时,y ^=0.576×37-0.448≈20.9,故37岁时人的脂肪含量约为20.9%.(教师用书独具)为研究重量x (单位:克)对弹簧长度y (单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:x 51015202530y 7.258.128.959.9010.911.8(1)(2)求出R2;(3)进行残差分析.【思路探究】(1)由表作出散点图,求出系数值,即可写出回归方程.(2)列出残差表,计算R2,由R2的值判断拟合效果.(3)由(2)中残差表中数值,进行回归分析.【自主解答】(1)散点图如图.x=16(5+10+15+20+25+30)=17.5,y=16(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,∑i=16x2i=2 275,∑i=16x i y i=1 076.2.计算得,b^≈0.183,a^≈6.285,所求线性回归方程为y^=6.285+0.183x.(2)列表如下:y i-y^i0.050.005-0.08-0.0450.040.025y i-y-2.24-1.37-0.540.41 1.41 2.31所以∑i=16(y i-y^i)2≈0.013 18,∑i=16(y i-y)2=14.678 4.所以,R2=1-0.013 1814.678 4≈0.999 1,回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系.建立回归模型的基本步骤:(1)确定解释变量和预报变量;(2)画散点图,观察是否存在线性相关关系;(3)确定回归方程的类型,如y=bx+a;(4)按最小二乘法估计回归方程中的参数;(5)得结果后分析残差图是否异常,若存在异常,则检查数据是否有误,或模型是否合适.假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有关的统计资料如下表所示.使用年限x 2345 6维修费用y 2.2 3.8 5.5 6.57.0若由资料知(1)线性回归方程y^=b^x+a^的回归系数a^、b^;(2)求相关指数R2;(3)估计使用年限为10年时,维修费用是多少?【解】(1)由已知数据制成下表.由此可得x yb^=∑i=15(x i-x)(y i-y)∑i=15(x i-x)2=1.23,a^=y-b^x=5-1.23×4=0.08,∴y^=1.23x+0.08.(2)R2=1-∑i=15(y i-y^i)2∑i=15(y i-y)2=1-0.65115.78≈0.958 7.(3)回归直线方程为y^=1.23x+0.08,当x=10(年)时,y^=1.23×10+0.08=12.38(万元),即估计使用10年时维修费用是12.38万元.。