《回归分析》教学案例山东省青州实验中学262500聂公民王垒适用人民教育出版教学选修2-3 第三章统计案例《回归分析》教学教学目标1、知识与技能(1)学生通过收集现实问题中两个变量的数据,会画出散点图,分析数据,认为判断两个变量的关系。
(2)能求出回归系数,确定回归方程,并根据回归方程作出数据预测。
(3)了解非线性回归问题,能找出解决一般问题的思路。
(4)通过相关检验,了解回归分析的思想与方法,例如用表格收集数据,画散点图分析数据等。
2、过程与方法(1)通过复习线性回归方程,探究相关性检验的基本方法与思想。
(2)通过收集数据,分析数据,培养学生类比、迁移、化归的能力,合情推理推理的能力,解决问题的能力。
3、情感态度与价值观培养学生合作探究、积极参与、大胆探索的精神,增强学生的数据分析意识。
教学重点与难点重点:回归分析的思想与方法难点:回归分析的应用教学方法:学生自主实践探究为主,教师指导为辅,形成完整的知识结构。
师生共同将知识深入探究,为增强直观性,采用多媒体辅助教学,注重计算机、计算机在数据分析中的应用,注意计算机、计算器的操作指导。
预备活动教师准备A.预备活动纸(见附件1),B.课上活动纸(见附件2),C.课后活动纸(见附件3),提前一天分发给学生,学生利用课余时间提前完成。
设计意图:帮助学生回顾复习必修3相关内容,为学习新知识作好准备。
并提出启发性问题,便于引入课题。
教学过程:一、复习引入学生回答“预备活动纸”。
教师总结由活动纸上问题“比较三组数据的相关性显著程度”引出相关检验,进入课题。
设计意图:为新知识讲授作铺垫。
二、举例精解教师分发课上活动纸。
例1(1)研究某灌溉渠道的水流速度y m/s与水深x m之间的关系,测得数据如下:表格 1预测当水深为1.50m时水流速度为多少?(2)为了解某地母亲身亲x与女儿身高y的相关关系,随机测得10对母女的身高数据如下:表格 2母亲身高为161cm,预测女儿身高为多少?课件展示。
师生共同用软件Excel 画出散点图,并求出回归直线方程和相关系数等,作出预测。
引导问题:从这两例画出的散点图我们发现数据的成性相关性显著程度有何不同?设计意图:使学生了解Excel在数据分析中的应用,引出课题。
师生共同归纳总结出:(1)中数据的线性相关关系比(2)中数据更为显著。
在数据分析中用相关系数表示这特征。
教师展示相关系数r,()()x x y y x ynxyr ---==说明:① 1r ≤;② r 越接近1,线性相关系越强; ③ r 越近0线性相关程度越弱。
④ r ≥0.95两个变量有很显著的线性相关关系 0.90≤r ≤0.95两个变量有显著的线性相关关系 0.75≤r ≤0.90两个变量有较显著的线性相关关系教师展示例1(2)建立回归模型的方法及步骤,归结如下(课件展示): (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量。
(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系)。
(3)由经验确定回归方程的类型(如我们观察数据呈线性关系,则选用线性回归方程 y = a + b x ).(4)按一定规则估计回归方程中参数(如最小二乘法)。
(5)得出结果后分析残差图是否有异常(个别数据残差过大,或残差呈现不随机规律性,等),若存在异常,则检查数据是否有误,或模型是否合适等。
按上述步骤教师示范。
教师指导学生Excel 的使用方法,使用说明见附件4。
⒈画散点图图表 1⒉回归方程:y = 0.7815x + 34.996⒊用Excel数据分析工具得到的数据:表格 3SUMMARY OUTPUT回归统计Multiple R 0.714798R Square 0.510936Adjusted R Square 0.449803标准误差 1.865065观测值10表格 4方差分析df SS MS F Significance F 回归分析 1 29.07227 29.07227 8.357783 0.020169 残差8 27.82773 3.478466总计9 56.9表格 5Coefficients 标准误差t Stat P-value Lower95%Upper95%下限95.0%上限95.0%Intercept 34.9958 42.93208 0.815143 0.438582 -64.0058 133.9973 -64.0058 133.9973 X Variable 1 0.781513 0.270328 2.890983 0.020169 0.158136 1.404889 0.158136 1.404889 表格 6RESIDUAL OUTPUT观测值预测 Y 残差1 159.256 -1.25632 160.038 -1.03783 160.038 -0.03784 162.382 -1.38245 159.256 1.74376 155.349 -0.34877 159.256 2.74378 158.475 -1.47489 159.256 2.743710 157.693 -1.6933⒋画残差图残差图(如图表2)中各点在水平带状区域分布不均匀,而且R 2 = 0.5109,r = 0.714798,故此线性回归方程不是很合适。
所以这个模型需改进。
改进方法:可以去掉残差为正值的两组数据再作分析。
图表 2残差图-2-10123153154155156157158159160161162163164X Variable 1残差改进后的Excel 回归分析结果图表 3设计意图:教师通过示范让学生体验解题过程与方法,了解回归分析的思想及作用。
培养学生分析数据的能力与意识。
教师课件展示练习:1、某市居民1996-2003年货币由入x 与购买商品的支出y 的统计数据如下:表格 7年份 1996 1997 1998 1999 2000 2001 2002 2003 货币收入 36 37 38 40 42 44 47 50 购买支出 30.0 31.0 32.0 33.2 34.8 36.5 39.0 41.6货币收入为50,预测购买商品的支出量是多少?设计意图:通过练习让学生体验解决问题的过程与方法,形成技能。
教师课件展示例题例2 某种书每本的成本费y元与印刷册数x千册有关,统计了如下数据:表格8这种书印刷55千册,预计每本书成本费是多少?这种书印刷250千册,预计每本书成本费是多少?引导问题1:给散点图加趋势线,趋势线大约是何种形状?引导问题2:能画出1x与y的散点图吗?有何特点?引导问题3:你能检验一下1x与y的线性相关关系吗?引导问题4:求出y与1x的回归方程,作出预测。
学生根据问题完成回归分析。
设计意图:引导学生自己解决问题,培养学生的思维。
三、归纳小结教师学生回答,教师归纳,作如下总结1、回归分析的思想方法2、回归分析的应用设计意图:师生共同总结,加深学生对回归分析思想的认识。
知道学习回归分析的意义。
四、作业设计层次1烟雾环境死亡指数研究(1)画出表格9中数据的散点图(2)列出回归直线方程,作出回归分析(3)完成表格10(4)确定这个回归直线方程是否符合回归检验的要求。
(画出残差图说明)(5)是否需改变变量回归直线方程以期更适合数据特征。
表格9数据序号吸烟指数死亡指数177842137116311712349412851161556102101711111889311398810410102881191104121041291310786141129615113144161101391712511318133146191151282010511521877922918523100120247660256651表格10数据序号吸烟指数死亡指数死亡指数预测值残差177842137116311712349412851161556102101711111889311398810410102881191104121041291310786141129615113144161101391712511318133146191151282010511521877922918523100120247660256651(6)在数据统计上,预测吸烟指数平均水平(吸烟指数为100)时的死亡率。
这个预测值与实际值比较有意义吗?(7)你能给出不吸烟者(吸烟指数为0)的死亡率吗?这预测出了什么问题?层次2球自由落体后回弹高度试验表格11表格12是否有线性相关关系?_____________回归直线方程_________________________相关系数_________________是正相关还是负相关?_______________相关显著程度如何?_______________预测球从140cm下落时的回弹高度__________________预测球从250cm下落时的回弹高度__________________上面的哪个预测值更可信?并作出恰当说明。
_____________________________________________________________________ 球从什么高度自由下落可以回弹90cm?__________________回顾一下你是如何解决上面这些问题的。
_____________________________________________________________________ __________________________________________________________________设计意图:通过分层次作业满足不同学生的需求,使学生全面发展。
层次2是试验探究性质的作业,可培养学生的数学应用意识,认识到数学是探究自然世界的有力工具。
附件1 预备活动 1、上面两组数据是否具有线性相关关系? 3、分析下面数据回答问题。
跳高 掷铁饼 跳远 年份 74.8 1418.5 282.875 1900 71 1546.5 289 1904 75 1610 294.25 1908 76 1780 299.25 1912 76.5 1759.25 281.5 1920 78 1817.125 293.125 1924 76.375 1863 304.75 1928 77.625 1948.875 300.75 1932 79.9375 1987.375 371.3125 1936 782078308 194880.32 2166.85 298 195283.25 2218.5 308.25 195685 2330 319.75 196085.75 2401.5 317.75 196488.25 2550.5 350.5 196887.75 2535 324.5 197288.5 2657.4 328.5 197692.75 2624 336.25 198092.5 2622 336.25 1984数据信息来自/data/general/olympic.html 单位:英寸A. 跳远1、预测1944年的记录2、预测2040年的记录B.跳高1、预测1916年的记录2、预测1940年的记录3、预测1944年的记录C.掷铁饼1、预测1916年的记录2、预测1940年的记录D.比较以上数据年份与记录相关程度。