当前位置:文档之家› 《第三章—统计案例》单元设计

《第三章—统计案例》单元设计

《第三章—统计案例》单元设计注:本单元设计分为单元学前设计、单元教学设计和单元巩固设计【单元学前设计】一、知识体系梳理(旧知识)本章共2节,大约4课时,知识框架如下:⎪⎪⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎪⎪⎨⎧⎪⎪⎩⎪⎪⎨⎧⎩⎨⎧⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧⎪⎩⎪⎨⎧独立性检验的基本原理精确检验两个分类变量等高条形图列联表只管判定两个变量有关分类变量独立性检验直观相关系数残差平方和残差图回归分析非线性回归模型线性回归模型观察相关关系:利用散点图回归分析统计案例--- 二、本单元地位本章内容是《选修数学2-3》第三章统计案例。

在必修3中学生已经学习了抽样、用样本估计总体、线性回归等基本知识,本章中,我们将在此基础上,通过对典型案例的讨论,进一步讨论线性回归分析方法及其应用,并初步了解独立性检验的基本思想,认识统计方法在决策中的作用。

学习本单元新知识应具备基础知识测试:【单元教学设计】一、 单元知识点:1、线性回归模型(1)回归方程的相关计算:① 函数关系是一种确定性关系,而相关关系是一种非确定性关系② 回归分析是对具有相关关系的两个变量进行统计分析的一种常用手法.③ 对于一组具有线性相关关系的数据)()()(2211n n y x y x y x ,,,,,,⋯,回归直线的斜率和截距的最小二乘估计公式分别为∑∑∑∑====-⋅-=---=n i i ni ii n i i ni iixx yx n yx x x y yx x b1221121)())((ˆ, x b y aˆˆ-=(其中∑==n i i x n x 11 ,∑==ni i y n y 11 ,),(y x 称为样本点中心)④ 回归直线必过样本点的中心,即点),(y x(2)线性回归模型:①在线性回归模型:y bx a e =++中,a 和b 为模型的未知参数,e 是y 与y bx a =+ 之间的误差,通常e 为随机变量,称为随机误差,它的均值E(e)=0,方差2()D e σ=0>②线性回归模型的完整表达式为2()0,()y bx a e E e D e σ=++⎧⎨==⎩随机误差e 的方差2σ越小,通过回归直线y bx a =+预报真实值y 的精确度越高.③ 在回归模型中,y 的值由x 和随机因素e 共同确定,即x 只能解释部分y 的变化,因此把x 称为解释变量,y 称为预报变量.2、残差分析①残差对于样本点112233(,),(,),(,),,(,).n n x y x y x y x y 而言,相应于它们的随机误差为i e =(i=1,2,3,…,n)其估算值为i e a x b y y y ii i i ˆˆˆ--=-=,(i=1,2,3,…,n). i e 称为相应于点(,)i i x y 的残差。

②残差图:利用图形来分析残差特性,作图时纵坐标残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.3、回归模型拟合效果的判断方法:(1)残差图法:残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适, 这样的带状区域越窄,说明模型拟合精度越高,回归方程的预报精度越高. (2)残差平方和法:21()nii yy =-∑称为残差平方和,残差平方和越小,模型的拟合效果越好.(3)2R :可以用21R =-∑∑==--ni ini iiy y yy 1212)()ˆ(来刻画回归的效果,2R 越大,模型的拟合效果越好, 2R 越小,模型的拟合效果越差.★在线性回归模型中,2R 表示解释变量对于预报变量变化的贡献率,2R 越接近于1 ,表示回归的效果越好.★在含有一个解释变量的线性模型中,2R 恰好等于相关系数r . 4、数据的表示方法(1)变量的不同值表示个体所属的不同类别,像这种变量称为分类变量 (2)用图表列出两个分类变量的频数表,称为列联表;与表格相比,图形更能直观地反映出两个分类变量间是否相互影响; 常用等高条形图展示列联表数据的频率特征. 5、2×2列联表:假设有两个分类变量X 和Y ,它们的取值分别为}{21,x x 和}{21,y y ,其样本频数列联表(称 为2×2列联表)为:2K =))()()(()(2d b c a d c b a bc ad n ++++- ,其中d c b a n +++=为样本容量.6、独立性检验定义利用随机变量2K 来判断“两个分类变量有关系”的方法称为独立性检验.7、独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量X 与Y 有关系”犯错误概率的上界a ,然后查表确定临界值0k (2)由2×2列联表计算2K =的观测值k ))()()(())((2d c d b c a b a bc ad d c b a ++++-+++(3)把k 的值与临界值比较确定X 与Y 有关的程度或无关。

如果0k k ≥,则推断“在犯错误的概率不超过a 的前提下认为X 与Y 有关系”(或有a -1的把握认为X 与Y 有关系); 如果0k k <,则推断“不能在犯错误的概率不超过a 的前提下认为X 与Y 有关系”(或没有a -1的把握认为X 与Y 有关系). 二、高考考点:1.相关关系的判断(基础送分题型))2.回归分析(题点多变型考点)(1)线性回归方程及应用 (2)相关系数及应用 3.独立性检验(重点保分型考点) 三、教学内容设计、教学学时安排§3.1 回归分析的基本思想及其初步应用(2课时) §3.2独立性检验的基本思想及其初步应用(2课时) 四、高考真题:1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( ).A .抽签法B .随机数法C .系统抽样法D .分层抽样法2.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( ).A .45B .50C .55D .603.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423; ②y 与x 负相关且y ^ =-3.476x +5.648; ③y 与x 正相关且y ^ =5.437x +8.493; ④y 与x 正相关且y ^ =-4.326x -4.578. 其中一定不正确的结论的序号是( ).A .①②B .②③C .③④D .①④4.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科 文科 男 13 10 女720已知P (K 2≥3.841) 根据表中数据,得到k =50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.5.(本小题满分12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.错误!未找到引用源。

(x i-错误!未找到引用源。

)2错误!未找到引用源。

(w i-错误!未找到引用源。

)2错误!未找到引用源。

(x i-错误!未找到引用源。

)(y i-错误!未找到引用源。

)错误!未找到引用源。

(w i-错误!未找到引用源。

)(y i-错误!未找到引用源。

)46.6 563 6.8 289.8 1.6 1 469 108.8表中w i=错误!未找到引用源。

,错误!未找到引用源。

=错误!未找到引用源。

w i.(1)根据散点图判断,y=a+bx与y=c+d错误!未找到引用源。

哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(u n,v n),其回归线v=α+βu的斜率和截距的最小二乘估计分别为:=错误!未找到引用源。

,=错误!未找到引用源。

-错误!未找到引用源。

.【单元巩固设计】【单元基础训练题】一、选择题(本大题共12小题,每小题5分,共60分.每小题中只有一项符合题目要求)1.在对两个变量x, y 进行线性回归分析时有下列步骤:①对所求出的回归直线方程作出解释;②收集数据(x i ,y i ),i =1,2,…,n ;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.若根据可靠性要求能够作出变量x ,y 具有线性相关结论,则下列操作顺序正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤D .②⑤④③①2.为了考查两个变量x 和y 之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l 1和l 2,已知两个人在试验中发现对变量x 的观测数据的平均值都是s ,对变量y 的观测数据的平均值都是t ,那么下列说法正确的是( )A .l 1和l 2有交点(s ,t )B .l 1与l 2相交,但交点不一定是(s ,t )C .l 1与l 2必定平行D .l 1与l 2必定重合3.实验测得四组(x ,y )的值为(1,2),(2,3),(3,4),(4,5),则y 与x 之间的回归直线方程为( )A.y ∧=x +1 B.y ∧=x +2 C.y ∧=2x +1 D.y ∧=x -14.今有一组实验数据如下:( )A .v =log2tB .v =log 12t C .v =t 2-12D .v =2t -25.对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程中的截 距为( )A .a =y -bxB .a =y -b ∧x C.a ∧=y -bx D.a ∧=y -b ∧x 6.下面是一个2×2列联表其中a 、b A .52 54 B .54 52 C .94 146 D .146 947.设有一个回归方程为y ∧=3-5x ,则变量x 增加一个单位时( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位 D .y 平均减少3个单位8.在一个2×2列联表中,由其数据计算得K 2=13.097,则其两个变量间有关系的可能性为( )A .99%B .95%C .90%D .无关系 9.两个相关变量满足如下关系:A.y ∧=0.56x +997.4 B.y ∧=0.63x -231.2 B.y ∧=50.2x +501.4 D.y ∧=60.4x +400.710.线性回归方程y ∧=b ∧x +a ∧必过( )A .(0,0)B .(x ,0)C .(0,y )D .(x ,y )11.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A .总偏差平方和 B .残差平方和 C .回归平方和 D .相关指数R 2 12.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,所以判断性别与运动有关,那么这种判断犯错的可能性不超过( )A .2.5%B .0.5%C .1%D .5%二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上)13.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算得K 2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,无关).14.在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:15.用身高(cm)预报体重(kg)满足y ∧=0.849x -85.712,若要找到41.638 kg 的人,________是在150 cm 的人群中.(填“一定”、“不一定”)16.吃零食是中学生中普遍存在的现象.吃零食对学生身体发育诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表男 女 总计 喜欢吃零食 5 12 17 不喜欢吃零食40 28 68 合计454085试回答吃零食与性别有关系吗?答有或没有________.三、解答题(本大题共7小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.(10分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x (个) 2 3 4 5 加工的时间y (小时)2.53.04.04.5(1)在给定的坐标系(如下图)中画出表中数据的散点图;(2)求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧,并在坐标系中画出回归直线; (3)试预测加工10个零件需要多少时间?18.(12分)某企业的某种产品产量与单位成本数据如下:月份 1 2 3 4 5 6 产量(千件) 2 3 4 3 4 5 单位成本(元)737271736968(1)(2)指出产量每增加1 000件时,单位成本下降多少?(3)假定产量为6 000件时,单位成本是多少?单位成本为70元时,产量应为多少件?19.(2011·安徽)某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.20.(12分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关?并说明理由.21.(12分)某运动队研制了一种有助于运动员在大运动量的训练后快速恢复体力的口服制剂,为了实验新药的效果而抽取若干名运动员来实验,所得资料如下:有效(恢复得好),60,120,45,180 无效(恢复得差),45,45,60,255总计,105,165,105,435区分该种药剂对男、女运动员产生的效果的强弱.22.(12分)第17届亚运会于2014年9月19日至10月4日在韩国仁川进行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动.(1)根据以上数据完成以下2×2列联表:喜爱运动 不喜爱运动总计 男 10 16 女 6 14 总计30(2)运动有关?(3)如果从喜欢运动的女志愿者中(其中恰有4人会外语),抽取2名负责翻译工作,那么抽出的志愿者中至少有1人能胜任翻译工作的概率是多少?【单元检测设计】参考公式P k 2(K ) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.8281.在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上 (C)可以选择两个变量中任意一个变量在x 轴上 (D)可以选择两个变量中任意一个变量在y 轴上2、设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵截距是a ,那么必有() (A) b 与r 的符号相同 (B) a 与r 的符号相同 (C) b 与r 的相反 (D) a 与r 的符号相反3、一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93 用这个模型预测这个孩子10岁时的身高,则正确的叙述是() (A)身高一定是145.83cm (B)身高在145.83cm 以上 (C)身高在145.83cm 以下 (D)身高在145.83cm 左右4、两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是()(A)模型1的相关指数2R 为0.98 (B) 模型2的相关指数2R 为0.80 (C)模型3的相关指数2R 为0.50 (D) 模型4的相关指数2R 为0.255、工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090yx =+,下列判断正确的是( ) (A)劳动生产率为1000元时,工资为50元 (B)劳动生产率提高1000元时,工资提高150元 (C)劳动生产率提高1000元时,工资提高90元 (D)劳动生产率为1000元时,工资为90元 6、为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( )(A) 1l 与2l 重合 (B) 1l 与2l 一定平行 (C) 1l 与2l 相交于点),(y x (D) 无法判断1l 和2l 是否相交 7、考察棉花种子经过处理跟生病之间的关系得到如下表数据:(A)种子经过处理跟是否生病有关 (B)种子经过处理跟是否生病无关 (C)种子是否经过处理决定是否生病 (D)以上都是错误的8、变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问题中,y 的预报最大取值是10,则x 的最大取值不能超过() (A)16 (B)17 (C)15 (D)129、在研究身高和体重的关系时,求得相关指数≈2R ______________,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”所以身高对体重的效应比随机误差的效应大得多。

相关主题