第一章:统计案例一.选择题1. 炼钢时钢水的含碳量与冶炼时间有( )A.确定性关系B.相关关系C.函数关系D.无任何关系 2.下列说法正确的有( )①回归方程适用于一切样本和总体。
②回归方程一般都有时间性。
③样本取值的范围会影响回归方程的适用范围。
④回归方程得到的预报值是预报变量的精确值。
A. ①② B. ②③ C. ③④ D. ①③ 3.下列结论正确的是( )①函数关系是一种确定性关系; ②相关关系是一种非确定性关系 ③回归分析是对具有函数关系的两个变量进行统计分析的一种方法 ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
A. ①② B. ①②③ C. ①②④ D. ①②③④ 4. 设有一个回归方程为y=2-2.5x,则变量x 增加一个单位时( ) A.y 平均增加2.5个单位 B.y 平均增加2个单位 C.y 平均减少2.5个单位 D.y 平均减少2个单位5.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( ) A. y ∧=1.23x +4 B. y ∧=1.23x+5 C. y ∧=1.23x+0.08 D. y ∧=0.08x+1.23 6. 已知x 与y 之间的一组数据:则y 与x 的线性回归方程为y=bx+a 必过( )A.(2,2)点B.(1.5,0)点C.(1,2)点D.(1.5,4)点7. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就( )A. 越大B.越小C.无法判断D. 以上都不对 8.身高与体重有关系可以用( )分析来分析A.殘差B.回归C.二维条形图D.独立检验9. 设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵截距是a ,那么必有( )A. b 与r 的符号相同B. a 与r 的符号相同C. b 与r 的相反D. a 与r 的符号相反10. 为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( )A. 1l 与2l 重合B. 1l 与2l 一定平行C. 1l 与2l 相交于点),(y xD. 无法判断1l 和2l 是否相交 11. 考察棉花种子经过处理跟生病之间的关系得到如下表数据:A.种子经过处理跟是否生病有关B. 种子经过处理跟是否生病无关C.种子是否经过处理决定是否生病D. 以上都是错误的12.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问题中,y 的预报最大取值是10,则x 的最大取值不能超过( ) A.16 B.17 C.15 D.12 二.填空题13 .有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系; (2)曲线上的点与该点的坐标之间的关系; (3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系,其中有相关关系的是 14. 归直线方程为y=0.5x-0.81,则x=25时,y 的估计值为15. 在两个变量的回归分析中,作散点图的目的是______________________________16. 许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x )和收入低于官方规定的贫困线的人数占本州人数的百分比(y )的数据,建立的回归直线方程如下ˆ0.8 4.6yx =+,斜率的估计等于0.8说明 ,成年人受过9年或更少教育的百分比(x )和收入低于官方的贫困线的人数占本州人数的百分比(y )之间的相关系数 (填充“大于0”或“小于0”) 三.解答题17. 在回归分析中,通过模型由解释变量计算预报变量时,应注意什么问题?18.若)101(,1531≤≤=+=i iy y i x i i ,求.,y x19.某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下联表:生产线与产品合格率列联表请问甲、乙两线生产的产品合格率在多大程度上有关系?20.为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下:(1) 用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图 (2) 描述解释变量与预报变量之间的关系 (3) 计算残差、相关指数R 2.1.1 回归分析的基本思想及其初步应用例题:1. 在画两个变量的散点图时,下面哪个叙述是正确的( )(A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上(C)可以选择两个变量中任意一个变量在x 轴上 (D)可以选择两个变量中任意一个变量在y 轴上 2. 若一组观测值(x 1,y 1)(x 2,y 2)…(x n ,y n )之间满足y i =bx i +a+e i (i=1、2. …n)若e i 恒为0,则R 2为3. 假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?课后练习:1. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93 用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm; B.身高在145.83cm 以上; C.身高在145.83cm 以下; D.身高在145.83cm 左右.2. 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( )A.模型1的相关指数2R 为0.98B.模型2的相关指数2R 为0.80C.模型3的相关指数2R 为0.50D.模型4的相关指数2R 为0.253.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数R 24.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090y x =+,下列判断正确的是( ) A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资为90元5.线性回归模型y=bx+a+e中,b=_______,a=_________e称为_________6. 若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为_______ 回归平方和为____________7. 一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)变量y对x进行相关性检验;(2)如果y对x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?1.2 独立性检验的基本思想及其初步应用例题:1.三维柱形图中柱的高度表示的是( )A.各分类变量的频数B.分类变量的百分比C.分类变量的样本数D.分类变量的具体值2. 统计推断,当______时,有95 %的把握说事件A 与B 有关;当______时,认为没有充分的证据显示事件A 与B 是有关的.3.为了探究患慢性气管炎与吸烟有无关系,调查了却339名50岁以上的人,结果如下表所示,据此数据请问:50岁以上的人患慢性气管炎与吸烟习惯有关系吗?课后练习:1. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就()A.越大B.越小C.无法判断D.以上都不对2.下列关于三维柱形图和二维条形图的叙述正确的是: ( )A .从三维柱形图可以精确地看出两个分类变量是否有关系B .从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C .从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对K的观测值K ,说法正确的是()3.对分类变量X 与Y 的随机变量2A . k 越大," X 与Y 有关系”可信程度越小;B . k 越小," X 与Y 有关系”可信程度越小;C . k 越接近于0," X 与Y 无关”程度越小D . k 越大," X 与Y 无关”程度越大4. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.5.若由一个2*2列联表中的数据计算得k2=4.013,那么有把握认为两个变量有关系6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:性别 专业非统计专业统计专业 男 13 10 女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为2 3.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ____;7.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。
(1)根据以上数据建立一个2×2的列联表; (2)判断性别与休闲方式是否有关系。
高中新课标选修(1-2)统计案例测试题1一、选择题1.下列属于相关现象的是( )A .利息与利率B .居民收入与储蓄存款C .电视机产量与苹果产量D .某种商品的销售额与销售价格 2.如果有95%的把握说事件A 和B 有关,那么具体算出的数据满足( ) A .2 3.841K >B .2 3.841K <C .2 6.635K >D .2 6.635K <3.如图所示,图中有5组数据,去掉 组数据后(填字母代号),剩下的4组数据的线性相关性最大 A .EB .CC .DD .A4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A .90%B .95%C .99%D .100%5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:你认为婴儿的性别与出生时间有关系的把握为( ) A .80%B .90%C .95%D .99%6.已知有线性相关关系的两个变量建立的回归直线方程为y a bx =+,方程中的回归系数b ( ) A .可以小于0B .只能大于0C .可以为0D .只能小于07.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A .废品率每增加1%,成本每吨增加64元 B .废品率每增加1%,成本每吨增加8% C .废品率每增加1%,成本每吨增加8元 D .如果废品率增加1%,则每吨成本为56元8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.( ) A .①②B .②③C .①③D .①②③9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:如果某天气温是2℃,则这天卖出的热饮杯数约为( ) A .100B .143C .200D .24310.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于()A.0.30.4B.0.40.5C.0.50.6D.0.60.7二、填空题11.某矿山采煤的单位成本Y与采煤量x有关,其数据如下:则Y对x的回归系数为.12.对于回归直线方程 4.75257=+,当28y xx=时,y的估计值为.13.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则2K=.14.某工厂在2004年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据:则月总成本y对月产量x的回归直线方程为.三、解答题15.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:对于教育机构的研究项目,根据上述数据能得出什么结论.16.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数9.10.006=+⨯吨位.(1)假定两艘轮船相差1000吨,船员平均人数相差多少?(2)对于最小的船估计的船员数为多少?对于最大的船估计的船员数是多少?17.假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录:(1)作出这些数据的散点图;(2)求出这些数据的回归方程;(3)对于这个例子,你如何解释回归系数的含义?(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从3~16岁身高的年均增长数.(5)解释一下回归系数与每年平均增长的身高之间的联系.18.某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表:已知721280i i x ==∑,72145309i i y ==∑,713487i i i x y ==∑.(1)求x y ,;(2)画出散点图;(3)判断纯利y 与每天销售件数x 之间是否线性相关,如果线性相关,求出回归方程.高中新课标数学选修(1-2)统计案例测试题一、选择题:本大题共12道小题,每小题5分,共60分1、对于散点图下列说法中正确一个是( )(A )通过散点图一定可以看出变量之间的变化规律(B )通过散点图一定不可以看出变量之间的变化规律(C )通过散点图可以看出正相关与负相关有明显区别(D )通过散点图看不出正相关与负相关有什么区别2、在画两个变量的散点图时,下面叙述正确的是( )(A )预报变量在x 轴上,解释变量在y 轴上(B )解释变量在x 轴上,预报变量在y 轴上(C )可以选择两个变量中的任意一个变量在x 轴上(D )可以选择两个变量中的任意一个变量在y 轴上3、如果根据性别与是否爱好运动的列联表,得到841.3852.3>≈k ,所以判断性别与运动有关,那么这种判断出错的可能性为( )(A )0020 (B )0015 (C )0010 (D )0054、下列关于线性回归的说法,不正确的是( )(A )变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;(B )在平面直角坐标系中用描点法的方法得到表示具有相关关系的两个变量的一组数据的图形叫散点图;(C )线性回归直线方程最能代表观测值y x ,之间的关系;(D )任何一组观测值都能得到具有代表意义的回归直线方程;5、在两个变量y 与x 的回归模型中,分别选择了四个不同的模型,它们的相关指数2R 如下,其中拟合效果最好的为( )(A )模型①的相关指数为976.0 (B )模型②的相关指数为776.0(C )模型③的相关指数为076.0 (D )模型④的相关指数为351.06、关于如何求回归直线的方程,下列说法正确的一项是( )(A )先画一条,测出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测出此时的斜率与截距,就可得到回归直线方程(B )在散点图中,选两点,画一条直线,使所画直线两侧的点数一样多或基本相同,求出此直线方程,则该方程即为所求回归方程(C )在散点图中多选几组点,分别求出各直线的斜率与截距,再求它们的平均值,就得到了回归直线的斜率与截距,即可产生回归方程(D )上述三种方法都不可行7、若对于变量y 与x 的10组统计数据的回归模型中,相关指数95.02=R ,又知残差平方和为53.120,那么∑=-1012)(i i y y的值为( )(A )06.241 (B )6.2410 (C )08.253 (D )8.25308、右表是对与喜欢足球与否的统计列联表依据表中的数据,得到( )(A )564.92=K (B )564.32=K(C )706.22<K (D )841.32>K9、某医院用光电比色计检验尿汞时,得尿汞含量)/(L mg 与消光系数读数的结果如下:如果y 与x 之间具有线性相关关系,那么当消光系数的读数为480时,( )(A )汞含量约为L mg /27.13 (B )汞含量高于L mg /27.13(C )汞含量低于L mg /27.13 (D )汞含量一定是L mg /27.1310、由一组样本数据),(,),,(),,(2221n n y x y x y x 得到的回归直线方程a bx y +=∧,那么下面说法正确的是(A )直线a bx y +=∧必过点),(--y x(B )直线a bx y +=∧必经过),(,),,(),,(2221n n y x y x y x 一点(C )直线a bx y +=∧经过),(,),,(),,(2221n n y x y x y x 中某两个特殊点(D )直线a bx y +=∧必不过点),(--y x11、根据下面的列联表得到如下中个判断:①有009.99的把握认为患肝病与嗜酒有关;②有0099的把握认为患肝病与嗜酒有关;③认为患肝病与嗜酒有关的出错的可能为001;④认为患肝病与嗜酒有关的出错的可能为0010;其中正确命题的个数为( )(A )0 (B )1 (C )2 (D )312、对于两个变量之间的相关系数r ,下列说法中正确的是( )(A )||r 越大,相关程度越大 (B )||r 越小,相关程度越大(C )||r 越大,相关程度越小;||r 越小,相关程度越大(D )1||≤r 且||r 越接近于1,相关程度越大; ||r 越接近于0,相关程度越小;二、填空题:本大题共4小题,每小题4分,共16分,把答案填在题中的横线上13、下表是关于出生男婴与女婴调查的列联表那么,A= ,B= ,C= ,D= ,E= ;14、如右表中给出五组数据),(y x ,从中选出四组使其线性相关最大,且保留第一组)3,5(--,那么,应去掉第 组。