选修1-2第一章、统计案例测试一、选择题1.已知x 与y 之间的一组数据:则y 与x 的线性回归方程为∧∧∧+=a x b y 必过点( ) A.(2,2) B. (1.5 ,4) C.(1.5 ,0) D.(1,2) 【答案】B 【解析】为∧∧∧+=a x b y 必过点(1.5,4)考点:本题考查了线性回归直线方程的性质2.年劳动生产率x (千元)和工人工资y (元)之间回归方程为1070y x =+,这意味着年劳动生产率每提高1千元时,工人工资平均A.增加70元 B.减少70元 C.增加80元 D.减少80元 【答案】A 【解析】试题分析:由题意,年劳动生产率x (千元)和工人工资y (元)之间回归方程为1070y x =+,故当x 增加1时,y 要增加70元,∴劳动生产率每提高1千元时,工资平均提高70元, 故A正确.考点:线性回归方程.点评: 本题考查线性回归方程的运用,正确理解线性回归方程是关键.3.已知某回归方程为:ˆˆ23y x =-,则当解释变量增加1个单位时,预报变量平均:( )A 、增加3个单位BC 、减少3个单位D 、 【答案】C【解析】解释变量即回归方程里的自变量xˆ,由回归方程知预报变量y ˆ减少3个单位 4.变量X 与Y 相对应的一组数据为(10, 1), (11.3, 2), (11.8, 3), (12.5, 4), (13, 5);变量U 与V 相对应的一组数据为(10,5), (11.3, 4), (11.8, 3), (12.5, 2), (13, 1),1r 表示变量Y 与X 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则 A .012<<r r B . 120r r << C . 120r r << D . 12r r =【答案】C【解析】解:∵变量X 与Y 相对应的一组数据为(10,1),(11.3,2), (11.8,3),(12.5,4),(13,5),. X =(10+11.3+11.8+12.5+13)÷ 5 =11.72 . Y =(1+2+3+4+5) ÷5 =3∴这组数据的相关系数是r=7.2 ÷19.172 =0.3755, 变量U 与V 相对应的一组数据为 (10,5),(11.3,4), (11.8,3),(12.5,2),(13,1) . U =(5+4+3+2+1)÷ 5 =3,∴这组数据的相关系数是-0.3755,∴第一组数据的相关系数大于零,第二组数据的相关系数小于零, 故选C .5.统计中有一个非常有用的统计量2k ,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个平行班(甲班A 老师教, 乙班B 老师教)进行2×2列联表.根据2k 的值,你认为不及格人数的多少与不同老师执教有关系的把握大约为A .99.5%B .99.9%C .95%D .无充分依据. 【答案】A【解析】解:=80(4×24-16×36) 2/ 20×60×40×40 =9.6>7.879∴不及格人数的多少与不同老师执教有关系的把握大约为99.5% 故选A .6. 下面是一个2⨯2列联表,则表中a 、b 处的值分别为( )A. 94、96B. 52、54C. 52、50D. 54、52 【答案】B【解析】解:因为根据表格中的数据可知,2+a=b,b+46=100,b=54,a=52,选B7.右图是2×2列联表:则表中a 、b 的值分别为A.94,72B.52,50C.52,74D.74,52 【答案】C【解析】a=73-21=52 b=a+22=52+22=74 故选C8.统计中有一个非常有用的统计量2k ,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个班级进行数学考试,按学生考试及格与不则2k 的值为( )A .0.559B .0.456C .0.443D .0.4【答案】A【解析】2290(1236339)900.55945452169161χ⨯-⨯==≈⨯⨯⨯,故选A 。
9.若有99%的把握说事件A 与事件B 有关,那么具体算出的2χ一定满足( )A .210.828χ>B .210.828χ< C .26.635χ> D .26.635χ<【答案】C【解析】在临界值表中2( 6.635)0.010P χ≥≈,此临界值说明在假设事件A 与事件B 无关的前提下,2χ的观测值大于6.635的概率接近0.010,是小概率事件;如果在假设事件A 与事件B 无关的前提下,计算出的2χ>6.635,说明小概率事件发生了,即说事件A 与事件B 有关犯错的概率不超过0.010,也就是说有99﹪的把握事件A 与事件B 有关。
故选C10.下面关于卡方说法正确的是( ) A.K 2在任何相互独立的问题中都可以用于检验有关还是无关 B.K 2的值越大,两个事件的相关性就越大 C.K 2是用来判断两个分类变量是否相关的随机变量,当K 2的值很小时可以推定两类变量不相关D.K 2的观测值的计算公式是))()()(()(2d b c a d c b a bc ad n K ++++-=【答案】B【解析】2K 只适用于2×2型列联表问题,且2K 只能推定两个分类变量相关的大小,所以A 错;2K 的值很小时,只能说两个变量的相关程度低,不能推定两个变量不相关.所以C 错;选项D 中22()()()()()n ad bc K a b c d a c b d -=++++,所以D 错。
故选B二、填空题11.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,则至少有 的把握认为喜爱打篮球与性别有关(请用百分数表示).【答案】99.5%【解析】解:根据所给的列联表,得到k 2=50(20×15-10×5)2÷(30×20×25×25) =8.333>7.879, ∴至少有99.5%的把握说明喜爱打篮球与性别有关. 故答案为:99.5%12.为了解某班学生喜欢打篮球是否与性别有关,对本班50人进行了问卷调查得到了下表:则根据以下参考公式可得随机变量K 2的值为(保留三位小数),有 %的把握认为喜爱打篮球与性别有关.(参考公式:K 2中n =a +b +c +d)【答案】8.333 99.5%.【解析】所以有99.5%的把握认为喜爱打蓝球与性别有关.13.下表是某数学老师及他的爷爷、父亲和儿子的身高数据:因为儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 .参考公式: 回归直线的方程是:∧∧+=a x b yˆ, 其中;其中i y 是与i x 对应的回归估计值.参考数据:【答案】185cm【解析】由题可得(173,170),(170,176),(176,182) ,代入线性回归方程得,b=1,a=3 所以Y=X+3,当X=182时,Y=185 即他孙子的身高是185厘米14.经过对卡方X 2统计量分布的研究,已经得到两个临界值,当根据具体的数据算出的X 2>6.635时,有______ 的把握说事件A 和B 有关。
【答案】99%【解析】当2χ>6.635时,有99%的把握说事件A 与B 有关15.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:设H 0:服用此药的效果与患者的性别无关,则K 2的观测值k≈________,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________. 【答案】4.882,5%【解析】22100(1544356) 4.88250502179χ⨯-⨯=≈⨯⨯⨯,因为3.841 4.8820.025<<。
所以这种判断出错的可能性为0.05,即5%16.吃零食是中学生中普遍存在的现象.吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表试回答吃零食与性别有关系吗?(答有或没有)____________. 【答案】有【解析】2285(5281240) 4.72217684540χ⨯-⨯=≈⨯⨯⨯,则吃零食和性别有关系的概率为95%,所以两者有关系三、解答题 17.(本小题满分12分)甲乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下的列联表: 根据列联表的独立性检验,能否在犯错误的概率不超过0.01的前提下认为成绩与班级有关系? 附:【答案】在犯错误的概率不超过0.01的前提下不能认为成绩与班级有关系。
【解析】本试题主要是考查了独立性检验的思想的运用,求解分类变量的相关性问题的判定。
表中的数据可得结论。
10,35,7,3845,17,45,73,90a b c d a b a c c d b d n ====+=+=+=+==解:依题意得:所以在犯错误的概率不超过0.01的前提下不能认为成绩与班级有关系。
18.(本小题满分12分)某中学采取分层抽样的方法从应届高三学生中按照性别抽取20名学生, 其中8名女生中有3名报考理科,男生中有2名报考文科 (1)是根据以上信息,写出22⨯列联表 (2)用假设检验的方法分析有多大的把握认为该中学的高三学生选报文理科与性别【答案】(1)(2)2( 3.84)0.05p K >=,所以我们有95%把握认为该中学的高三学生选报文理科与性别有关【解析】(I)写列联表要注意格式,是22⨯列联表.(2)然后与提供的数据表对照估计出把文理科与性别存在相关关系的可信度. 解:(1)(2) 假设0H :报考文理科与性别无关.则2K的估计值因为2( 3.84)0.05p K >=,所以我们有95%把握认为该中学的高三学生选报文理科与性别有关 19.(12分)某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如22⨯列联表所示(单位:人).(1)求m ,n ;(2)你有多大把握认为“教学方式与成绩有关系”? 参考公式及数据:【答案】解:⑴ 301545=-=m , 1005050=+=n .⑵有99.5%的把握认为“教学方式与成绩”有关系.【解析】第一问中利用22⨯列联表求解301545=-=m , 1005050=+=n,得到值因为27.879K >,从而说明有99.5%的把握认为“教学方式与成绩”有关系 解:⑴ 301545=-=m , ……………………………2分1005050=+=n . ………………………………4分8分9.091≈ ………………………………………………… 9分 因为27.879K >,所以0.005P = ………………………… 11分所以有99.5%的把握认为“教学方式与成绩”有关系.……………12分20. (本小题满分12分)为考察某种药物预防疾病的效果,进行动物试验,调查了105个样本,统计结果为:服用药的共有55个样本,服用药但患病的仍有10个样本,没有服用药且未患病的有30个样本.(1)根据所给样本数据画出2×2列联表;(2)请问能有多大把握认为药物有效?【答案】 (1)(2)这种判断出错的可能性不超过5%【解析】根据题意,列出服用药的共有55个样本,则未服药的50个样本,服用药但未患病的有20个样本,没有服用药且未患病的有30个样本,列出2×2列联表;断。