高考专题突破六 高考中的概率与统计问题【考点自测】1.在可行域内任取一点,其规则如算法框图所示,则能输出数对(x ,y )的概率是()A.π8B.π4C.π6D.π2 答案 B解析 由题意知,可行域为正方形,输出数对(x ,y )形成的图形为图中阴影部分,故所求概率为P =14π⎝⎛⎭⎪⎫22222·22=π4.2.(2017·湖南邵阳二模)假设有两个分类变量X 和Y 的2×2列联表如下:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为( ) A .a =45,c =15B .a =40,c =20C .a =35,c =25D .a =30,c =30答案 A解析 根据2×2列联表与独立性检验可知,当a a +10与cc +30相差越大时,X 与Y 有关系的可能性越大,即a ,c 相差越大,a a +10与cc +30相差越大,故选A. 3.设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( ) A .1+a,4 B .1+a,4+a C .1,4 D .1,4+a答案 A 解析x 1+x 2+…+x 1010=1,y i =x i +a ,所以y 1,y 2,…,y 10的均值为1+a ,方差不变仍为4.故选A.4.已知高一年级某班有63名学生,现要选1名学生作为标兵,每名学生被选中的概率是相同的,若“选出的标兵是女生”的概率是“选出的标兵是男生”的概率的1011,则这个班男生的人数为________. 答案 33解析 根据题意,设该班的男生人数为x ,则女生人数为63-x ,因为每名学生被选中的概率是相同的, 根据古典概型的概率计算公式知,“选出的标兵是女生”的概率是63-x63,“选出的标兵是男生”的概率是x63,故63-x 63=1011×x 63,解得x =33,故这个班男生的人数为33. 5.某单位为了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程为y =bx +a 中的b =-2,预测当气温为-4 ℃时,用电量约为________度. 答案 68解析 根据题意知x =18+13+10+(-1)4=10,y =24+34+38+644=40,因为回归直线过样本点的中心,所以a =40-(-2)×10=60,所以当x =-4时,y =(-2)×(-4)+60=68,所以用电量约为68度.题型一 古典概型与几何概型例1 (1)(2017·榆林二模)若函数f (x )=⎩⎪⎨⎪⎧e x,0≤x <1,ln x +e ,1≤x ≤e, 在区间[0,e]上随机取一个实数x ,则f (x )的值不小于常数e 的概率是( ) A.1e B .1-1eC.e1+eD.11+e答案 B解析 当0≤x <1时,f (x )<e ,当1≤x ≤e 时,e≤f (x )≤1+e ,∵f (x )的值不小于常数e ,∴1≤x ≤e,∴所求概率为e -1e =1-1e,故选B.(2)(2017·太原一模)现有2名女教师和1名男教师参加说题比赛,共有2道备选题目,若每位选手从中有放回地随机选出一道题进行说题,其中恰有一男一女抽到同一道题的概率为( ) A.13 B.23 C.12 D.34答案 C解析 记两道题分别为A ,B ,所有抽取的情况为AAA ,AAB ,ABA ,ABB ,BAA ,BAB ,BBA ,BBB (其中第1个、第2个分别表示两个女教师抽取的题目,第3个表示男教师抽取的题目),共有8种;其中满足恰有一男一女抽到同一道题目的情况为ABA ,ABB ,BAA ,BAB ,共4种.故所求事件的概率为12.故选C.思维升华 几何概型与古典概型的本质区别在于试验结果的无限性,几何概型经常涉及的几何度量有长度、面积、体积等,解决几何概型的关键是找准几何测度;古典概型是命题的重点,对于较复杂的基本事件,列举时要按照一定的规律进行,做到不重不漏.跟踪训练1 (1)(2017·商丘二模)已知函数f (x )=13x 3+ax 2+b 2x +1,若a 是从1,2,3中任取的一个数,b 是从0,1,2中任取的一个数,则该函数有两个极值点的概率为( )A.79B.13C.59D.23 答案 D解析 f ′(x )=x 2+2ax +b 2,要使函数f (x )有两个极值点,则有Δ=(2a )2-4b 2>0,即a 2>b 2.由题意知所有的基本事件有9个,即(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),(3,2),其中第一个数表示a 的取值,第二个数表示b 的取值.满足a 2>b 2的有6个基本事件,即(1,0),(2,0),(2,1),(3,0),(3,1),(3,2), 所以所求事件的概率为69=23.(2)(2017·青岛模拟)如图所示,四个相同的直角三角形与中间的小正方形拼成一个边长为2的大正方形,若直角三角形中较小的锐角θ=π6.现在向该正方形区域内随机地投掷一枚飞镖,则飞镖落在小正方形内的概率是________.答案2-32解析 易知小正方形的边长为3-1,故小正方形的面积为S 1=(3-1)2=4-23, 又大正方形的面积为S =2×2=4,故飞镖落在小正方形内的概率P =S 1S =4-234=2-32.题型二 概率与统计的综合应用例2 (2017·西安质检)长时间用手机上网严重影响着学生的身体健康,某校为了解A ,B 两班学生手机上网的时长,分别从这两个班中随机抽取5名同学进行调查,将他们平均每周手机上网的时长作为样本绘制成茎叶图如图所示(图中的茎表示十位数字,叶表示个位数字).(1)你能否估计哪个班级平均每周上网时间较长?(2)从A 班的样本数据中随机抽取一个不超过19的数据记为a ,从B 班的样本数据中随机抽取一个不超过21的数据记为b ,求a >b 的概率.解 (1)A 班样本数据的平均值为15(9+11+14+20+31)=17,由此估计A 班学生每周平均上网时间为17小时;B 班样本数据的平均值为15(11+12+21+25+26)=19, 由此估计B 班学生每周平均上网时间为19小时. 所以B 班学生上网时间较长.(2)A 班的样本数据中不超过19的数据a 有3个,分别为9,11,14,B 班的样本数据中不超过21的数据b 也有3个,分别为11,12,21.从A 班和B 班的样本数据中各随机抽取一个共有9种不同的情况,分别为(9,11),(9,12),(9,21),(11,11),(11,12),(11,21),(14,11),(14,12),(14,21), 其中a >b 的情况有(14,11),(14,12)2种,故a >b 的概率P =29.思维升华 概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性. 跟踪训练2 某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100)后得到如图所示的频率分布直方图.(1)求图中实数a 的值;(2)若该校高一年级共有640人,试估计该校高一年级期中考试数学成绩不低于60分的人数; (3)若从数学成绩在[40,50)与[90,100)两个分数段内的学生中随机选取2名学生,求这2名学生的数学成绩之差的绝对值不大于10的概率.解 (1)由已知,得10×(0.005+0.010+0.020+a +0.025+0.010)=1,解得a =0.03. (2)根据频率分布直方图,可知成绩不低于60分的频率为1-10×(0.005+0.010)=0.85.由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级期中考试数学成绩不低于60分的人数为640×0.85=544.(3)易知成绩在[40,50)分数段内的人数为40×0.05=2,这2人分别记为A ,B ;成绩在[90,100)分数段内的人数为40×0.1=4,这4人分别记为C ,D ,E ,F .若从数学成绩在[40,50)与[90,100)两个分数段内的学生中随机选取2名学生,则所有的基本事件有(A ,B ),(A ,C ),(A ,D ),(A ,E ),(A ,F ),(B ,C ),(B ,D ),(B ,E ),(B ,F ),(C ,D ),(C ,E ),(C ,F ),(D ,E ),(D ,F ),(E ,F ),共15个.如果2名学生的数学成绩都在[40,50)分数段内或都在[90,100)分数段内,那么这2名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在[40,50)分数段内,另一个成绩在[90,100)分数段内,那么这2名学生的数学成绩之差的绝对值一定大于10.记“这2名学生的数学成绩之差的绝对值不大于10”为事件M ,则事件M 包含的基本事件有(A ,B ),(C ,D ),(C ,E ),(C ,F ),(D ,E ),(D ,F ),(E ,F ),共7个,故所求概率P (M )=715.题型三 概率与统计案例的综合应用例3 某校计划面向高一年级1 200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类、自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.(1)分别计算抽取的样本中男生、女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类的学生人数;(2)根据抽取的180名学生的调查结果,完成以下2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解 (1)由条件知,抽取的男生有105人,女生有180-105=75(人).男生选择社会科学类的频率为45105=37,女生选择社会科学类的频率为4575=35.由题意,知男生总数为1 200×105180=700,女生总数为1 200×75180=500,所以估计选择社会科学类的人数为 700×37+500×35=600.(2)根据统计数据,可得列联表如下:则χ2=180×(60×45-30×45)2105×75×90×90=367≈5.142 9>5.024,所以在犯错误的概率不超过0.025的前提下能认为科类的选择与性别有关.思维升华 统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.跟踪训练3 近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病.为了解三高疾病是否与性别有关,医院随机对入院的60人进行了问卷调查,得到了如下的列联表:(1)请将如图的列联表补充完整.若用分层抽样的方法在患三高疾病的人群中抽9人,其中女生抽多少人?(2)为了研究患三高疾病是否与性别有关,请计算出统计量χ2,并说明是否可以在犯错误的概率不超过0.005的前提下认为患三高疾病与性别有关.下面的临界值表供参考:(参考公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )解 (1)完善补充列联表如下:在患三高疾病人群中抽9人,则抽取比例为936=14,所以女性应该抽取12×14=3(人).(2)根据2×2列联表,则χ2=60×(24×18-6×12)230×30×36×24=10>7.879.所以可以在犯错误的概率不超过0.005的前提下认为患三高疾病与性别有关.1.某单位对职员中的老年、中年、青年进行健康状况调查,其中老年、中年、青年职员的人数之比为k ∶5∶3,现用分层抽样的方法抽出一个容量为120的样本,已知在老年职员中抽取了24人,则在青年职员中抽取的人数为_______________________. 答案 36解析 ∵老年、中年、青年职员的人数之比为k ∶5∶3, ∴kk +3+5=24120,解得k =2,∴在青年职员中抽取的人数为120×310=36.2.在不等式组⎩⎪⎨⎪⎧y ≤x ,0<x ≤3,y >1x所表示的平面区域内的所有格点(横、纵坐标均为整数的点称为格点)中任取3个点,则该3点恰能作为一个三角形的3个顶点的概率为________.答案910解析 不等式组表示的平面区域内的格点有(2,1),(2,2),(3,1),(3,2),(3,3),共5个,从中任取3个点,有10种取法,其中共线的3点不能构成三角形,有(3,1),(3,2),(3,3),1种情况,所以能够作为三角形3个顶点的情况有9种,故所求概率是910.3.(2018·唐山模拟)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80的为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).解(1)由已知得,样本中有25周岁以上(含25周岁)组工人60名,25周岁以下组工人40名.所以样本中日平均生产件数不足60的工人中,25周岁以上(含25周岁)组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上(含25周岁)组”中的生产能手有60×0.25=15(人),“25周岁以下组”中的生产能手有40×0.375=15(人),据此可得2×2列联表如下:所以得χ2=(a +b )(c +d )(a +c )(b +d )=100×(15×25-15×45)260×40×30×70=2514≈1.79.因为1.79<2.706.所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.4.(2018·北京海淀区模拟)某商场在元旦举行购物抽奖促销活动,规定顾客从装有编号为0,1,2,3,4的五个相同小球的抽奖箱中一次任意摸出两个小球,若取出的两个小球的编号之和等于7,则中一等奖,等于6或5,则中二等奖,等于4,则中三等奖,其余结果为不中奖. (1)求中二等奖的概率; (2)求不中奖的概率.解 (1)记“中二等奖”为事件A .从五个小球中一次任意摸出两个小球,不同的结果有{0,1},{0,2},{0,3},{0,4},{1,2},{1,3},{1,4},{2,3},{2,4},{3,4},共10个基本事件.记两个小球的编号之和为x ,由题意可知,事件A 包括两个互斥事件:x =5,x =6. 事件x =5的取法有2种,即{1,4},{2,3}, 故P (x =5)=210=15;事件x =6的取法有1种,即{2,4},故P (x =6)=110.所以P (A )=P (x =5)+P (x =6)=15+110=310.(2)记“不中奖”为事件B ,则“中奖”为事件B ,由题意可知,事件B 包括三个互斥事件:中一等奖(x =7),中二等奖(事件A ),中三等奖(x =4). 事件x =7的取法有1种,即{3,4},故P (x =7)=110;事件x =4的取法有{0,4},{1,3},共2种, 故P (x =4)=210=15.由(1)可知,P (A )=310.所以P (B )=P (x =7)+P (x =4)+P (A ) =110+15+310=35. 所以不中奖的概率为P (B )=1-P (B )=1-35=25.5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:(1)求出y 关于x 的线性回归方程y =bx +a ,并在坐标系中画出回归直线; (2)试预测加工10个零件需要的时间.(注:b =∑i =1nx i y i -n xy∑i =1nx 2i-n x2,a =y -b x ,∑i =14x i y i =52.5,∑i =14x 2i =54)解 (1)由表中数据得x =14×(2+3+4+5)=3.5,y =14×(2.5+3+4+4.5)=3.5,∴b =52.5-4×3.5×3.554-4×3.52=0.7, a =3.5-0.7×3.5=1.05.∴y =0.7x +1.05. 回归直线如图所示.(2)将x =10代入线性回归方程,得y =0.7×10+1.05=8.05,故预测加工10个零件需要8.05小时.6.某校高三期中考试后,数学教师对本次全部数学成绩按1∶20进行分层抽样,随机抽取了20名学生的成绩为样本,成绩用茎叶图记录如图所示,但部分数据不小心丢失,同时得到如下表所示的频率分布表:(1)求表中a,b的值及成绩在[90,110)范围内的样本数,并估计这次考试全校高三学生数学成绩的及格率(成绩在[90,150)内为及格);(2)若从茎叶图中成绩在[100,130)范围内的样本中一次性抽取两个,求取出两个样本数字之差的绝对值小于或等于10的概率.解(1)由茎叶图知成绩在[50,70)范围内的有2人,在[110,130)范围内的有3人,∴a=0.1,b=3.∵成绩在[90,110)范围内的频率为1-0.1-0.25-0.25=0.4,∴成绩在[90,110)范围内的样本数为20×0.4=8.估计这次考试全校高三学生数学成绩的及格率为P=1-0.1-0.25=0.65.(2)所有可能的结果为(100,102),(100,106),(100,106),(100,116),(100,118),(100,128),(102,106),(102,106),(102,116),(102,118),(102,128),(106,106),(106,116),(106,118),(106,128),(106,116),(106,118),(106,128),(116,118),(116,128),(118,128),共21个,取出的两个样本中数字之差小于或等于10的结果为(100,102),(100,106),(100,106),(102,106),(102,106),(106,106),(106,116),(106,116),(116,118),(118,128),共10个, ∴P (A )=1021.。