2020年高考文科数学《概率与统计》题型归纳与训练【题型归纳】题型一古典概型例1 从甲、乙等5名学生中随机选出2人,则甲被选中的概率为().A. 15B. 25C. 825D.925【答案】B【解析】可设这5名学生分别是甲、乙、丙、丁、戊,从中随机选出2人的方法有:(甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊),(丙,丁),(丙,戊),(丁,戊),共有10种选法,其中只有前4种是甲被选中,所以所求概率为42105=.故选B.例2 将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为________.【答案】23【解析】根据题意显然这是一个古典概型,其基本事件有:数1,数2,语; 数1,语,数2;数2,数1,语; 数2,语,数1;语,数2,数1; 语,数1,数2共有6种,其中2本数学书相邻的有4种,则其概率为:4263p==.【易错点】列举不全面或重复,就是不准确【思维点拨】直接列举,找出符合要求的事件个数.题型二几何概型1 / 18例 1 如图所示,正方形ABCD 内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( ).A.14 B. π8 C. 12 D. π4【答案】B【解析】不妨设正方形边长为a ,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为822122ππ=⎪⎭⎫⎝⎛⨯⨯a a .故选B.例2 在区间[0,5]上随机地选择一个数p ,则方程22320x px p 有两个负根的概率为________. 【答案】32【解析】方程22320x px p 有两个负根的充要条件是2121244(32)020320p p x x p x x p ⎧∆=--≥⎪+=-<⎨⎪=->⎩即21,3p <≤或2p ≥,又因为[0,5]p ∈,所以使方程22320x px p 有两个负根的p 的取值范围为2(,1][2,5]3,故所求的概率2(1)(52)23503-+-=-,故填:32.【易错点】“有两个负根”这个条件不会转化.【思维点拨】“有两个负根”转化为函数图像与x 轴负半轴有两个交点.从而得到参数p 的范围.在利用几何概型的计算公式计算即可.D3 / 18题型三 抽样与样本数据特征例1 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 ________件.【答案】18【解析】按照分层抽样的概念应从丙种型号的产品中抽取60300181000⨯=(件). 例2 已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为 .【答案】11【解析】 因为样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,又样本数据121x +,221x +,⋅⋅⋅,21n x +的和为()122n x x x n ++++,所以样本数据的均值为21x +=11.例3 某电子商务公司对10000名网络购物者2018年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.30.9],内,其频率分布直方图如图所示. (1)直方图中的a = .(2)在这些购物者中,消费金额在区间[0.50.9],内的购物者的人数为. /万元a【答案】3a = 人数为0.6100006000⨯=【解析】 由频率分布直方图及频率和等于1,可得0.20.10.80.1 1.50.120.1 2.50.10.11a ⨯+⨯+⨯+⨯+⨯+⨯=,解之得3a =.于是消费金额在区间[]0.50.9,内频率为0.20.10.80.120.130.10.6⨯+⨯+⨯+⨯=, 所以消费金额在区间[]0.50.9,内的购物者的人数为0.6100006000⨯=.例4 某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图所示./度(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则从月平均用电量在[)220,240的用户中应抽取多少户? 【答案】见解析【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=, 得0.0075x =.(2)由图可知,月平均用电量的众数是2202402302+=.5 / 18因为()0.0020.00950.011200.450.5++⨯=<, 又()0.0020.00950.0110.0125200.70.5+++⨯=>, 所以月平均用电量的中位数在[)220,240内.设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=, 得224a =,所以月平均用电量的中位数是224.(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=(户); 月平均用电量为[)240,260的用户有0.00752010015⨯⨯=(户); 月平均用电量为[)260,280的用户有0.0052010010⨯⨯=(户); 月平均用电量为[]280,300的用户有0.0025201005⨯⨯=(户). 抽取比例为11125151055=+++,所以从月平均用电量在[)220,240的用户中应抽取12555⨯=(户). 【易错点】没有读懂题意,计算错误.不会用函数思想处理问题【思维点拨】根据题意分情况写出函数解析式;2牵涉到策略问题,一般可以转化为比较两个指标的大小. 题型四 回归与分析例1下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图y年生活垃圾无害化处理量年份代码t(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:719.32i i y ==∑,7140.17i i i t y ==∑0.55=2.646≈.参考公式:相关系数()()niit t y y r --=∑ 回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:121()()()nii i nii tt y y b tt ==--=-∑∑,=.a y bt -【答案】见解析【解析】(1)由折线图中数据和附注中参考数据得4t =,()27128i i t t =-=∑,0.55=,()()77711140.1749.32 2.89iii iii i i t t y y t y t y===--=-=-⨯=∑∑∑, 2.890.990.552 2.646r ≈≈⨯⨯.因为y 与t的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t的关系.(1)变量y 与t 的相关系数7777()()7iii i i it t y y t y t y r ---⋅==∑∑∑∑,7 / 18又7128i i t ==∑,719.32i i y ==∑,7140.17i i i t y ==∑5.292==0.55=,所以740.17289.320.997 5.2920.55r ⨯-⨯=≈⨯⨯ ,故可用线性回归模型拟合变量y 与t 的关系.(2)4t=,y =7117i i y =∑,所以7172211740.17749.327ˆ0.10287i ii ii t y t yb tt ==-⋅-⨯⨯⨯===-∑∑, 1ˆˆ9.320.1040.937ay bx =-=⨯-⨯≈,所以线性回归方程为ˆ0.10.93y t =+. 当9t =时,ˆ0.190.93 1.83y=⨯+=.因此,我们可以预测2016年我国生活垃圾无害化处理1.83亿吨.【易错点】没有读懂题意,计算错误.【思维点拨】将题目的已知条件分析透彻,利用好题目中给的公式与数据. 题型五 独立性检验例1 甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:则哪位同学的试验结果体现A 、B 两变量更强的线性相关性?( )A .甲B .乙C .丙D .丁 【答案】D【解析】 D 因为r>0且丁最接近1,残差平方和最小,所以丁相关性最高 【易错点】不理解相关系数和残差平方和与相关性的关系【思维点拨】相关系数r的绝对值越趋向于1,相关性越强.残差平方和m越小相关性越强【巩固训练】题型一古典概型1.将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是.【答案】56【解析】将先后两次点数记为(),x y,则基本事件共有6636⨯=(个),其中点数之和大于等于10有()()()()()()4,6,5,5,5,6,6,4,6,5,6,6,共6种,则点数之和小于10共有30种,所以概率为305366=.2.我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是().A.112B.114C.115D.118【答案】C【解析】不超过30的素数有2、3、5、7、11、13、17、19、23、29,共10个,随机选取两数有45(种)情况,其中两数相加和为30的有7和23,11和19,13和17,共3种情况,根据古典概型得314515P==.故选C.3.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机摸出2只球,则这2只球颜色不同的概率为.【答案】56P=9 / 18【解析】1只白球设为a ,1只红球设为b ,2只黄球设为c ,d , 则摸球的所有情况为(),a b ,(),a c ,(),a d ,(),b c ,(),b d ,(),c d ,共6件, 满足题意的事件为(),a b ,(),a c ,(),a d ,(),b c ,(),b d ,共5件,故概率为56P =.题型二 几何概型1.某公司的班车在7:00,8:00,8:30发车,学.小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( ).A .13B .12C .23D .34【答案】B【解析】 如图所示,画出时间轴.A 8:208:307:30小明到达的时间会随机的落在图中线段AB 中,而当他的到达时间落在线段AC 或DB 时,才能保证他等车的时间不超过10分钟.根据几何概型,所求概率10101402P +==.故选B . 2. 从区间[]0,1随机抽取2n 个数1x ,2x ,…,n x ,1y ,2y ,…,n y ,构成n 个数对()11,x y ,()22,x y ,…,(),n n x y ,其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为( ).A .4n mB .2n mC .4m nD .2mn【答案】C【解析】由题意得:()()12i i x y i n =⋅⋅⋅,,,,在如图所示方格中,而平方和小于1的点均在如图所示的阴影中,由几何概型概率计算公式知π41m n=,所以4πmn =.故选C .3.下图来自古希腊数学家希波克拉底所研究的几何图形,此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC ,ABC △的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ,在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为1p ,2p ,3p ,则 A .12p p = B .13p p = C .23p p = D .123p p p =+【答案】A【解析】概率为几何概型,总区域面积一定,只需比较Ⅰ,Ⅱ,Ⅲ区域面积即可.设直角三角形ABC 的三个角A ,B ,C 所对的边长分别为a ,b ,c ,则区域Ⅰ的面积为112S ab =,区域Ⅱ的面积为222211111111πππ22222222S c b ab a ab ⎛⎫⎛⎫⎛⎫=++-= ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭, 区域Ⅲ的面积为22231111111πππ2222282S c b ab a ab ⎛⎫⎛⎫=+-=- ⎪ ⎪⎝⎭⎝⎭. 显然12p p =.故选A .题型三 抽样与样本的数据特征1.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为 . 【答案】10【解析】平均数()14658766 6x=+++++=.2.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(Ⅰ)直方图中的a=_________;(Ⅱ)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为_________.【答案】3;6000【解析】频率和等于1可得0.20.10.80.1 1.50.120.1 2.50.10.11a⨯+⨯+⨯+⨯+⨯+⨯=,解之得3a=.于是消费金额在区间[0.5,0.9]内频率为0.20.10.80.120.130.10.6⨯+⨯+⨯+⨯=,所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6100006000⨯=,故应填3;6000.3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨)、一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)0,0.5,[)0.5,1,⋅⋅⋅,[)4,4.5分成9组,制成了如图所示的频率分布直方图. (1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,请说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.11 / 18【答案】见解析【解析】(1)由频率分布直方图知,月均用水量在[)00.5,中的频率为0.080.50.04⨯=,同理,在[)0.5,1,[)1.5,2,[)22.5,, [)33.5,,[)3.54,,[)44.5,中的频率分别为0.08,0.20, 0.26, 0.06, 0.04, 0.02.由0.04+0.08+0.50.200.260.50.060.040.021a a ⨯+++⨯+++=,解得0.30a =.(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为3000000.1236000⨯=.(3)因为前6组的频率之和为0.040.080.150.200.260.15=0.880.85----->, 而前5组的频率之和为0.04+0.08+0.150.200.26=0.730.85--<,所以2.5 3.x < 由()0.3 2.50.850.73x ⨯-=-,解得 2.9x =. 题型四 回归与分析1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元13 / 18【答案】B【解析】由已知得8.28.610.011.311.9105x ++++==(万元),6.27.58.08.59.885y ++++==(万元),故ˆ80.76100.4a =-⨯=, 所以回归直线方程为ˆ0.760.4y x =+.当社区一户收入为15万元,家庭年支出为 ˆ0.7615y =⨯+0.411.8=(万元).故选B .2.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为( ).A . 160B . 163C . 166D .170 【答案】C 【解析】 22.5x =,160y =,所以160422.570a =-⨯=,24x =时,42470166y =⨯+=.故选C .3.某公司为确定下一年投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量()1,2,,8i y i =⋅⋅⋅数据作了初步处理,得到下面的散点图及一些统计量的值.年宣传费/千元表中i w =8118i i w w ==∑,(1)根据散点图判断,y a bx =+与y c =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由)? (2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系式为0.2z y x =-,根据(2)的结果回答下列问题:(ⅰ)年宣传费49x =时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据()11,u v ()22,u v ,⋅⋅⋅,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i nii uu v v uu β==--=-∑∑,ˆˆv u αβ=-.15 / 18【答案】见解析【解析】(1)由散点图变化情况可知选择y c =+较为适宜.(2)由题意知()()()81821108.8681.6iii ii w w y y d w w ==--===-∑∑.又y c =+一定过点(),y ω,所以c y d ω=-=56368 6.8100.6-⨯=, 所以y 与x的回归方程为100.6y =+(3)(ⅰ)由(2)知,当49x =时,()100.668576.6t y =+=, 0.2576.649z =⨯-=66.32(千元), 所以当年宣传费为49x =时,年销售量为()576.6t ,利润预估为66.32千元. (ⅱ)由(2)知,(0.20.2100.6z y x x =-=+-=x +20.12=)226.8 6.820.12-++6.8时,年利润的预估值最大,即26.846.24x ==(千元). 题型五 独立性检验1.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H :“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的K 2≈3.918,则下列表述中正确的是( )A .有95℅的把握认为“这种血清能起到预防感冒的作用”B .若有人未使用该血清,那么他一年中有95℅的可能性得感冒C .这种血清预防感冒的有效率为95℅D .这种血清预防感冒的有效率为5℅【答案】A【解析】由题可知,在假设H 成立情况下,)841.3(2≥K P 的概率约为0.05,即在犯错的概率不错过0.05的前提下认为“血清起预防感冒的作用”,即有95℅的把握认为“这种血清能起到预防感冒的作用”.这里的95℅是我们判断H 不成立的概率量度而非预测血清与感冒的几率的量度,故B 错误.C ,D 也犯有B 中的错误.故选A 2.观察下面频率等高条形图,其中两个分类变量x y ,之间关系最强的是( )A .B .C .D . 【答案】D【解析】在频率等高条形图中,a ab +与cc d+相差很大时,我们认为两个分类变量有关系,四个选项中,即等高的条形图中12,x x 所占比例相差越大,则分类变量,x y 关系越强,故选D .3.淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg )的频率分布直方图如图所示.17 /18频率频率组距箱产量/kg新养殖法旧养殖法箱产量/kg(1)设两种养殖方法的箱产量相互独立,记A 表示事件:旧养殖法的箱产量低于50kg , 新养殖法的箱产量不低于50kg ,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:22()()()()()n ad bc K a b c d a c b d -=++++ .【答案】见解析【解析】(1)记:“旧养殖法的箱产量低于50kg ” 为事件B ,“新养殖法的箱产量不低于50kg ”为事件C ,由题图并以频率作为概率得()0.04050.03450.02450.01450.0125P B =⨯+⨯+⨯+⨯+⨯0.62=,()0.06850.04650.01050.0085P C =⨯+⨯+⨯+⨯0.66=,()()()0.4092P A P B P C ==.(2)由计算可得2K 的观测值为()222006266383415.70510010096104k⨯⨯-⨯==⨯⨯⨯,因为15.705 6.635>,所以()2 6.6350.001P K ≈≥,从而有99%以上的把握认为箱产量与养殖方法有关.(3)150.2÷=,()0.10.0040.0200.0440.032-++=,80.0320.06817÷=,85 2.3517⨯≈,50 2.3552.35+=,所以中位数为52.35.。