概率与统计大题总结一、知识点汇编:1.线性回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)线性回归分析:方法是画散点图,求回归直线方程,并用回归直线方程进行预报.其回归方程的截距和斜率的最小二乘估计公式分别为:回归模型中,R 2表示解释变量对于预报变量变化的贡献率.R 2越接近于1,表示回归的效果越好.如果对某组数据可能采取几种不同的回归方程进行回归分析,也可以通过比较几个R 2,选择R 2大的模型作为这组数据的模型.说明:r 只能用于线性模型,R 2则可用于任一种模型. 对线性回归模型来说,22=R r .3、独立性检验(1)对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量. (2)假设有两个分类变量X 和Y ,它们的值域分别为{}11x ,y 和{}12y ,y 其样本频数列联表称为2×2列联表:y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c+d(3)构造随机变量()()()()()()22+++-=++++a b c d ad bc K ,a b c d a c b d 利用K 2的大小可以确定在多大程度上可以认为“两个分类变量有关系”,这种方法称为如:如果k >7.879,就有99.5%的把握认为“X 与Y 有关系”. 4、概率 事件的关系:⑴事件B 包含事件A :事件A 发生,事件B 一定发生,记作B A ⊆; ⑵事件A 与事件B 相等:若A B B A ⊆⊆,,则事件A 与B 相等,记作A=B ; ⑶并(和)事件:某事件发生,当且仅当事件A 发生或B 发生,记作B A ⋃(或B A +); ⑷并(积)事件:某事件发生,当且仅当事件A 发生且B 发生,记作B A ⋂(或AB ) ;⑸事件A 与事件B 互斥:若B A ⋂为不可能事件(φ=⋂B A ),则事件A 与互斥; ⑹对立事件:B A ⋂为不可能事件,B A ⋃为必然事件,则A 与B 互为对立事件。
概率公式:⑵古典概型:基本事件的总数包含的基本事件的个数A A P =)(;⑶几何概型:等)区域长度(面积或体积试验的全部结果构成的积等)的区域长度(面积或体构成事件A A P =)( ;5、统计案例 抽样方法:⑴简单随机抽样:一般地,设一个总体的个数为N ,通过逐个不放回的方法从中抽取一个容量为n 的样本,且每个个体被抽到的机会相等,就称这种抽样为简单随机抽样。
注:①每个个体被抽到的概率为Nn ; ②常用的简单随机抽样方法有:抽签法;随机数表法。
⑵系统抽样:当总体个数较多时,可将总体均衡的分成几个部分,然后按照预先制定的规则,从每一个部分抽取一个个体,得到所需样本,这种抽样方法叫系统抽样。
注:步骤:①编号;②分段;③在第一段采用简单随机抽样方法确定起始的个体编号;④按预先制定的规则抽取样本。
⑶分层抽样:当已知总体有差异比较明显的几部分组成时,为使样本更充分的反映总体的情况,将总体分成几部分,然后按照各部分占总体的比例进行抽样,这种抽样叫分层抽样。
注:每个部分所抽取的样本个体数=该部分个体数⨯Nn注:以上三种抽样的共同特点是:在抽样过程中每个个体被抽取的概率相等频率分布直方图与茎叶图:⑴用直方图反映样本的频率分布规律的直方图称为频率分布直方图。
⑵当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边像植物茎上长出来的叶子,这种表示数据的图叫做茎叶图。
总体特征数的估计:⑴样本平均数∑==+⋅⋅⋅++=ni i n x nx x x n x 1211)(1;⑵样本方差])()()[(1222212x x x x x x n S n -+⋅⋅⋅+-+-=21)(1x x nni i -=∑= ;⑶样本标准差])()()[(122221x x x x x x n S n -+⋅⋅⋅+-+-==21)(1x x nni i-∑=大题训练1.(本小题满分12分)某中学准备招聘一批优秀大学生到本单位就业,但在签约前要对他们的师范生素质进行测试.在待测试的某一个小组中有男、女生共10人(其中女生人数多于男生人数),如果从中随机选2人参加测试,其中恰为一男一女的概率为815. (1)求该小组中女生的人数;(2)假设此项专业技能测试对该小组的学生而言,每个女生通过的概率为34,每个男生通过的频率为23.现对该小组中男生甲、男生乙和女生丙3个人进行测试,记这3个人中通过测试的人数为随机变量ξ,求ξ的分布列和数学期望.解析 (1)设该小组有n 个女生,根据题意,得C 1n C 110-n C 210=815,(3分)解得n =6或n =4(舍去).(5分) ∴该小组中有6个女生.(6分)(2)由题意知,ξ的所有可能取值为0,1,2,3, P (ξ=0)=13×13×14=136,(7分)P (ξ=1)=C 12×23×13×14+(13)2×34=736,(8分) P (ξ=2)=C 12×23×13×34+(23)2×14=49,(9分) P (ξ=3)=(23)2×34=13.(10分)∴ξ的分布列为(11分)∴E (ξ)=0×136+1×736+2×49+3×13=2512.(12分)2.(2014·江西红色六校二次联考)(本小题满分12分)某企业招聘工作人员,设置A ,B ,C 三组测试项目供参考人员选择,甲、乙、丙、丁、戊五人参加招聘,其中甲、乙两人各自独立参加A 组测试,丙、丁两人各自独立参加B 组测试.已知甲、乙两人各自通过测试的概率均为13,丙、丁两人各自通过测试的概率均为12.戊参加C 组测试,C 组共有6道试题,戊会其中4题.戊只能且必须选择4题作答,至少答对3题则竞聘成功.(1)求戊竞聘成功的概率;(2)求参加A 组测试通过的人数多于参加B 组测试通过的人数的概率; (3)记A 、B 组测试通过的总人数为ξ,求ξ的分布列和期望. 解析 (1)设戊竞聘成功为A 事件,则P (A )=C 44+C 34C 12C 46=1+815=35.(3分) (2)设参加A 组测试通过的人数多于参加B 组测试通过的人数为B 事件, 则P (B )=C 12×13×23×(12)2+13×13×(12)2+13×13×C 12×(12)2=736.(6分) (3)ξ的所有可能取值为0,1,2,3,4, P (ξ=0)=23×23×12×12=19,P (ξ=1)=C 12×13×23×12×12+23×23×C 12×12×12=13, P (ξ=2)=13×13×12×12+23×23×12×12+C 12×13×23×C 12×12×12=1336, P (ξ=3)=13×13×C 12×12×12+C 12×13×23×12×12=16, P (ξ=4)=13×13×12×12=136.(10分)所以ξ的分布列为E (ξ)=0×19+1×13+2×1336+3×16+4×136=53.(12分)3.(2014·石家庄一模)(本小题满分12分)现有甲、乙、丙三人参加某电视台的应聘节目《非你莫属》,若甲应聘成功的概率为12,乙、丙应聘成功的概率均为t2(0<t <2),且三个人是否应聘成功是相互独立的.(1)若乙、丙有且只有一个人应聘成功的概率等于甲应聘成功的概率,求t 的值; (2)记应聘成功的人数为ξ,若当且仅当ξ为2时概率最大,求E (ξ)的取值范围. 解析 (1)由题意得2×t 2×(1-t 2)=12,解得t =1.(3分)(2)ξ的所有可能取值为0,1,2,3, P (ξ=0)=(1-12)(1-t 2)(1-t 2)=(2-t )28,P (ξ=1)=12×(1-t 2)×(1-t 2)+2×(1-12)×t 2×(1-t 2)=4-t28,P (ξ=2)=2×12×t 2×(1-t 2)+(1-12)×t 2×t 2=4t -t28,P (ξ=3)=12×t 2×t 2=t 28.故ξ的分布列为(7分)所以E (ξ)=t +12.(8分)由题意得P (ξ=2)-P (ξ=1)=t -12>0,P (ξ=2)-P (ξ=0)=-t 2+4t -24>0,P (ξ=2)-P (ξ=3)=2t -t 24>0.又因为0<t <2,所以t 的取值范围是1<t <2.(11分) 所以32<E (ξ)<52.(12分)4.(本小题满分12分)周先生的船舱中装有6条小鱼和1条大鱼,由于在海上漂流,他计划从当天开始,每天从该船中捕捉1条鱼(每条鱼被抓到的概率相同)并吃掉来维持生计.若大鱼未被捕捉,则它每天要吃掉1条小鱼.(1)求这7条鱼中至少有6条被周先生吃的概率;(2)以ξ表示这7条鱼中被周先生吃掉的条掉,求ξ的分布列及其数学期望. 解析 (1)设周先生能吃到的鱼的条数为ξ,若周先生要吃到7条鱼,则必须在第一天吃掉大鱼,P (ξ=7)=17,若周先生要吃到6条鱼,则必须在第二天吃掉大鱼,P (ξ=6)=67×15=635.故周先生至少吃掉6条鱼的概率是P (ξ≥6)=P (ξ=6)+P (ξ=7)=1135.(4分)(2)周先生能吃到的鱼的条数ξ可取4,5,6,7,最坏的情况是只能吃到4条鱼:前3天各吃掉1条小鱼,其余3条小鱼被大鱼吃掉,第4天吃掉大鱼,其概率为P (ξ=4)=67×45×23=1635,(6分)P (ξ=5)=67×45×13=835,由(1)知P (ξ=6)=635,P (ξ=7)=17.(8分)所以ξ的分布列为(10分)故E (ξ)=4×1635+5×835+6×635+7×17=5.(12分)5.(2014·北京)(每小题满分13分)李明在10场篮球比赛中的投篮情况统计如下(假设各场比赛相互独立):(2)从上述比赛中随机选择一个主场和一个客场,求李明的投篮命中率一场超过0.6,一场不超过0.6的概率;(3)记x 为表中10个命中次数的平均数.从上述比赛中随机选择一场,记X 为李明在这场比赛中的命中次数.比较E (X )与x 的大小.(只需写出结论)思路 (1)利用古典概型求概率;(2)利用互斥事件和独立事件概率计算公式求概率; (3)直接利用数学期望公式求解.解析 (1)根据投篮统计数据,在10场比赛中,李明投篮命中率超过0.6的场次有5场,分别是主场2,主场3,主场5,客场2,客场4.所以在随机选择的一场比赛中,李明的投篮命中率超过0.6的概率是0.5.(3分) (2)记事件A 为“在随机选择的一场主场比赛中李明的投篮命中率超过0.6”,事件B 为“在随机选择的一场客场比赛中李明的投篮命中率超过0.6”,事件C 为“在随机选择的一个主场和一个客场中,李明的投篮命中率一场超过0.6,一场不超过0.6”.则C =A B ∪A B ,A ,B 独立.(5分) 根据投篮统计数据,P (A )=35,P (B )=25.P (C )=P (A B )+P (A B ) =35×35+25×25 =1325.(8分) 所以在随机选择的一个主场和一个客场中,李明的投篮命中率一场超过0.6,一场不超过0.6的概率为1325.(9分)(3)E (X )=x .(13分) 6.(本小题满分12分)我国的高铁技术发展迅速,铁道部门计划在A ,B 两城市之间开通高速列车,假设列车在试运行期间,每天在8:00-9:00,9:00-10:00两个时间段内各发一趟由A 城开往B城的列车(两车发车情况互不影响),A 城发车时间及概率如下表所示:8:00和周日8:20.(只考虑候车时间,不考虑其他因素)(1)求甲、乙两人候车时间相等的概率;(2)设乙候车所需时间为随机变量ξ,求ξ的分布列和数学期望E (ξ).解析 (1)由题意得,甲、乙两人的候车时间分别是10分钟,30分钟,50分钟的概率为P 甲(10)=16,P 甲(30)=13,P 甲(50)=12;P 乙(10)=13,P 乙(30)=12,P 乙(50)=16×16=136.(4分)所以甲、乙两人候车时间相等的概率P =16×13+13×12+12×136=1772.(6分)(2)ξ的所有可能取值为10,30,50,70,90,(单位:分钟) 所以ξ的分布列为数学期望E (ξ)=10×13+30×12+50×136+70×118+90×112=2809.(12分)7.(本小题满分12分)考古工作人员在某遗址经过全面勘探、调查和试掘,判定该遗址有A ,B ,C ,D ,E ,F 六件珍贵物件,且这六件珍贵物件呈如图所示的位置在地底埋藏着,考古工作人员需挖掘出上面的某个物件后才能挖掘其相应位置下面的物件.(1)若要求先挖掘物件A ,B ,C ,E ,求物件E 第3次被挖掘到的概率; (2)设物件E 第X 次被挖掘到,求随机变量X 的分布列与数学期望.解析 (1)由题意,可将上述问题转化为:挖掘4个物件A ,B ,C ,E 进行了4个步骤,且挖掘B 步骤一定在挖掘E 步骤前,物件E 可在第2步、第3步或第4步被挖掘到.方法一 分类列举(不考虑D ,F ):若E 在第2步被挖掘到,则B 必在第1步被挖掘到,故有A 22=2种情况;(1分)若E 在第3步被挖掘到,则B 在E 前选1步被挖掘到,故有C 12A 22=4种情况;(3分)若E 在第4步被挖掘到,则有A 33=6种情况.(4分) 故物件E 第3次被挖掘到的概率P =412=13.(5分)方法二 排组计数(考虑了D ,F ):因为B 必在E 前,即B ,E 步骤顺序一定,故总的可能情况有C 24A 22A 22=24种.(2分) 若E 在第3步被挖掘到,则B 在E 前选1步被挖掘到,故有C 12A 22A 22=8种情况,(4分)故物件E 第3次被挖掘到的概率P =824=13.(5分)(2)由题意,可将上述问题转化为:挖掘6个物件A ,B ,C ,D ,E ,F 进行了6个步骤,且要求A 在D 前,B 在E 前,C 在F 前.则物件E 可在第2步、第3步、第4步、第5步、第6步被挖掘到,即X 的所有可能取值为2,3,4,5,6.P (X =2)=C 24C 22C 26C 24C 22=115,P (X =3)=C 12C 24C 22C 26C 24C 22=215,P (X =4)=C 13C 24C 22C 26C 24C 22=15,P (X =5)=C 14C 24C 22C 26C 24C 22=415,P (X =6)=C 15C 24C 22C 26C 24C 22=13.随机变量X 的分布列为(10分)所以E (X )=2×115+3×215+4×15+5×415+6×13=143.(12分)8.(2014·成都二次诊断)(本小题满分12分)节能灯的质量通过其正常使用时间来衡量,使用时间越长,表明质量越好,且使用时间大于或等于6千小时的产品为优质品.现用A ,B 两种不同型号的节能灯做试验,各随机抽取部分产品作为样本,得到试验结果的频率分布直方图如图所示:以上述试验结果中使用时间落入各组的频率作为相应的概率.(1)现从大量的A ,B 两种型号节能灯中各随机抽取两件产品,求恰有两件是优质品的概率;(2)已知A 型节能灯的生产厂家对使用时间小于6千小时的节能灯实行“三包”.通过多年统计发现,A 型节能灯每件产品的利润y (单位:元)与其使用时间t (单位:千小时)的关系如下表:及数学期望.解析 (1)从A 型号节能灯中随机抽取一件产品为优质品的概率P (A )=12.(1分)从B 型号节能灯中随机抽取一件产品为优质品的概率P (B )=25.(2分)∴从A ,B 两种型号节能灯中各随机抽取两件产品,恰有两件是优质品的概率P =C 12(12)1(12)1×C 12(25)1(35)1+C 22(12)2×C 22(35)2×C 22(12)2×C 22(25)2=37100.(6分) (2)据题意,知X 的可能取值为-40,0,20,40,60,80.(7分) ∵P (X =-40)=C 22(110)2=1100, P (X =0)=C 12(110)1×(25)1=225, P (X =20)=C 12(110)1×(12)1=110, P (X =40)=C 22(25)2=425, P (X =60)=C 12(25)1×(12)1=25, P (X =80)=C 22(12)2=14. ∴X 的分布列为(10分)∴数学期望E (X )=10(-4×1100+0+2×110+4×425+6×25+8×14)=52.(12分)9.(2014·安徽)(本小题满分12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d).思路(1)根据抽样比计算分层抽样中应抽取的人数;(2)利用对立事件或互斥事件的概率公式求运动时间超过4小时的概率;(3)根据K2的计算公式求解.解析(1)300×4 50015 0000=90,所以应收集90位女生的样本数据.(2分)(2)由频率分布直方图,得1-2×(0.025+0.100)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(5分)(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:(7分)每周平均体育运动时间与性别列联表结合列联表可算得K 2=300×(45×60-165×30)275×225×210×90=10021≈4.762>3.841. 所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.(12分) 探究 知识:分层抽样、频率分布直方图、独立性检验.能力:根据频率分布直方图求概率、分层抽样计算女生的人数以及根据K 2进行独立性检验,考查运算求解能力、分析解决问题的能力、数据处理能力以及逻辑思维运算能力.试题难度:中等.10.(2014·山东六校联考)(本小题满分12分)为改善城市雾霾天气造成的空气污染,社会各界掀起净化、美化环境的热潮.某单位计划在办公楼前种植A ,B ,C ,D 四棵风景树,受本地地理环境的影响,A ,B 两棵树种成活的概率均为12,另外两棵树种的成活率都为a (0<a <1).(1)若出现A ,B 有且只有一棵成活的概率与C ,D 都成活的概率相等,求a 的值; (2)当a =23时,记ξ为最终成活的树的数量,求ξ的分布列和数学期望E (ξ).思路 本题以社会热点问题为命题背景,考查概率的计算、随机变量ξ的分布列和数学期望E (ξ)的计算.(1)根据A ,B 有且只有一棵成活的概率与C ,D 都成活的概率相等列出等式即可求出a 的值;(2)考查离散型随机变量的期望值,求解离散型随机变量的问题,首先根据题意分别求出随机变量ξ的可能取值对应的概率,列出ξ的分布列,再根据期望公式计算E (ξ)的值.解析 (1)由题意,得2×12×(1-12)=a 2,解得a =22.(4分)(2)依题意,随机变量ξ的所有可能取值为0,1,2,3,4, 则P (ξ=0)=C 02×(1-12)2×C 02×(1-23)2=136,P (ξ=1)=C 12×12×(1-12)×C 02×(1-23)2+C 02×(1-12)2×C 12×23×(1-23)=16, P (ξ=2)=C 22×(12)2×C 02×(1-23)2+C 12×12×(1-12)×C 12×23×(1-23)+C 02×(1-12)2×C 22×(23)2=1336, P (ξ=3)=C 22×(12)2×C 12×23×(1-23)+C 12×12×(1-12)×C 22×(23)2=13, P (ξ=4)=C 22×(12)2×C 22×(23)2=19.(9分) 所以ξ的分布列为E (ξ)=0×136+1×16+2×1336+3×13+4×19=73.(12分)11.(2014·南昌二模)(本小题满分12分)某公司生产产品A ,产品质量按测试指标分为:指标大于或等于90为一等品,大于或等于80小于90为二等品,小于80为三等品,生产一件一等品可盈利50元,生产一件二等品可盈利30元,生产一件三等品亏损10元.现随机抽查熟练工人甲和新工人乙生产的这种产品各100件进行检测,检测结果统计如下:估计为他们生产产品A 为一等品、二等品、三等品的概率.(1)计算新工人乙生产三件产品A 给工厂带来盈利大于或等于100元的概率;(2)记甲、乙两人分别生产一件产品A 给工厂带来的盈利和为X ,求随机变量X 的概率分布和数学期望.解析 甲生产一件产品A 为一等品、二等品、三等品的概率分别为310,610,110,(3分)乙生产一件产品A 为一等品、二等品、三等品的概率分别为110,710,210.(6分)(1)记“新工人乙生产三件产品A 给工厂带来盈利大于或等于100元”为事件D ,则D 包含的情况有:三件都是一等品;两件是一等品,一件是二等品或一件是一等品,两件是二等品.故P (D )=(110)3+3×(110)2×710+3×110×(710)2=1691 000.(8分)(2)随机变量X 的所有可能取值为100,80,60,40,20,-20. P (X =100)=310×110=3100,P (X =80)=310×710+110×610=27100,P (X =60)=610×710=42100=2150,P (X =40)=310×210+110×110=7100,P (X =20)=610×210+110×710=19100,P (X =-20)=110×210=2100=150.所以随机变量X 的概率分布为(10分)E (X )=300+2 160+2 520+280+380-40100=56.(12分)12.(本小题满分12分)甲、乙、丙三人参加某次招聘会、假设甲能被聘用的概率是25,甲、丙两人同时不能被聘用的概率是625,乙、丙两人同时能被聘用的概率是310,且三人各自能否被聘用相互独立.(1)求乙、丙两人各自能被聘用的概率;(2)设ξ表示甲、乙、丙三人中能被聘用的人数与不能被聘用的人数之差的绝对值,求ξ的分布列与数学期望.解析 (1)记甲、乙、丙各自能被聘用的事件分别为A 1,A 2,A 3,由已知A 1,A 2,A 3相互独立,且满足⎩⎪⎨⎪⎧P (A 1)=25,[1-P (A 1)][1-P (A 3)]=625,P (A 2)P (A 3)=310.(3分)解得P (A 2)=12,P (A 3)=35.所以乙、丙两人各自能被聘用的概率分别为12,35.(6分)(2)ξ的所有可能取值为1,3.因为P (ξ=3)=P (A 1A 2A 3)+P (A 1 A 2 A 3) =P (A 1)P (A 2)P (A 3)+[1-P (A 1)][1-P (A 2)][1-P (A 3)] =25×12×35+35×12×25=625,(8分) 所以P (ξ=1)=1-P (ξ=3)=1-625=1925.所以ξ的分布列为所以E (ξ)=1×1925+3×625=3725.(12分)。