概率统计常见题型及方法总结Prepared on 22 November 2020常见大题:1. 全概率公式和贝叶斯公式问题 B 看做“结果”,有多个“原因或者条件iA ”可以导致B这个“结果”发生,考虑结果B 发生的概率,或者求在B 发生的条件下,源于某个原因iA 的概率问题全概率公式:()()()1B |ni i i P B P A P A ==∑贝叶斯公式:1(|)()()()()ni i i jjj P A B P A P B A P A P BA ==∑||一(12分)今有四个口袋,它们是甲、乙、丙、丁,每个口袋中都装有a 只红球和b 只白球。
先从甲口袋中任取一只球放入乙口袋,再从乙口袋中任取一只球放入丙口袋,然后再从丙口袋中任取一只球放入丁口袋,最后从丁口袋中任取一球,问取到红球的概率为多少解 i B 表示从第i 个口袋放入第1+i 个口袋红球,4,3,2,1=ii A 表示从第i 个口袋中任取一个球为红球,2分 则ba aB P +=)(1, 2分)()()()()(1111111B A P B P B A P B P A P += 111++++++++=b a a b a b b a a b a a ba a+= 2分 依次类推 2分ba aA P i +=)( 二(10分)袋中装有m 只正品硬币,n 只次品硬币(次品硬币的两面均印有国徽),在袋中任取一只,将它投掷r 次,已知每次都出现国徽,问这只硬币是次品的概率为多少、解 记B ={取到次品},B ={取到正品},A ={将硬币投掷r 次每次都出现国徽} 则()(),n m P B P B m n m n==++,()1P A B =,()12r P A B =―—5分 ()()1()212()()()()12r rr nP B P A B n m n P B A n m n m P B P A B P B P A B m n m n ⨯+===++⨯+⨯++三、(10分)一批产品共100件,其中有4件次品,其余皆为正品。
现在每次从中任取一件产品进行检验,检验后放回,连续检验3次,如果发现有次品,则认为这批产品不合格。
在检验时,一件正品被误判为次品的概率为,而一件次品被误判为正品的概率为。
(1)求任取一件产品被检验为正品的概率;(2)求这批产品被检验为合格品的概率。
解 设 A 表示“任取一件产品被检验为正品”, B 表示“任取一件产品是正品”,则()96100P B =,()4100P B =,()|0.95P A B =,()|0.01P A B = (1)由全概率公式得()()()()()||0.9124P A P B P A B P B P A B =+=(2)这批产品被检验为合格品的概率为()330.91240.7596p P A ===⎡⎤⎣⎦四、在电报通讯中不断发出信号‘0’和‘1’,统计资料表明,发出‘0’和‘1’的概率分别为和,由于存在干扰,发出‘0’时,分别以概率和接收到‘0’和‘1’,以的概率收为模糊信号‘x ’;发出‘1’时,分别以概率和收到‘1’和‘0’,以概率收到模糊信号‘x ’。
(1)求收到模糊信号‘x ’的概率;(2)当收到模糊信号‘x ’时,以译成哪个信号为好为什么解 设i A =“发出信号i ”)1,0(=i , i B =“收到信号i ”),1,0(x i =。
由题意知6.0)(0=A P , 4.0)(1=A P , 2.0)|(0=A B P x ,1.0)|(1=A B P x 。
(1)由全概率公式得)()|()()|()(1100A P A B P A P A B P B P x x x += 4分16.04.01.06.02.0=⨯+⨯=。
2分(2)由贝叶斯公式得75.016.06.02.0)()()|()|(000=⨯==x x x B P A P A B P B A P , 3分25.075.01)|(1)|(01=-=-=x x B A P B A P 3分二、随机变量函数的分布及其边缘密度及其独立性的判断 记住如下知识点: 常见分布律和概率密度:一般正态分布的计算转化为标准正态分布去做:连续随机变量X:二维随机变量的分布函数:联合密度:掌握如下解决随机变量函数分布的解题方法:对于二维随机变量函数的概率密度,注意:除了求随机变量 Z=X+Y 的密度函数用公式:()(,)(,)Z f z f x z x dx f z y y dy+∞+∞-∞-∞=-=-⎰⎰注意:先写出联合密度:(,y)f x ,根据联合密度写出(,)f x z x -或者(,)f z y y -,在平面x0z 或者y0z 上画出被积函数(,)f x z x -不为零的区域,然后穿线通过区域确定x 的上下限。
他的函数Z = g ( X , Y )的概率密度,只能使用分布函数法 其步骤如下: 第一步 求联合密度:(,y)f x ,根据联合密度写出(,)f x z x -或者(,)f z y y -第二步 求z 的分布函数:()Z F z {}P Z z =≤{2}P X Y z =+≤(,)(,)g x y zf x y dxdy≤=⎰⎰难点是画出二重积分的积分区域,然后把二重积分化为二次积分定上下限,画图:先画出被积函数也就是联合密度非零的区域,再确定区域(,)g x y z ≤与密度非零区域的重合区域就是二重积分的积分区域,穿线定积分限:然后左右穿或者上下穿个积分区域定内限,求出分布函数第三步 求密度函数:()()Z Z f z F z '= 分析:一、设总体X 服从(0,1)上的均匀分布,12,,,n X X X 是来自总体X 的一个样本,最大顺序统计量),,,max (21)(n n X X X X =, 1.求随机变量)(n X 的概率密度;解:⎩⎨⎧<<=其它,010,1)(~x x f X ,其分布函数为⎪⎩⎪⎨⎧≥<<≤=1,110,0,0)(x x x x x F而),,,max (21)(n n X X X X =的分布函数为})),,,{max(}{)(21)()(z X X X P z X P z F n n X n ≤=≤=}),,,{21z X z X z X P n ≤≤≤= n z F )]([=()()z F z f n n XX )()('=()[]()z f z F n n 1-=1-=n nz ,)10(<<z 二、(10分)设二维随机变量(),X Y 的概率密度为(),0,0,y Ae x yf x y -⎧≤≤=⎨⎩其它(1)求常数A 的值;(2)求X 与Y 的协方差(),Cov X Y 。
解 (1)由()01,yy f x y dxdy dy Ae dx A ∞∞∞--∞-∞===⎰⎰⎰⎰,得1A =(2)()()201,12y y yE X xf x y dxdy dy xe dx y e dy +∞+∞∞∞---∞-∞====⎰⎰⎰⎰⎰()()301,32y yyE XY xyf x y dxdy dy xye dx y e dy +∞+∞∞∞---∞-∞====⎰⎰⎰⎰⎰()()20,2yyy E Y yf x y dxdy dy ye dx y e dy +∞+∞∞∞---∞-∞====⎰⎰⎰⎰⎰()()(),321Cov X Y E X E Y ==-=三(16分)设二维随机变量),(Y X 的概率密度为⎩⎨⎧>>=+-其它,00,0,),()(y x e y x f y x(1) 求边缘密度函数)(x f X ,)(y f Y ; (2) 求边缘分布函数)(x F X ,)(y F Y ; (3) 判断X 与Y 是否相互独立; (4) 求)1(>+Y X P 。
(1) ()(,)X f x f x y dy +∞-∞=⎰,当x ≤0时,(,)f x y =0,于是()X f x =0当x >0时,()X f x =y x xe dy e +∞--=⎰,所以X 的边缘概率密度为()X f x =⎩⎨⎧≤>-0,00,x x e xY 的边缘概率密度 ()(,)Y f y f x y dx +∞-∞=⎰当y ≤0时, ()Y f y =0当y >0时 ()Y f y =⎩⎨⎧≤>-0,00,y y e y 4分(2) ⎩⎨⎧<-=-其他,00,1)(ye y F y⎩⎨⎧<-=-其他,00,1)(xe x F x 4分(3)独立 4分(3)12(X 1)(,)x y P Y f x y dxdy e+>+>==⎰⎰4分四(10分)设随机变量),(Y X 的概率密度为⎩⎨⎧>>=+-其他,00,0,2),()2(y x e y x f y x求随机变量Y X Z 2+=的分布函数。
⎰⎰≤+=≤+=zy x Z dxdy y x f z Y X P z F 2),(}2{)(当0≤z 时,0)(=z F Z 当0>z 时,z z zxz y x Z ze e dy e dx z F ---+---==⎰⎰12)(020)2(所以Y X Z 2+=的分布函数为 ⎩⎨⎧>--≤=--0,10,0)(z ze e z z F zz Z 3.中心极限定理的问题:用正态分布近似计算共两类:一类是二项分布的近似计算问题~(,)X b n p(,(1))N np np p -近似~(0,1)(1)N np p -,{}P a X b <≤≈Φ-Φ这个公式给出了n 较大时二项分布的概率计算方法。
另一类是除二项分布之外的其他分布的独立变量连加和的计算问题, 设12,,,,n X X X 独立同分布,()()201,2,,.k k E X D X k n μσ==>=近似有连加和服从正态分布:21~(,)nii XN n n μσ=∑一、 (14分) 设粮仓内老鼠的数目是一个服从泊松分布的随机变量,且仓内无鼠的概率为2-e 。
(1)写出随机变量的分布律;(2)试用中心极限定理计算,在200个同类粮仓内老鼠总数超过350只的概率。
解 (1))2(~πX ; 5分(2)X 表示任意老鼠个数,由中心极限定理 3分⎪⎪⎭⎫⎝⎛⨯⨯->⨯⨯-=>2200220035022002200)350(X P X P 3分⎪⎪⎭⎫⎝⎛⨯⨯-Φ-≈220022003501 3分二、(10分)某保险公司多年的统计资料表明,在索赔户中被盗索赔户占20%,以X表示在随意抽查的100个索赔户中因被盗而向保险公司索赔的数。