一、基本概率公式及分布1、概率常用公式:P(A+B)=P(A)+P(B)-P(AB) ;P(A-B)=P(A)-P(AB) ; 如A、B独立,则P(AB)=P(A)P(B) ; P()=1-P(A) ;B发生的前提下A发生的概率==条件概率:P(A|B)=;或记:P(AB)=P(A|B)*P(B) ;2、随机变量分布律、分布函数、概率密度分布律:离散型X的取值是x k(k=1,2,3...), 事件X=x k的概率为:P{X=x k}=P k, k=1,2,3...; --- 既X的分布律;X X1 X2 .... xnPk P1 P2 ... pnX的分布律也可以是上面的表格形式,二者都可以。
分布函数:F(x)=P(X), -; 是概率的累积!P(x1<X<x2)=F(x2)-F(x1) ;离散型rv X; F(x)= P{X;(把X<x的概率累加)连续型rvX;F(x)=, f(x)称密度函数;既分布函数F(X)是密度函数f(x)和X轴上的(-∞,x)围成的面积!性质:F(; F(;二、常用概率分布:①离散:二项分布:事件发生的概率为p,重复实验n次,发生k 次的概率(如打靶、投篮等),记为B(n,p)P{X=k}=,k=0,1,2,...n; E(X)=np, D(X)=np(1-p);②离散:泊松分布:X~Π(λ)P{X=k}=,k=0,1,2,...; E(X)=λ, D(X)=λ;③连续型:均匀分布:X在(a,b)上均匀分布,X~U(a,b),则:密度函数:f(x)=分布函数F(x)==④连续型:指数分布,参数为,f(x)=F(x)=;⑤连续型:正态分布:X~N(most importment!密度函数f(x),表达式不用记!一定要记住对称轴x=µ, E(X)=µ,方差D(X)=; 当µ=0,时,N(0,1)称标准正态,图形为:分布函数F(x)为密度函数f(x)从(-∞,x)围成的面积。
当X~N(0,1),F(x)=Φ(x)(换个叫法), 由对称性有Φ(-a)=1-Φ(a);看到X~N(,求概率的题,一定要变成标准正态N(0,1);既把X变成;则~N(0,1);例题:已知X~N(;求P(-1<X<3).解:(思路:µ=1,σ=2;变换式:)P(-1<X<3)=P(-1-1<X-1<3-1)=P()=P()= Φ(1)- Φ(-1)= Φ(1)-[1-Φ(1)]=2Φ(1)-1;查表正态性质:如X~N(N(;则Z=aX+bY也是正态;Z~N(,其中µz=aµ1+bµ2 ; σz²=a²σ1²+b²σ2²;三、二维随机变量:离散型:(X,Y)可能取值(xi,yj)(i,j=1,2,...).联合分布律:P{X=xi,Y=yj)=pij, (i,j=1,2,3,..)联合分布律的表格形式:XYY1 Y2 Y3 P(X=I)X1 P11 P12 P13 P11+P12+P13X2 P21 P22 P23 P21+P22+P23X3 P31 P32 P33 P31+P32+P33P(Y= J) P11+P21+P31P12+P22+P32P13+P23+P33边缘分布:P(X=1)=P11+P12+P13(横排相加); P(X=2),P(X=3)同样计算P(Y=1)=P11+P21+P31(竖排相加); P(Y=2) ,P(Y=3)类似计算;条件概率:X=X1条件下Y的分布律:P{Y=yj|X=x1}==; P{Y=y1|X=x1}=; P{Y=y2|X=x1}=; P{Y=y3|X=x1}=连续型:设f(x,y)是联合概率密度;(注意x,y常常有取值范围D的)则:F(x,y)=P(X<x,Y<y)=; F(∞,∞)=1 . 边缘密度:如XY独立,则f(X,Y)=fx(X)*fy(Y); 反之也成立;X,Y二维正态密度中的参数则X,Y独立;题型:1、f(x)有未知常数,求未知常数;思路:注意x的定义域,利用F(∞)=求出参数;2、求P(X<Y)或P(X+Y>1)类,先画出x=y,x+y=1的图,确定积分上下限,并求积分;3、求Z=X+Y的分布:密度公式四、数学期望、方差数学期望E(X), 方差D(X) :离散:E(X)=; E(g(X))=;连续:E(X)=E(g(X))=性质:E(C)=C, E(CX)=CE(X);E(X+Y)=E(X)+E(Y)如X,Y独立,则E(XY)=E(X)*E(Y);D(X)=E(X; D(C)=0,D(CX)=C²X如X,Y独立,D(X五、样本及抽样分布中心极限定理:E(X)=µ,D(X)=σ²的独立同分布的X1,X2,X3...Xn,当n充分大时,有:~N(0,1);是Xi的和;样本及抽样分布:从总体X中抽取一个个体,独立抽n次,记为X1,X2,...Xn, 它们组成独立、同分布的随机变量,叫随机样本,n是样本容量,X1,X2,..Xn的观测值x1,x2,x3...xn叫样本值。
如总体X的分布函数是F,密度是f; 则:F(x1,x2,..xn)=F(x1)*F(x2)*...*F(xn)=;f(x1,x2,...,xn)=;重要统计量:样本均值:=; 样本方差S²=; 如总体X的E(X)=µ,D(X)=σ²,则E(,D(;六、正态总体分布常用统计量:1、卡方χ²:X1,X2,...是来自总体X~N(0,1)的样本,χ²=X1²+X2²+...+Xn², 则称χ²~χ²(n)为自由度n卡方分布;性质:E(χ²)=n , D(χ²)=2n ;卡方χ²的上分位点:给定0<a<1, 满足P{χ²>χa²(n)}=a的χa²(n),已知a,n,查表可χ²(n);a2、t分布:X~N(0,1),Y~χ²(n),XY互相独立,t=,称自由度为n的t分布,记t~t(n); 图形和N(0,1)类似;t分布的上分位点:给定0<a<1, 满足P{t>t a(n)}=a的,已知a,n,查表可t分布的图形:,3、F分布:U~χ²(n1) ;V~χ²(n2) ,且UV互相独立,F=; 是自由度为(n1,n2)的F分布,记F~F(n1,n2);F分布的上分位点:给定0<a<1, 满足P{F>Fa(n1,n2)}=a的χa ²,已知a,n1,n2,查表可;F分布性质:1-a(n1,n2)=1/a(n2,n1) ; 正态总体N(µ,σ²)的平均值和方差分布:E(, D(; D(S²)=σ²;性质1:平均值~N(µ,;2:~χ²(n-1); 卡方χ²分布;3:~t(n-1) ;t分布;4:X~N(µ1,), Y~N(µ2,) ; S1,S2是对应方差;~F(n1-1,n2-1) ;七、参数估计1、最大似然估计法:离散型总体X,其分布律P{X=x}=p(x;,待定参数,Xi(i=1,2..n)是个体样本,xi(i=1,2,..n)是样本取样值,则Xi(i=1,2..n)的联合分布律为:(既Xi(i=1,2..n)的积事件);似然函数L(;把如L(=0时,可解得,称最大似然估计值。
为计算方便;可=0 ,计算出,正态X)的最大似然估计量为:=,=;2、无偏估计:指估计量的数学期望E()=;如E(,称是总体均值D(S²)=σ²,称样本方差是总体方差的无偏估计;其中,样本方差S²=,分母是n-1,不是n!.3、区间估计:置信区间:给定a(0<a<1),理解为概率,来自总体X的样本X1,X2,...Xn的统计量(如均值,方差等)在)之间,使得抽样样本的概率在1-a。
则称(为置信水平1-a的置信区间。
连续型rv:a已知,利用P()=1-a, 求出;常用的正态分布公式是:~N(µ,;题型:①求的置信水平为1-a的置信区间:a、变换成标准正态;令Y=, 则Y~N(0,1);上分位点可查表得出,由于N(0,1)的对称性,下分位点是-;b、由-<<; 得<;就是的置信区间。
见图!②求的置信水平为1-a的置信区间:~t(n-1);由P(>t a/2(n-1))=a/2, 查表得上分位点t a/2(n-1) ,由于t函数对称性,下分位点是- t a/2(n-1) ;- t a/2(n-1)< < t a/2(n-1) ;既得的置信区间(* t a/2(n-1))③方差的置信区间(未知);~χ²(n-1); 卡方χ²分布;给定a, 查表可得上下分位点χ²a/2 (n-1)和χ²1-a/2 (n-1) ;解χ²a/2 (n-1)<(n-1)S²/σ²<χ²1-a/2 (n-1)得方差的置信区间:(,)④两个正态总体X~N(,Y~N(的置信区间;来自总体X的样本X1,X2,...Xn1, 均值,方差S1²;来自总体Y的样本Y1,Y2,... Yn2, 均值,方差S2²;a、的置信区间:1)、已知,设Z=, 则Z~N(既~N(0,1,上分位点为Z a/2; 置信区间为:(Z a/2)2)、=(未知),; 置信区间:((n1+n2-2))其中:S²w=;b、两个方差之比的置信区间,均未知。
由:~F(n1-1,n2-1);给定a, F分布的上下分位点分别为F a/2(n1-1,n2-1), F1-a/2(n1-1,n2-1),有:F a/2(n1-1,n2-1)<< F1-a/2(n1-1,n2-1) ;置信区间:( ,);八、假设检验方法:给定较小的a值(0.01,0.05), 得到上分布点Z a/2; 当统计量、等<Z a/2时,说明假设(H0)成立, 否则假设不成立(H1), a称显著性水平。
双边检验:H0:, H1:; H0的拒绝域为Z>Za时;左检验:H0:, H1:; H0的拒绝域为Z>Za时;右检验:H0:, H1:; H0的拒绝域为Z<Za时;,∴总体抽样的个体,分布在<Za的概率要大。