第八讲概率与数理统计一、内容提要:本讲主要是讲解随机事件与概率,古典概率,一维随机变量的分布和数字特征,数理统计的基本概念,参数估计,假设检验,方差分析,回归分析。
二、本讲的重点是:随机事件的关系,二项概率公式,条件概率,分布函数的性质,连续型随机变量的密度函数、分布函数,正态分布,常用随机变量的分布和数字特征。
本讲的难点是:数理统计方面的参数估计,假设检验,方差分析,回归分析。
三、内容讲解:1、随机事件与概率:(1)随机事件的关系与运算:包含:若事件A发生,一定导致事件B发生,那么称事件B包含事件A,记作A B;相等:若两事件A与B相互相互包含,即A B且B A,那么称事件A与B相等,记作A=B 和事件:称“事件A与事件B中至少有一个发生”的事件为A与B的和事件,记为A∪B 积事件:称“事件A与事件B同时发生”的事件为A与B的积事件,记为A∩B简记为AB 互不相容:若事件A与事件B不能同时发生,则称A与B互不相容,记作AB=差事件:称“事件A发生且事件B不发生”的事件为A与B的差,记作A-B对立事件:若事件A与B满足A∪B= ( 为必然事件),同时AB=,称A与B是对立的,记B=交换律:对任意两事件A和B有A∪B=B∪A,AB=BA,结合律:对任意事件A、B、C有A∪(B∪C)= (A∪B)∪C,A∩(B∩C)=(A∩B)∩C分配律:对任意事件A、B、C有A∪(B∩C)=(A∪B)∩(A∪C),A∩(B∪C)=(A∩B)∪(A∩C)(2)概率的公理化定义:设试验的样本空间为,随机事件A为的子集,P(A)为实值函数,若满足下列三条公理:公理1、对于任一随机事件A,有0≤P(A)≤1,公理2、P()=1,P()=0公理3、对于一系列互不相容的事件A1,A2,…A n…有P(A1+ A2+…)=P(A1)+P(A2)+…则称函数P(A)为随机事件的概率。
概率的性质:(i) P()=1-P(A)(ii)(ii)当A B时,有P(B-A)=P(B)-P(A)(iii)当A1,A2,…A n互不相容时,有P(A1+ A2+…)=P(A1)+P(A2)+…P(A n)(iv)P(A∪B)=P(A)+P(B)-P(AB)(2)条件概率与相互独立性:条件概率:如果A、B是随机试验的两个事件,且P(B)>0,则称事件B发生的条件下事件A的概率为事件B发生条件下事件A发生的条件概率,记作P(A|B)条件概率可以通过下列公式计算:( P(B)>0)乘法定理:两事件的积事件的概率等于其中一事件的概率与另一事件在前一事件出现下的条件概率的乘积:P(AB)=P(A)P(B|A)( P(A)>0)P(AB)=P(B)P(A|B)( P(B)>0)全概率公式:设事件A1,A2,…A n两两相斥,且事件B为事件A1+A2+…+A n的子事件,A1+A2+…+A n=,且P(A i)>0,则对任一事件B有P(B)=P(A1)P(B| A1)+ P(A2)P(B| A2)+…+ P(A n)P(B| A n)这个公式称为全概率公式,贝叶斯公式事件的相互独立性:若P(AB)=P(A)P(B),则称A、B相互独立。
当P(A)、P(B)都不为零时,从事件A、B相互独立能推得(B|A)=P(B)或P(A|B)=P(A)定理:若四对事件A、B;A、;、B;、中有一对相互独立,则另外三对也是相互独立的。
(4)重复独立试验、二项概率公式:重复独立试验:做几个试验,它们是完全同样一个试验的重复,且它们是相互独立的,即相应于每一次试验的随机事件的概率都不依赖于其它各次试验的结果,称这类试验是重复独立试验。
二项概率公式:设每个试验中事件A出现的概率为p,则n次重复独立试验中事件A恰好出现k次的概率(k=0,1,2,…,n)此公式称为二项概率公式。
例1、某人投篮,每次命中率为0.7,至少命中4次的概率是多少?解:利用二项公式得:因为有“至少”二字,所以k可为4或5所以至少命中4次的概率为:0.36+0.17=0.53例1、有三批同一规格的产品存放在一起,各批产品分别占存时的40%、35%、25%,而次品率分别为2%、1%、3%,若从这堆存品中随机地抽取一个产品,则它是次品的概率为多少。
解:利用全概率公式得:P(B)=P(A1)P(B|A1)+ P(A2)P(B|A2)+ P(A3)P(B|A3)=0.4×0.02+0.35×0.01+0.25×0.03=0.019例2、两个小组生产同样的零件,第一组的废品率为2%,第二组产品为第一组的2倍,而废品率为3%,若两组生产的零件放在一起,从中任选一件,经检查是废品,则这件废品是第一组生产的概率为多少。
解:由全概率公式可得:2、古典概型:具备下面两个特点的随机试验的数学模型称为古典概型:(1)可能的试验结果的个数是有限的,记为n个;(2)两两互斥的诸基本事件出现的可能性相等。
这时,称所讨论的问题是古典概型。
对于满足古典概型下的随机事件A的概率可用下式计算:p(A)=m/n,其中m为随机事件A所所包含的试验结果的个数。
例4、从一批由90件正品、3件次品组成的产品中,任取一件产品,求取得正品的概率。
解:3、一维随机变量的分布和数字特征:一维随机变量的概念:一个变量依试验结果的改变而取不同的实数值,而试验的结果具有随机性,因此这个变量的取值也具有随机性,称这个变量为一维随机变量,记为X。
3.1随机变量的分布函数:定义:随机变量X取值不大于实数x的概率p(X≤x)叫做随机变量X的分布函数,记作F(x)=p(X≤x)性质:分布函数具有以下的性质:(1)3.2离散型随机变量及其分布:有一类随机变量,它所有可能取的值是有限个或可数多个数值,这样的随机变量称为离散型随机变量,它的分布称为离散型分布。
其分布可用下列表格给出:Xx2…x i…概率p1p2…p i…3.4随机变量函数的分布:3.5随机变量的数学期望、随机变量的方差:离散型随机变量的数学期望定义:连续型随机变量的数学期望的定义:随机变量的方差定义:D(X)=E(X-E(X))2随机变量的期望、方差的性质:(1)E(k)=k,D(k)=0,其中k为常数;(2)E(kX)=k(X), D(kX)=k2D(X), 其中k为常数(3)E(X+k)= E(X)+k, D(X+k)= D(X) 其中k为常(4)当ξη相互独立时,E(ξ±η)=E(ξ)±E(η),D(ξ±η)=D(ξ)+D(η)3.6常用随机变量的分布和数字特征:例5、列函数中哪个不是随机变量的分布函数( C )例6、设函数F1(x)与F2(x)分别是随机变量x1与x2的分布函数,为使F(x)=a F1(x)-b F2(x)为某一随机变量的分布函数,在下列给定的各组数中应取( A )例7 连续型随机变量X的密度函数一定满足(C)例8、记正态分布N(a,σ2)的分布函数为F a, σ(x),其X~N(-1,4),则下列计算正确的是(D)例9、已知随机变量X服从二项分布,且E(x)=2.4,D(x)=1.44,则二项分布的参数为多少解:E(x)=np=2.4, D(x)=np(1-p)=1.44,可解得n=6,p=0.44、数理统计的基本概念:总体:在统计中,将研究、考察对象的全体称为总体。
也特指某个指标X,X具有随机性,因此研究总体也转化为研究X的分布。
样本:从总体中抽取的一部分个体叫做样本,样本中所所包含的个体的数量叫做样本容量。
一般我们抽取的样本满足下面二个条件:(1)样本中的个体相互独立,(2)样本中个体的分布同总体的分布。
统计量:不含未知参数的样本函数称为统计量。
例如:从均值为μ方差为σ2的总体中抽得一个样本量为n的样本X1,X2,…Xn其中μ、σ2未知,那么X1+ X2,max{X1,X2,…Xn}是统计量,而X1+ X2-2μ、(X1-μ)/σ都不是统计量。
例10、总体X服从参数为λ的指数分布,X1,X2,…Xn是从中抽取的样本,试求5、参数估计、假设检验: 5.1参数估计:设总体X服从f(x,θ)的分布,其中θ为未知参数,X1,X2,…Xn是从总体X中抽取的样本,用样本的函数即统计量去估计未知参数,这就是参数估计。
参数估计有两种形式:点估计和区间估计。
点估计:若取样本的某个函数作为未知参数估计量,则称为θ的点估计量,称为θ的点估计值。
求点估计常用的方法为矩法估计:即总体均值E(X)用样本均值来估计,总体方差区间估计:例11、设一个物体的重量μ未知,为估计其重量,可以用天平去称,所得称重与实际值间是有误差的,因此所得的称重是一个随机变量,通常服从正态分布,如果已知称量的误差的标准差为0.1克,为使μ的95%的置信区间的长度不超过0.1,那么至少应该称多少次?解:这是求样本容量的问题。
在标准差已知时,μ的95%的置信区间为:5.2 假设检验:假设检验的基本步骤:(1)、建立假设(2)、选择检验统计量,给出拒绝的形式(3)、给出显著性水平α,常取α为0.05(4)、定出临界值c,写出拒绝域W,作出判断。
正态总体中均值μ的假设检验:H0:μ=μ0,H0:μ≠μ0例12、某电工器材厂行产一种云母带,其厚度在正常生产下服从N(0.13,0.0152),某日在生产的产品中抽查了10次,发现平均厚度为0.136,如果标准差不变,试部生产是否正常?取α为0.05由于样本观测值未落在拒绝域中,所以不能拒绝原假设,可以认为该天生产正常。
6、用的统计技术:方差分析与回归分析。
方差分析的基本假定是:(1)在水平Ai下,指标服从正态分布;(2)在不同水平下,方差相等(3)数据Yij相互独立。
回归分析:平方和分解公式:。