一、教学目的与要求1、掌握随机变量的概念,离散型随机变量的分布列,会用Ch1求事件概率的方法,求随机变量的分布列;2、熟悉随机变量的数学期望,方差的概念,会应用分布列求数学期望、方差;掌握数学期望,方差的性质;3、掌握二维随机变量的分布,边际分布的概念,会应用联合分布列求边际分布,会计算二维随机变量的数字特征,会判定随机变量的独立性与相关性。
4、掌握随机变量函数分布的求法,会求随机变量函数的数字特征。
二、教学重点与难点重点是分布列的求法,期望与方差的计算。
难点是二维随机变量联合分布列的求法,期望与方差性质的应用。
§2.1一维随机变量及分布列一.随机变量及其分类1.概念在Ch1里,我们研究了随机事件及其概率,细心的同学可能会注意到在某些例子中,随机事件与实数之间存在某种客观的联系。
例如袋中有五个球(三白两黑)从中任取三球,则取到的黑球数可能为0,1,2本身就是数量且随着随机试验结果的变化而变化的。
又如在“n重贝努里试验中,事件A出现k次”这一事件的概率,若记ξ=n重贝努里试验中A出现的次数,则上述“n重贝努里试验中,事件A出现k次”这一事件可以简记为(ξ=k),从而有P(ξ=k)= C p q q=1-p并且ξ的所有可能取值就是事件A可能出现的次数0,1,2,……n,有些初看起来与数值无关的随机现象,也常常能联系数值来描述。
例如抛掷一枚均匀的硬币可能出现正面,也可能出现反面,约定若试验结果出现正面, 令η=1, 从而{试验结果出现正面}=(η=1);若试验结果出现反面, 令η=0, 从而{试验结果出现反面}=(η=0)。
为了计算n次投掷中出现正面数就只需计算其中“1”出现的次数了。
一般地,若A为某个随机事件,则一定可以通过如下示性函数使它与数值发生联系在上面的例子中,我们遇到了两个随机变量ξ,η,这两个变量取什么值,在每次试验之前是不确定的,因为它的取值依赖于试验的结果,也就是说它的取值是随机的,通常称这种量为随机变量。
从上面例子可以发现,有了随机变量,至少使随机事件的表达在形式上简洁得多了。
在上述前两个例子中,对每一个随机试验的结果自然地对应着一个实数,而在后两个例子中,这种对应关系是人为地建立起来,由此可见,无论哪一种性质,所谓随机变量,不过是随机试验的结果(即样本点)和实数之间的一一对应关系。
这与数学分析中函数的概念本质上是一致的。
只不过在函数概念中,f(x)的自变量x为实数,而随机变量的概念中,随机变量ξ(ω)的自变量为样本点ω,因为对每个试验结果ω都有函数ξ(ω)与之对应,所以ξ(ω)的定义域是样本空间,值域是实数域。
定义1:设随机试验的每一个可能的结果(样本点)ω唯一地对应一个实数,则称实变量为随机变量,通常用希腊字母或大写字母X,Y,Z等表示随机变量,例1:一射手对一射击目标连续射击,则他命中目标的次数为随机变量,的可能取值为0,1,2……例2:某一公交车站每隔5分钟有一辆汽车停靠,一位乘客不知道汽车到达的时间,则侯车时间为随机变量,的可能取值为。
例3:考察某一地区全年的温度的变化情况,则某一地区的温度为随机变量,的可能取值为。
例4:大炮对某一目标射击,弹着点的位置,如果建立如图所示的坐标系,则弹着点就可以用一个二维坐标()表示出来,这时,就要用二维随机变量来描述。
2.随机变量的分类从随机变量的取值情况来看,若随机变量的可能取值只要有限个或可列个则该随机变量为离散型随机变量,不是离散型随机变量统称为非离散型随机变量,若随机变量的取值是连续的,称为连续型随机变量,它是非离散型随机变量的特殊情形。
从随机变量的个数来分,随机变量可分为一维随机变量和多维随机变量,二、一维随机变量及分布列1.定义定义2:定义在样本空间上,取值于实数域R,且只取有限个或可列个值的变量称为一维(实值)离散型随机变量,简称离散型随机变量。
讨论离散型随机变量主要要搞清楚两个方面:一是随机变量的所有可能取值;更主要的的是搞清楚随机变量取这些可能值的概率。
例5:设袋中有五个球(3个白球2个黑球)从中任取两球,则取到的黑球数为随机变量,的可能取值为0,1,2。
===习惯上,把它们写成或0122、分布律如果离散型随机变可能取值为()相应的取值的概率称为随机变量的分布列,也称为分布律,简称分布。
也可以用下列表格或矩阵的形式来表示,称为随机变量的分布律:例6:在n=5的贝努里试验中,设随机事件A在一次试验中出现的概率p,令=5次试验中事件A出现的次数。
则k=0,1,2,3,4,5于是的分布列为0123453、分布列的性质由概率的性质可知,任一离散型随机变量的分布列都具有下述性质:非负性:1)….规范性:2)反过来,任意一个具有以上性质的数列都可以看成某一个随机变量的分布列。
分布列不仅明确地给出了()的概率,而且对于任意的实数a<b,事件()发生的概率均可由分布列算出,因为()=于是由概率的可列可加性有P()=,其中由此可知,取各种值的概率都可以由它的分布列,通过计算而得到,这种事实常常说成是,分布列全面地描述离散型随机变量。
例7:设随机变量的分布列为:P(=i)=c求c的值。
解:的分布列为P(=i)=c由分布列的性质=1 即c例8:一个口袋中有n只球,其中m只白球,无放回地连续地取球,每次取一球,直到取到黑球时为止,设此时取出了个白球,求的分布列。
解:的可能取值为0,1,2,3……mP(=i)=注意:(=i)表示第i次取出白球,第i+1 次取出黑球,例9:抛掷一枚不均匀的硬币,出现正面的概率为p(0<p<1),设为一直掷到正、反都出现时所需要的次数,求的分布列。
解:的所有可能取值为2,3……则P(=k)=+k=2,3……三、几种常用分布1、退化分布设的分布列为P()=1 (a为常数),则称服从退化分布;2、两点分布设的分布列为10p q称服从两点分布或0—1分布或贝努里分布。
3.二项分布设随机变量的分布列为P()=k=0.1.2…n显然1)k=0.1.2….n2)称随机变量服从二项分布认为~b(k;n,p)大家可以发现二点分布是二项分布在n=1的情形。
4.几何分布在贝努里试验中,每次试验成功的概率为p,失败的概率为q=1-p,设试验进行到第次才出现成功。
的分布列为P k=1.2…(k=1.2…)是几何级数的一般项。
因此称它为几何分布记为~g(k;p)。
5.普哇松(Poisson)分布观察电信局在单位时间内收到的呼唤次数,某公共汽车站在单位时间内来站乘车的乘客数等。
可用相应的变量表示,实践表明的统计规律近似地为P()k=0.1.2…其中>0是某个常数,易验证1)P()>0k=0.1.2…2)==1也就是说,若的分布列为P()k=0.1.2…()称服从参数为的普哇松(Poisson)分布,记为~p(k;)在很多实践问题中的随机变量都可以用Poisson 分布来描述。
从而使得Poisson分布对于概率论来说,有着重要的作用,而概率论理论的研究又表明Poisson分布在理论上也具有特殊重要的地位。
下面介绍Poisson分布与二项分布之间的关系Th2.1(Poisson定理)在n 重贝努里试验中,事件A在一次试验中出现的概率为(与试验总数n有关)。
若当时(>0常数)。
则有k=0.1.2…证明:自己阅读P66。
这个定理在近似计算方面有较大的作用,在二项分布中,要计算b(k;n,p)= ,当n和k都比较大时。
计算量比较大,若此时np不太大(即p较小)那么由Poisson定理就有b(k;n,p)其中而要计算有专用的Poisson分布表可查。
例10.已知某中疾病的发病率为1/1000,某单位共有5000人,问该单位患有这种疾病的人数超过5的概率为多大?解:设该单位患这种疾病的人数为.则~其中b(k;5000,1/1000)=这时如果直接计算p()计算量较大。
由于n很大。
P较小。
而np=5不很大。
可以利用Poisson定理p()=1-p()查Poisson分布表得于是p()。
例11.由该商店过去的销售记录知道,某中商品每月销售数可以用参数的Poisson分布来描述,为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?解:设该商店每月销售某种商品件,月底的进货为a件则当()时就不会脱销。
因而按题意要求为又查Poisson分布表得于是这家商店只要在月底进货某种商品15件(假定上月没有存货)就可以以95%的把握保证这种商品在下个月不会脱销。
§2.2 多维随机变量联合分布列和边际分布列一、多维随机变量及其联合分布列1、定义定义1.设是样本空间上的n个离散型随机变量,则称n维向量()是上的一个n维离散型随机变量或n维随机向量。
对于n维随机变量而言,固然可以对它的每一个分量分别研究,但我们可以将它看成一个向量,则不仅能研究各个分量的性质,而且更重要的是要考虑它们之间的联系。
下面主要讨论二维离散型随机变量。
设()是二维离散型随机变量,它们的一切可能取值为()i,j=1,2…i,j=1,2…,注意=。
称= i,j=1,2…为二维随机变量()的联合分布列。
与一维时的情形相似,人们也常常习惯于把二维离散型随机变量的联合分布用下面表格形式表示2.联合分布的性质容易证明二维离散型随机变量的联合分布具有下面的性质:1)非负性:i,j=1,2…2)规范性:3)二.边际分布(边缘分布)设()为二维离散型随机变量,它们的每一个分量的分布称为()关于的边际分布,记为与。
若()的联合分布为i,j…则==由此可以发现,由联合分布列可以唯一确定边际分布,反之,由边际分布不能唯一确定联合分布(反例在下面举)。
大家可以发现,边际分布列的求法只须在联合分布列{}的右方加了一列,它将每一行中的相加而得出,这就是的分布列;相应地在()下面增加一行,它把每一列中的对i 相加而得到恰好就是边际分布列,这也是边际分布列名称的来历。
即例1.设把三个相同的球等可能地放入编号为1.2.3的三个盒子中,记落入第1号中球的个数为,落入第2号盒子中球的个数为,求()的联合分布列及的边际分布列。
解:的可能取值为0.1.2.3(首先确定()的所有可能取值(i,j))然后利用ch1知识计算概率。
当i+j>3时=所以()的联合分布列123例2.把3个白球和3个红球等可能地放入编号为1.2.3的三个盒子中,记落入第1号的盒子中的白球个数为,落入第2号盒子中的红球的个数为,求()的联合分布列和边际分布列。
解:()的可能取值为(i,j=0.1.2.3)显然有,i=0.1.2.30123123比较例1和例2可以发现两者有完全相同的边际分布列,而联合分布列却不同,由此可知边际分布列不能唯一确定联合分布列,也就是说二维随机变量的性质并不能由它的两的分量的个别性质来确定,这时还必须考虑它们之间的联系,由此也就说明了研究多维随机变量的作用。