第四章随机变量的数字特征【基本要求】理解随机变量的数学期望与方差的概念,掌握它们的性质与计算方法;掌握计算随机变量函数的数学期望方法;掌握二项分布、泊松分布、正态分布和指数分布的数学期望和方差;了解协方差、相关系数、矩的概念、性质及计算方法。
【本章重点】数学期望与方差的概念、性质与计算方法;求随机变量函数的数学期望的方法;二项分布、泊松分布、正态分布和指数分布的数学期望和方差。
【本章难点】数学期望与方差的概念计算方法;随机变量函数的数学期望的计算方法;协方差、相关系数、矩的概念、性质及计算方法【学时分配】7-9学时分布函数:)xF≤=——全面描述随机变量X取值的统计规律。
但是,在实际问题中PX)((x分布函数的确定并不是一件容易的事,而且有时我们也不需要知道分布函数,只需知道随机变量的某些数字特征就够了。
例如:评价粮食产量,只关注平均产量;研究水稻品种优劣,只关注每株平均粒数;评价某班成绩,只关注平均分数、偏离程度;评价射击水平,只关注平均命中环数、偏离程度。
描述变量的平均值的量——数学期望,描述变量的离散程度的量——方差。
§4.1 数学期望教学目的:使学生理解掌握随机变量的数学期望的实际意义及概念,会计算具体分布的数学期望;使学生理解掌握随机变量函数的数学期望的计算及数学期望的性质。
教学重点、难点:数学期望的概念及其计算;随机变量函数的数学期望的计算及数学期望的性质。
教学过程:(一) 数学期望的概念先看一个例子:一射手进行打靶练习,规定射入 区域2e 得2分, 射入区域1e 得1分,脱靶即射入区域0e 得0分.设射手一次射击的得分数X 是一个e 0 随机变量,而且X 的分布律为P{X=k}=k p ,k=0,1,2现射击N 次,其中得0分0a 次,得1分1a 次,得2分2a 次,0a +1a +2a =N.则他射击N 次得分的总和为0a 0+ 1a 1+ 2a 2,他平均一次射击的得分数为∑==⨯+⨯+⨯2210210k k N ak N a a a ,因为当N 充分大时, 频率k p 概率稳定值−−→−N a k 。
所以当N 充分大时, 平均数∑=−−→−2k k k p x x 稳定值。
显然,数值∑=2k k k p x 完全由随机变量X 的概率分布确定,而与试验无关,它反映了平均数的大小。
定义:1.离散型随机变量的数学期望:设离散型随机变量X 的分布律为{}k k P X x p ==,1,2,3k =…若级数1k k k x p ∞=∑绝对收敛,则称级数1k k k x p ∞=∑为随机变量X 的数学期望,记为()E X ,即()E X =1k k k x p ∞=∑。
2.连续型随机变量的数学期望:设连续型随机变量X 的密度函数为()f x ,若积分()xf x dx ∞-∞⎰绝对收敛,则称积分()xf x dx ∞-∞⎰的值为随机变量X 的数学期望,记为()E X 。
即()E X =()xf x dx ∞-∞⎰。
数学期望简称期望,又称为均值。
(二) 数学期望的计算关键是:求出随机变量的分布律或者密度函数。
1、离散型——若则()E X =1k k k x p ∞=∑ (绝对收敛)2、连续型——若X ~ 密度函数,则()E X =()xf x dx ∞-∞⎰ (绝对收敛)例1 甲、乙两个工人,生产同一种产品,在相同条件下,生产100件产品所出的废品数分别用X 、Y 表示,它们的概率分布如下:问这两个工人谁的技术好?解: ()E X =00.710.120.130.10.6⨯+⨯+⨯+⨯=,()E Y =00.510.320.2300.7⨯+⨯+⨯+⨯=甲工人生产出废品的均值较小,甲的技术好。
例2 有5个相互独立工作的电子装置,它们的寿命X k (k=1,2,3,4,5)服从同一指数分布,其概率密度为()⎪⎩⎪⎨⎧≤>=-.0,0,0,1x x e x f x θθ,0>θ,(1)若将这5个电子装置串联连接组成整机,求整机寿命(以小时记)N 的数学期望。
(2)若将这5个电子装置并联连接组成整机,求整机寿命(以小时记)M 的数学期望。
分析:5个电子装置串联,整机寿命{}54321,,,,min X X X X X N =,并联,整机寿命{}54321,,,,max X X X X X M =,要求N ,M 的数学期望,关键求N,M 的密度函数).(),(max min x f x f解: (1)k X ()5,4,3,2,1=k 的分布函数为()⎪⎩⎪⎨⎧≤>-=-.0,0,0,1x x e x F x θ。
因为5个电子装置串联,所以整机寿命{}54321,,,,min X X X X X N =的分布函数为()()[]⎩⎨⎧≤>-=--=-.0,0,0,11155min x x e x F x F x θ,因而N 的概率密度为()⎩⎨⎧≤>=-.0,0,0,55min x x e x f x θθ,于是N 的数学期望为,()5)(055min θθθ===⎰⎰+∞-+∞∞-dx e x dx x xf N E x 。
(2) 因为5个电子装置并联,所以整机寿命{}54321,,,,max X X X X X M =的分布函数为()()[][]⎪⎩⎪⎨⎧≤>-==-.0,0,0,155max x x e x F x F x θ,因而N 的概率密度为 ()[]⎪⎩⎪⎨⎧≤>-=--.0,0,0,145m ax x x e e x f xx θθθ,于是N 的数学期望为()[]θθθθ601371)(045max =-==⎰⎰+∞--+∞∞-dx ee x dx x xf N E xx 。
我们可以看到()()4.11≈N E M E ,即5个电子装置并联联接工作的平均寿命是串联联接工作的平均寿命的11.4倍。
例3 按规定,某车站每天8:00~9:00,9:00~10:00都恰有一辆客车到站,但到站的时间是随机的,且两者到站的时间相互独立。
其规律为分析 :第一车8:30到站10分钟,第一车8:50到站30分钟解 设旅客候车的时间为X(以分记),则X 的的可取值为10、30、50、70、90. 且 P{X=10}=P “第一班车8:30到站”=63. P{X=30}= P “第一班车8:50到站”=62.P{X=50}= P “第一班车8:10到站,且第二班车9:10到站”= 3616161=⨯P{X=70}= P “第一班车8:10 到站,且第二班车9:30到站” = 3636361=⨯P{X=90}= P “第一班车8:10 到站,且第二班车9:50到站” = 3626261=⨯即X 的分布列为X 的数学期望为所以若旅客8:20到站,则他候车时间的数学期望为27.22(分)。
例4 一个人数很多的团体中普查某种疾病,为此要抽验N 个人的血,可以用两种方法进行。
(1)将每个人的血分别去验,这就需验N 次。
(2)按k 个人一组进行分组.把k 个人抽来的血混合在一起进行检验,如果这混合血液显阴性反应,就说明k 个人的血都显阴性反应,这样,这k 个人的血就只需验一次。
若显阳性,则再将对这k 个人的血液分别进行化验,这样,这k 个人的血总共要化验k+1次,假设每个人化验显阳性的概率为p ,且这些人的试验反应是相互独立的。
试说明当p 较小时,选取适当的k ,按第二种方法可以减少化验的次数。
并说明k 取什么值时最适宜。
解 若按第二种方法,以k 个人为一组进行化验,记1-p=q ,设组内每个人化验的次数为X ,则X 的可取值为kk k 1,1+.由于各人是否显阴性是相互独立的,所以:P{kx 1=}= P “k 个人的混合血显阴性”= P “k 个人的血都显阴性”=P{kk x 1+=}=P (k 个人的混合血显阳性)= P (k 个人的混合血不阴性)=k q -1 故每个人化验次数X 的期望值为:当时,在普查中平均每人的化验次数就小于1,从而第二种方法可以减少化验的次数。
显然,p 愈小这种方法愈有利。
当p 已知时,可选定使kq k 1-达最大即达最小,以个人为一组进行化验,将能最大限度地减少化验次数。
例如p=0.1即q=0.9时可用赋值法求函数kq k 1-的最大值:可见,当k=4时,函数kq k -有最大值0.4,说明以4个人为一组进行化验能减少40%的工作量。
(三)随机变量函数的数学期望1、已知X 的分布,求Y=g(X) 的数学期望E(Y)我们经常需要求随机变量的函数的数学期望,例如飞机机翼受到压力W=kV 2(V 是风速,k>0 是常数)的作用,需要求W 的数学期望,这里W 是随机变量V 的函数。
这时,可以通过下面的定理来求W 的数学期望。
定理 设Y 是随机变量X 的函数,()Y g X =(g 是连续函数)(1) X 是离散型随机变量,它的分布律为{}k k P X x p ==,k =1,2,3,…,若1()k k k g X p ∞=∑绝对收敛,则有()[()]E Y E g x ==1()k k k g x p ∞=∑(2) X 是连续型随机变量,它的概率密度为()f x ,若()()g x f x dx +∞-∞⎰绝对收敛,则有()[()]E Y E g x ==()()g x f x dx +∞-∞⎰证明: 设X 是连续型随机变量,且y=g(x)满足第二章§5中定理的条件。
由第二章§5中的(5.2)式知道随机变量Y=g(X)的概率密度为⎩⎨⎧<<= . ,0),('|)]([)(其它βαy y h y h f y f x Y 于是,E (Y )= ⎰⎰=∞∞-βαdyy h y h yf dy y yf x Y |)('|)]([)(当)(y h '恒>0时,E (Y )= ⎰⎰∞∞-=.)()(|)('|)]([dx x f x g dy y h y h yf x βα当)(y h '恒<0时,E (Y )=⎰⎰⎰-∞∞∞∞-=-=-.)()()()()(')]([dx x f x g dx x f x g dy y h y h yf x βα综合上两式,(1.4)得证。
上述定理还可以推广到两个或两个以上随机变量的函数的情况。
给出如下结论: 设Z 是二维随机变量(,)X Y 的函数(,)Z g X Y =,其中g 是二元连续函数, (1)设(,)X Y 是离散型,其分布律为,{}i i ij P X x Y y p ===,,i j =1,2,3,…,则当级数11(,)i i ij i j g x y p ∞∞==∑∑绝对收敛时,有()[(,)]E Z E g x y ==11(,)iiiji j g x y p∞∞==∑∑(3) 设(,)X Y 是连续型,密度函数为(,)f x y ,则当积分(,)(,)g x y f x y dxdy +∞+∞-∞-∞⎰⎰绝对收敛时,有()[(,)]E Z E g x y == (,)(,)g x y f x y dxdy +∞+∞-∞-∞⎰⎰例5 设风速V 在(0,a )上服从均匀分布,即具有概率密度⎪⎩⎪⎨⎧<<=.,0,a v 01)(其它,a v f又设飞机机翼受到的正压力W 是V 的函数:2kV W =(V 是风速,k>0 是常数),求W 的数学期望。