§2.2 随机变量的数学期望
每个随机变量都有一个概率分布(分布函数,或分布列、概率密度),这种分布完整地刻画了随机变量取值的统计规律性。
由概率分布可以计算出有关随机变量的各个事件的概率。
此外,概率分布还可以确定随机变量的各种特征数,比如,数学期望、方差、中位数等,这些特征数都是用以刻画随机变量(或其概率分布)的某一方面的特征。
例如,考虑某种元件的寿命,如果知道了寿命X 的概率分布,就可以计算出寿命在任一指定范围内的概率,对这种元件的寿命状况提供了一幅完整图景。
根据这一分布,还可以确定用以反映寿命平均水平的特征数-数学期望,用以刻画寿命值的散布程度(或稳定程度)的特征数-方差.这些特征数虽不能对寿命状况提供完整刻画,但却往往是人们最为关注的一个方面.无论在理论上还是在实用中,这些特征数都有着极重要的意义.尤其是实用中,概率分布虽很“完美”,但难以把握;而特征数则容易把握,并且特征数是以一个“醒目”的数值刻画随机变量的某种特征,是概率分布某个方面的概括,这使得应用方便.
一. 数学期望的定义
定义 设离散型随机变量X 的分布列为
i i p x X P ==)(, ,2,1=i
如果
∞<∑∞=1
||i i i p x
则称∑∞=1i i i
p x 为X 的数学期望,记为)(X E ,即
∑∞==
1
)(i i i p x X E 若级数∑∞=1i i i p
x 不绝对收敛,则称X 的数学期望不存在。
由以上定义可看出,若X 只取有限个值,则它的数学期望总是存在的。
而若X 取可列个值,则它的数学期望不一定存在,是否存在就看级数∑∞=1i i i
p x 是否绝对收敛,这个要求的目
的在于使期望值唯一。
因为若无穷级数∑∞=1i i i
p x 只是条件收敛,则可通过改变这个级数各项
的次序,使得改变后的级数不收敛或收敛到任意指定的值,这意味着这个级数的和存在与否,以及等于多少,与X 的取值的排列次序有关,而)(X E 作为刻画X 取值的平均水平的特征数,具有客观意义,不应与X 的取值的排列次序有关。
由定义,X 的期望值就是其所有可能取值的加权平均,每个可能值的权重就是X 取该值的概率,因此X 的数学期望又称为X 的均值。
同时还可看出X 的数学期望完全由X 的概率分布所决定,所以X 的数学期望又叫做X 的分布的数学期望(对一般的随机变量的期望
(或其他特征数)也是如此)。
数学期望这个名称的由来要追溯到17世纪的一个著名的“分赌本”的问题.
期望的定义可以用概率的频率定义来解释:设想X 是一个机会游戏的某个参与者的所得,每次游戏,该参与者以概率)(i x p 赢得i x 元.如果他连续多次玩这个游戏,比如N 次,赢得i x 元的次数记为i n 次,那么在N 次游戏中,他平均所得为i i x N n ∑.由概率的频率定义,在N 很大时,频率N
n i 近乎概率)(i x p ,那么上述平均值近乎于期望值)(X E . 对于连续型随机变量,以积分代替求和,从而得到连续型随机变量的期望的定义.
定义 设连续型随机变量X 的密度函数为)(x p ,如果
∞<⎰+∞
∞-dx x p x )(||
则称 ⎰+∞∞-=dx x xp X E )()(
为X 的数学期望,简称为期望或均值.若⎰+∞
∞-dx x p x )(||不收敛,
则称X 的数学期望不存在. 注:期望这一概念可类比于质量分布的质心这一物理概念.把概率分布看作质量在x 轴上的分布.在离散场合,概率)()(i i x X P x p ==看作点i x 处的质量,那么该质量分布的质心的所在位置的坐标正是期望值)(X E .在连续场合,概率密度函数)(x p 对应于质量分布密度函数.
例 (1)设随机变量X 的分布列为
,)
1(1)1(+=-=n n n X P n )( ,2,1=n X 的数学期望是否存在?
(2) 设随机变量X 的分布列为
,2
1)1(n n n X P =-=)( ,2,1=n X 的数学期望是否存在?若存在,求其期望.
例 某人参加“答题秀”,一共有两个问题;问题1和问题2.他可以自行决定回答问题的顺序.如他先回答问题i ,那么只有回答正确,才被允许回答问题)(i j j ≠,否则不允许回答另一个问题.如果他正确地回答了问题i ,他将获得i v 元奖金.设他能正确地回答了问题i 的概率为i p ,且两个问题能否正确回答相互独立.那么他先回答哪个问题可使他获得奖金的期望值更大?
解:i X 表示他先回问题i 时获得的奖金,2,1=i ,则
1X 的分布列为
111)0(p X P -==,)1()(2111p p v X P -==,21211)(p p v v X P =+=
从而1X 的期望为
21212111)()1()(p p v v p p v X E ++-=
同样地可得
21211212)()1()(p p v v p p v X E ++-=,
因此,如果)1()1(122211p p v p p v ->-,即
2
2211111p p v p p v ->-,他回答问题1可使他获得奖金的期望值更大.
例(例2.2.2)
例 随机变量X 的密度函数为 ⎪⎩⎪⎨⎧<<=else
x x x p ,020,2-1)( 求)(X E .
例 设随机变量X 的密度函数为
)
1(1)(2x x p +π= 问X 的数学期望是否存在?(这种分布称为柯西分布)
二. 期望的性质
如果知道了随机变量X 的概率分布(分布列或概率密度),我们可以唯一地确定X 的数学期望。
而计算X 的函数)(X g (比如2X )的期望也是经常遇到的问题,既然)(X g 本身也是一个随机变量,也有自己的概率分布,这个分布可通过X 的概率分布确定,一旦确定了)(X g Y =的概率分布,那么我们利用)(X g Y =的概率分布计算出)]([X g E 。
另一方面,既然)(X g 的数学期望也完全取决于X 的概率分布,那么我们很自然地会想到能否直接利用X 的概率分布去计算)(X g 的数学期望?下面定理回答了这个问题。
定理 (1)若随机变量X 的分布列为 ,2,1),()(===i x X P x p i i ,那么X 的函数
)(X g 的数学期望为
∑∞==1)()]([i i i
p x g X g E
(2)若随机变量X 的密度函数)(x p ,那么X 的函数)(X g 的数学期望为 ⎰+∞
∞-=dx x p x g X g E )()()]([
这里我们假定涉及到的期望是存在的。
基于这个定理,我很容易地得到数学期望的几条性质。
1.设c 是常数,则c c E =)(
2. 设b a ,是常数,则b X aE b aX E +=+)()(
3. )]([)]([)]()([2121X g E X g E X g X g E +=+
例 随机变量X 的密度函数为
⎪⎩⎪⎨⎧<<=else
x x x p ,020,2-1)( 求)12(+X E ;)(2X E
例 设随机变量X 的密度函数为
)
1(1)(2x x p +π= 求)]1|,[min(|X E 。
解:⎰+∞∞-=
dx x p x X E )()1|,min(|)]1|,[min(| ⎰⎰⎰+∞-∞--+π++π++π⋅=12121
12)1(1)1(1)1(1||dx
x dx x dx x x 2
12ln +π= 细心的同学可以发现,本例中随机变量)1|,min(|X Y =既不是离散型随机变量,也不是连续型随机变量,但我们可以利用X 的概率密度求出其数学期望。
例(例2.2.7)。