条件数学期望及其应用The ways of finding the inverse matrix and it ’s application Abstract :The passage lists the ways of calculating the first type of curvilinear integral,and discusses it ’s application in geometry and in physical.Keywords :Curvilinear integral;Continuous;Integrable; Lateral area.0前言在曲线积分中,被积函数可以是标量函数或向量函数.积分的值是路径各点上的函数值乘上相应的权重(一般是弧长,在积分函数是向量函数时,一般是函数值与曲线微元向量的标量积)后的黎曼和.带有权重是曲线积分与一般区间上的积分的主要不同点.物理学中的许多公式在推广之后都是以曲线积分的形式出现.曲线积分是物理学中重要的工具.1条件数学期望1.1条件数学期望的定义定义1 设X 是一个离散型随机变量,取值为},,{21 x x ,分布列为},,{21 p p .又事件A 有0)(>A P ,这时,2,1,)()}({)|(|=⋂====i A P A x X P A x X P P i i A i 为在事件A 发生条件下X 的条件分布列.如果有∞<∑A i i i p x|则称A i ii p x A X E |]|[∑=.为随机变量X 在条件A 下的条件数学期望(简称条件期望).定义2 设X 是一个连续型随机变量,事件A 有0)(>A P ,且X 在条件A 之下的条件分布密度函数为)|(A x f .若⎰∞∞-∞<dx A X xf )|(称为随机变量X 在条件A 下的条件数学期望.定义3 设),(Y X 是离散型二维随机变量,其取值全体为},2,1,),,{( =j i y x i i ,联合分布列为,2,1,),,(====j i y Y x X P p i i ij ,在i y Y =的条件下X 的条件分布列为 ,2,1),|(|====i y Y x X P p i i j i 若∞<∑j i i i p x |,则j i i i i p x y Y X E |]|[∑==为随机变量X 在i y Y =条件下的条件数学期望.定义 4 设),(Y X 是连续型二维随机变量,随机变量X 在y Y =的条件下的条件密度函数为)|(|y x p Y X ,若∞<⎰∞∞-dx y x p x Y X )|(|,则称dx y x xp y Y X E Y X )|(]|[|⎰∞∞-== 为随机变量X 在}{y Y =条件下的条件数学期望.1.2条件数学期望的性质定理1 条件期望具有下面的性质:(1) )|()|()|(G bE G aE G b a E ηξηξ+=+,其中R b a ∈,,且假定)|(G b a E ηξ+存在;(2) )()]|([ξξE G E E =;(3) 如果ξ为G 可测,则ξξ=)|(G E ;(4) 如果ξ与σ代数G 独立,则ξξE G E =)|(;(5) 如果1G 是σ代数G 的子σ代数,则)|(]|))|([(11G E G G E E ξξ=;(6) )(不等式Jensen 如果f 是R 上的下凸函数,则)|)(())|((G f E G E f ξξ=;定理2 条件期望的极限定理:(1)单调收敛定理:若s a n ..ξξ↑,则在})|({-∞>G E ξ上,则)|(lim )|(G E G E n n ξξ∞→=. (2)Fatou 引理:若s a Y n .,≤ξ,则在})|({-∞>G E ξ上,则)|(sup lim )|sup (lim G E G E n n ξξ=.(3) 控制收敛定理:若Y s a Y n ,.,≤ξ可积,且P s a n 或.,ξξ→,则0)|(lim =-∞→G E n n ξξ. 1.3条件数学期望的求法在现代概率论体系中,条件期望的概念只是一种理论上的工具,在其定义中没有包含算法,所以求条件期望概率往往很难,需要技巧.本文对两种不同情形下的条件期望的求法做出讨论.方法一:利用问题本身所具有的某种对称性求解.例1设n ξξξ,,,21 时独立同分布随机变量.∞<ξE ,记∑==nk k S 1ξ,求n k S E k ,,2,1,|( =ξ.解 易证j i S E S E j i ≠=),|()|(ξξ.则n i S S nE S S E i ,,2,1,)|()|( ===ξ即n k s a nS S E k ,,2,1,.,)|( ==ξ 方法二:利用线性变换将随机变量分解为关于作为条件的σ域可测或独立的随机变量之和,利用条件期望的性质求和.例 2 设有正态样本n X X ,,1 ),0(2σN ,统计量∑==ni k X T 1,求)|(2T X E k .解 令∑==n k k X S 12,则)|(1)|(2T S E nT X E k =.作正交变换:⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=n n X X X C Y Y Y Y 2121,其中C 为正交阵,第一行为)1,,1(n n ,则有n T I CC Y X Cov EY ===),(,0,即∑=nk k Y T 22与独立,k Y n k N ,,2),,0(2 =σ,从而∑∑∑===+===n k k n k kn k k Y n T Y X S 2221212,2T 关于)(T σ可测,所以 2222222)11(]|)[(1)|(1)|(σn n T T Y n T E n T S E n T X E n k k k -++==∑=由以上例题可以看出,条件期望的求法是一个复杂的问题,我们必须从问题本身出发化简,将其转化为可测或独立于σ代数的随机变量,然后运用条件期望的性质求解.1.4全期望公式设事件n B B B ,,,21 是一完备事件组,即n B B B ,,,21 互不相交,n k B P k ≤≤>1,0)(,且Ω=⋃=k nk B 1,由全概率公式有,2,1),()()|()(1|1==⋅====∑∑==i B P p B P B x X P x X P p k n k B i k k nk i i i k 这时若∞<X E ,则有)()|[)()())((1|11|k n k k k B i i i n k k nk B i i i i i i B P B X E B P p x B P p x p x EX k k ∑∑∑∑∑∑=====⋅==如同全概率公式一样,上式可称为全期望公式.若n B B B ,,,21 是一个完备事件组,则也有全期望公式)(]|[1∑==nk k k B P B X E EX(注意,X 的密度有公式))()|()(1k nk k B P B x f x f ∑==.2条件数学期望的应用2.1条件数学期望在实际问题中的应用条件数学期望在概率论与数理统计中有重要的作用,在实际问题中也有大量应用.例如人们常说体育要从娃娃抓起.某少体校要在小学中选拔一批小学生进行重点培养,为我国篮球,排球运动准备后备力量.对一个运动员来说,他(她)的身高显然是一个非常重要的因素.于是问题产生了,在一大群各项素质(包括目前的身高)都差不多的七八岁的小朋友中,用什么办法来选拔一批将来(十年以后)身材会比较高的幼苗进行重点培养呢?科学工作者发现了小孩的足长与他(她)长大后的身高之间有密切的关系.我国的体育科研人员对16个省市的几万名青少年儿童进行了观测,建立了下述预测公式:成年身高=⨯k (少儿当年足长) (单位:cm )其中系数k 对不同性别,不同年龄组的儿童有不同的数值,其具体数值如下表:你大概很想知道上述预测公式是如何建立的?理论依据是什么?其实这正是现在所讨论的条件数学期望,对n (n 取定)岁的少年儿童来说,成年后的身高为X ,当年足长为Y 则),(Y X 是一个二维随机变量.一般认为他们的联合分布是正态分布.如果我们已知Y 的值,可以近似地以Y 的条件下X 的条件数学期望来估计X 的值,即用]|[Y X E 作X 的预测值.这时]|[Y X E 是Y 的线性函数,这就是成年身高的预测公式.例3 一全自动流水线正常生产时,产品中的一等品率为1p ,二等品率为2p ,等外品(即次品)率为3p ,1321=++p p p .为保证产品质量,厂方规定当生产出一件等外品时,该流水线即停工检修一次.已知首次检修之前共生产了n 件产品,求n 件产品中一等品件数的数学期望.解 设X 表示前n 件产品中一等品的件数,令}{件产品首次出现等外品第n A =.据题意是要求]|[A X E .因为在条件A 下,前1-n 件产品中没有等外品,这时1-n 件产品中的一等品率是211p p p +,而二等品率是212p p p +,因此 10,1)|(1212211|-≤≤⎪⎪⎭⎫ ⎝⎛+⎪⎪⎭⎫ ⎝⎛+⎪⎪⎭⎫ ⎝⎛-===--n k p p p p p p k n A k X P p k n k A k 这是参数为),1(211p p p n +-的二项分布.即 21110|)1(]|[p p p n kp A X E n k A k +-==∑-=. 实际上我们认为在条件A 下,前1-n 次试验是1-n 重贝努里试验,试验成功(取到一等品)的概率是211/p p p +.从直观意义看这是明显的,这也正是直接讨论条件分布的简捷之处.2.2全期望公式的应用例4 在贝努里试验中,每次试验成功的概率为p ,试验进行到出现首次成功时停止.求平均需试验多少次?解 设X 为首次成功需做试验的次数,问题是求EX .定义⎩⎨⎧=.,0,1第一次试验失第一次试验成功,Y 由全期望公式)0(]0|[)1(]1|[==+===Y P Y X E Y P Y X E EX ,已知p Y P p Y P -====1)0(,)1(,在1=Y ,即首次试验成功的条件下,自然有1=X ,因此1]1|[==Y X E .在0=Y 即首次首次实验失败的条件下,从第二次实验开始可以看作重新开始,因此,EX Y X E +==1]0|[.第一项的1是已经试验了一次,以后的情况与从头开始一样.所以)1)(1(EX p p EX +-+=,pEX 1=. 原来求数学期望需要知道分布,但在上例的做法中可以不必知道分布,充分利用了随机变量的特性,并借助全期望公式,简化了计算,这是真正有概率特点的做法.例5 设电力公司每月可以供应某电厂的电力服从]30,10[(单位:万度)上的均匀分布,而该工厂每月实际生产所需要的电力服从]20,10[上的均匀分布.如果工厂能从电力公司得到足够的电力,则每一万度电可以创造30万元利润,若工厂从电力公司得不到足够的电力,则不足部分由工厂通过其他途径自行解决,每一万度电只有10万元利润.问该厂每月的平均利润为多大?解 设电力公司每月供应电厂的电力为X (万度),工厂每月实际需要的电力为Y (万度),工厂每月的利润为T (万元).由题设条件知⎩⎨⎧>-+≤=X Y X Y X X Y Y T 当当),(1030,30 于是当3020≤≤x 时,有dy x y dy y x X T E x x ⎰⎰++==1020101)2010(10130]|[ 22224050)20(2)20(21)100(23x x x x x x -+=-+-+-=由式]}|[{X T E E ET =4332251006730025450201)4050(201302020102≈+⨯-+=+-+=⎰⎰dx dx x x 所以该工厂平均每月的利润为433万元.2.3预测与回归对于二维随机变量),(Y X ,如果已知其中一个随机变量Y 的值,要根据这一信息对另一个随机变量X 的取值作出预测,这样的问题在人们的实践中可以说是比比皆是,常称它们为“预测问题”.前面我们提议用]|[Y X E 作为X 的预测值,这样做的依据是什么呢?一般地,我们可以选取Y 的一个函数)(Y g 作为X 的预测值.这时预测的误差是)(Y g X -,由于绝对值运算在数学上处理不方便,我们用2)]([Y g X -代替它.自然应该使误差尽可能地小,但2)]([Y g X -是一个随机变量,因此很自然的要求它的平均值2)]([Y g X E -尽可能地小.这样的准则就称为均方误差最小准则.假设),(Y X 为连续型二维随机变量,密度函数为),(y x f ,则dydx y x f y g x y f dxdy y x f Y g x Y g X E Y X Y ))|()]([)((),()]([)]([|222⎰⎰⎰⎰∞∞-∞∞-∞∞-∞∞--=-=- 对每个y ,当]|[)(y Y X E y g ==时,能使dx y x f y g x Y X )|()]([|2⎰∞∞--达到最小.因此取]|[)(Y X E Y g =时,2)]([Y g X E -达到最小,这就证明了,按照均方误差最小准则,]|[Y X E 是X 的最佳预测.这就是选取条件数学期望作X 的预测值的理论依据.对离散型情形也可用相同的方法论证上述结论.函数]|[)(Y X E Y g =称为X 关于Y 的回归函数.一般情况下,求)(y g 是比较困难的.因此,把预测问题简化,选取Y 的线性函数b aY +作为X 的预测值.同样采用均方误差最小准则,选取常数b a ,使得22][)]([b aY X E b aY X E --=+-取最小值.我们早已知道,若a 固定,aEY EX aY X E b -=-=)(时,2][b aY X E --取最小值][aY X D -.我们只需求a ,使DX Y X a DY a aY X D +-=-),cov(2)(2达到最小值,即a 应取为DY Y X a ),cov(=, 我们称EX EY Y DYY X +-)(),cov( 为X 关于Y 的回归直线. 参考文献:[1] 中山大学数学系.概率论与数理统计[M].高等教育出版社.2002.[2] 周概容.概率论与数理统计[M].高等教育出版社.1984.[3] 茆试松.程依明.濮晓龙.概率论与数理统计教程[M].高等教育出版社.2004.[4] 孙荣恒.应用概率论[M].科学出版社.2001.[5] 何声武.概率论与数理统计[M].经济科学出版社.1992.。