本科生学年论文(设计)(级)论文(设计)题目浅谈泊松分布及其应用作者分院、专业班级指导教师(职称)字数成果完成时间杭州师范大学钱江学院教学部制浅谈泊松分布及其应用摘要:泊松分布作为大量试验中稀有事件出现的频数的概率分布的数学模型,是指一个系统在运行中超负载造成的失效次数的分布形式。
根据泊松分布的一些性质,引出这些性质在实际生活中的重要应用。
关键词:泊松分布概念实际应用Discuss poisson distribution and its applicationWuSuLing guidance teacher:QiuLiangHuaAbstract: the poisson distribution as a large number of test rare event of frequence of the probability distribution of the mathematical model, it is to point to a system in running the super load caused by the failure frequency distribution form. According to some properties of poisson distribution, leads to these properties in real life important application.Keywords: poisson distribution concept practical application.目录1 引言 (4)1.1 泊松分布 (4)2 泊松分布的基础知识 (4)3 泊松分布下的非线性拟合 (4)3.1 拟合函数是非线性的近似方法 (4)3.2 求解泊松分布问题的一般途径 (5)4 泊松分布在现实生活中的应用 (5)4.1 “非典”的流行和传播服从泊松分布 (5)4.2 泊松分布在生物学中的应用 (6)4.2.1泊松分布在遗传图距计算中的应用 (6)4.2.2泊松分布在计算病毒粒体对细胞感染率中的应用 (6)4.2.3泊松分布在估计一个基因文库所需克隆数中的应用 (6)4.3 初步研究固体火箭发动机可靠性 (7)4.4 保险损失费若干问题研究 (8)5 .结论 (8)5.1 结语 (8)泊松分布存在在现实生活的各地,在各个领域都有泊松分布 (8)5.2 参考文献 (8)浅谈泊松分布及其应用1引言1.1泊松分布泊松分布,是一种统计与或然率学里常见到的离散或然率分布,由法国数学家西莫恩德尼·泊松在1838年时发表,是在推广伯努利形式下的大数定律时,研究得出的一种概率分布,因而命名为泊松分布。
在概率论中现称泊松分布。
常用于描述单位时间、单位平面或单位空间中罕见“质点”总数的随机分布规律。
泊松分布作为大量试验中稀有事件出现的频数的概率分布的数学模型, 它具有很多性质,泊松分布在实际生活中起着很大的重要作用。
2 泊松分布的基础知识泊松分布定义:设随机变量 X 的可能取值为0, 1, 2, …; 且 p{X = k} =λke-λ/k! (k=0,1,2,……n), λ> 0为常数。
则称 X 服从参数为 λ的泊松分布, 记作 X ~ D ()λ。
特征:泊松分布的特点是总体上的稀有性和局部的密集性加偶然性。
定理1.如果 X 是一个具有以λ为参数的泊松分布, 则 E ()x =λ且D ()x =λ。
定理 2.设随机变量 xn(n = 1, 2, ) 服从二项分布, 其分布律为 P{xn = k} = Cn(k)Pn(k)[( 1- pn)^(n-k)]k =0, 1, 2, ?, n 。
又设 npn =λ> 0 是常数, 则lim {xn = k} =λke-λ/k!(n 趋向无穷大)。
泊松分布参数的最短置信区间:由于泊松分布的数学期望 E (X ) =λ,从而E( k)=∑E (xi) = λn 。
因此如果我们对总体参数λ进行区间估计, 可以先求出 λn 的置信区间的上下限,再分别除以样本容量 n,便得到λ的置信区间。
利用泊松分布的分布函数可以计算出参数 λn 的置信区间, 当 k>=1时, 可分别解出置信下限 a=1λn 和置信上限 b= 2λn其中, k 为样本总计数, 1- α为所需的置信度, 0<α <1 , 0<β<α。
3 泊松分布下的非线性拟合3.1拟合函数是非线性的近似方法对服从泊松概率分布的实验数据组进行拟合,如果拟合函数是非线性的,常常以下近似方法。
近似性之一:表现在将拟合函数线性化,或者采用某种参数寻优 的方法。
近似性之二:则是将泊松问题近似地看作高斯分布问题。
泊松分布与高斯分布:泊松分布与高斯分布是既相近又有差别的两种概率分布。
在概率论中,泊松分布和高斯分布都是二项分布中总项数 N 趋于无限大时的极限形式。
不同的是,泊松分布很适合描述其数据的可能值在一端严格有界,在另一端无界的实验。
而高斯分布的两端都可以无界。
并且,对事件的平均值而言,高斯分布是绝对对称的。
仅当事件的平均值远远大于 1时,泊松分布才接近于对称分布,与高斯分布相似。
3.2求解泊松分布问题的一般途径首先还是比较一下当数据涨落分别服从两种不同概率分布情况 下的异同.对于高斯概率分布问题,观测到该数据组的概率为()⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛--=∏=2121exp 21'i i i mi i x y y p σπσ 最大或然法与最小二乘法均给出同样结果,即()()[]()0121'ln 122=∂∂-=∂∂-=∂∂∑=ji i i m i i j j a x y x y y a x a p σ j=1,2,…n 4 泊松分布在现实生活中的应用4.1 “非典”的流行和传播服从泊松分布2003年,春, 肆虐的“非典”病毒向人类发起了猖狂攻击。
来势汹涌的“非典”, “非典”给了置身其中的我们很多很多的思索。
比如,为什么我国会成为“非典”的重灾区?“非典”的传播和扩散是否遵循一定的规律呢?2003年5月26日10时至5月27日10时,全国各地共报告新增非典型肺炎临床诊断病例9例,治愈出院115例,死亡4例。
其中,北京新增临床诊断病例9例, 治愈出院81例, 死亡4例; 其他省份都没有新增临床诊断病例和死亡病例。
”从“非典”在我国流行和传播的空间分布来看,主要发生在北京,显现总体上的稀有性和局部的密集性加偶然性的特点; 从时间上看,从发现病例以来,以2003年为高峰期,它符合泊松分布的特点, 各段时间出现失效与否,是相互独立的。
所以,“非典”在我国的流行和传播是符合泊松分布规律的的爆发,其流行和传播都是服从泊松分布规律的。
腐败现象的产生与发展符合泊松分布腐败现象作为社会现象中的一种非常态, 它的发生和发展规与泊松分布规律完全相同, 特点是总体上的稀有性和局部的密集性加偶然性,具体表现有“前腐后继案”“串案”“窝案”等形式。
“前腐后继案”表明了腐败现象在时间上是呈泊松分布,“窝案” 表明了腐败现象在空间上呈泊松分布,而“串案”则表明了腐败现象在立体上呈泊松分布。
4.2泊松分布在生物学中的应用泊松分布广泛应用于遗传学的遗传图距计算、生物物理学的辐射生物学的定量分析、病毒学中的病毒感染率计算、分子生物学中一个基因文库所需克隆数的估计、PCR扩增片段保真率的估算以及酵母单双杂交中转化率的估计等学科领域。
4.2.1泊松分布在遗传图距计算中的应用在遗传学上,计算遗传图距的基本方法是建立在重组率基础上的, 根据重组率的大小作出有关基因间的距离, 绘出线性基因图。
如果所研究的两基因座相距甚远, 其间可发生双交换、三交换、四交换或更高数目交换, 而形成的配子总有一半是非重组型的。
因此,我们可利用泊松分布原理来描述减数分裂过程中染色体上某区段交换的分布。
4.2.2泊松分布在计算病毒粒体对细胞感染率中的应用在感染病毒的细胞培养物中, 培养细胞可被不同数量的病毒粒体感染, 了解病毒粒体在培养细胞上的分布, 即了解病毒粒体所感染的细胞比率。
而受感染的细胞比率取决于每个细胞中所含有的病毒粒体的平均数, 称感染重数( m )。
感染细胞的病毒粒体是指那些早期起始感染的粒体, 无活性病毒粒体不计。
因此, m同感染细胞病毒粒体总数( N)和细胞总数( C)的关系是m =aN/C, 这里a是指细胞早期起始感染病毒粒体的比率, 如果a能确定, 则m 值可由已知的N值与C值计算出来。
实际上细胞大小和表面特性等许多方面细胞是不同的, 但这些偏差是可忽略的, 现假定对细胞来说被感染的能力都一样。
由泊松分布可知p(n)=(m^n)(e^-m)/n!z则未被感染的细胞比率p (0)=(m^0)(e^-m)/0!=e^-m那么感染重数m也可以通过未被感染的细胞比率p ( 0 )的实验测定来求得:m = - Inp (0)。
4.2.3泊松分布在估计一个基因文库所需克隆数中的应用在分子生物学中, 一个完整的基因文库所需克隆数的估计对基因克隆实验方案的设计具有重要意义。
由于基因组DNA是从大量细胞中提取的, 每个细胞中均含有全部基因组DNA, 那么每一种限制性片段的数目是大量的, 因此可以说各限制性片段的数目是相等的。
在基因克隆中, 基因组DNA 用限制性酶切割后与载体混合反应以及随后的过程均是随机的生化反应过程。
第一, 对克隆来说一限制性片段要么被克隆、要么不被克隆, 只有这两种结果;第二, 由于总体限制性片段是大量的, 被克隆的对总体影响很小; 第三, 在克隆中一片段被克隆的概率为f( f较小), 不被克隆的概率为1- ,f 且克隆时这两种概率都不变。
综上所述, 基因克隆的过程符合泊松分布, 可用泊松分布来分析计算。
设 p 为基因被克隆的概率; N 为要求的克隆的概率为 p 时一个基因文库所需含有重组 DNA 的克隆数; f 为限制性片段的平均长度与 基因组 DNA 总长度之比, 若基因 组DNA 被限制性酶切割成 n 个 DNA 片段, f 即1/n 。
则在克隆数为 N 时, 任一段被克隆一次或一次以上的概 率 为 p = 1 - p ( 0 ) = 1 –eNf -, 可 推 出 N =1n( 1- p )/f, 一般要求目的基因序列出现的概率 p 的期望值定为99%,那么N =- n1n (1- p)=- n1n ( 1- 0. 99) = 4. 605n 。
4.3初步研究固体火箭发动机可靠性固体火箭发动机研制一般要经过模样、初样、试样、定型等阶段, 在研制中进行可靠性增长试验是提高产品可靠性的有效手段. 通过这种试验, 不断发现和消除系统性缺陷, 提高产品的可靠性. 发动机可靠性增长研究是近年来发动机可靠性研究的一个重要方向, 已引起国内外学者的高度重视.数学模型假设: 研制生产的固体火箭发动机总数为 n; 最初设计的固体火箭发动机系统性缺陷数为 B0; 各系统性缺陷失效率均为 p;若试验失败, 则导致失败的故障模式可以确定, 并从以后的固体火箭发动机产品中成功消除.研究问题: 给定产品总数 n, 选择试验量 t,通过可靠性增长试验发现固体火箭发动机产品的系统性缺陷, 通过改进设计, 使余下的 (n- t)台固体火箭发动机成功数期望值最大.成功数 S0服从成功率为 ( 1- p)B0的二项分布, 即S0 ~ B in(n, (1- p )B0), 则条件期望为E[ S0 | B0] = n( 1- p )0B ).进一步, 假设完成了 t 次试验, E [St | Bt] = (n - t)( 1- p)Bt其中, Bt 是 t 次试验后剩余的系统性缺陷数. 注意到 t 次试验后任一缺陷继续存在的概率为( 1- p)t , 则 Bt 关于 B0的条件分布为二项分布:P {Bt = k | B0}=(B0 ; k)(列矩阵) (( 1- p )t )k (1- ( 1- p)t )K B -0 其母函数为 gBt|B0(z) = E[ zBt | B0] 设 gB0( z) 为 B0的母函数, 由条件期望的性质为gBt(z) = EBt[z Bt | B0] = EB0[E [z Bt | B0] ]= EB0[ (z( 1- p)t + (1- ( 1- p)t )0B ]= gB0(z( 1- p)t + ( 1- ( 1-p )^t) ).至此, 只要知道 B0的分布特征, 就可求得E [zBt ], 进而得到 E [St].一般取初始系统性缺陷数 B0为服从均值为λ的泊松分布, 则其母函数为 gB0(z) = ()1-z e λ, 所以EBt[z Bt ] = gB0(z ( 1- p)t + ( 1- ( 1- p)t ) )= ()()11--z t p e .推出E [St]= = (n - t) ()t p p e --1λ。