当前位置:文档之家› 概率论论文

概率论论文

哈尔滨工业大学
《概率论与数理统计》论文
正态分布的重要意义及应用
班级:1226103
姓名:***
学号:**********
哈尔滨工业大学数学系 2013 年 11 月 26日
正态分布的重要意义及应用
摘要:正态分布是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

它概率论中最重要的一种分布,也是自然界最常见的一种分布。

高斯(Gauss)在研究误差理论时首先用它来刻画误差的分布,故正态分布又称为高斯分布。

经验表明,生产与科学实验中很多随机变量的概率分布都近似地用正态分布来描述。

在实际中,许多随机变量都服从或近似服从这种“中间大,两头小”的正态分布。

例如,测量一个零件长度的测量误差,向一中心点射击的横向偏差或纵向偏差,等等,正态分布不仅在实际应用中有重要意义,而且在理论上也有很重要的意义。

关键字:正态分布高斯分布连续型随机变量
正文
1.正态分布的来源
正态分布是最重要的一种概率分布。

正态分布概念是由德国的数学家和天文学家德莫佛于1733年首次提出的,德莫佛最早发现了二项分布的一个近似公式,这一公式被认为是正态分布的首次露面,但由于德国数学家高斯率先将其应用于天文学的研究,故正态分布又叫高斯分布。

在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。

这要到20世纪正态小样本理论充分发展起来以后。

拉普拉斯在知道高斯的工作后,马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。

这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。

后来到1837年,海根在一篇论文中正式提出了这个学说。

正态分布的密度函数 :)2/()(2221)(σμπσ--=
x e x f
3.正态分布的性质
服从正态分布的变量的频数分布由μ、σ完全决定。

1、集中性:正态曲线的高峰位于正中央,即均数所在的位置。

2、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

4、u 变换:为了便于描述和应用,常将正态变量作数据转换。

μ是正态分布的位置参数,描述正态分布的集中趋势位置。

正态分布以X=μ为对称轴,左右完全对称。

正态分布的均数、中位数、众数相同,均等于μ。

5、正态分布有两个参数,即均数μ和标准差σ,可记作N (μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。

σ越小,曲线越陡峭;σ越大,曲线越扁平。

6、σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。

也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

7. P(μ-σ<X≤μ+σ)=68.3%
P(μ-2σ<X≤μ+2σ)=95.4%
P(μ-3σ<X≤μ+3)=99.7%
4.正态分布的实际应用
正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。

例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。

一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量x
y
具有正态分布(见中心极限定理)。

从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t 分布、F 分布等。

其主要应用如下:
1.估计频数分布
一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。

2. 质量控制:为了控制实验中的测量误差,常以测量最大最小值作为上、下警戒值,以标准差作为上、下控制值。

这样做的依据是:正常情况下测量(或实验)误差服从正态分布。

3.制定医学参考值范围:在一些医学现象中,例如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。

其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。

4.统计方法的理论基础:如t 分布、F 分布、分布都是在正态分布的基础上推导出来的,u 检验也是以正态分布为基础的。

此外,t 分布、二项分布、Poisson 分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。

下面我们有一道实际问题的例题来看一下正态分布的应用
问题某公司准备考试招工300名,其中280名正式工,20名临时工,实际报考人数1657名。

考满分400名,考试不久后,通过当地新闻网络媒体得到这样的一个消息:
考试平均成绩是166分,在360分以上的有31名,某考生A 的成绩是256分。

问他能录取不?若被录取,是正式工还是临时工?
下面我们就用正态分布来解决这个问题
例1.先预测最低分数线,设最低分数线是0χ,设考生的成绩是X ,对一次成功的考生来说,X 服从正态分布,即()2~166,X N σ
则 ()166
~0,1x Y N σ-=
有题设知 ()360160313601657
P X P Y σ-⎛⎫>=>≈ ⎪⎝⎭ 于是 3601603601603110.9811657P Y σσ--⎛⎫⎛⎫Φ=≤≈-= ⎪ ⎪⎝⎭⎝⎭
查正态分布表,得 360160
2.0893σσ-≈⇒=
所以 ()2~166,93X N
因为最低录取分数线0χ的确应使高于此线的考生的频率等于
3001657
,即 ()00166300931657x P X x P Y -⎛⎫>=>≈ ⎪⎝
⎭ 于是 001661663110.89193931657x x P Y --⎛⎫⎛⎫Φ=≤≈-= ⎪ ⎪⎝⎭⎝⎭ 001660.9125193
x x -⇒
=⇒= 即最低录取分数线为251分
下面预测考生A 的名次,其考分256=x ()()2561662560.83193P X x P X -⎛⎫≤=≤=Φ≈ ⎪⎝⎭
()2560.169P X ⇒>≈
次表示成绩高于考生A 的人数约占总人数的0016.9
16570.169282⨯≈
即考生A 大约排在283名。

结论:因为该考生靠了256分,大于录取分数线251分。

因此该考生能被录取。

但因为他是283名,排在280名之后,所以他不能被录取为正式工,只能是临时工。

5.正态分布的理论意义
20世纪前半期,概论论研究的中心课题之一,就是寻求独立随机变量和的极限分布是正态分布的条件。

因此,这一方面的定理统称为中心极限定理,较一般的中心极限定理表明:若被研究的随机变量是大量独立随机变量的和,其中每一个随机变量对于总和只起微小作用,则可认为这个随机变量近似于正态分布。

这就揭示了正态分布的重要性。

因为现实中许多随机变量都具有上述性质,例如测量误差,射击着弹点的横坐标,人的身高等都是由大量随机因素综合影响的结果,因而是近似正态分布。

独立分布的中心极限定理
如果随机变量序列x1,x…,…xn…,…独立同分布,并且具有有限的数学期
望和方差E(xi)=μ,D(xi)=σ2>0(i=1,2,…),此时X i 不关
服从什么分布,只要n 充分大,随机变量 就近似服从N (0,1),而随机变量 近似地服从N (n μ,n σ2),此时就称 渐进的服从N (0,1)
从此可以看出正态分布在理论上的重要作用,我们用一道例题对其进行讲解 例2.一部件包括10部分,每部分的长度是一随机变量,相互独立且具有同一分布,其数学期望为2 mm ,均方差为0.05 mm ,规定总长度为20mm 0.1 mm 时产
品合格,试求产品合格的概率。

已知:( 0.6 ) = 0.725;( 0.63 ) = 0.7357。

解:设每个部分的长度为Xi ( i = 1, 2,…, 10 )
E ( X
i ) = μ =2 , D( X
i
) = σ2= ( 0.05 ) 2 ,依题意,得合格品的概率为
从上面的例题可以看出正态分布其在各个方面的广范应用。

6.总结
正态分布的应用是广泛的,这里列举的只是有限的几个方面的应用。

现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。

这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项--正态分布。

研究正态分布具有十分重要的意义,本文中,我仅从起源、定义、性质介绍正态分布,并对正态分布的应用及其价值等方面作了些初步的研究和探索。

正态分布的更深层面的探索还需要我们去研究。

参考文献
【1】概率论与数理统计(第三版)高等教育出版社
【2】概率论与数理统计清华大学出版社龚光鲁
【3】概率论与数理统计/王勇主编。

——北京:高等教育出版社,2007.7。

相关主题