当前位置:文档之家› 正态分布及其应用

正态分布及其应用

正态分布及其应用安徽财经大学统计与应用数学学院 吴礼斌一. 随机变量及其分布(Random variable and Distribution )定义1.1 设E 是随机试验,它的样本空间为Ω={ω|ω为基本事件},对每一个样本点即基本事件ω∈Ω,都对应一个实数X(ω),对于任意实数x ,集合{ω| X (ω) ≤x }有确定的概率.则称X(ω)为随机变量,简记为X 。

随机变量按其取值情况可以分为两类:离散型与非离散型,常见非离散的连续型。

定义1.2 设X 为离散型随机变量,它的所有可能取值为x 1,x 2,…,x k ,…,(有限个或可列无限个),X 取值为x k 的概率记为).,3,2,1(,}{L ===k p x X P k k (2.1)称(2.1)式为随机变量X 的概率分布或分布律(Law of distribution),简称(2.1)式为X 的分布。

定义1.3 设X 是随机变量,任意给定实数x ,记事件}{x X ≤的概率为}{)(x X P x F ≤= (2.4.1)则F(x)为实值函数,称F(x)为X 的分布函数(distribution function )。

随机变量X 的分布函数)(x F 具有如下性质:(1)单调非降性;(2)规范性;(3)右连续性。

定义1.4设随机变量X 的其分布函数为F(x),若存在非负可积函数f(x),使得对于任意实数x, 有∫∞−=≤=xdt t f x X P x F )(}{)( (3.1)则称X 为连续型随机变量,称f(x)为X 的概率密度函数(Density function and nature ),简称概率函数或密度函数,记为X ~f(x),读作X 服从以f(x)为概率密度函数的随机变量。

X 的概率密度函数f(x)具有两条基本性质:(1)非负性;(2)完备性。

二、正态分布(Normal distribution)1.一般正态分布定义2.1 如果连续型随机变量X 的密度函数为),(,21)(22)(21+∞<<−∞=−−x ex f x µσσπ (2.1)其中)0(,>σσµ为常数,则称X 服从参数为µ和2σ的(一般)正态分布或高斯分布(Normal distribution or Gauss distribution ),记作),(~2σµN X 。

能够验证(2.1)式满足密度函数的两条性质,即 (1)0)(≥x f ;(2)1)(=∫+∞∞−dx x f 。

正态分布的密度函数f(x)的图形称为正态概率曲线(如图3-6),其特征为:(1)曲线为钟形,关于直线x=μ对称;在图形上横坐标为σµ±=x 的点是曲线的拐点。

(2)当x=μ时,f(x)取最大值σπµ21)(=f ,习惯上称此值为图形峰值。

(3)曲线以x 轴为水平渐近线;(4)若参数μ固定,曲线的形状随σ的不同而变化,σ越大,峰值越小,图形也就越平坦,σ越小,峰值越大,图形也就越陡峭。

(5)若参数σ固定,则曲线随参数μ的不同沿x 轴方向左右平移。

μ称为位置参数(Parameters Position )。

2. 标准正态分布(Standard normal distribution)定义2.2 在正态分布),(2σµN 中,若参数,1,0==σµ则称此正态分布为标准正态分布,记为)1,0(N 。

通常,设)1,0(~N X ,则X 的密度函数记为),(,21)(22+∞<<−∞=−x e x x πϕ(3.8)密度函数)(x ϕ的图形如图3-5所示,它是一条关于y 轴对称的钟形线,其峰值4.021)0(≈=πϕ,在图形上横坐标为1±=x 的点是曲线的拐点,以x 轴为渐近线。

标准正态分布的分布函数记为.21)(22dt ex xt ∫∞−−=Φπ(3.9)几何上,Φ(x) 表示曲线)(x ϕ下方且位于x 点右侧图中(图3.5)阴影部分的面积。

人们将)(x Φ的数值已经编制成表,该表为称标准正态分布(函数值)表,参见本书末的附表二。

若 X~N(0,1),则标准正态分布函数)(x Φ具有以下运算性质(其中a,b,c>0是常数): (1))(1)(x x Φ−=−Φ; (3.10)(2))(}{a a X P Φ=≤;(3))(1}{1}{a a X P a X P Φ−=≤−=>; (4))()(}{a b b X a P Φ−Φ=≤≤;(5)1)(2)()(}|{|−Φ=−Φ−Φ=<c c c c X P .性质(1)表明Φ(x)的数值只需给出x>0的情形,x<0时的Φ(x)的数值可由该性质转化就行了。

3. 一般正态分布与标准正态分布的关系 定理3.3 若),(~2σµN X ,令 σµ−=X Y ,则Y ~N(0,1)。

定理表明:(一般)正态分布的概率计算问题可以转化为标准正态分布的概率计算问题。

即若),(~2σµN X ,有下面的概率公式(其中a,b,c>0是常数)(1))(}{}{σµσµσµ−Φ=−≤−=≤a a X P a X P (3.13)(2)((}{σµσµ−Φ−−Φ=≤≤a b b X a P (3.14)(3)1(2}|{|−Φ=≤−σµcc X P (3.15)4. 正态分布的3σ原则 若),(~2σµN X ,则;9973.0199865.021)3(2}3|{|;9545.0197725.021)2(2}2|{|;6828.018413.021)1(2}|{|=−×=−Φ=≤−=−×=−Φ=≤−=−×=−Φ=≤−σµσµσµX P X P X P 结果表明X 取值于区间)3,3(σµσµ+−内的概率达99.73%。

5. 正态分布的期望与方差定义4.1 设X 为离散型随机变量,其分布律为),3,2,1=(,=}={L k p x X P k k若级数∑∞1=i ii p x 绝对收敛,则称 ∑∞1=2211=++++i i i n n p x p x p x p x L L (5.1)为X 的数学期望,简称为期望,记为E(X)。

定义4.2 设连续型随机变量X 的密度函数为f(x),若反常积分∫+∞∞−dx x xf )(绝对收敛,则称该积分为X 的数学期望,记为)(X E ,即∫+∞∞−=dx x xf X E )()(。

(5.2)若反常积分∫+∞∞−dx x xf )(不绝对收敛,则称X 的期望不存在。

(1)正态分布的期望设),(~2σµN X ,则µ=)(X E 。

这因为µµσπµσπµσπµσπσπσµσσµσµσµ=−=+=+−=⋅=⋅=∫∫∫∫∫∫∞+∞−−−∞+∞−−∞+∞−−−∞+∞−−−∞+∞−−−∞+∞−)(212121)(21)(21)()(22222222222)(22)(2)(2)(x t dx e dt tedxedx e x dx e x dx x f x X E x t x x x 其中分项积分可见,正态分布),(2σµN 中的参数µ正是其数学期望。

(2)正态分布的方差定义4.3 设X 是随机变量,若2)]([X E X E −存在,称2)]([X E X E −为X 的方差,记作D(X),即2)]([)(X E X E X D −=。

方差的简化计算公式22)]([)()(X E X E X D −=正态分布的方差:设),(~2σµN X ,则2)(σ=X D 。

这因为.22|)(2221)()]([)(222222222)(2222σππσπσσµπσσπµσµ=⋅=+∞−∞+−=−==⋅−=−=∫∫∫∞+∞−−−∞+∞−−∞+∞−−−dt ee t x t dt et dxex x E X E X D ttt x表明正态分布中的参数2σ正是其方差。

6.正态分布的性质(1)(线性性质)若),(~2σµN X ,令b aX Y +=(其中b a ,0≠为常数),则 ),(~22σµa b a N Y +。

(2)(平方性质)若)1,0(~N X ,则)1(~22χX 。

(3)(分布的可加性)若X 与Y 相互独立,且),,(~),,(~222211σµσµN Y N X 则).(~2221,21σσµµ+++=N Y X Z(4)(线性组合性质)若n X X X ,,,21⋅⋅⋅相互独立,且,,,2,1),,(~2n k N X k k k ⋅⋅⋅=σµ则 ).,(~12211∑∑∑====nk k k n k k k nk kk a a N Xa Z σµ(5)(平均值性质)若n X X X ,,,21⋅⋅⋅相互独立,且,,,2,1),,(~2n k N X k ⋅⋅⋅=σµ则,(~121nN X n n k k σµ∑= 7. 抽样分布定理(1)(卡方分布的生成性)设)1,0(~N X i ,且),,2,1(n i X i L =相互独立,则)(~212222212n X X X X ni i nχχ∑==+++=L 。

(2)(t 分布的生成性)设)1,0(~N X ,)(~2n Y χ,X 与Y 独立,则称随机变量)(~n t nY XT =(3)(生成性). 若),(~),(~2212n Y n X χχ且Y X ,相互独立,则随机变量()211221,~n n F Y n X n n Y nXF ==.(4)(抽样分布的基本定理)设总体),(~2σµN X ,),,,(21n X X X L 为取自该总体的样本,则1)样本均值),(~2nN X σµ;2)为样本方差其中221222),1(~)()1(S n XX S n nk k −−=−∑=χσσ;3)相互独立与2S X .(5)设n X X X ,,21L 为来自总体),(2σµN 的样本,则统计量)1(~−−=n t nS X T µ.8. 中心极限定理(1)(林德贝格-勒维(Lindeberg-Levy)定理)设相互独立的随机变量L L ,,,,21n X X X 服从同一分布,且),,2,1(0)(,)(2L =≠==i X D X E i i σµ则对于任意x ,随机变量σµn n XY nk kn ∑=−=1的分布函数)(x F n 趋于标准正态分布函数)(x Φ,即有)(21}{lim )(lim 22x dt ex Y P x F xt n n n n Φ==≤=∫∞−−∞→∞→π(2)设相互独立的随机变量L L ,,,,21n X X X 服从同一分布,且已知),,2,1(0)(,)(2L =≠==i X D X E i i σµ每个随机变量的分布函数未知,则当n 充分大时,1)∑==nk k X X 1近似服从正态分布),(2σµn n N ; 2)∑=nk k X n 11近似服从正态分布,(2nN σµ。

相关主题