当前位置：文档之家› 正态分布及其应用

正态分布及其应用

正态分布及其应用安徽财经大学统计与应用数学学院吴礼斌一. 随机变量及其分布（Random variable and Distribution ）定义1.1 设E 是随机试验，它的样本空间为Ω=｛ω｜ω为基本事件｝，对每一个样本点即基本事件ω∈Ω，都对应一个实数X(ω)，对于任意实数x ，集合{ω| X (ω) ≤x }有确定的概率．则称X(ω)为随机变量，简记为X 。

随机变量按其取值情况可以分为两类：离散型与非离散型，常见非离散的连续型。

定义1.2 设X 为离散型随机变量，它的所有可能取值为x 1,x 2,…，x k ，…，(有限个或可列无限个)，X 取值为x k 的概率记为).,3,2,1(,}{L ===k p x X P k k (2.1)称(2.1)式为随机变量X 的概率分布或分布律（Law of distribution)，简称(2.1)式为X 的分布。

定义1.3 设X 是随机变量，任意给定实数x ，记事件}{x X ≤的概率为}{)(x X P x F ≤= （2.4.1）则F(x)为实值函数，称F(x)为X 的分布函数（distribution function ）。

随机变量X 的分布函数)(x F 具有如下性质：（1）单调非降性；（2）规范性；（3）右连续性。

定义1.4设随机变量X 的其分布函数为F(x)，若存在非负可积函数f(x)，使得对于任意实数x, 有∫∞−=≤=xdt t f x X P x F )(}{)( (3.1)则称X 为连续型随机变量，称f(x)为X 的概率密度函数（Density function and nature ），简称概率函数或密度函数，记为X ～f(x)，读作X 服从以f(x)为概率密度函数的随机变量。

X 的概率密度函数f(x)具有两条基本性质：(1)非负性；(2)完备性。

二、正态分布(Normal distribution)1．一般正态分布定义2.1 如果连续型随机变量X 的密度函数为),(,21)(22)(21+∞<<−∞=−−x ex f x µσσπ (2.1)其中)0(,>σσµ为常数，则称X 服从参数为µ和2σ的（一般）正态分布或高斯分布(Normal distribution or Gauss distribution )，记作),(~2σµN X 。

能够验证(2.1)式满足密度函数的两条性质，即（1）0)(≥x f ；（2）1)(=∫+∞∞−dx x f 。

正态分布的密度函数f(x)的图形称为正态概率曲线(如图3-6)，其特征为：（1）曲线为钟形，关于直线x=μ对称；在图形上横坐标为σµ±=x 的点是曲线的拐点。

（2）当x=μ时，f(x)取最大值σπµ21)(=f ，习惯上称此值为图形峰值。

（3）曲线以x 轴为水平渐近线；（4）若参数μ固定，曲线的形状随σ的不同而变化，σ越大，峰值越小，图形也就越平坦，σ越小，峰值越大，图形也就越陡峭。

（5）若参数σ固定，则曲线随参数μ的不同沿x 轴方向左右平移。

μ称为位置参数（Parameters Position ）。

2. 标准正态分布(Standard normal distribution)定义2.2 在正态分布),(2σµN 中，若参数,1,0==σµ则称此正态分布为标准正态分布，记为)1,0(N 。

通常，设)1,0(~N X ，则X 的密度函数记为),(,21)(22+∞<<−∞=−x e x x πϕ（3.8）密度函数)(x ϕ的图形如图3-5所示，它是一条关于y 轴对称的钟形线，其峰值4.021)0(≈=πϕ，在图形上横坐标为1±=x 的点是曲线的拐点，以x 轴为渐近线。

标准正态分布的分布函数记为.21)(22dt ex xt ∫∞−−=Φπ(3.9)几何上，Φ(x) 表示曲线)(x ϕ下方且位于x 点右侧图中（图3.5）阴影部分的面积。

人们将)(x Φ的数值已经编制成表，该表为称标准正态分布（函数值）表，参见本书末的附表二。

若 X~N(0，1)，则标准正态分布函数)(x Φ具有以下运算性质（其中a,b,c>0是常数）：（1）)(1)(x x Φ−=−Φ；（3.10）（2）)(}{a a X P Φ=≤；（3）)(1}{1}{a a X P a X P Φ−=≤−=>；（4）)()(}{a b b X a P Φ−Φ=≤≤；（5）1)(2)()(}|{|−Φ=−Φ−Φ=<c c c c X P .性质（1）表明Φ(x)的数值只需给出x>0的情形，x<0时的Φ(x)的数值可由该性质转化就行了。

3. 一般正态分布与标准正态分布的关系定理3.3 若),(~2σµN X ，令 σµ−=X Y ，则Y ～N(0，1)。

定理表明：（一般）正态分布的概率计算问题可以转化为标准正态分布的概率计算问题。

即若),(~2σµN X ，有下面的概率公式（其中a,b,c>0是常数）(1))(}{}{σµσµσµ−Φ=−≤−=≤a a X P a X P (3.13)(2)((}{σµσµ−Φ−−Φ=≤≤a b b X a P (3.14)(3)1(2}|{|−Φ=≤−σµcc X P (3.15)4. 正态分布的3σ原则若),(~2σµN X ，则;9973.0199865.021)3(2}3|{|;9545.0197725.021)2(2}2|{|;6828.018413.021)1(2}|{|=−×=−Φ=≤−=−×=−Φ=≤−=−×=−Φ=≤−σµσµσµX P X P X P 结果表明X 取值于区间)3,3(σµσµ+−内的概率达99.73%。

5. 正态分布的期望与方差定义4.1 设X 为离散型随机变量，其分布律为),3,2,1=(,=}={L k p x X P k k若级数∑∞1=i ii p x 绝对收敛，则称 ∑∞1=2211=++++i i i n n p x p x p x p x L L (5.1)为X 的数学期望，简称为期望，记为E(X)。

定义4.2 设连续型随机变量X 的密度函数为f(x)，若反常积分∫+∞∞−dx x xf )(绝对收敛，则称该积分为X 的数学期望，记为)(X E ，即∫+∞∞−=dx x xf X E )()(。

(5.2)若反常积分∫+∞∞−dx x xf )(不绝对收敛，则称X 的期望不存在。

（1）正态分布的期望设),(~2σµN X ，则µ=)(X E 。

这因为µµσπµσπµσπµσπσπσµσσµσµσµ=−=+=+−=⋅=⋅=∫∫∫∫∫∫∞+∞−−−∞+∞−−∞+∞−−−∞+∞−−−∞+∞−−−∞+∞−)(212121)(21)(21)()(22222222222)(22)(2)(2)(x t dx e dt tedxedx e x dx e x dx x f x X E x t x x x 其中分项积分可见，正态分布),(2σµN 中的参数µ正是其数学期望。

（2）正态分布的方差定义4.3 设X 是随机变量，若2)]([X E X E −存在，称2)]([X E X E −为X 的方差，记作D(X)，即2)]([)(X E X E X D −=。

方差的简化计算公式22)]([)()(X E X E X D −=正态分布的方差：设),(~2σµN X ，则2)(σ=X D 。

这因为.22|)(2221)()]([)(222222222)(2222σππσπσσµπσσπµσµ=⋅=+∞−∞+−=−==⋅−=−=∫∫∫∞+∞−−−∞+∞−−∞+∞−−−dt ee t x t dt et dxex x E X E X D ttt x表明正态分布中的参数2σ正是其方差。

6.正态分布的性质（1）（线性性质）若),(~2σµN X ，令b aX Y +=（其中b a ,0≠为常数），则 ),(~22σµa b a N Y +。

（2）（平方性质）若)1,0(~N X ，则)1(~22χX 。

（3）（分布的可加性）若X 与Y 相互独立,且),,(~),,(~222211σµσµN Y N X 则).(~2221,21σσµµ+++=N Y X Z（4）（线性组合性质）若n X X X ,,,21⋅⋅⋅相互独立，且,,,2,1),,(~2n k N X k k k ⋅⋅⋅=σµ则 ).,(~12211∑∑∑====nk k k n k k k nk kk a a N Xa Z σµ（5）（平均值性质）若n X X X ,,,21⋅⋅⋅相互独立，且,,,2,1),,(~2n k N X k ⋅⋅⋅=σµ则,(~121nN X n n k k σµ∑= 7. 抽样分布定理（1）（卡方分布的生成性）设)1,0(~N X i ，且),,2,1(n i X i L =相互独立，则)(~212222212n X X X X ni i nχχ∑==+++=L 。

（2）（t 分布的生成性）设)1,0(~N X ，)(~2n Y χ，X 与Y 独立，则称随机变量)(~n t nY XT =（3）（生成性）. 若),(~),(~2212n Y n X χχ且Y X ,相互独立,则随机变量()211221,~n n F Y n X n n Y nXF ==.（4）（抽样分布的基本定理）设总体),(~2σµN X ，),,,(21n X X X L 为取自该总体的样本，则1）样本均值),(~2nN X σµ；2）为样本方差其中221222),1(~)()1(S n XX S n nk k −−=−∑=χσσ；3）相互独立与2S X .（5）设n X X X ,,21L 为来自总体),(2σµN 的样本，则统计量)1(~−−=n t nS X T µ.8. 中心极限定理（1）（林德贝格-勒维(Lindeberg-Levy)定理）设相互独立的随机变量L L ,,,,21n X X X 服从同一分布，且),,2,1(0)(,)(2L =≠==i X D X E i i σµ则对于任意x ，随机变量σµn n XY nk kn ∑=−=1的分布函数)(x F n 趋于标准正态分布函数)(x Φ，即有)(21}{lim )(lim 22x dt ex Y P x F xt n n n n Φ==≤=∫∞−−∞→∞→π（2）设相互独立的随机变量L L ,,,,21n X X X 服从同一分布，且已知),,2,1(0)(,)(2L =≠==i X D X E i i σµ每个随机变量的分布函数未知，则当n 充分大时，1）∑==nk k X X 1近似服从正态分布),(2σµn n N ； 2）∑=nk k X n 11近似服从正态分布,(2nN σµ。

e商务文档

正态分布及其应用

相关文档推荐：