当前位置:文档之家› 常用21个统计分布总结

常用21个统计分布总结

Bernoulli ( p ) 伯努利分布说明与例:x 为伯努利试验的结果,当试验成功,则x=1,试验失败则x=0。

可以把伯努利试验理解为抛硬币,x=1为出现正面@ Binomial ( n, p ) 二项分布(图以p=,n=5为例).说明与例:x是重复n 次的伯努利试验结果,即x=试验成功的次数,可以理解为抛n 次硬币,正面出现的次数。

P X x p | ()p x 1p ()1x ;x 01 , ; 0p 1EXp , Var Xp 1p ()M X t ()1p ()pe t 01xP X x n | p , ()n x ()p x1p ()nxx 012...n , , , , ; 0p 1EX np , Var X np 1p ()M x t ()pe t1p ()[]nMultinomial ( m, p 1, ..., p n ){多项分布图略(因为是联合分布的多维分布)说明与例:多项分布是二项分布的推广,二项分布结果只有两个,而多项分布结果可以有多个,比如仍骰子,x1表示n 次试验点数1出现的次数…x6表示点数6出现的次数。

Geometric ( p )—几何分布(图以p=为例)说明与例:得到一次成功而进行的伯努利试验次数n ,即前面失败了n-1次,第n 次成功。

比如x 可以理解为抛硬币,出现正面所抛的次数&f x 1...x n , , ()m !x 1!...x n !p 1x 1...p n xnm !i 1np i x ix i !ÕP X x p | ()p 1p ()x 1 ; x 12... , , ; 0p 1EX1p, Var X1pp 2M X t ()pe t11p ()et, t log 1p ()-!Hypergeometric 超几何分布!(以N=10,m=5,n=4为例)说明与例:已知N 个总体中有m 个不合格的产品,现在抽取n 个,出现不合格产品的数量。

Negative binomial ( r, p ) 负二项分布"P X x N | M K , , ()Mx ()N MK x ()N K () ; x 01...K , , , M N K ()x M ; N M K 0 , , EX KM N , Var XKM N N M ()N K ()NN 1()P X x r | p , ()rx 1x()p r1p ()x ;x 01... , , ;0p 1EX r 1p ()p , Var Xr 1p ()p2M X t ()p11p ()e t()r, t log 1p ()-)(改图来自维基百科,反映了一个大致的变动趋势)(这是以r=3,p=为例进行模拟得到的)说明与例:在一连串伯努利试验中,一件事刚好在第r+k 次试验出现第r 次的概率,如做了3+1次试验,每次成功概率为, 那么该试验刚好在第四次出现第三次成功的概率就为>Poisson ( λ ) 泊松分布说明与例:泊松分布多用来描述单位时间(面积)内随机事件发生的次数,参数λ是单位时间(面积)内随机事件的平均发生率,如显微镜下单位分区内的细菌分布数、服务设施在一定时间内受到的服务请求次数等。

<Beta ( α, β ) 贝塔分布P X x λ | ()e λ-λxx ! ; x 01... , , ; 0λ¥EX λ , Var X λM X t ()eλe t 1()其中1110(,)(1)(0,0)p q B p q x x dxp q --=->>⎰{说明与例:某变量取某一个有限长度(时间)中的某一段长度(时间)时,该变量表现为贝塔分布,如心理学中认为,一个正常人在整个睡眠中,异相睡眠所占的比例服从贝塔分布。

(参考资料:维基百科贝塔分布的有关性质及应用探讨 )Cauchy (θ, σ ) ~柯西分布Mean and variance Do not existIf X and Y are independent N(0,1), X/Y is Cauchyf x α | β , ()1B αβ , ()x α11x ()β1 , 0x 1 , α0 , β0EXααβ, Var Xαβαβ()2αβ1()M X t ()1k 1¥r 0k1αr αβr Õ()t kk !åf x θ | σ , ()1p σ11x θσ()2, σ0…说明与例:柯西分布于正态分布的图形有点像,但柯西分布的图形下降至0的速度更快,如第2张图中,下面的那个是柯西分布。

柯西分布用来描述共振行为,如在物理学中描述受迫共振的微分方程的解,在光谱学中描述共振或者其他机制加宽的谱线性状。

Chi squared ( p ) 卡方分布¥f x p | ()x p21e x -2Γp 2()2p 2; 0x ¥ ; p 12..., , EXp , Var X 2p M X t ()112t()p 2, t12χ2m ()Gamma m 22, ()说明与例: k 个独立的标准正态分布变量的平方和服从自由度为k 的卡方分布。

在独立性检验、样本对总体的拟合程度等中常常用到。

Double exponential ( μ, σ ) 双参指数分布》(以double exponential(1,2)为例,即把单指数分布exponential(2)右移1个单位,在按照对称轴x=1反转)Exponential ( β ) : 指数分布f x μ |σ , ()12σe x μ||-σ, σ0EX μ , Var X 2σ2M X t ()e μt 1σt ()2, t ||1σf x β | ()1βe x -β , 0x¥ , β0以(exponential (2)为例,便于与exponential (1,2)对比);(来自维基百科)说明与例:指数分布常用于等待时间,因为它具有“无记忆性”即,已经等待了10分钟,再等待5分钟的概率,与已经等待30分钟,再等待50分钟的概率是一样的。

FF 分布)EX β , Var X β2M X t ()11βt, t 1βf x v 1 | v 2 , ()Γv 1v 22()Γv 12()Γv 22()v 1v 2()v 12xv 12()21v 1v 2()x ()v 1v 2()2EXv 2v 22, v 22Var X 2v 2v 22()2v 1v 22v 1v 24(), v 24EXnΓv 12n 2()Γv 22n 2()Γv 12()Γv 22()v 2v 1()n, nv 22说明与例:常用于统计检验,如方差分析、估计模型的拟合效果等~Gamma ( α, β ) 伽马分布(来自维基百科)~说明与例:G(a,b)意义是,如果某事件发生一次需要时间b (1/b 即该事件的发生频率),那么x 为等到第a 事件发生时所需的时间),比如,经济衰退发生一次要3年,那么第2次经济衰退的时间就服从G (2,3)的伽马分布(现实中并没求证,只是举个例子)Logistic ( μ, β)F v 1v2, χv 12v 1()χv 22v 2()F1v, t v 2f x α | β , ()1Γα()βαx α1e x -β , 0x¥ , αβ , >0EX αβ , Var X αβ2M X t ()11βt()α, t1β逻辑分布这个分布之前没听说过,在excel 也没有相关函数对其分布进行模拟 ;Lognormal (μ, α)对数正态分布-(来自维基百科)说明与例:当x 服从正态分布时,y=exp(x)就服从对数正态分布。

变量可以看做是很多很小的独立因子乘积时候,该变量多服从对数正态分布,比如股票投资的长期收益率,它是每天收益率的乘积。

Normal (μ, σ2) 正态分布f x μ | β , ()1βe x μ()-β1e x μ()-β[]2, β0EX μ , Var X p 2β2()3M X t ()e μt Γ1βt ()Γ1βt () , t ||1βf x μ | σ2 , ()12p σelog x ()μ()-22σ2()x, 0x ¥EX eμσ22, Var Xe 2μσ2()e2μσ2EXnenμn 2σ22f x μ | σ2 , ()12p σe xμ()-22σ2()EX μ , Var X σ2M X t ()eμtσ2t 22*说明与例:最广泛的分布,试验过程中的随机误差多呈现正态分布,很多医学、经济、人口指标都服从或近似服从,如同质群体的身高、红细胞数、血红蛋白量、人的智力等等·Pareto ( α, β )帕累托分布说明与例:帕累托来源于对财富的观察:20%的人掌握了80%的财富,因此帕累托分布的例子有:中产阶级崛起之前,财富在个人之间的分布、人类居住区域的大小、油田石油贮备数f x α | β , ()βαβx β1, 0αx ¥ , α0 , βEXβαβ1, β 1 , Var Xβα2β1()2β2(), β2量(都是前面少部分掌握了最大部分的资源)>TT 分布(来自维基百科)说明与例:在一些检验中,由于总体标准差是未知的,小样本情况下,再用u 检验会产生很大的误差,用t 检验改进以获得准确的结果,如两样本的t 检验。

Uniform (a, b) 均匀分布f x v | ()Γv 12()Γv 2()1v p 11x 2v ()()v 1()2, v 1..., EX 0 , v 1 , Var Xv v 2EX n Γn 12()Γv n 2()p Γv 2()v n 2if n<v and evenEXn0 if n<v and oddF 1v , t v 2f x a | b , ()1b a, a xbEXb a 2, Var Xb a ()212M X t ()e bt e at b a ()t说明与例:当x 在a~b 之间取任何一个值都是等可能时,此时x 服从均匀分布。

如掷骰子,x 出现的点数。

Weibull ( γ, β ) 威布尔分布f x γ | β , ()γβx γ1e x -γβ , 0x ¥ , γ0 , β0EXβ1γΓ11γ() , Var X β2γΓ12γ()Γ211γ()[]EX n βn γΓ1n γ()说明与例:寿命常服从这个分布,如滚动轴承的寿命等,因此在生存分析、工业产品制造、可靠性和失效分析、寿险模型等中用到很多。

相关主题