3 理论分布与抽样分布
【例3.7】 已知u~N(0,1),试求: (1) P(u<-1.64)=?
(2) P (u≥2.58)=?
(3) P (|u|≥2.56)=? (4) P(0.34≤u<1.53) =?
(1) P(u<-1.64)=0.05050
(2) P (u≥2.58)=Φ(-2.58)=0.024940
加减不同倍数σ区间的概率)是经常用到的。
P(μ-σ≤x<μ+σ)= 0.6826
P(μ-2σ≤x<μ+2σ) = 0.9545 P (μ-3σ≤x<μ+3σ) = 0.9973
P (μ-1.96σ≤x<μ+1.96σ) = 0.95
P (μ-2.58σ≤x<μ+2.58σ)= 0.99
在数理统计分析中,不仅注意随机变量x落在平均数加减不 同倍数标准差区间(μ-kσ , μ+kσ)之内的概率,更关心的是x落在 此区间之外的概率。
二项分布---二项分布的定义及其特点
二项分布的应用条件: (1)各观察单位 只具有相互对立 的一种结果,如合格或不 合格, 生存或死亡等等,非此即彼; (2)已知发生某一结果 (如死亡) 的概率为p,其对立结果 的概率则为1-P=q,实际中要求p 是从大量观察中获得的比较 稳定的数值; (3)n次观察结果互相独立,即每个观察单位的观察结果不
P (-2.58≤u<2.58)=0.99
标准正态分布的三个常用概率如图示
u变量在上述区间以外取值的概率分别为: P(|u|≥1)=2Φ(-1)=1- P(-1≤u<1) =1-0.6826=0.3174 P(|u|≥2)=2Φ(-2) =1- P(-2≤u<2) =1-0.9545=0.0455 P(|u|≥3)=1-0.9973=0.0027 P(|u|≥1.96)=1-0.95=0.05 P(|u|≥2.58)=1-0.99=0.01
x~N(μ,σ2) u=(x-μ)/σ
x~N(0,1)
0
正态分布
例如,u=1.75时,由附表1可以查出 Φ(1.75)=0.95994 有时会遇到给定Φ(u)值 ,例如Φ(u)=0.284,反 过来查u值。这时只需在附表1中找到与 0.284 最 接近的值0.2843,对应查出相应的u值为 u = - 0.57,即 Φ(-0.57)=0.284
λ是波松分布所依赖的唯一参数。 λ值愈小分布愈偏倚,
随着λ的增大 ,分 布趋于对称(如图所示)。当λ = 20时分布接 近于正态分布;当λ = 50时, 可以认 为波松分布呈正态分布。 所以在实际工作中,当 λ≥20时就可以用正态分布来近似地处 理波松分布的问题。
图3-3 不同λ的泊松分布
泊松分布
生时取0。那么,贝努利试验的概率公式可以表示为:
P(x=1)=p
P(x=0)=q
1,A事件发生,成功
其中x=
0,A事件未发生,失败
也称为两点分布
二项分布---二项分布的定义及其特点
二项分布---二项分布的定义及其特点
一般,在n重贝努利试验中,事件A恰好发生 k(0≤k≤n)次的概率为 k =0,1,2…,n 二项概率公式
(3) P (|u|≥2.56)
=2Φ(-2.56)=2×0.005234
=0.010468
(4) P (0.34≤u<1.53)
=Φ(1.53)-Φ(0.34)
=0.93669-0.6331=0.30389
对于标准正态分布,特殊区间的概率为:
P(-1≤u<1)=0.6826 P(-2≤u<2)=0.9545 P(-3≤u<3)=0.9973 P(-1.96≤u<1.96)=0.95
第三章 统计数据的理论分布与抽样分布
统计数据的理论分布与抽样分布---二项分布
重要的离散型分布
只有两种可能结果的随机试验称为贝努利试验
食品抽样中,产品合格或不合格,
种子发芽或不发芽,施药后害虫死或活等等。
二项分布---贝努利试验的概率公式
在贝努利试验中,事件A可能发生,也可能不发生,用随
机变量x表示贝努利试验的两种结果,记A发生时取1,A不发
由标准正态分布概率计算式及正态分布的对称性可推出
下列关系式:
P( 0≤u<u1)= Φ(u1)-0.5
P(u≥u1) = Φ(-u1)
P(|u|≥u1)=
P(u< u2) = Φ(u2)
2 Φ(-u1)
P(|u|<u1 ) = 1-2 Φ(-u1) P(u1≤u<u2)= Φ(u2) - Φ(u1)
项分布可由波松分布近似;当p>0.1且n很大时,二项分布可由 正态分布近似。
对于波松分布,当λ→∞时 ,波松分布以正态分布为极 限。在实际计算中, 当 λ≥20 (也有人认为λ≥6)时,用波
正态分布(normal distribution)
正态分布是一种很重要的连续型随机变量的概率分布。自 然现象中有许多变量是服从或近似服从正态分布的。如食品
中各种成分的含量、有害物质残留量、瓶装食品的重量、分
析测定过程中的随机误差等等。许多统计分析方法都是以正 态分布为基础的。此外,还有不少随机变量的概率分布在一 定条件下以正态分布为其极限分布。因此在统计学中,正态 分布无论在理论研究上还是实际应用中,均占有十分重要的
【例3-6】 为监测饮用水的污染情况, 现检验某社区每毫升饮 用水中细菌数 , 共得400个记录如下:
试分析饮用水中细菌数的分布是否服从波松分布。若服从, 按波松分布计算每毫升水中细菌数的概率及理论次数并将頻率分 布与波松分布作直观比较。
细菌数的波松分布
可见细菌数的频率分布与λ=0.5的波松分 布是相当吻合的 , 进一步说明用波松分布描述 单位容积(或面积)中细菌数的分布是适宜的。
标准正态分布的分布函数
随机变量u服从标准正态分布,记作u~N(0,1),分 布密度曲线如图所示。
0
图 标准正态分布曲线
正态分布
对于任何一个服从正态分布N(μ,σ2)的随机变量x,都可以通 过标准化变换,
u = ( x - μ )/ σ
将其变换为服从标准正态分布的随机变量u。u称为标准正 态变量或标准正态离差。
图3-5 σ相同而μ不同的3个正态分布比较
图3-6 μ相同而σ不同的3个正态分布比较大
正态分布
(6)分布密度曲线与横轴所围成的区间面积为1,即:
(7) 正态分布的次数多数集中在平均数μ的附近,离均
数越远,其相应次数越少,在3σ以外的极少,这就是食品
工业控制中的3σ 原理的基础。
正态分布
标准正态分布 正态分布是依赖于参数 μ和 σ2 (或 σ) 的一簇 分布,正态
泊松分布ห้องสมุดไป่ตู้
注意,二项分布的应用条件也是波松分布的应用条件。 比如二项分布要求n 次试验是相互独立的,这也是波松分布 的要求。 然而一些具有传染性的罕见疾病的发病数,因为首例发
生之后可成为传染源,会影响到后续病例的发生,所以不符
合波松分布的应用条件。 对于在单位时间、单位面积或单位容积内,所观察的稀 有事件由于某些原因分布不随机时,如细菌在牛奶中成集落 存在时,不呈波松分布,不能用波松分布来描述其发生规律。
的次数,每升饮水中大肠杆菌数,计数器小方格中血球数,
一批香肠中含有毛发的香肠数,1000袋面粉中含有金属物 的袋数等等,都是服从或近似服从波松分布的。
泊松分布
k=0,1,……
泊松分布
波松分布重要的特征
波松分布为离散型随机变量的概率分布,其平均数和方 差相等,都等于常数λ,即 μ = σ2 = λ
因此,计算一般正态分布的概率时, 只要将原区间的上下
限作适当变换(标准化), 就可用查标准正态分布的概率表的方 法求取某一区间的概率。
已知x~N(100,22),试求P(100≤x<102)=?。
=P(0≤u<1) =Φ(1) - Φ(0)
= 0.8413-0.5000
=0.3413
关于一般正态分布,以下几个概率(即随机变量x落在μ
曲线的位置及形态随 μ和 σ2的不同而不同 。这就给研究具体
的正态总体带来困难, 通常将一般的N(μ,σ2) 转 换为 μ= 0, σ2=1的正态分布。记做u~N(0, 1)。 μ=0,σ2=1的正态分布为标准正态分布(standard normal
distribution)。
正态分布
标准正态分布的概率密度函数及分布函数分别记作ψ(u) 和Φ(u), 标准正态分布的概率密度函数
会影响到其它观察单位的观察结果。
泊松分布(poisson distribution)
波松分布是一种 可以用来描述和分析随机地发生在单位 空间或 时间里的稀有事件的概率分布。要观察到这类事件, 样本含量 n 必须很大 。 所谓稀有事件即是小概率事件。在生物、医学等研究中, 服从波松分布的随机变量也是常见的。例如,正常生产线中 单位事件生产出不合格产品个数,单位事件内机器出现故障
图3-2 p值不同的二项分布比较
二项分布---二项分布的定义及其特点
二项分布的概率计算及应用条件
(1)已知随机变量 x~ B(n,p),求x正好有k次发生的概率。
【例p43】有一批食品,其合格率为0.85,今在该批食品中随 机抽取6份该食品,求正好有5份食品合格的概率? 由题意可知,食品抽检结果有两种可能,合格与不合格,合格率 为0.85,即P(A)=0.85,相应不合格率为P( )=1-0.85 =0.15,由概率公式得,正好有5个合格产品的概率为:
者间的关系如下:
对于二项分布,在n→∞,p→0, 且 n p =λ (较小常数)情 况下 ,二项分布趋于波松分布。在这种场合,波松分布中的参 数λ 用二项分布的n p代之;在n→∞, p→0.5时,二项分布趋 于正态分布。在这种场合 ,正态分布中的 μ 、σ 2用二项分布