当前位置:
文档之家› 第三章 几种常见的概率分布律
第三章 几种常见的概率分布律
第三章 几种常见的概率分布律
二项分布
泊松分布 离散型变量 超几何分布 负二项分布 连续型变量
正态分布 指数分布
第一节 二项分布
(Binomial Distribution)
1.贝努利试验和在什么情形下应用二项分布
•贝努利试验(Bernoulli trial):试验只有两种可能的结果,并
且发生每种结果的概率是一定的。
根据题意, n 2000 , 0 . 70 。
平均数 n 2000 2000 0 . 7 0 . 3 20 . 4
二项分布
(实例)
【例】已知 100 件产品中有 5 件次品,现从中任取一件,有 放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的 概率 解:设 Y 为所抽取的3件产品中的次品数,则根据二项分 布公式有
y 1 • Y的分布函数 F ( y ) P ( Y y ) f ( y ) d y e
2
d y
正态分布曲线的主要特征:
(1)曲线是单峰、对称的“悬钟”形曲线,对称轴是 x=μ (2)曲线是非负函数,以x轴为渐近线,分布从-∞到∞ (3)曲线在x=μ±σ处各有一个拐点,即在[μ-σ, μ+σ]范 围内是上凸,其余是下凸。 (4)曲线有两个参数:μ和σ。 μ代表平均数,σ代表 标准差, μ和σ一起决定曲线的位置和形状。 μ越大, 则曲线沿x轴越向右移动;反之向左。 σ是变异度参 数, σ愈大则曲线愈“胖”;反之则愈瘦。
2. 泊松分布的概率函数与特征数
泊松分布变量 Y 只取零和正整数: 0,1,2… ,其概率 函数为
P(y)
y
y!
e
其中 0 , e2 . 7182 是自然对数底数。
注意: P ( y ) 怎么得到的呢?泊松分 布可以用二项分布 n , 0 , y !
y y y n y n 的情形来近似。在这种 情形下 C ( 1 ) e , 证明见 46 页 n
这说明每穴种6粒种子,几乎肯定出苗。
4 二项分布的概率分布表和概率分布图
除以P(y)表示,二项分布也可通过表或图来直观显示。
例如,抛硬币4次,获得的正面数记为Y,则Y服从二项 分布。Y的概率分布表为 Y P(y)
n 4 , 0 . 5 ,
0 0 4 P ( 0 ) C . 5 0 . 5 0 . 062 40
数学期望与方差
计算程序: P ( Y ) =hypgeomdist ( y , n , M ,
N)
例子
四川卧龙大熊猫自然保护区共有野生大熊猫 100只,其中10 只做了标记。某小组去调查研究大熊猫的生活习性,随机观 察了15只大熊猫,问这15只大熊猫中有5只做了标记的概率?
解:依题意有N=100,M=10,n=15,y=5,求p(5)
10 ! 7 3 0.75 0.25 7 ! 3 ! 0.2503
所以,窝产仔10头,有7头白猪的概率是0.2503。
例二,有一批玉米种子,出苗率为 0.67 。现任取 6 粒种子种1穴中,问这穴至少有1粒种子出苗的概率 是多少?
解:根据题意,这是一 个二项分布的问题。 视出苗为成功 n 6 , = 0 . 67 。 设出苗的种子数为 y , 则 y 服从二项分布。
P ( 至少有 1 粒出苗 ) = P ( y 1 ) P ( y 1 ) P ( y 2 ) P ( y 6 )
1 1 5 2 2 4 6 6 0 C 0 . 67 0 . 33 C 0 . 67 0 . 33 C 0 . 67 0 . 33 6 6 6
2 2 3 2 P Y 2 C ( 0 . 05 ) ( 0 . 95 ) 0 . 0071 3
二项分布的程序计算方法
二项分布函数Binomdist(k,n,p,false/true) 某数阶乘的计算函数Fact 从给定元素数目m的集合中抽取若干n元素的排列 组合数C n m 计算函数Combin(m,n)
p ( 5 ) =hypgeomdist ( y , n , M , N ) =hypgeomdist
(5,15,10,100)=0.00569
第三节 正态分布
(Normal Distribution)
正态分布是一种最重要的连续型变量的概率分布。
• 在生物科学研究里,有许多变量是服从或近似 服从正态分布的,如水稻产量、小麦株高、玉 米百粒重等; • 许多统计分析方法是以正态分布为基础的。 • 不少随机变量的概率分布在样本容量增大时趋于 正态分布。 因此,在统计学里,正态分布无论在理论研究上还是在实际
第二节 泊松分布
(Poisson Distribution)
1. 在什么情形下应用泊松分布
泊松分布是一种用来描述一定的空间或时间里稀有事件发生次 数的概率分布。 服从泊松分布的变量的一些例子: • 一定畜群中某中患病率很低的非传染性疾病患病数或死亡数。 • 畜群中遗传的畸形怪胎数 • 单位空间内某些野生动物或昆虫数 • 每升饮水中的大肠杆菌数
2 2 4 2 P ( 2 ) C ( 1 ) 4
* *由此类推到一般情形, 在 n 此贝努利试验中,共 得 y 次成功的概率是
y y n y P (y ) C ( 1 ) n
关于 P ( y ) C ( 1 ) 的讨论:
y y n n y
y y n y n ( 1 )从形式上来说, C ( 1 ) 是二项式 [ ( 1 )] 展开 n
5 二项分布变量的平均数和标准差
平均数
E ( Y ) n
Var ( X ) n ( 1 )
2
方差和标准差
n ( 1 )
例三,某树种幼苗成材率为70%,现种植2000 株,问成材幼苗数的平均值和标准差是多少?
解:设 2000 株幼苗的成材数为 Y ,则 Y 服从二项
大约有 100 P ( X 3 ) 100 0 . 4232 42 . 32 ( 张 )
程序计算
Poisson(y,µ,true or false)
超几何分布
适用范围:多次完全相同并且相互独立的重 复试验,如果在有限总体中不重复抽样,抽 样成功的次数Y的概率分布服从超几何分布, 如福利彩票
σ=0.5 σ=1 σ=2
(5)曲线下和x轴所夹的总面积为1
2 标准正态分布
定义:μ=0,σ=1时的正态分布称为标准正态分布。 标准正态分布变量记为U,写作 U~N(0,1)。
1 密度函数: ( u ) e 2
2. 二项分布的常用符号
n:贝努利试验的次数(或 样本含量)
y :在 n 次试验中事件 A 出现的次数,即二项分 布变量 Y 的取值
:事件 A 发生的概率 ( 每次试验都是恒定的 )
1 - :事件 A 发生的概率
p ( y ):Y 的概率函数即 P ( Y y )
F ( y ) P ( Y y ) p ( y i)
0 . 0157 0 . 0799 0 . 0905 0 . 9987 另外一种方法:
P ( 至少有 1 粒出苗 ) = 1 - P ( 没有出苗 ) = 1 P ( y 0 )
0 0 6 1 C 0 . 67 0 . 33 1 0 . 0013 0 . 9987 6
的第 y 1 项,所以有“二项分布 ”这个名称。
例一,纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子 二代中白猪与黑猪的比率为3:1。求窝产仔10头,有7头白猪 的概率。
解:根据题意,这是一 个二项分布的问题, 3 视白猪为成功,有 n 10 , = 0 .75 , y7 。 4
7 7 1 7 0 P ( y 7 ) P ( 7 ) C 0 . 75 ( 1 0 . 75 ) 10
泊松分布的平均数
= E ( X )
泊松分布的方差和标准差
= Var ( X )
2
例一,显微镜下观察一种悬浮液中的某种颗粒,据前人报告, 平均每张样片可以观察到3个微粒,问在一次观察中看到3个 微粒的概率是多大?少于3个微粒的概率是多少?若观察100 张片子,大约有多少张片子看到的微粒数少于3个?
例如:抛一枚硬币,看得到正面还是反面; 掷一次骰子,看得到6还是没有得到6; 随机抽查一名婴儿的性别,看是男是女 在贝努利试验里,两种结果可分别称为“成功”和“失败”, 或者“事件A发生”和“事件A没有发生”。
• 什么情形时应用二项分布:实验中进行了 n 次独立的贝努利 试验,统计在这n次试验中总共获得了多少次“成功”。“成 功”的次数,记为变量Y;Y称为二项分布变量,Y的概率分布 称为二项分布。 Y的可能取值为0,1,2,…,n。所以Y是个离散型变量。
二项分布变量的一些例子:
(1)连续抛硬币100次,统计总共出现正面的次数。次数Y服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为Y,则Y服从二项分布。 (3)调查n枚种蛋的出雏数,出雏数Y服从二项分布。 (4)n头病畜治疗后的治愈数Y,Y服从二项分布。 (5)n尾鱼苗的成活数Y,Y服从二项分布。
0
1 2 3 4
0.062
0.250 0.375 0.250 0.062
Y的概率分布图为
二项分布 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0 1 2 获得正面的次数y 3 4
注意:
0.5时,分布对称; 0.5时,分布偏斜:
概率
0.5时,正偏 0.5时,负偏
应用中均占有重要的地位。