当前位置:文档之家› 统计学 概率

统计学 概率

? 一是各次试验互相独立, ? 二是每次试验得到一种结果的概率不
变(这里是得到正面的概率总是p)。
? 类似于抛硬币的仅有两种结果的重复 独立试验被称为贝努里试验( Bernoulli trials )。
4.4.1二项分布
? 下面试验可看成为贝努里试验:
? 每一个进入某商场的顾客是否购买某商 品
? 每个被调查者是否认可某种产品 ? 每一个新出婴儿的性别。
一家餐馆营业一天
顾客数
0,1,2,…
抽查一批电Leabharlann 原件使用寿命X? 0
新建一座住宅楼 半年完成工程的百 0?X ?100 分比
分布
? 随机变量取一切可能值或范围的概率或概率的规 律称为概率分布 (probability distribution , 简称分布 )。
? 概率分布可以用各种图或表来表示;一些可以用 公式来表示。
? 根据这种简单试验的分布,可以得到基 于这个试验的更加复杂事件的概率。
? 为了方便,人们通常称贝努里试验的两 种结果为“成功”和“失败”。
4.4.1二项分布
? 和贝努里试验相关的最常见的问题是:如 果进行n次贝努里试验,每次成功的概率为 p,那么成功k次的概率是多少?
? 这个概率的分布就是所谓的二项分布 (binomial distribution) 。
? 概率分布是关于总体的概念。有了概率分布就等 于知道了总体。
? 前面介绍过的样本均值、样本标准差和样本方差 等样本特征的概念是相应的总体特征的反映。
? 我们也有描述变量“位置”的总体均值、总体中 位数、总体百分位数以及描述变量分散(集中) 程度的总体标准差和总体方差等概念。
4.4 离散随机变量的分布
Bernoulli 试验中成功的次数的概率 ,p为每次试验成功的概率。有
p(k) ?
这里
? ? ?
n k
? ? ?
p
k
(1?
p)n?k ,
?n ??k
? ? ?
?
n! k!(n ?
k)!
k ? 0,1,..., n
为二项式系数,或记为 Cnk
九个二项分布 B(5,p) (p=0.1到0.9)的概率分布图
? 离散变量只取离散的值,比如骰子的点数 、网站点击数、顾客人数等等。每一种取 值都有某种概率。各种取值点的概率总和 应该是1。
? 当然离散变量不不仅仅限于取非负整数值 。
? 一般来说,某离散随机变量的每一个可能 取值xi都相应于取该值的概率 p(xi),这些概 率应该满足关系
? p(xi ) ? 1, p(xi ) ? 0 i
? 这时,人们想知道,该批产品被退回 的概率是多少?
? 这种概率就满足超几何分布( hypergeometric distribution )。
4.5 连续变量的分布
? 取连续值的变量,如高度、长度、重 量、时间、距离等等;它们被称为连 续变量(continuous variable) 。
? 换言之,一个随机变量如果能够在一 区间(无论这个区间多么小)内取任 何值,则该变量称为在此区间内是连 续的,其分布称为连续型概率分布。
.3
这里点间的连线没有意义,仅仅为容易识别 而画,因为Poisson 变量仅取非负整数值
.2
.1
Poisson 分 布
P(10)
概率
P(6)
0.0 0
P(3)
5
10
15
20
k
4.4.3 超几何分布
? 假定有一批500个产品,而其中有5个 次品。假定该产品的质量检查采取随 机抽取20个产品进行检查。如果抽到 的20个产品中含有2个或更多不合格产 品,则整个500个产品将会被退回。
? 它可以认为是衡量某种事件在一定 期间出现的数目的概率。
? 比如说在一定时间内顾客的人数、 打入电话总机电话的个数、页面上 出现印刷错误的个数、纺织品上出 现疵点的个数。
4.4.2 Poisson分布
? 在不同条件下,同样事件在单位时间 中出现同等数目的概率不尽相同。
? 比如中午和晚上某商店在 10分钟内出 现5个顾客的概率就不一定相同。
? 它们的概率分布很难准确地用离散变 量概率的条形图表示。
4.5 连续变量的分布
? 想象连续变量观测值的直方图;如果其纵 坐标为相对频数,那么所有这些矩形条的 高度和为1;完全可以重新设置量纲,使得 这些矩形条的面积和为1。
p=0.1
0.60
p=0.2
p=0.3
0.40
概 率
0.20
0.00
p=0.4
0.60
p=0.5
p=0.6
0.40
概 率
0.20
0.00
p=0.7
0.60
p=0.8
p=0.9
0.40
概 率
0.20
0.00
0
1
2
3
4
5

0
1
2
3
4
5

0
1
2
3
4
5

4.4.2 Poisson分布
? 另一个常用离散分布是 Poisson 分 布(“泊松分布”)。
4.4.1二项分布
? 最简单的离散分布应该是基于可重复 的有两结果(比如成功和失败)的相 同独立试验(每次试验成功概率相同 )的分布,例如抛硬币。
? 比如用p代表得到硬币正面的概率,那 么1-p则是得到反面的概率。
? 如果知道p,这个抛硬币的试验的概率
分布也就都知道了。
4.4.1二项分布
? 这种有两个可能结果的试验有两个特 点:
? 因此,Poisson 分布也是一个分布族 。族中不同成员的区别在于事件出现 数目的均值l 不一样。
4.4.2 Poisson分布
? 参数为l 的Poisson 分布变量的概 率分布为(p(k)表示Poisson 变量 等于k的概率)
P(k) ? e?l
l
k
,
k ? 0,1,2,...
k!
参数为3、6、10的Poisson 分布(只 标出了20之内的部分)
? 这个分布有两个参数,一个是试验次数n, 另一个是每次试验成功的概率p。
? 基于此,二项分布用符号B(n,p)或Bin(n,p) 表示。
? 由于n和p可以根据实际情况取各种不同的 值,因此二项分布是一族分布,族内的分 布以这两个参数来区分。
4.4.1二项分布
? 一 般 公 式 。 下 面 p(k) 代 表 在 n 次
第4章 随机变量的概率分布
4.4 离散随机变量的分布 4.5 连续随机变量的分布 4.6 使用概率来检验假设
学习目标
? 离散随机变量及相应的分布 ? 连续随机变量及相应的分布; ? 利用概率进行决策分析。
离散型随机变量与连续型随机变量
试验 抽查100个产品
随机变量
可能的取值
取到次品的个数 0,1,2,…,100
相关主题