第三章37概率
§3. 7 概率模型及其模拟
1. 随机变量及其概率分布 样本点ω:随机试验的可能结果 称全体样本点组成的集合为样本空间, 记为 Ω 随机事件A:样本空间中的子集 A ⊆Ω σ-代数F:样本空间的子集构成的集合,具有性质: Ω∈F 若A∈F 则 Ac∈F 若Ai∈F 则 ∪Ai ∈F
概率测度:定义在F上的实值函数, P: A → P{A}, A ∈ F , 满足: 1)非负性:P{A}>0, 2) 规范性:P{Ω}=1, 3)可列可加性: 设Ai ∈F 是两两不相容的事 件,则 P{∪Ai }= ∑P{Ai} , 称P{A} 为事件A 的概率, 0 ≤ P{A} ≤ 1. 称(Ω F P) 为概率空间,它是研究随机试验 的概率模型
⎧ X 1 + + X n − nμ ⎫ lim Pr ⎨ ≤ t ⎬ → Φ (t ) = n →∞ σ n ⎩ ⎭
∫
t
−∞
1 − x2 / 2 e dx 2π
于是,有 95% 的把握断言
−2≤ X1 + + X n − nμ ≤2
σ n
nμ − 2σ n ≤ X 1 +
+ X n ≤ nμ + 2σ n
dA q ΔA / A S ( A, q ) = ⋅ = lim dq A Δq →0 Δq / q
更一般的稳健性分析要考虑独立性的假设。这里 假设在操作过程中接连出现次品的次数之间是无 关的。事实上,有可能由于生产环境中的一些异 常的原因,如工作台的颤动或电压变化的冲击, 使得次品的二极管趋向于出现在一些批次中。这 时,独立随机变量概率模型的数学分析就不能完 全处理这个问题。 在下一节介绍的随机过程的模型可以描述某些具 有依赖性的问题。当然,有些依赖性的问题不容 易给出解析的表达式,随机模拟就成为常用的方 法。
2 . 当n = 153时,因为对于任何的 λ∈[128,178] 区间(153 /λ-2*1531/2/λ,153 /λ+2*1531/2/λ)总 会包含 1,所以对于任何的社区,只要它的平均 每月报警电话数在128到178次之间,一个月有 153次报警就属于正常的变化范围。 3. 因为,中心极限定理只要当 μ和 σ是有限的时 对于任何的分布都是正确的。所以,我们的结论 上对于报警电话之间的时间 间隔是指数分布的假 设是不灵敏的。
变量 n = 每个检验组内二极管的数目(决策变量) C = 一组元件的检验费用(分)(随机变量) A = 平均检验费用(分/个) q=一个二极管为次品的概率 假设:二极管质量相互独立 如果 n = 1, 则 A = 5分 否则 (n > 1), 都是好的, 则 C = 4 + n 如果检验结果有次品, 则 C = (4 + n) + 5 n A = (C 的平均值)/ n 目标: 求 n 的数值, 使 A 最小
P (ξ = k ) =
λk
k!
e
−λ
P (ξ t = k ) =
λt− e − λ t , t ≥ 0 F (t ) = ⎨ ⎩ 0, t < 0 ⎧ λ e − λt , t ≥ 0 p (t ) = ⎨ ⎩ 0, t < 0
均匀分布 离散的均匀分布 连续的均匀分布 正态分布
建模的方法:统计推断。 假设 X,X1,X2,X3,…是独立的随机变量,全部 有相同的分布。它的平均或期望值是 EX = Σxk P{X = xk}, 方差为 VX =Σ(xk – EX)2 P{X = xk}, 中心极限定理:当 n →∞时, X1+…+Xn 的分布越来 越接近于正态分布。特别是,如果 μ= EX,σ2 = VX,则对于所有的实数 t,有
2 几类常见的概率分布 两点分布 只有两种可能结果 (成功、失败)的实验 称为贝努里试验。 试验成功的概率为p 二项分布
⎧1 ξ = ⎨ ⎩0 成功 失败
⎧ p P (ξ = x) = ⎨ ⎩1 − p
x =1 x=0
ξ: n重贝努里试验成功的次数。
P (ξ = k ) = C p (1 − p )
当 n = 17 时 A 取最小值 A = 1.48 (分/个)。 结论:在次品的二极管出现得很少,每一 千的中只有三个的前提下,采用分组检验 次品二极管的方法非常经济。逐个检验的 花费是 5 分/个。使用每一组 17 个二极管 串联起来分组化验,在不影响质量的前提 下可以将检验的费用降低到三分之一,花 费只有1.5 分/个。
k n k
n−k
泊松分布 ξ: 在单位时间间隔内随机 事件发生的次数.(已知 单位时间内平均发生的 次数为λ.) 注:满足独立增量、平稳 性、普通性的随机过程) 在时间区间[0,t)内随机 事件发生的次数ξt服从泊 松分布,称为泊松过程 指数分布 泊松过程的随机事件陆续 发生的时间间隔, (已知平均时间间隔为1/λ)
组建模型:假设报警电话之间的时间 Xn 是指数分布。 期望:μ= 1/λ 方差:σ2=1/λ2 将 λ=171 和 n = 153 代入也就是说, 0.75 ≤ X1 + … + X153 ≤ 1.04 因此,观察值
X1 + … +X153 ≈ 1
在正常的变化范围之内。
结论:断言火灾报警率降低的证据是不充分的。 所观测到的报警电话的数量也许是正态随机 变量的正常的结果。自然,每月报警电话的 数量连续这样低,则我们就需要重新评估这 一情况。 灵敏性分析: 1. 当λ=171时,因为对于任何的 n ∈[147,198], 区间(n/171-2n1/2/171, n/171+2n1/2/171)总 会包含 1,所以有 95% 的时间这个社区每 月报警电话的次数在147到198之间。
问题1 在一个简单的掷骰子的游戏中,同时投掷 两个骰子,庄家将按照两个骰子所示的点数付 给你同等面值的人民币(元)。要付多少钱你 才愿意玩这个游戏? 注: EX=2*1/36+3*2/36+4*3/36+5*4/36+6*5/36 +7*6/36+8*5/36+9*4/36+9*4/36+10*3/36 +11*2/36+12*1/36=7
连续型 若 P(ξ ∈ [a, b]) = ∫a p ( x)dx 则称 函数 p(x) 为随机变量 ξ 的分布密度,
b
∫
+∞
−∞
p ( x)dx = 1
此时随机变量 ξ 的分布函数为 F ( x) = ∫−∞ p( x)dx 随机变量 ξ 的分布函数F(x)具有性质: 单调非降 左连续 规范性: F(- ∞)=0, F(+ ∞)=1
变量: n=飞机容量, g=机票价格, r=飞行费用, g=r/(an), a =利润调节因子(例如,a=60%, 表示 飞机60%的满员率就不亏本)。 m=预订票数量的限额 (>n), p=每位持票乘客不按时前来登机的概率,个人的 行为是独立的。 b=每位因满员不能飞走的乘客获得的赔偿金。
假设: 1. 预订票的乘客按时前来登机是随机的。 2. 维护公司的社会声誉可以通过使得持票按时前 来登机,但因为满员不能飞走的乘客人数限制 在一定范围内来实现。 3. 公司的经济利益由每次航班利润s的期望值(平 均利润)S体现, s=机票收入-飞行费用-赔偿金。 目标:确定预订票数量的最佳限额m,使公司利益 最大化,既要使得最大,且使得因飞机满员不 能飞走的乘客限制在一定数量以内。
灵敏度分析:质量管理程序的实行将依赖于 若干模型范围之外的因素。 1. 也许由于我们操作的特殊性对于10个或20 个一批的二极管或者 n 是 4 或 5 的倍数时检 验起来更容易。 验证:在 n = 10 和 n = 35 之间时检验的平 均花费 A 没有明显的变化。
2. 在检验过程中的次品率 q = 0.003 同样也是 必须考虑的。这个数值可能会随着工厂内的 环境条件而发生变化。 一般模型 A=4/n+6– 5 (1 – q)n 当n=17时,A对q的灵敏性 S(A,q)=0.16 所以,q 的微小的改变不会导致检验费用大 的变化。
4. 数值模拟
• 解析模拟方法
例3:航空公司的预订票策略 航空公司预订票业务承诺,预先订购机票的乘客 可以在登机时才付款。如果限定预订票的数量 恰好等于飞机的容量,则可能由于定了票的乘 客不按时前来登机,致使飞机因为不满员而利 润降低,甚至亏本。如果不限制预订票数量, 那么当持票按时前来登机的乘客超过飞机容量 时,必然会引起乘客的不满,导致公司在经济 和声誉方面受损。所以公司要确定预订票数量 的最佳限额。
一共有 n 个二极管,一个二极管为次品的概率是 0.003。换句话说,一个二极管是正品的概率为 0.997。假设每个二极管都是相互独立的,于是 一个检验组内的 n 个二极管全部是正品的概率为 p = 0.997n。 随机变量 C 的期望值是 EC = (4+n) 0.997n + [(4+n) + 5n] (1 – 0.997n) = (4+n) + 5n (1 – 0.997n) = 4 + 6n – 5n (0.997)n 由大数定律知,C的平均值≈C 的期望值 模型:每一个二极管的平均检验费用为 A = 4/n + 6 – 5(0.997)n
建模的方法:离散的概率模型。 对于任何的 n > 1, 随机变量 C 取两个可能数值中的一个: 如果所有的二极管都是好的, 则 C=4+n. 否则 C=(4+n)+5n, 用 p 表示所有的二极管都是正品的概率,则 C 的 平均或期望值是 EC =(4 + n)p +[(4 + n)+5n](1–p)
例2:火灾率
一个地区119 应急服务中心在过去的一年内 平均每月要收到171个房屋火灾的电话。基 于这个资料房屋的火灾率被估计为每月171 次。下一个月收到的火灾报警电话只有153 个。这是否表明房屋的火灾率实际上减少 了,或者它就是一个随机波动?