当前位置:
文档之家› 数学建模 概率统计建模的理论与方法
数学建模 概率统计建模的理论与方法
0,x b; 1 e ( x b ) x b.
0,x b; 其密度函数为 pY ( x) ( x b ) x b. e
4 5
6
7
8
9
10
4
可以看出, {X 6} 1 P{X 6} 0.000864 P 也就是说,如果供应6个单位的电力,则超负荷工作的 概率只有0.000864,即每
1 1147分钟 20小时 0.000864
中,才可能有一分钟电力不够用。还可以算出,八个或八 个以上工人同时使用电力的概率就更小了,比上面概率的 1/11还要小。 问题:二项分布是一个重要的用来计数的分布。什么 样的随机变量会服从二项分布? 进行n次独立观测,在每次观测中所关心的事件出现 的概率都是p,那么在这n次观测中事件A出现的总次数 是一个服从二项分布B(n,p)。 5
这是一般的指数分布。
E (Y )
1
b,D(Y )
1
2
15
b=0的指数分布的密度函数图像如下所示(指数密度):
可见,随着 的减小,随机变量取到较大值的概率增加 1 事实上, b 随机变量的数学期望。 16 指数随机变量经常用来刻画寿命。
5. 多维随机变量 我们经常需要考虑量与量之间的关系,如果这些量是 随机变量,那么就需要把多个随机变量放在一起,考虑多 元随机变量。设 ( X1,X 2 , , X n ) 是n元随机变量,它的分布 函数是一个n元函数:
下面我们就讨论用统计方法确定分布的问题。
20
二、 数据的统计描述与分析 1.经验分布函数和频率直方图 当我们确定讨论的指标的确是随机变量后, 剩下的关键任务就是确定它的分布。那么它的 观测数据就是我们赖以解决问题的基本资料, 叫做样本,而这个随机变量就叫做总体。这些 数据反映了该随机变量分布的基本特征。我们 可以利用这些数据构造一个分布函数,理论上 可以证明它很接近于那个未知分布。这个分布 函数就叫做经验分布函数。
练习:用MATLAB计算本题
binopdf(x,n,p) 计算x中每个值对应的二项分布概率 binocdf(x,n,p) 计算x中每个值对应的分布函数值 例如binopdf(0:10,10,0.2)
6
2.Poisson分布
例2.Rutherford 对裂变物质的观测
英国著名物理学家 Rutherford(1871-1937)在其放射性 物质试验中,观测在时间间隔ΔT内放射性物质放射出的α粒子 数。实际试验时,取时间间隔为ΔT=7.5秒,观测了N=2608次, 将每次观测到的粒子数记录下来,列在下表中第1,2行:
poisspdf(x,λ),计算poisson概率,
例如,poisspdf(0:9,3.87)
问题:Poisson分布是又一类非常重要的用来
计数的离散型分布,它依赖于一个参数 。什么
样的随机变量会服从Poisson分布呢?
10
在给定的观测范围内(例如给定时间内,给定区域内等等), 事件会发生多少次?把观测范围分成n个小范围: 1.给定事件在每个小范围内可能发生,也可能不发生,发生多少 次取决于小范围的大小; 2.在不同的小范围内发生多少事件相互独立; 3.在小范围里发生的事件数多于一个的概率,和小范围的大小相 比可以忽略不计,用 pn 表示在小范围内事件发生一次的概率。 那么在给定范围内发生的总事件数X近似服从 B(n, pn ) , npn 为给定范围内事件发生次数的近似平均值。令 n ,则
概率统计建模的基本原理及方法
随机变量及其分布
主 要 内 容
数据的统计描述及分析
参数估计
假设检验
一、随机变量及其分布
1.二项分布 例1.能量供应问题
假定有 n 10个工人间歇性地使用电力,估计所需 要的总负荷。
首先我们要知道,或者是假定,每个工人彼此独立工作, 而每一时刻每个工人都以相同的概率p需要一个单位的电力。 那么,同时使用电力的人数就是一个随机变量,它服从所谓的 二项分布。用X表示这个随机变量,记做 X B(n, p) ,且
它的分布函数为
0, x 0; F ( x) 1 e x x
14
设Y
X
b, 0,b R是给定常数,则Y的分布函数为
FY ( x) P{Y x} P{ X ( x b)} F ( ( x b))
P{a X b} F (b) F (a) Fn (b) Fn (a ).
24
当然,由于是离散型的随机变量,我们可能更熟 悉如下频率分布图像:
0.25 0.2 0.15 0.1 0.05 0 2 3 4 5 6 1 7 0 8 9 10
一个随机变量,服从什么分布呢?在2608次观测中,共
观测到10094个α粒子数,平均每次观测到
λ=M÷N=10094÷2608≈3.87
个α粒子数,用参数为λ=3.87的Poisson分布P计算一下:
P{ X k}
k
k!
e ,k 0,1, 2,,
将计算结果列在上表中最后一行,与列在第3行的实际频 率比较,比较的图示在下图中。(Excel)
k P( X k ) Cn pk (1 p)nk ,
k 0,1,, n
这是非常重要的一类概率分布。其中
E(X)=np,
D(X)=np(1-p)。
3
其次,要根据经验来估计出,p值是多少?例如,一个工人 在一个小时里有12分钟在使用电力,那么应该有
p 12 0.2 60
3 0.20132 7 0.87912 6 4 0.08808 5 0.02642 4 0.99363 1 6 0.00550 5 0.99913 6 7 0.00078 6 0.99992 2 8 0.00007 4 0.99999 6 9 0.00000 4 10 0.00000 0
21
例6.例2续(经验分布函数) 在例2,我们确定所讨论的指标—在时间间隔ΔT秒 内放射出的α粒子数X,是一个随机变量。且有该随机 变量的n=2608个观测值,这就是一个容量为2608的样 本。在没有其他信息的情况下,首先应该给出该样本的 经验分布函数:
样本中不超过x的观测值的个数 Fn ( x) , x R. n
6 273 0.10467 8 0.09732 3
7 139 0.05329 8 0.05380 5
8 45 0.01725 5 0.02602 8
9 27 0.01035 3 0.01119 2
>=10 16 0.00613 5 0.00654 7
概率p
7
我们用X表示ΔT=7.5秒内观测到的α粒子数,它是
x 0; 0 x 1; 1 x 2; 2 x 3; 3 x 4; 4 x 5; 5 x 6; 6 x 7; 7 x 8; 8 x 9; 9 x 10; x 10.
23
这个函数的图像如下(Poisson2):
如果熟悉Poisson分布的分布函数图像的话, 就可以从这个图像判断出,X可能服从参数为3.87 的Poisson分布。从这个经验分布函数容易解决概 率计算问题:
8
0.25 0.2 0.15 0.1 0.05 0 0 1 2 3 4 5 6 7 8 9 10
观测频率 理论概率P (3.87)
可以看出,认为X服从参数为3.87的Poisson分布还是非常 2 合理的。在后面统计部分,我们会用Pearson- 拟合检验法来 证明这种合理性
9
练习:用MATLAB计算本题
( x )2 2 2
x ,
2
则称此随机变量服从参数为 ( , ) 的正态分布,记 做 X N ( , 2 ) ,其中 R, 0, 都是给定的参数, E( X ) ,D( X ) 2。称 N (0,1) 为标准正态分布, 用 ( x ) 表示其分布函数,其密度函数为
npn 为给定范围内事件发生次数的准确平均值,这时
k k k P( X k ) Cn pn (1 pn )nk
k
k!
e ,k
这正是Poisson分布,其中参数 =E ( X )
11
3. 正态分布
随机变量X如果有密度函数
1 p ( x) e 2
a
大量连续型随机变量服从正态分布,所以正态分布 在处理数据时是非常有用处的。我们在统计部分会大量 用到它。下面是正态分布的密度函数图像:
13
4.指数分布 称随机变量X服从参数为1的指数分布或标准指数 分布,若它有密度函数
e x , x 0; p ( x) 0,其他.
F ( x1, x2 ,, xn ) P{X1 x1, X 2 x2 ,, X n xn}
利用这个分布函数就可以讨论这n个随机变量之 间各种各样的关系。
17
(1)边际分布与独立性
FX ( xi ) P{Xi xi } F (,, xi ,, ),i 1, 2,, n.
在这里我们可求出这个经验分布函数如下:
22
ቤተ መጻሕፍቲ ባይዱ
0, 0.021855828, 0.099693252, 0.24654908 , 0.447852761, 0.651840491, F2608 ( x ) 0.808282209, 0.912960123, 0.966257669, 0.98351227, 0.993865031, 1,
1 ( x) e 2
b
x2 2
x .
( x)dx b a a 12
b
X N ( , 2 ) 时,我们有