蒙特卡罗算法
我们可产生一系列随机数 1,2 ,3,4 ,5,6 ,....... 可简单取3个随机数构成一个随机点,即
(1,2 ,3 ), (4 ,5,6 ),.......
相应地,
1 b 1 n a f ( x)dx n f ( xi ) ba i 1 d b 1 1 n c a f ( x, y)dxdy n f ( xi , yi ) (d c)(b a) i 1
据此,可得产生 X 的随机数的具体过程为:每产 生一个(0,1)区间上均匀分布随机数U ,若
P(n 1) U P(n)
则令 X 取值 x n .
26
例1:
离散型随机变量X有ቤተ መጻሕፍቲ ባይዱ下分布律: X 0 1 2 P(x) 0.3 0.3 0.4 设 U1 ,U2 ,,U N 是(0,1)上均匀分布的随机数,令
每个 xi j 有 m 种选择,所以向量 ( xi 1 , xi 2 ......xi -k ) 可以取 m
k -1
个不同的值,所以这样的随机数生成器
的最大周期可以达到 mk -1 1,大大提高了简单同余 生成器的周期。
22
算法实现
许多程序语言中都自带生成随机数的方法,如 c 中的 random() 函数,Matlab中的rand()函数等。 但这些生成器生成的随机数效果很不一样,比如 c 中的函数生成的随机数性质就比较差,如果用 c ,最好自己再编一个程序。Matlab 中的 rand() 函数,经过了很多优化。可以产生性质很好的随 机数,可以直接利用。
2147483399 2147483563
复杂一些的生成器
Multiple recursive generator
xi (a1 xi 1 a2 xi 2 ...... ak xi k ) mod m ui xi / m 需要选取种子(xk 1 , xk 2 .......x0 )
4
于是有: l p P( X sin ) 2 0
l sin 2
0
2 2l dxd a a
2l ap
若我们独立重复地作 n 次投针试验,记 n ( A) 为 A 发生的次数。 f n ( A) 为 A
ˆ 在 n 次中出现的频率。假如我们取 f n ( A) 作为 p P ( A) 的估计,即 p fn ( A) 。
16
乘同余法:
U(0,1)随机数的生成
xi 1 axi mod m ui 1 xi 1 / m
其中 xi , a, m 均为整数, x0 可以任意选取。
x0 称为种子,a 是乘因子,m是模数
17
一个简单的例子
当 x0 1 时,得到序列: 1,6,3,7,9,10,5,8,4,2,1,6,3......
将 {P(n)} 作为区间(0,1)的分点.若随机变量 U ~ U (0,1) ,有
P{P(n 1) U P(n)} P(n) P(n 1) pn , (n 1,2,)
25
令 {P(n 1) U P(n)} {X xn}
则有
P{X xn } pn
20
常用的线性同余生成器
Modulus m 2^31-1 =2147483647 Multiplier a 16807 39373 742938285 950706376 1226874159 40692 40014 Reference Lewis, Goodman, and Miller L’Ecuyer Fishman and Moore Fishman and Moore Fishman and Moore L’Ecuyer L’Ecuyer 21
23
从U(0,1)到其它概率分布的随机数
1.离散型随机数的模拟
2.连续型随机数的模拟
3.正态随机数的模拟
24
1.离散型随机数的模拟
设随机变量 X 的分布律为 令
P{X xi } pi
n i 1
(i 1,2,)
(n 1, 2 ,)
P(0) 0, P(n) pi ,
一般地,
A
f ( x)d (measure of A) (average of f over n random points in A)
8
Monte Carlo数值积分的优点
与一般的数值积分方法比较,Monte Carlo方法 具有以下优点:
1. 一般的数值方法很难推广到高维积分的情形,而 Monte Carlo方法很容易推广到高维情形
由定理 1 ,要产生来自 F ( x) 的随机数,只要先 产生来自U (0,1) 随机数 u ,然后计算 F 1 (u ) 即 可。具体步骤如下:
11
均匀分布随机变量X的取值具有”均匀性” 均匀性特点:均匀分布随机变量X落在(a,b)内 任意子区间的概率只与子区间的长度有关,而与 子区间的位置无关. 可假设有这种特性的随机变量服从均匀分布.
12
2. 正态分布 正态分布随机变量X的概率密度函数是
1 1 x 2 f ( x) exp[ ( ) ], x R 2 2
ˆ 然后取 2l a.s. ˆ 作为 的估计。根据大数定律,当 n 时, p f n ( A) p. af n ( A) 2l P 。这样可以用随机试验的方法求得 的估计。历史上 af n ( A)
ˆ 从而有
有如下的试验结果。
5
试验者
时间(年)
0, 0 U i 0.3 xi 1, 0.3 U i 0.6 2, 0.6 U i
则 x1 , x2 ,, xN 是具有X分布律的随机数.
27
2.连续型随机数的模拟
a.逆变换方法(常用) (Inverse Transform Method) b.舍取方法 (Acceptance-Rejection Method)
4.必要时,还应改进模型以降低估计方差和减少试验费 用,提高模拟计算的效率
10
回顾几种连续型分布
1.均匀分布U(a,b) 其概率密度函数为
1 ,a x b f ( x) b a 0 , 其他
有
cd P{c x d} , 其中(c, d ) (a, b) ba
定理: 设随机变量Y的分布函数F(y)是连续函数, 而U是在(0,1)上均匀分布的随机变量, 令 X F 1 (U ) , 则Y与X有相同的分布.
28
证明: 由 F 1 (U ) 的定义和均匀分布的分布函数可得: P( X x) P( F 1 (U ) x) P(U F ( x)) F ( x)
一般形式: xi 1 (axi c) mod m ui 1 xi 1 / m
1. c是非负整数.通过适当选取参数c可以改善 随机数的统计性质(独立性,均匀性).
2. 线性同余器可以达到的最长周期为 m 1 ,我们 可以通过适当的选择 m 和 a ,使无论选取怎样的 初值 x0 都可以达到最大周期(一般选取 m 为质数)
14
3. 指数分布 指数分布随机变量X的概率密度为
ex , x 0 f ( x) 0, x 0
指数分布常用来描述寿命问题.
15
二.随机数的生成
1.蒙特卡罗模拟的关键是生成优良的随机数。 2.在计算机实现中,我们是通过确定性的算法生成 随机数,所以这样生成的序列在本质上不是随机 的,只是很好的模仿了随机数的性质(如可以通过 统计检验)。我们通常称之为伪随机数(pseudorandom numbers)。 3.在模拟中,我们需要产生各种概率分布的随机数, 而大多数概率分布的随机数产生均基于均匀分布 U(0,1)的随机数。
Monte Carlo Simulation Methods (蒙特卡罗模拟方法)
主要内容: 一. M-C方法概述. 二. 随机数的生成. 三. 模拟训练. 四. 实验题目.
成信院数学与信息科学系 李胜坤
1
一.M-C方法概述
蒙特卡洛(Monte Carlo)方法,或称计算机 随机模拟方法,是一种基于“随机数”的计 算方法。这一方法源于美国在第二次世界大 战中研制原子弹的“曼哈顿计划”。该计划 的主持人之一、数学家冯· 诺伊曼用驰名世 界的赌城—摩纳哥的Monte Carlo—来命名 这种方法,为它蒙上了一层神秘色彩。
2
基本思想很早以前就被人们所发现和 利用。17世纪,人们就知道用事件发 生的“频率”来决定事件的“概率”。 19世纪人们用投针试验的方法来决定π。 高速计算机的出现,使得用数学方法 在计算机上大量模拟这样的试验成为 可能。
3
从Buffon(蒲丰)投针问题谈起
Buffon 投针问题:平面上画很多平行线,间距为 a.向此平面投掷长为 l ( l < a) 的 针,此针与任一平行线相交的概率 p。
xi1 6xi mod11, ui+1 xi1 /11 (a 6, m 11 )
如果令 a 3, x0 1 ,得到序列: 1,3,9,5, 4,1,3,9........ 如果令 a 3, x0 2, 得到序列: 2, 6, 7,10,8, 2, 6.......
针长 投针次数 相交次数
π的估计值
Wolf
1850
0.80
5000
2532
3.15956
Smith
1855
0.60
3204
1218
3.15665
Fox
1884
0.75
1030
489
3.15951
Lazzarini
1925
0.83
3408
1808
3.14159292
6
数值积分问题