4第四章_隐马尔可夫模型
4.2 隐马尔可夫模型的定义
一般情况下,只能观察到输出符号序列(ab),
而不能观测到状态之间如何转移(状态转移概率)
和状态的分布(状态的概率),所以称为隐藏的马
尔可夫模型。
语音信号是一个可观察的序列:它是由大脑中的思
维(不可观测)及语言需要和语法知识(不可观测)
所发出的参数流。
球和缸
S1
S2
SN
第四章 隐马尔可夫模型(HMM)
4.1 马尔可夫模型的定义 4.2 隐马尔可夫模型的定义 4.3 隐马尔可夫模型的参数
HMM的由来
1870年,俄国有机化学家Vladimir
V.
Markovnikov第一次提出马尔可夫模型
马尔可夫性
如果一个过程的“将来”仅依赖“现在” 而不依赖“过去”,则此过程具有马尔 可夫性,或称此过程为马尔可夫过程 X(t+1) = f( X(t) ) X(n+1) = f( X(n) )
实例
缸的数目 彩球颜色数目 在选定某个缸的情况 下,选择另一个缸的 概率 每个缸中的颜色分布 初始时选择某口缸的 概率
B
3. 一个输出概率:
将每一种可能路径的的输出概率相加
得到的总的概率值作为输出概率。
4.3隐马尔可夫模型的参数 {N , M , T , A, B, } { A, B, }
N 模型中状态的数目。状态的集合 S {S1 , S2 , S N }
M 每个状态对应的观测符号数。观测符号集合 V {v1 , v2 ,vM } T 观测符号序列的长度,观测符号序列 O {O , O2 ,OT } 1 A 状态转移概率分布 B 状态的观测符号概率分布 B {bj (k )}, bj (k ) P[vk | S j ],1 j N ,1 k M
A {aij }, aij P[S j Si ],1 i, j N
初始状态的概率分布
{ i }, i P[Si ],1 i N
HMM的基本要素
参数
N M A
{N , M , T , A, B, }
含义
状态数目 每个状态可能的观察 值数目 与时间无关的状态转 移概率矩阵 给定状态下,观察值 概率分布 初始状态空间的概率 分布
S2
a23 0.6
a 0 .5 b 0 .5
S3
a13 0.2
a 1 b 0
a 0.8 a11 0.3 b 0 .2
a22 0.4 a 0.3
b 0 .7
S1
a12 0.5
a 1 b 0
4.1马尔可夫模型(MM)的定义
MM是一个输出符号序列的统计模型,具有N个状
态S1,S2,…SN,它按一定的周期从一个状态转移到另外
一个状态,每次转移时,输出一个符号。
S1
起始状态
S2
a/b 输出符号
S3 终止状态
4.1马尔可夫模型(MM)的定义
转移到哪一个状态,转移时输出什么符号,分别由状态转
P(green)=bN(4)
P(black)=b1(M)
P(black)=b2(M)
P(black)=bN(M)
观察序列O={绿,绿,蓝,红,红,黄,….. 蓝}
设有N个缸,每个缸中装有很多彩色的球,不同颜色
的球(M)的多少由一组概率分布来描述,
根据某个初始概率分布,随机选择一个缸,例如第i 个缸,再根据这个缸中彩色球颜色的概率分布,随 机选择一个球,记O1,再把球放回缸中。 根据缸的转移概率,选择下一个缸,例如第j个缸。
已知一天(t=1)的天气是晴(S3),问:其后7天 的天气为“晴,晴,雨,雨,晴,多云,晴”的 概率是多少? 观察序列O={S3,S3,S3,S1,S1,S3,S2,S3}
对应时间t=1,2,3,4,5,6,7,8
P(O) P[ S 3, S 3, S 3, S1, S1, S 3, S 2, S 3] P( S 3) P( S 3 S 3) P ( S 3 S 3) P ( S1 S 3) P( S1 S1) P( S 3 S1) P ( S 2 S 3) P ( S 3 S 2) 1 a33 a33 a31 a11 a13 a32 a23 1.536 104
P(red)=b1(1) P(yellow)=b1 (2) P(bule)=b1(3)
P(red)=b2(1) P(yellow)=b2 (2) P(bule)=b2(3) P(green)=b2(4)
P(red)=bN(1) P(yellow)=bN (2) P(bule)=bN(3)
P(green)=b1(4)
马尔科夫链
时间和状态都离散的马尔科夫过程称为马尔科夫链 记作{Sn = S(n), n = 0,1,2,…} 在时间集T1 = {0,1,2,…}上对离散状态的过程相继 观察的结果 链的状态空间记做I = {S1, S2,…}, Si∈R. 条件概率P{Sj|Si} 为马氏链在时刻m处于状态Si条 件下,在时刻m+1转移到状态Sj的转移概率。
S2
a23 0.6
a 0 .5 b 0 .5
S3
a13 0.2
a 1 b 0
a11 a12 a13 1 a 22 a 23 1 a b 1
从一个状态转移出去 的概率之和为1。
每次转移时输出符号a和b 的概率之和为1。
一个关于天气的3状态马尔可夫模型
再根据这个缸中彩色球颜色的概率分布,随机选择
一个球,记O2,再把球放回缸中。 最后得到描述球颜色的序列O1 O2 观察,被隐藏。 ,成为观察值 序列,但每次选取的缸和缸之间的转移并不能直接
设观察到的输出符号序列是aab。试求aab的输出概率?
a 0.8 a11 0.3 b 0 .2 a 0 .3 a22 0.4 b 0 .7 a 1 b 0
S1
S1
S1 S3
由于是隐HMM模型,不知输出aab时,到底是经 过了哪一条不同状态组成的路径,因此,求aab的 输出概率时,将每一种可能路径的的输出概率相加 得到的总的概率值作为aab的输出概率值: 0.036+0.018+0=0.054
总结
1.HMM包含两个随机过程:
(1)马尔可夫链:一个随机过程描述的状态
每个状态存在的概率矩阵P1
a13 0.3 0.5 0.2 a 23 0 0.4 0.6 状态之间转移 的概率矩阵P2 a 33 0 0 0
0.8 0.2 1 0 转移中输出符号的概率矩阵P3 P3 1 0 0.3 0 .7 0.5 0.5
移概率和转移时的输出概率来决定。即每一条弧上有一个状态
转移概率以及输出概率。aij表示从状态Si转移到状态Sj的概率。
a 0.8 a11 0.3 b 0 .2
a22 0.4 a 0.3
b 0 .7
S1
a12 0.5
a 1 b 0
S1
a12 0.5
S2
a23 0.6
a 0 .5 b 0 .5
S3
aHale Waihona Puke 3 0.2 a 1 b 0
从S1到S3,并且输出aab,可能的路径有三种:
S1
S1
S1
S2
S2 S3
S2 S3
0.3×0.8×0.5×1×0.6×0.5=0.036
0.5×1×0.4×0.3×0.6×0.5=0.018 0.3×0.8×0.3×0.8×0.2×0=0
0.3 0.4 0.6 0.8 0.2 0.1 0.3 0.2
雨 S1
多云 S2
0.1
晴 S3
a11 P a21 a31
a12 a22 a32
a13 0.4 0.3 0.3 a23 0.2 0.6 0.2 a33 0.1 0.1 0.8
(S1,S2,S3)和状态转移序列(状态转移序列S1 S1 S2 S3、S1 S2 S2 S3和S1 S1 S1 S3 等); (2)一个随机过程描述状态和观察值之间的统计对 应关系(每次转移时输出的符号组成的符号序列, 如,aab)。
2.HMM包含三个概率矩阵:
1 1 1 P1 3 3 3 a11 a12 P 2 a 21 a 22 a 31 a 32