小论文写作: 隐马尔可夫模型及其应用学院:数学与统计学院专业:信息与计算科学学生:卢富毓学号:20101910072内容摘要:隐马尔可夫模型是序列数据处理和统计学习的重要概率模型,已经成功被应用到多工程任务中。
本小论文首先从隐马尔可夫模型基本理论和模型的表达式出发,进一步阐述了隐马尔可夫模型的应用。
HMM隐马尔可夫模型(Hidden Markov Model,HMM)作为一种统计分析模型,创立于20世纪70年代。
80 年代得到了传播和发展,成为信号处理的一个重要方向,现已成功地用于语音识别,行为识别,文字识别以及故障诊断等领域。
隐马尔可夫模型状态变迁图(例子如下)x—隐含状态y—可观察的输出a—转换概率(transition probabilities)b—输出概率(output probabilities)隐马尔可夫模型它用来描述一个含有隐含未知参数的马尔可夫过程。
其难点是从可观察的参数中确定该过程的隐含参数。
然后利用这些参数来作进一步的分析,例如模式识别。
在正常的马尔可夫模型中,状态对于观察者来说是直接可见的。
这样状态的转换概率便是全部的参数。
而在隐马尔可夫模型中,状态并不是直接可见的,但受状态影响的某些变量则是可见的。
每一个状态在可能输出的符号上都有一概率分布。
因此输出符号的序列能够透露出状态序列的一些信息。
HMM的基本理论隐马尔可夫模型是马尔可夫链的一种,它的状态不能直接观察到,但能通过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有相应概率密度分布的状态序列产生。
所以,隐马尔可夫模型是一个双重随机过程----具有一定状态数的隐马尔可夫链和显示随机函数集。
自20世纪80年代以来,HMM被应用于语音识别,取得重大成功。
到了90年代,HMM还被引入计算机文字识别和移动通信核心技术“多用户的检测”。
近年来,HMM在生物信息科学、故障诊断等领域也开始得到应用。
隐马尔可夫模型(HMM)可以用五个元素来描述,包括2个状态集合和3个概率矩阵:(1)隐含状态S这些状态之间满足马尔可夫性质,是马尔可夫模型中实际所隐含的状态。
这些状态通常无法通过直接观测而得到。
(例如S1、S2、S3等等)(2)可观测状态O在模型中与隐含状态相关联,可通过直接观测而得到。
(例如O1、O2、O3等等,可观测状态的数目不一定要和隐含状态的数目一致)。
(3)初始状态概率矩阵π表示隐含状态在初始时刻t=1的概率矩阵,(例如t=1时,P(S1)=p1、P(S2)=P2、P(S3)=p3,则初始状态概率矩阵π=[ p1 p2 p3 ].(4)隐含状态转移概率矩阵A。
描述了HMM模型中各个状态之间的转移概率。
其中Aij = P( Sj | Si ),1≤i,,j≤N.表示在t 时刻、状态为Si 的条件下,在t+1 时刻状态是Sj 的概率。
(5)观测状态转移概率矩阵 B (英文名为Confusion Matrix,直译为混淆矩阵不太易于从字面理解)。
令N代表隐含状态数目,M代表可观测状态数目,则:Bij = P( Oi | Sj ), 1≤i≤M,1≤j≤N.表示在t 时刻、隐含状态是Sj 条件下,观察状态为Oi 的概率。
一般的,可以用λ=(A,B,π)三元组来简洁的表示一个隐马尔可夫模型。
隐马尔可夫模型实际上是标准马尔可夫模型的扩展,添加了可观测状态集合和这些状态与隐含状态之间的概率关系。
HMM的三个典型问题已知模型参数,计算某一特定输出序列的概率.通常使用forward算法解决.已知模型参数,寻找最可能的能产生某一特定输出序列的隐含状态的序列.通常使用Viterbi算法解决.已知输出序列,寻找最可能的状态转移以及输出概率.通常使用Baum-Welch 算法以及Reversed Viterbi算法解决.另外,最近的一些方法使用Junction tree算法来解决这三个问题。
来自维基百科的关于HMM的一个实例假设你有一个住得很远的朋友,他每天跟你打电话告诉你他那天做了什么.你的朋友仅仅对三种活动感兴趣:公园散步,购物以及清理房间.他选择做什么事情只凭天气.你对于他所住的地方的天气情况并不了解,但是你知道总的趋势.在他告诉你每天所做的事情基础上,你想要猜测他所在地的天气情况.你认为天气的运行就像一个马尔可夫链.其有两个状态"雨"和"晴",但是你无法直接观察它们,也就是说,它们对于你是隐藏的.每天,你的朋友有一定的概率进行下列活动:"散步", "购物", 或"清理". 因为你朋友告诉你他的活动,所以这些活动就是你的观察数据.这整个系统就是一个隐马尔可夫模型HMM.你知道这个地区的总的天气趋势,并且平时知道你朋友会做的事情.也就是说这个隐马尔可夫模型的参数是已知的.你可以用程序语言(Python)写下来: states = ('Rainy', 'Sunny')observations = ('walk', 'shop', 'clean')start_probability = {'Rainy': 0.6, 'Sunny': 0.4}transition_probability = {'Rainy' : {'Rainy': 0.7, 'Sunny': 0.3},'Sunny' : {'Rainy': 0.4, 'Sunny': 0.6},}emission_probability = {'Rainy' : {'walk': 0.1, 'shop': 0.4, 'clean': 0.5},'Sunny' : {'walk': 0.6, 'shop': 0.3, 'clean': 0.1},}在这些代码中,start_probability代表了你对于你朋友第一次给你打电话时的天气情况的不确定性(你知道的只是那个地方平均起来下雨多些).在这里,这个特定的概率分布并非平衡的,平衡概率应该接近(在给定变迁概率的情况下){'Rainy': 0.571, 'Sunny': 0.429}< transition_probability 表示基于马尔可夫链模型的天气变迁,在这个例子中,如果今天下雨,那么明天天晴的概率只有30%.代码emission_probability 表示了你朋友每天做某件事的概率.如果下雨,有50% 的概率他在清理房间;如果天晴,则有60%的概率他在外头散步.HMM的应用一、HMM在语音处理中的应用HMM是序列数据处理和统计学习的一种重要概率模型,近几年来已成功被应用到许多语音处理的任务中。
抽取过程描述如下:(1)对论文部分进行预处理。
主要是依据回车和逗号、分号等标点和符号对头部信息进行语义块切分,然后在语义块基础上进行信息抽取,这样可以有效提高抽取准确率召回率。
另外还根据“摘要”、“中图分类号”等待定标签将相应抽取域标识;(2)根据一些特征对部分语义块(如标题、单位等)进行词语切分,然后计算各个词语成语义块输出概率;(3)在给定的HMM模型下,用韦特比算法进行计算,求出状态序列,即语义块相关联的域,然后按关联抽取各语义项。
下面给出HMM模型的语音到口型的映射图。
二、HMM在人脸表情识别中的应用HMM在人脸识别中应用模型步骤如下:(1)评估问题:得到观察序列和模型参数,利用前向-后向算法快速计算出该模型下,观察事件序列发生的概率 .(2)解码问题:利用 Viterbi算法选择对应的状态序列,是S能够合理地解释观察序列O。
即揭晓模型隐含部分,在优化准则下找到最有状态序列。
(3) 学习问题。
利用Baum-Welch算法来调整模型参数,即得到模型中的五个参数,使得最大。
人脸表情识别的任务就在于通过表情图像来分析和建立HMM,对表情进行训练和识别。
人脸表情HMM状态划分和确定如下图所示,结果如表2所示:除此之外,HMM在生物信号分析、故障诊断等研究广泛运用,并且取得了丰硕的成果。
HMM的最新应用HMM作为序列数据处理和统计学习的一种重要概率模型,具有建模简单,物理意义明确等优点,且已经有很多成熟的算法,是一种精确地匹配时变数据的技术,除了在上述中的语音识别、生物信号分析、模式(如人脸、步态、表情等)识别、故障诊断等的研究中广泛运用,并且取得了丰硕的成果。
在以下几个方面得到最新的应用:A、HMM在人的行为分析中的应用:人的行为分析在视频会议、人机交互、智能控制、基于行为的视频检索以及医疗诊断等方面有广泛的应用前景和潜在的经济价值,是当前计算机视觉领域的一个研究热点。
B、HMM在网络安全中的应用:随着计算机的飞速发展,信息网络已经成为社会发展的重要保障,网络安全越来越受到关注。
在网络安全研究中,入侵检验是其中重要的一方面,是对入侵行为进行处理以保证网络安全的前提和基础。
传统的检测方法是Forrest等人提出的时延嵌入序列法(TIDE)。
而由Warrender等人于1999年首次在入侵检测中引入HMM,随后被广泛应用入侵检测中。
除了入侵检测,还应用于数据库异常检测、Web用户异常访问等的检测中。
C、HMM在信息抽取中的应用:信息抽取是处理海量文件的重要环节,旨在帮助人们从海量联机文件中快速、准确地抽取自己真正需要的信息,抽取出来的信息以一定的方式存储在数据库中。
而信息抽取中目标信息在网页、文章等中的具体位置,称为抽取域,而要抽取的信息,即抽取域中的内容称为语义项,信息抽取的过程首先要确定抽取域,然后提取相应的语义项,这与HMM的结构相吻合,即各抽取域和HMM的隐状态序列相对应,而语义项和个状态的观测相对应,从而HMM应用于信息抽取,具有易建立、适应性好、抽取精确高等优点,从而在信息抽取中得到了广泛的应用。
D、除了在上述中的应用,近几年来,HMM在金融、管理和心理情绪等的建模中应用。
小结:本文介绍了HMM的基本理论知识,并简单描述了HMM在语音识别、人脸以及人脸表情识别外,还简单说了HMM在人的行为分析、网络安全和信息抽取中广泛应用,并且取得了丰硕的成果,而且我们可以估计,HMM的应用前景非常好。