当前位置:
文档之家› 第10章模式识别的理论和方法
第10章模式识别的理论和方法
N
Di ( X ) wik xk wi0
k 1
(10-12)
式中Di(X)代表第i个判别函数;wik是系数或权; wi0为常数或 称为阈值。在两类之间的判决界处有式(10-13)的形式:
Di ( X ) D j ( X ) 0
(10-13)
该方程在二维空间中是直线,在三维空间中是平面,在N维 空间中是超平面。
• 第二部分相当于人们把调查了解到的数据材料进行加工、 整理、分析、归纳,以去伪存真,去粗取精,抽出能反映 事物本质的东西。当然,抽取什么特征,保留多少特征与 采用何种判决有很大关系。
• 第三部分是判决和分类,这相当于人们从感性上升到理性
认识而做出结论的过程。第三部分与抽取特征的方式密切
相关,它的复杂程度依赖于特征的抽取方式,如类似度、
– 读书、看报也是识别过程,不会识别就看不懂。
3
• 用计算机进行模式识别就是研究让计算机处理哪 些信息和怎样处理这些信息。因此,它是信息处 理中的又一个研究领域。例如,
– 根据气象观测数据或气象卫星拍照的图片如何准确 的预报天气;
– 根据石油勘探的人工地震波如何提供储油的岩层结 构;
4
– 从遥感图片中如何区别农作物、湖泊、森林、导弹 基地等;
19
训练/学习
20
10.2.1 决策理论方法
正如图10-2框图所示,统计模式识别方法最终
归结为分类问题。统计决策理论是统计模式识别的
基本理论。假如已抽取出 N 个特征,而图像可分为
m类,那么就可以对N 进行分类,从而决定未知图
像属于m类中的哪一类。一般把识别模式看成是对N
维空间中的向量X进行分类,即:
(10) 考古(Archaeology)
13
目前世界上已有一些较为完善的图像识别系统。这些系 统无论从识别分析的功能来讲还是从处理速度上来说都较初 期有很大的发展。例如,
• 美国的OLPARS(联机图像分析识别系统)能识别数字、字 母及分析识别航空照片。
• 英国的新产品QUANTIMENT 720高速多功能图像分析系 统可以观察由光学和显微镜获得的图像、照片、底片、 电影、幻灯片及X光照片。能对图像进行各种测量及单独 实施测量特征,数据由微计算机处理。
18
10.2 统计模式识别法
统计模式识别的过程如图10-2所示。这是计算 机识别的基本过程。数字化的任务是把图像信号变 成计算机能接受的数字信号。预处理的目的是去除 干扰、噪声及差异,将原始信号变成适合于特征抽 取的形式,然后,对经过预处理的信号进行特征抽 取。最后进行判决分类,得到识别结果。为了进行 分类,必须有图像样本。对图像样本进行特征选择 及学习是识别处理所必要的分析工作。
x1
x2
X
x3
xN
(10-1)
21
模式类别为 w1, w2, w3,wm。识别就是要判断 X 属于模 式类别中的哪一类。
在这个过程中主要解决两个问题: • 一是如何抽取特征,要求特征数N尽可能小而且
对分类判断有效; • 二是假设已有了代表模式的向量,如何决定它属
相关性、最小距离等。
9
• 模式识别的主要方法可分为两大类,这就是统 计方法和语言学方法。
• 前一种方法是建立在被研究对象的统计知识上, 也就是对图像进行大量分析,抽出图像中本质 的特征而进行识别。这是一种数学方法,它是 受数学中的决策理论的启发而产生的识别方法。 在这种方法中很大的力量用在抽取图像特征方 面,也就是把图像大量的原始信息缩减为少数 特征,然后再提取这些特征,把它作为识别的 依据。
12
模糊识别的应用较广,大致有如下几个方面:
(1) 字符识别(Character recognition)
(2) 医学诊断(Medical diagnosis)
(3) 遥感(Remote Sensing)
(4) 人脸和指纹鉴别(Identification of human faces and fingerprints)
7
图像识别系统可分为3个主要部分 (1)图像信息的获取; (2)信息的加工和处理,抽取特征; (3)判断或分类。其框图如图 10-1 所示。
8
• 第一部分相当于对被研究对象的调查和了解,从中得到数 据和材料;对图像识别来说,就是把图片,底片,文字图 形等用光电扫描设备变换为电信号,而对语言来说就可用 话筒等设备把声音变成电信号以备后续处理。
(5) 污染(Pollution)
(6) 自动检查和自动化(Automatic inspection and Automation)
(7) 可靠性(Reliability)
(8) 社会经济(Socio-economics)
(9) 语音识别和理解(Speech understanding and recognition)
25
Di (x) D j (x) 可以写成下列形式:
N
Di ( X ) D j ( X ) (wik w jk )xk (wi0 w j0 )
k 1
(10-14)
其判决过程可如下进行:如果 Di (X ) Dj (X ) 或 Di ( X ) D j ( X ) 0,则x wi ;如果
在两类的分界线上,则有
Di ( X ) D j ( X )
(10-3)
这时X 既属于第 i 类,也属于第 j类,因此这种判别
失效。为了进行识别就必须重新考虑其它特征,再
进行判别。问题的关键是找到合适的判别函数。
23
1. 常用的决策规则
1) 基于最小错误概率的贝叶斯决策 在图像识别中,人们总希望尽量减少分类错误,
利用贝叶斯(Bayes) 公式能够得到错误率最小的分 类规则,这就是最小错误概率的贝叶斯决策。
2) 基于最小风险的贝叶斯决策 最小风险的贝叶斯决策是考虑各种错误造成损
失而提出的决策规则。 引入损失函数。
24
2. 线性判别函数
线性判别函数是应用较广的一种判别函数。所谓线性判 别函数就是指判别函数是图像所有特征量的线性组合,即
27
28
在线性分类器中要找到合适的系数,以便使 分类尽可能不出差错,唯一的办法就是试验法。 例如,先设所有的系数为1,送进每一个模式,如 果分类有错就调整系数,这个过程就叫做线性分 类器的训练或学习。例如,我们把N个特征X和1放 在一起叫做Y,N+1个系数为W,即:
29
x1
x
2
10
• 另一种是语言学法或句法结构识别法。它是立 足于分析图像结构。把一个图像看成语言结构。 例如一个英文句子,它是结构分析的课题。这 些基本元素相当于句子中的单词,那些直线, 曲线的组合相当于短语,他们全体如何构成图 像就相当于语法规则。此时,图像识别就相当 于检查图像所代表的某一类句型是否符合事先 规定的语法,如果语法正确就识别出结果。由 此可见,这种方法主要是利用了图像结构上的 关系,这和统计学方法不同。
于哪一类,这就需要判别函数。
22
例如,模式有 w1, w2 , w3 ,wm 共m个类别,则应
有 D1(X), D2(X), D3(X), …, Dm(X) , 共m个判别函数。 如果 X 属于第i 类,则有:
Di ( X ) D j ( X ) j 1, 2, 3,, m ji
(10-2)
第 10 章 模式识别的理论和方法
• 我们把环境与客体统称为“模式”。 • 图像识别
– 光学字符识别 – 车牌识别 – 生物特征识别(指纹、人脸、虹膜、掌纹) – ------
• 语音识别 • 心电脉冲识别 • 地震波识别
• ------
1
本章内容
10.1 概述 10.2 统计模式识别法 10.3 模式识别的几种应用
11
• 从上述两类方法来看,第一种方法没有利用图 像本身的结构关系,第二类方法没有考虑图像 在环境中受噪声的干扰。如果两者结合起来考 虑可能会有新的识别方法,目前这方面的研究 还不多,除此之外,基于模糊数学的发展,目 前正在发展一种模糊识别法。这种方法较多地 考虑了人的逻辑思维方法,方法较为独特,这 种方法的研究得到了人们的广泛关注。
17
• 近年来国际上在这一领域给予了极大的重视,微软、 Intel、IBM等大公司纷纷提出研究计划,所谓的 “Multimodel”研究已形成了新的研究热点。
• 与此同时,对有关图像识别的图像处理软件及新算法也 受到极大的重视,如人工神经元网络、遗传算法等在在 模式识别研究中已取得了可喜的结果。现在,研究高性 能、多用途的图像分析识别系统仍是有待我们努力解决 的课题。 随着生产与科学技术的发展,各个领域将会给 模式识别技术以极大的注意,这一技术必将在我国的现 代化建设中发挥作用。
14
• 日本的OCR-ASPET/71型识别系统能识别多种字体, 每秒钟可识别2000字。
• 英国的IBM1287光学文字阅读机能识别10个阿拉伯数 字,在邮局推广使用,误体数字、字母、速度达30000件每小时。
• 在医学中也有较多应用,如一种5类白血球分类器可做 到95%的正确分类,每分钟100个细胞。另外还有染色 体自动分类,医学管理方面也多有应用。
15
随着计算机技术的发展,模式识别的理论和 方法得到进一步发展。特别是图像识别这个领域 近年来兴旺活跃,发展蓬勃。在某种意义上说, 图像识别已发展为人与机器,自然科学和社会基 础科学理论与技术之间的接口领域。目前,不仅 研究单一功能的识别系统,而且在研究多功能的 识别系统。
16
• 如北京交通大学信息科学研究所会同清华大学、 上海交通大学研究所的“超级智能视听信息处理 系统”就是一种多信息融合的处理系统,它的目 的是利用多信息的融合技术,在模式识别中互相 补充、互相借鉴,从而克服过去单一识别所面临 的难以克服的困难,试图在模式识别领域有较大 的突破。同时,该系统在当今颇为热门的人-机 通过自然手段进行交互的领域也进行了有意的尝 试。