第6讲模糊模式识别(第三章模糊模式识别)一、模式识别一般原理1.模式识别的概念模式识别是人工智能的一个重要方面,也是一门独立的学科。
模式:用数学描述的信息结构或观察信号。
模式识别就是把要辨别的对象,通过与已知模式进行比较,从而确定出它和哪一个模式相类同的过程。
2.模式识别系统人们识别事物时,首先要对事物进行观察,抓住特点,分析比较,才能加以判断和辨别,而机器进行模式识别也同样要有这些过程。
因此模式识别系统通常由以下四个部分构成:①传感器部分:这是获取信息的过程。
比如摄像头就象人的眼睛,把图像信息变为电信号,麦克风象人的耳朵,获取声音信号,又如霍尔元件可以感受磁场,压电陶瓷可以把力转换为电信号等等。
②预处理部分:这是对信息进行前端处理的过程。
它把传感器送来的信号滤除杂波并作规范化、数字化。
③特征提取部分:这是从信号中提取一些能够反映模式特征的数据的过程。
④识别判断部分:这是根据提取的特征,按照某种归类原则,对输入的模式进行判断的过程。
二、模糊模式识别模糊模式识别主要是指用模糊集合表示标准模式,进而进行识别的理论和方法。
主要涉及到三个问题:(1)用模糊集合表示标准模式;(2)度量模糊集合之间的相似性;(3)模糊模式识别的原则。
例3.1 邮政编码识别问题识别:0,1,2,……,9关键:1)如何刻化,0,1,……,9(如何选取特征?)(区分)2)如何度量特征之间的相似性? 1.模糊集合的贴近度贴近度是度量两个模糊集合接近(相似)程度的数量指标,公理化定义如下:定义3.1 设,,()A B C F X ∈,若映射[]:()()0,1N F X F X ⨯→ 满足条件:①(,)(,)N A B N B A =; ②(,)1,(,)0N A A N X φ==; ③若A B C ⊆⊆,则(,)(,)(,)N A C N A B N B C ≤∧。
则称(,)N A B 为模糊集合A 与B 的贴近度。
N 称为()F X 上的贴近度函数。
这个定义实际上是对贴近度提出了几个准则,并没给出具体的贴近度。
2.常用的贴近度①海明贴近度若{}12,,...,n X x x x =,则111(,)1()()ni i i N A B A x B x n ==--∑若[,]X a b R =⊆,则11(,)1()()baN A B A x B x dx b a ∆=---⎰ 1(,)N A B 称为海明贴近度。
②欧几里得贴近度 若{}12,,...,n X x x x =,则12221(,)1(()())ni i i N A B A x B x =⎫=--⎪⎭∑若[,]X a b R =⊆,则)1222(,)1(()())baN A B A x B x dx=--⎰2(,)N A B 称为欧几里得贴近度。
③最大最小贴近度 设{}12,,...,n X x x x =,则131(()())(,)(()())niii niii A x B x N A B A x B x ==∧=∨∑∑3(,)N A B 称为最大最小贴近度。
④算术平均贴近度14112(()())(,)()()n i i i nniii i A x B x N A B A x B x ===∧=+∑∑∑4(,)N A B 称为算数平均贴近度。
⑤测度贴近度设(),()A x B x 是测度空间(,(),)X X σμ上可测函数,则可定义5()()(()())(,)()()(()())X X XXA B x d A x B x d N A B A B x d A x B x d μμμμ⋂∧==⋃∨⎰⎰⎰⎰ 62()()2(()())(,)()()()()XXXXXXA B x d A x B x d N A B A x d B x d A x d B x d μμμμμμ⋂∧==++⎰⎰⎰⎰⎰⎰上面的贴近度可供应用时选择。
3.格贴近度定义3.2 设,()A B F X ∈,称(()())x XA B A x B x ∈=∨∧(()())x XA B A x B x ∧∈=∧∨分别为模糊集合,A B 的内积和外积。
定义3.3 设()A F X ∈,令()x Xa A x ∈=∨()x Xa A x ∈=∧a 和a 分别称为模糊集合A 的峰值和谷值。
设,,()A B C F X ∈,内积和外积满足下面性质:性质1 对偶律c c cB A B A =⎪⎭⎫ ⎝⎛∧,()c c cB A B A ∧= 性质2 A B a b ≤∧;A B a b ∧≥∨ 性质3 A A a =;A A a ∧=性质4 ()()B F X A B a ∈∨=; ()()B F X A B a ∧∈∧= 性质5 A B A B a ⊆⇒=;A B b ∧=性质6 12cA A ≤;12c A A ∧≥性质7 A B A C B C ⊆⇒≤,A C B C ∧∧≤。
证明:仅证性质1中第二式。
()))()((1x B x A B A Xx c∧∨-=∈)]}()([1{x B x A Xx ∧-∧=∈ )))(1())(1((x B x A Xx -∨-∧=∈))()((x B x A c c Xx ∨∧=∈ccB A ∧= 。
# 引理3.1 设,()A B F X ∈,令(,)()()c A B A B A B ∧=∧则有下面结论成立: ①0(,)1A B ≤≤; ②(,)(,)A B B A =;③(,)(1)A A a a =∧-;④(,)(,)(,)A B C A C A B B C ⊆⊆⇒≤∧。
特别地,若1a =,0a =,则(,)1A A =。
下面证明④式。
证明:根据性质5,由A C ⊆得(,)()()()c c A C A C A C a c ∧=∧=∧由A B ⊆得(,)()()()c c A B A B A B a b ∧=∧=∧因为b c ≤,从而()()c cb c ≥,所以(,)(,)A C A B ≤同理(,)(,)A C B C ≤于是(,)(,)(,)A C A B B C ≤∧。
定义3.4 设,()A B F X ∈,令(,)()()c N A B A B A B ∧=∧称(,)N A B 为模糊集合A 与B 的格贴近度。
当X 有限时,11(,){[()()]}{1[()()]}nni i i i i i N A B A x B x A x B x ===∨∧∧-∧∨例 3.2 设221212(), ()x x A x eB x eμμσσ⎛⎫⎛⎫---- ⎪⎪⎝⎭⎝⎭==是实数域上的模糊集,求(,)N A B 。
模糊集合,A B 的隶属函数如图3-1所示。
图3-1 模糊集合,A B 隶属函数图像解:(()())()x RA B A x B x A x *∈=∨∧= 令 ()()A x B x =,即221212x x μμσσ⎛⎫⎛⎫--= ⎪ ⎪⎝⎭⎝⎭解得1221112x σμσμσσ+=+ 2112221x σμσμσσ-=-其中2x 不在1μ,2μ之间,*1x x =,于是有22121*()A B A x eμμσσ⎛⎫-- ⎪+⎝⎭==而[(1())(1())]1c c x RA B A x B x ∈=∨-∧-=由格贴近度公式,得22121(,)N A B eμμσσ⎛⎫-- ⎪+⎝⎭=。
4.模糊模式识别原则①最大隶属原则:设()i A F X ∈,1,2,,i n =,对0,x X ∈若{}0010200()max (),(),,()i n A x A x A x A x =则认为(判别)0x 相对地隶属于0i A 。
例 3.3 设[0, 3]X =为身高论域(单位:米),对任意x X ∈, 识别x 是高个子,中等个子,还是矮个子。
解: 首先确定“高个子”H ,“中等个子”M 和“矮个子”L 三个模糊集合。
也即建立标准模式。
假设三个模糊集合的隶属函数分别为:1, 1.81.7(), 1.7 1.81.8 1.70, 1.7x x H x x x ≥⎧⎪-⎪=≤<⎨-⎪<⎪⎩ 1, 1.7 1.751.65, 1.65 1.71.7 1.65() 1.8, 1.75 1.81.8 1.750, x x x M x x x ≤<⎧⎪-⎪≤<⎪-=⎨-⎪≤<⎪-⎪⎩其它 0, 1.751.75(), 1.65 1.751.75 1.651, 1.65x x L x x x >⎧⎪-⎪=≤<⎨-⎪≤⎪⎩ 给定待识别身高x X ∈,计算(),(),()H x M x L x ,按最大隶属原则判别x 属于哪种个子。
如,当0 1.78x =,1 1.76x =时,将0 1.78x =代入三个标准模糊集,,H M L 得:(1.78)0.8H =,(1.78)0.4M =,(1.78)0L = 按最大隶属原则,可判别1.78米相对属于高个子。
而(1.76)0.6H =,(1.76)0.8M =,(1.76)0L = 因此0 1.76x =属于中等个子。
②阈值原则:设()i A F X ∈,1,2,,i n =,对0,x X ∈对取定的水平[0,1]α∈,若存在{}12,,,1,2,,k i i i n ∈,使0(), (1,2,,)j i A x j k α≥=则判别0x 相对地隶属于12ki i i A A A ⋂⋂⋂;若01()ni i A x α=∨<,不能识别,此时需要查找原因另作分析。
在例3.3中,如给定0.6α=,按阈值原则,0 1.78x =属于高个子;1 1.76x =既属于高个子也属于中等个子。
应用中如果出现一个对象同时隶属于多个模式,常常需要做进一步识别。
这类似于设备事故诊断和对人进行医疗诊断。
例如,我们经常遇到某人感到不舒服,医生根据症状初步诊断(识别)可能是得了病A 或病B ,为了进一步确诊(识别)是病A 或病B ,一般要根据病A 或病B 的特点检查相应的项目,根据检查结果,做出最后的诊断(识别)。
③择近原则:设,()i A B F X ∈,1,2,,i n =,若0(,)max{(,)}i i iN A B N A B = 则判别B 与0i A 为同一类,或者说B 是0i A 。
这个原则称为择近原则,其中B 是待识别对象,i A 为标准模式。
例 3.4 小麦亲本的识别。
以每株小麦的百粒重量为对象,统计出五个亲本模型,每个亲本可以用一个正态模糊集合表示,如表3-1所示:表3-1 五个亲本模型对应的参数值试问,若待识别小麦B 的参数为 3.43μ=,0.28σ=,应归属于哪种类型?解:选格贴近度公式计算,由例3.2知: 22121()(,)()()c N A B A B A B e μμσσ-∧-+=∧=由此可得:1(,)0.8052N A B =,2(,)0.4339N A B =,3(,)0N A B =, 4(,)0.5186N A B =,5(,)0.7288N A B =。