当前位置：文档之家› 图像识别ppt

图像识别ppt

输入
数据获取
预处理
特征提取
决策分类
输出

数据获取：通过图像输入设备实现。预处理：提高图像质量，包括滤波、平滑、增强、复原、提取边缘、图像分割等方法特征提取和选择：将预处理后的图像转化为若干特征。常见特征有：幅度特征，统计特征，几何特征，变换系数特征等

决策分类是模式识别要解决的关键问题决策分类可以认为是寻找进行分类的决策函数的过程。当已知待识别模式的完整的先验知识时，则可以据此确定决策函数的数学表达式。如果仅已知待识别模式的定性知识，则在确定决策函数的过程中，通过反复学习、调整，以取得满意的决策函数表达式

输入：k:类的个数，D:包含n个对象的数据集。输出：k个类的集合步骤：
◦
◦
1、从D中任意选择k个对象作为初始类中心；
2、根据簇中对象的均值，将每个对象指派到最相似的类
◦
◦
3、更新类均值，即计算每个类中对象的均值
4、重复2~3步，直至误差平方准则 J 变化幅度小于下界

例：中国男足近几年到底在亚洲处于几流水平？下图是采集的亚洲15只球队在2005年-2010年间大型杯赛的战绩
y 0
i 1 i i
n
将求解后得到的 ai 带回可得决策函数参数的取值

由于处于非边界位置的ai 都为零。处于边界的ai 不为零。 W 只是处于边界处数据的线性组合，可将处于边界处的原始数据当做支持向量。

检测新数据z时：如果 W T z b 小于0，则认为是第一类；否则为第二类
如 X 属于 i 类，则
di ( X ) d j ( X ),j i

对样本抽取N个特征，即 X x1 , x2 , , xn ，建立线性决策函数和构造一个线性分类器，利用该分类器完成对未知类别的模式分类。通过学习的方法对分类器进行训练，利用已知类别的训练样本通过分类器训练，如果分类错了就调整权向量W，直到对训练样本集正确训练为止

用k-means算法进行聚类。设 k=3，即将这15支球队分成三类。现抽取日本、巴林和泰国的值作为三个类的中心。计算所有球队分别对三个中心点的相似度，这里以欧氏距离度量。聚类结果为：中国C，日本A，韩国A，伊朗B，沙特B，伊拉克C，卡塔尔C，阿联酋C，乌兹别克斯坦B，泰国C，越南C，阿曼C，巴林B，朝鲜B，印尼 C。

统计模式识别：以概率统计为基础，模式用特征向量描述，找出决策函数进行模式决策分类句法模式识别：以形式语言理论概念为基础。模式被分解为模式基元，识别过程为判定输入的模式基元串能否被文法识别器接受。模糊模式识别：以模糊集理论为基础，利用模糊信息进行模式决策分类。神经网络模式识别：神经网络具有信息分布式存储，大规模自适应并行处理，高度容错性等优点。对于不确定的模式识别具有优势
若全部样本共分为 C 类 P(i / X ) max{P( j / X )} X i 平均错误率的定义为：
p(e) p(e, x)dx p(e / x) p( x)dx

为使最小，应取此两块错误区域面积相等。
p( X / 1 ) p(1 )
1
(1 0 )
P( X / w1 ) P( X / w2 ) dX
2
1 P( X / w2 ) P( X / w1 ) 0 X 2
p( X / 2 ) p(2 )

2、基于最小风险的Bayes准则：
P( X 1 / w1 ); P( X 2 / w2 ); P( X 1 / w2 ) P( X 2 / w1 )
相应的4种选择风险或代价记为平均风险：
C11 , C12 , C22 , C21
R=C11P( w1 ) P( X 1 / w1 ) C12 P( w1 ) P( X 1 / w2 ) C22 P( w2 ) P( X 2 / w2 ) C21P( w2 ) P( X 2 / w1 )

对所用的训练样本 xi 有：
yi (W xi b) 1
T
i
将之前的目标函数进行转化得到新的优化问题
1 2 Minimize W 2 s.b yi (W T xi b ) 1 i
定义Lagrange函数 n 1 2 (W , b, ) W +i [1 yi (W T xi b)] 2 i 1 原问题等价于 min max (W ,b , )

多类别情况，需要分成三种情况进行讨论

1、每一类模式与其他类模式用单个决策面分割设M类模式，由M个决策函数，具有以下性质：
0 di ( X ) Wi X 0
T
X i 其他
其中，i 1, 2,3,, M 。Wi (Wi1,Wi 2 ,,Win ,Wi,(n1) )T 表示第i个决策函数的权向量

数据获取：将细胞涂片上显微细胞图像转换为细胞数字图像，该细胞数字灰度图像反映了原细胞图像中相应位置的光密度大小。预处理：采用图像平滑法去除噪声，用图像阈值分割在差分直方图上求出划分细胞与背景、细胞核与细胞浆的两个灰度阈值特征的选择和提取：根据医生的建议和细胞所处部位及病变阶段，建立细胞的特征模型。一般可取33个特征。
2 P( X / 2 )dX 1
2
令 2 0 ，且以它为约束条件使 1最小。采用拉格朗日乘子法，可得：
1 ( 2 0 )
上式整理可得 (1 0 ) 为减小r可得：
P( X / w2 ) P( X / w1 ) dX
1 P( X / 1 ) (C21 C22 ) P(2 ) L( X )= X 2 P( X / 2 ) (C12 C11 ) P(1 )

3、奈曼－皮而逊决策：
当难以给出适当而合理的风险函数，一个明显的事实或规则，是设法限制或约束某一错误概率，而使另一错误概率最小。设有两种错误： 1 P( X / 1 )dX
2、集群准则函数：集群准则函数反映了类别间的相似性或分离性。
误差平方和准则： J e X mi
i 1 X i
C
2
离散度准则：
Sw
c i 1 xk classi
c

i 1
(ui xk )(ui xk )T （类内散度）
（类间散度）
Sb ni (ui u)(ui u)T
上式整理可得：
R =C11P( w1 ) C22 P( w2 ) (C21 C22 ) P( w2 ) P( X / w2 ) (C12 C11 ) P( w1 ) P( X / w1 ) dX
1
为使 R 最小，则整个规则可用如下不等式表示：
1 (C21 C22 ) P(2 ) P( X / 2 ) (C12 C11 ) P(1 ) P( X / 1 ) X 2
T

许多决策函数可以分割这些数据点出为两类如何选取决策函数
第2
第2类
第2类
第1类
第1类

最佳的决策函数应该最大化两类之间的间隔 m
第2类
m
2 m W
d ( X )=W T X +b=1 d ( X )=W T X +b=0
第1类
T
d ( X )=W X b 1

2、每一类模式与其他类由不同的决策面单个地分开，即类别间是成对可分的，这样就有M(M-1)/2个决策面。决策函数形式为： dij ( X ) Wij T X X i 若模式X 属于 i 类，则有：
dij ( X ) 0, j i

3、存在M 个决策函数
dK ( X ) WK T X , K 1, 2,...,M

图像识别的基本概念统计模式识别

线性决策函数距离函数模式分类似然函数模式分类

模式是对客观事物的描述，是指建立一个可用于仿效的完善的标本。模式识别本质上是经过分析、判断、归类、识别出事物与哪个供仿效的标本相同或相似。有时可将模式识别理解为模式分类。图像识别就是图像分类，属于模式识别的范畴
对于两类的问题，基于最小错误率的Bayes准则：
1 P(1 / X ) P(2 / X ) X 2
P( X / 1 ) P(1 ) P( X / 2 ) P(2 ) X 1 2
1 P( X / 1 ) P(2 ) L( X ) X 2 P( X / 2 ) P(1 )
对于二维输入特征X=(x1,x2), 线性决策函数为：
d ( X ) W1x1 W2 x2 W3 0
x2
分类结果：
若 d(X ) 0
若 d(X ) 0
X 1
d( X ) Wx 1 1 W 2 x2 W 3 0
X 2
若 d ( X ) 0 ，X处于不确定状态

1、基于最小错误率的Bayes准则
若已知两类的先验概率分别为 P (1 ) 和 P (2 ) ，两类的类条件概率密度为 P( X / 1 ) 和 P( X / 2 ) 。根据Bayes定理，已知先验概率和类条件概率密度函数，可求出后验概率 P(i / X )
P( X / i ) P(i ) P(i / X ) P( X )
(W , b, ) ，可得：通过求导求解 min W ,b
W i yi xi
原对偶问题转化为
n
n
i 1
y

e商务文档

图像识别ppt

相关文档推荐：