《模式识别基础》课程标准(执笔人:刘雨审阅学院:电子科学与工程学院)课程编号:08113英文名称:Pattern Recognition预修课程:高等数学,线性代数,概率论与数理统计,程序设计学时安排:40学时,其中讲授32学时,实践8学时。
学分:2一、课程概述(一)课程性质地位模式识别课基础程是军事指挥类本科生信息工程专业的专业基础课,通信工程专业的选修课。
在知识结构中处于承上启下的重要位置,对于巩固已学知识、开展专业课学习及未来工作具有重要意义。
课程特点是理论与实践联系密切,是培养学生理论素养、实践技能和创新能力的重要环节。
是以后工作中理解、使用信息战中涉及的众多信息处理技术的重要知识储备。
本课程主要介绍统计模式识别的基本理论和方法,包括聚类分析,判别域代数界面方程法,统计判决、训练学习与错误率估计,最近邻方法以及特征提取与选择。
模式识别是研究信息分类识别理论和方法的学科,综合性、交叉性强。
从内涵讲,模式识别是一门数据处理、信息分析的学科,从应用讲,属于人工智能、机器学习范畴。
理论上它涉及的数学知识较多,如代数学、矩阵论、函数论、概率统计、最优化方法、图论等,用到信号处理、控制论、计算机技术、生理物理学等知识。
典型应用有文字、语音、图像、视频机器识别,雷达、红外、声纳、遥感目标识别,可用于军事、侦探、生物、天文、地质、经济、医学等众多领域。
(二)课程基本理念以学生为主体,教师为主导,精讲多练,以用促学,学以致用。
使学生理解模式识别的本质,掌握利用机器进行信息识别分类的基本原理和方法,在思、学、用、思、学、用的循环中,达到培养理论素养,锻炼实践技能,激发创新能力的目的。
(三)课程设计思路围绕培养科技底蕴厚实、创新能力突出的高素质人才的目标,本课程的培养目标是:使学生掌握统计模式识别的基本原理和方法,了解其应用领域和发展动态,达到夯实理论基础、锻炼理论素养及实践技能、激发创新能力的目的。
模式识别是研究分类识别理论和方法的学科,综合性、交叉性强,涉及的数学知识多,应用广。
针对其特点,教学设计的思路是:以模式可分性为核心,模式特征提取、学习、分类为主线,理论上分层次、抓重点,方法上重比较、突出应用适应性。
除了讲授传统的、经典的重要内容之外,结合科研成果,介绍不断出现的新理论、新方法,新技术、新应用,开拓学生视野,激发学习兴趣,培养创新能力。
教学设计以章为单元,用实际科研例子为引导,围绕基本原理展开。
选择两个以上基本方法,辅以实验,最后进行对比分析、归纳总结。
使学生在课程学习中达到一个思、学、用、思、学、用的良性循环。
在习题、实验素材的选取上,各章节单元之间应保持连贯性,以减少学生不必要的重复劳动。
实验和平时作业占考试成绩的30%,对于确有学习心得,并体现在实验报告中的学生,实行加分。
二、课程目标(一)知识与技能本课程主要介绍统计模式识别的基本理论和方法,包括聚类分析,判别域代数界面方程法,统计判决、训练学习与错误率估计,最近邻方法以及特征提取与选择。
使学生理解模式识别的本质,掌握利用机器进行信息识别分类的基本原理和方法。
培养通过信息分析,发现问题、解决问题的能力。
为以后工作中理解、使用信息战中涉及的众多信息处理技术打下一定的理论和方法基础。
(二)过程与方法从课堂讲授中获得统计模式识别的基本理论知识,了解实际中的模式识别现实问题。
在实验中,编程实现部分基本的模式识别算法,通过对算法及实验结果的分析,验证所学的理论知识,并用以指导实验,改善实验结果,获得实践经验,加深对模式识别理论及方法的理解。
在实验基础上,通过课堂研讨,深化对理论问题的认识,锻炼实践技能,培养创新能力。
(三)情感态度与价值观模式识别是一门理论与实践结合紧密的课程。
通过课程的学习,认识以往所学基础理论知识和技能在实践中的重要性和实用性。
用模式识别实际应用问题激发探究热情,通过课程的理论学习和实验环节培养解决问题的成就感。
感受从感性认识到理性认识、具体到抽象、理论指导实践的全过程。
培养解决问题的理论思考及动手能力。
教学目标突出学员学习的主体地位,实现多层次要求。
基本层,要求完成课程学习,通过考试,获得学分。
提高层,能够将所学知识和内容用于课题研究,解决实际问题。
飞跃层,通过模式识别的学习,改进思维方式,为将来的工作打好基础,终身受益。
三、内容标准第一章引论(2学时)第1节概述介绍模式识别的基本概念及术语,概述模式识别过程、方法,学科特点、历史现状和发展、应用。
第2节特征矢量及特征空间引入研究对象模型—特征矢量,建立特征空间概念,熟练掌握随机特征矢量的描述方法及特征矢量变换。
复习重要的概率统计知识,相关、正交、独立等概念,多元正态分布及其性质。
本章重点:模式识别的概念及过程,特征矢量的描述方法和特征空间概念。
本章难点:随机矢量间的统计关系。
第二章聚类分析(8学时,含2学时实验)介绍非监督分类的原则,聚类思想和基本方法。
明确聚类分析在模式识别中的作用。
第1节聚类分析的概念掌握聚类分析的基本思想,影响分类有效性的因素,建立以相似性作为分类依据的思想。
第2节模式相似性测度掌握若干重要的特征矢量相似性测度,包括距离侧度,相关系数,匹配测度等的定义、特点及适用场合。
第3节类的定义与类间距离掌握类间距离的定义及递推计算、聚类准则函数,了解它们对聚类结果的影响。
第4节聚类算法(1)经验法:根据相似性阈值和最小距离原则的聚类方法,最大最小距离算法;(2)层次聚类法;(3)动态聚类法:c-均值法、近邻函数算法。
要求熟练掌握依据模式相似性测度进行聚类的概念和基本方法。
本章重点:相似性测度,层次聚类法和c-均值算法。
本章难点:聚类准则函数的内涵,影响c均值算法的因数及改进方法。
第三章判别域代数界面方程法(8学时,含2学时实验)介绍用判别类域界面进行分类的思想及主要方法。
第1节用判别函数分类的概念建立判别域的概念, 掌握用判别域界面进行分类的思想。
第2节线性判别函数介绍n维特征空间中线性判别函数的一般形式。
掌握两类问题和多类问题的判别规则,处理多类问题的技术途径。
第3节判别函数值的鉴别意义熟练熟练掌握特征空间、权空间、解空间的概念,n维线性判别函数的几何意义。
第4节线性判别函数的求解方法掌握一次、二次准则函数及梯度下降法,熟练掌握感知器算法解多类问题。
建立根据与错分敏感的一次、二次准则函数的梯度进行最优化求解线性判别函数权系数的概念,并掌握其方法。
第5节非线性判别函数第六节最近邻方法掌握非线性判别函数方法之一:势函数法。
本章重点:线性判别函数的的鉴别意义,一次、二次准则函数及其解法, 势函数法。
本章难点:二次准则函数及其解法第四章统计判决(4学时)介绍利用概率统计知识进行分类判决的准则。
第1节最小误判概率准则熟练掌握最小误判概率准则,多类问题判决规则的几个等价形式, 几种特殊情况下的正态模式判决规则的具体形式,及误判概率的简单计算。
第2节最小损失准则判决建立损失与损失函数思想, 掌握最小损失准则下的判决规则。
学会基于实际问题建立平均损失函数。
第3节N-P判决了解N-P判决准则及适用场合。
本章重点:分类识别判决的几个准则及其适用场合。
本章难点:误判概率的求法。
第五章统计决策中的训练、学习与错误率估计(8学时,含2学时实验)利用训练样本进行概率密度未知参数集的估计式或导出判别函数、估计概率密度函数,建立用已知类别样本进行学习的概念。
第1节参数估计掌握矩估计,均值矢量和协方差矩阵估计的递推关系。
复习最大似然估计,掌握贝叶斯学习原理。
第2节概率密度的窗函数估计法及Kn近邻法掌握类概率密度函数窗函数估计法的原理,了解Parzen窗法和Kn近邻法的差别。
本章重点:类概率密度函数估计的基本思想和有关具体方法。
本章难点:贝叶斯学习,窗函数估计法的收敛条件。
本章难点:最近邻方法的误判概率与贝叶斯最小误判概率的关系。
第六章特征提取和选择(8学时,含2学时实验)特征选择的好坏关系到能否成功地完成分类和识别, 因此本章内容非常重要。
本章从分类和识别的立场上介绍选择优良特征的方法。
第1节. 概述从分类和识别的立场介绍特征的性质,了解对特征的基本要求。
要求: 明确特征选择的重要性和特征选择所应遵循的基本原则。
第2节. 类别可分性判据内容: 提出对判据的基本要求, 引入基于几何距离的可分性判据、基于类概率密度的可分性判据。
要求: 掌握几种重要判据的具体形式。
第3节. 基于可分性判据的特征提取选择内容: 介绍基于离差阵的特征提取与选择方法。
要求: 了解方法的实质是离差矩阵的主分量提取。
第4节. K-L变换与特征提取内容: 给出变换的定义、性质及应用。
要求: 掌握K-L变换在特征提取中的应用。
第5节.分支定界法内容:介绍分支定界算法要求:了解算法的基本特点及搜索树的结构规律。
本章重点:可分性判据及特征提取与选择方法。
本章难点:基于类概率密度函数的可分性判据,主分量提取及变换的内涵。
第七章复习(2学时)实验教学部分教学目的:模式识别是一门理论与实践紧密结合的课程,应用广泛,发展迅速。
实验是学习模式识别的重要环节。
主导思想:通过编程实验使学生熟练掌握模式识别的基本原理和方法,加深对各方法涉及的基础知识的认识,强化编程技能,培养创新能力。
教学要求:熟练掌握统计模式识别的基本方法,用C++语言或Matlab编写能对实际模式样本正确分类的算法程序;通过分析、比较各种方法的性能,了解各种方法的适用条件、实际处理效果,探讨可能的改进方法。
教学内容:实验1 c-均值算法掌握动态聚类算法的基本思想,认识类别数、初始类心的选择对c-均值算法聚类结果的影响,编写能对实际模式样本正确分类的c-均值算法程序。
实验2 感知器算法掌握感知器算法的基本原理;加深对有监督训练、线性可分、解空间、权空间等概念的理解。
编写能对实际模式样本正确分类的感知器算法程序。
要求分析影响感知器算法收敛及收敛速度的因素,明确算法的适用条件。
实验3 H-K算法(选做)掌握基于二次准则函数的梯度下降算法的基本思想,了解该算法的特点。
编写能对实际模式样本正确分类的Ho-Kashyyap算法(简称H-K算法)程序。
要求针对不同的输入样本集,观察算法的收敛性及收敛速度,明确算法的适用条件。
实验4 Bayes分类器设计掌握Bayes分类器的基本原理和方法。
内容及要求(1)产生二维正态分布模式,并将产生的样本集随机地分为参照集和测试集;(2)用最大似然估计法和(1)产生的样本参照集估计模式的分布参数;(3)分别设计最小误判概率准则Bayes分类器和最小损失准则Bayes分类器,对(1)中产生的样本测试集进行分类,观察代价函数的设置对分类结果的影响;(4)统计错分概率。
(5)(选做)用Parzen窗函数法估计概率密度,重复(3)~(4)。