当前位置:文档之家› 《KMP 字符串模式匹配算法》教学课例

《KMP 字符串模式匹配算法》教学课例

《KMP字符串模式匹配算法》教学课例程玉胜安庆师范学院计算机与信息学院KMP字符串模式匹配是数据结构课程中一个重要的知识点,也是一个难点(学过KMP 算法的同学100%认为:KMP是数据结构课程中最难的部分)。

为了消除他们对KMP算法学习的恐惧心理,激发他们的学习兴趣,调动其积极性,显得尤为重要。

基于以上,我们根据学生的认知特点和接受水平,对教材内容进行了重新构建,并按照数据结构中“时间复杂度”概念,增加了不同模式匹配算法的运行时间,动态逼真的显示了算法的“时间”性能,获得了较好的教学效果。

一、教学目标知识目标:让学生了解KMP算法应用的普遍性。

如:在目前众多的文字处理软件中得到广泛应用,如Microsoft Word中的“查找”或“替换”操作。

而这种操作实现的机制,同学们特别是计算机专业的学生很少去想过。

能力目标:要求学生体验一个完整的抽象数据类型(ADT)的实现方法和过程,并学会判断、计算算法优劣的方法。

价值目标:消除恐怖的学习心态,让学生感悟数据结构算法实际应用价值,从而激发学习的兴趣,形成积极主动式学习的态度。

二、教材分析使用教材是清华大学严蔚敏教授并由清华大学出版社出版的《数据结构(C语言版)》,该教材难度较大,其实验方法特别是ADT方法在教材中介绍较少,而且KMP算法更是从理论分析的角度介绍了匹配算法和next的计算,自学难度很大;虽然该节知识点属于“**(表示难度较大,可以不讲)”,但是其又是考研的一个热点,所以我们又不得不讲。

三、教学重点、难点教学重点:KMP算法中的next和改进的nextval计算教学难点:KMP算法中如何计算next值四、教具准备卡片:多个字符串,字符串指针强力磁吸:6个五、互动式教学过程教学内容教师活动学生活动目标状态创设情境引入课题目前的众多软件中,“查找”、“替换”等操作实现方法,要求学生举例。

给出一篇word文档完成在上述文档中从当前位置向后查找“计算机”或者向前查找“计算机”字符串的方法。

这些软件中“查找”操作是怎么实现的?提出问题教师给出如下任务:手动演示如下两个字符串的查找操作。

例如:在串S=”abcabcabdabba”中查找T=”abcabd”的位置。

学生分组讨论,演示“查找”过程,如图(教具演示)我们发现比较到S[6] 和T[6]不等时,怎么办?解决问题| 简单匹配算法引入“简单匹配算法”给出上例的匹配过程前两步:第一趟、第二趟、学生完成匹配后面过程第三趟、第四趟、要求学生计算匹配次数:通过4次匹配,终于在S串中“查找”到T串,位置时4在第一趟比较后,进行的第二趟、第三趟比较有必要吗?进一步提出问题第一趟后,当S[6]≠T[6]时,◆第二趟进行S[2]与T[1]比较是必要的吗?◆第三趟进行S[3]与T[1]比较是必要的吗?◆第四趟进行S[4]与T[1]比较是必要的吗?◆第四趟进行S[4]与T[2]比较是必要的吗?学生讨论,然后找学生提问,最后证明。

如果是不必要的,那么第一趟后,当S[6]≠T[6]时,S[6]与T[ ]比较是必要的呢!“”怎么求?解决问题| KMP 匹配算法引入“MP匹配算法”第一趟,当S[6]≠T[6]时,S下标不是回溯到2,T下标也不是回溯到开始,而是根据T中T[6]==’d’的模式函数值(next[6]=3,为什么?后面讲)进行匹配,要求学生完成匹配过程当S[6]≠T[6]时,根据next[6]=3匹配过程:要求学生计算匹配次数:仅通过2次匹配,终于在S串中“查找”到T串,位置时4next[6]=3含义:其实这个3表示T[6]==’d’的前面有2个字符和开始的两个字符相同”怎么求串的模式值next[n]?教学重点内容| next 值的计算引入“模式值next[n]的计算”定义:略例二、求T=“abcab”的模式函数的值。

下标 1 2 3 4 5T a b c a bnext 0 1 1 1 2设T=“abcab”,S=“abcadcabcab”,利用KMP算法进行匹配,几次匹配成功?存在什么问题?问题的进一步提出第一趟:当出现S[5]≠T[5]时,根据next[5]=2,得:第二趟、第三趟、学生完成后面的工作:要求学生计算匹配次数:仅通过5次匹配,在S串中“查找”到T串,位置时7比如:“abcab”模式串中,NEXT值为(0 1 1 1 2 )。

当比较到T[5]=b不成功时,原NEXT的值跟T[2]比较,可事实上,T[2]也是b,与T[5]相同,所以可以直接跟T[1]比较。

可见,第二趟比较是多余的,那么如何改进呢?教学重点内容|next[n]改进为nextval[n]:如果T[j]≠T[k],k=next[j] 否则k=next[k]要求学生计算nextval值下标 1 2 3 4 5T a b c a cnext 0 1 1 1 2完成理论教学目标,那么在计算机中我们怎样编程实现?另外几种算法的时间复杂度怎样计算?nextval 值的计算nextval 0 ? ? ? ? 根据nextval,计算改进后的匹配次数。

成品介绍| ADT 简单匹配算法演示:简单匹配算法介绍抽象数据类型的简单匹配算法实现及其时间复杂度计算方法。

进一步认识“数据封装”的含义,在原有程序基础上增加“匹配次数”的计算方法:结果:怎样实现KMP算法及其改进的模式匹配算法主动式学习与模仿| KMP 算法实现教师辅导学生模仿“简单匹配算法”实现代码,实现“KMP算法”程序调试过程时,学生可以向下面的学生求助,也可以向老师求助进一步熟悉了ADT编程方法和调试机巧课堂作业1. 给出字符串‘abacabaaad’在KMP算法中的next和nextval数组。

2.对S=’aabcbabcaabcaaba’,T=’bca’,画出T为模式串,S为目标串的匹配过程。

10分钟完成,并检查掌握情况课后作业:1.求串’ababaaababaa’的next函数值。

2模式串t=’abcaabbcaabdab’,求模式串的next和nextval函数的值。

提高创新仿照WORD文档中的“查找”操作,编程实现在文本文件中查找指定的字符串位置。

学生讨论,查找相关文献资料将结果上传至作业存储的ftp服务器ftp://219.231.49.249网上答疑课堂作业、课后作业答案将在数据结构在线学习网站—网站公告”中公布在学习过程中遇到的不懂的、或者难题,请同学继续在“数据结构在线学习网站—网上答疑”中提交对于“网上答疑”中的问题,我们将及时回复,目前“网上答疑”的开通,极大的方便了老师与学生的交流,反映效果较好。

附:详细的教学过程1、创设情境,引入课题老师:目前的众多软件中,“查找”、“替换”等操作实现方法,要求学生举例。

给出一篇word文档学生:完成在上述文档中从当前位置向后查找“计算机”或者向前查找“计算机”字符串的方法。

2、提出问题,解决问题老师:这些软件中“查找”操作是怎么实现的?教师给出如下任务:手动演示如下两个字符串的查找操作,例如:在串S=”abcabcabdabba”中查找T=”abcabd”的位置。

学生分组讨论,演示“查找”过程,如图1(教具演示)老师提出问题:我们发现比较到S[6] 和T[6]不等时,怎么办?解决问题:引入“简单匹配算法”3、简单匹配算法基本的模式匹配算法:以主串的某个字符与子串的第一个字符相比较,若相等,则继续比较二者的后一个字符,否则主串的字符指针从开始与子串第一个字符比较处后移一个位置,而子串的字符指针重新指向子串的第一个字符。

当这样一个失配发生时,T下标必须回溯到开始,S下标回溯的长度与T相同,然后S 下标增1,然后再次比较。

如图:这次立刻发生了失配,T下标又回溯到开始,S下标增1,然后再次比较。

如图:又一次发生了失配,所以T下标又回溯到开始,S下标增1,然后再次比较。

这次T中的所有字符都和S中相应的字符匹配了。

函数返回T在S中的起始下标4。

如图:上述通过4次匹配,终于在S串中“查找”到T串,位置时4。

老师再次提出问题:在第一趟比较后,进行的第二趟、第三趟比较有必要吗?提问的形式:让学生讨论如下问题,第一趟后,当S[6]≠T[6]时,第二趟进行S[2]与T[1]比较是必要的吗?第三趟进行S[3]与T[1]比较是必要的吗?第四趟进行S[4]与T[1]比较是必要的吗?第四趟进行S[4]与T[2]比较是必要的吗?如果是不必要的,那么第一趟后,当S[6]≠T[6]时,S[6]与T[ ?]比较是必要的呢!解决问题:引入“KMP匹配算法”4、KMP 匹配算法KMP算法:KMP算法是对传统模式匹配算法的较大改进,在传统的模式匹配算法中,当出现主串中的字符与子串中的字符不等时,同时向前回溯了两个指针,一个是主串的指针,一个是子串的指针。

而KMP算法的基本思路是在不回溯主串的指针,而只回溯子串的指针的情况下完成模式匹配,这样就省去了回溯主串指针进行比较的一部分时间。

KMP算法的核心思想是利用已经得到的部分匹配信息来进行后面的匹配过程。

还是相同的例子,在S=”abcabcabdabba”中查找T=”abcabd”,如果使用KMP匹配算法,当第一次搜索到S[6] 和T[6]不等后,S下标不是回溯到2,T下标也不是回溯到开始,而是根据T中T[6]==’d’的模式函数值(next[6]=3,为什么?后面讲),直接比较S[6] 和T[3]是否相等,因为相等,S和T的下标同时增加;因为又相等,S和T的下标又同时增加。

最终在S中找到了T。

如图:next[6]=3含义:其实这个3表示T[6]==’d’的前面有2个字符和开始的两个字符相同”。

请看图:因为,S[5] ==T[5],S[4] ==T[4],根据next[6]=3,有T[4]==T[1],T[5] ==T[2],所以S[4]==T[1],S[5] ==T[2](两对相当于间接比较过了),因此,接下来比较S[6] 和T[3]是否相等。

有人可能会问:S[4]和T[1],S[5] 和T[2]是根据next[6]=3间接比较相等,那S[2]和T[1],S[3] 和T[1]之间又是怎么跳过,可以不比较呢?因为S[1]=T[1],S[2]=T[2],S[3]=T[3],而T[1] != T[2], T[2] != T[3],==> S[1] != S[2],S[2] != S[3],所以S[2] != T[1],S[3] != T[1]. 还是从理论上间接比较了。

5 . 怎么求串的模式值next[n]定义:0 如果j=1next[j]={ Max{k|1<k<j且'p1...p k-1'='p j-k+1...p j-1'1 其它情况(1)next[1]=0 意义:任何串的第一个字符的模式值规定为0。

相关主题