当前位置:文档之家› 哈夫曼编码译码器课程设计

哈夫曼编码译码器课程设计

目录目录 01 课程设计的目的和意义 (1)2 需求分析 (2)3 系统(项目)设计 (4)①设计思路及方案 (5)②模块的设计及介绍 (5)③主要模块程序流程图 (8)4 系统实现 (10)①主调函数 (12)②建立HuffmanTree (12)③生成Huffman编码并写入文件 (15)④电文译码 (16)5 系统调试 (16)参考文献 (19)附录源程序 (20)1 课程设计的目的和意义在当今信息爆炸时代,如何采用有效的数据压缩技术来节省数据文件的存储空间和计算机网络的传送时间已越来越引起人们的重视。

哈夫曼编码正是一种应用广泛且非常有效的数据压缩技术。

哈夫曼编码的应用很广泛,利用哈夫曼树求得的用于通信的二进制编码称为哈夫曼编码。

树中从根到每个叶子都有一条路径,对路径上的各分支约定:指向左子树的分支表示“0”码,指向右子树的分支表示“1”码,取每条路径上的“0”或“1”的序列作为和各个对应的字符的编码,这就是哈夫曼编码。

通常我们把数据压缩的过程称为编码,解压缩的过程称为解码。

电报通信是传递文字的二进制码形式的字符串。

但在信息传递时,总希望总长度尽可能最短,即采用最短码。

作为信息管理专业的学生,我们应该很好的掌握这门技术。

在课堂上,我们能过学到许多的理论知识,但我们很少有过自己动手实践的机会!课程设计就是为解决这个问题提供了一个平台。

在课程设计过程中,我们每个人选择一个课题,认真研究,根据课堂讲授内容,借助书本,自己动手实践。

这样不但有助于我们消化课堂所讲解的内容,还可以增强我们的独立思考能力和动手能力;通过编写实验代码和调试运行,我们可以逐步积累调试C程序的经验并逐渐培养我们的编程能力、用计算机解决实际问题的能力。

在课程设计过程中,我们不但有自己的独立思考,还借助各种参考文献来帮助我们完成系统。

更为重要的是,我们同学之间加强了交流,在对问题的认识方面可以交换不同的意见。

同时,师生之间的互动也随之改善,我们可以通过具体的实例来从老师那学到更多的实用的知识。

数据结构课程具有比较强的理论性,同时也具有较强的可应用性和实践性。

课程设计是一个重要的教学环节。

我们在一般情况下都能够重视实验环节,但是容易忽略实验的总结,忽略实验报告的撰写。

通过这次实验让我们明白:作为一名大学生必须严格训练分析总结能力、书面表达能力。

需要逐步培养书写科学实验报告以及科技论文的能力。

只有这样,我们的综合素质才会有好的提高。

2 需求分析课题:哈夫曼编码译码器系统问题描述:打开一篇英文文章,统计该文章中每个字符出现的次数,然后以它们作为权值,对每一个字符进行编码,编码完成后再对其编码进行译码。

问题补充:1. 从硬盘的一个文件里读出一段英语文章;2. 统计这篇文章中的每个字符出现的次数;3. 以字符出现字数作为权值,构建哈夫曼树,并将哈夫曼树的存储结构的初态和终态进行输出;4. 对每个字符进行编码并将所编码写入文件然后对所编码进行破译。

具体介绍:在本课题中,我们在硬盘E盘中预先建立一个file1.txt文档,在里面编辑一篇文章(大写)。

然后运行程序,调用fileopen()函数读出该文章,显示在界面;再调用jsq()函数对该文章的字符种类进行统计,并对每个字符的出现次数进行统计,并且在界面上显示;然后以每个字符出现次数作为权值,调用ChuffmanTree()函数构建哈夫曼树;并调用print1()和print2()函数将哈夫曼的存储结构的初态和终态进行输出。

然后调用HuffmanEncoding()函数对哈夫曼树进行编码,调用coding()函数将编码写入文件;再调用decode()对编码进行译码,再输出至界面。

至此,整个工作就完成了。

测试数据:例如从文本中读到文章为:IAMASTUDENT。

则效果如下:IAMASTUDENT--------------------------------------HuffmanTree的初态:2 0 0 01 0 0 01 0 0 01 0 0 01 0 0 01 0 0 01 0 0 02 0 0 01 0 0 0- 0 0 0- 0 0 0- 0 0 0- 0 0 0- 0 0 0- 0 0 0- 0 0 0- 0 0 0--------------------------------------字符A次数:2字符D次数:1字符E次数:1字符I 次数:1字符M次数:1字符N 次数:1字符S 次数:1字符T次数:2字符U次数:1--------------------------------------HuffmanTree的终态:2 13 0 01 10 0 01 10 0 01 11 0 01 11 0 01 12 0 01 12 0 02 14 0 01 13 0 02 14 2 32 15 4 52 15 6 73 16 9 14 16 8 104 17 11 127 17 13 1411 0 15 16--------------------------------------译码后的字符串:IAMASTUDENT********************************************************** Press any key to continue3 系统(项目)设计(1)设计思路及方案本课题是用最优二叉树即哈夫曼树来实现哈夫曼编码译码器的功能。

假设每种字符在电文中出现的次数为Wi,编码长度为Li,电文中有n种字符,则电文编码总长度为(W1*L1)+(W2*L2)+…+(Wi*Li)。

若将此对应到二叉树上,Wi为叶结点,Li为根结点到叶结点的路径长度。

那么,(W1*L1)+(W2*L2)+…+(Wi*Li)恰好为二叉树上带权路径长度。

因此,设计电文总长最短的二进制前缀编码,就是以n种字符出现的频率作权,构造一棵哈夫曼树,此构造过程称为哈夫曼编码。

该系统将实现以下几大功能:从硬盘读取字符串,建立哈夫曼树,输出哈夫曼树的存储结构的初态和终态,输出各种字符出现的次数以及哈夫曼编码的译码等。

(2)模块的设计及介绍①从硬盘读取字符串fileopen(参数){实现命令;打印输出;}②建立HuffmanTree通过三个函数来实现:void select(参数){初始化;for{接受命令;处理命令;}说明:在ht[1....k]中选择parent为0且权值最小的两个根结点的算法int jsq(参数){初始化;for{接受命令;处理命令;}}说明:统计字符串中各种字母的个数以及字符的种类void ChuffmanTree(){初始化;for{接受命令;处理命令;}输出字符统计情况;}说明:构造哈夫曼树③输出哈夫曼树的存储结构的初态和终态分别调用print1()和print2()来实现void print1(参数){初始化;输出初态;说明:输出哈夫曼树的初态void print2(参数){for{输出终态;}}说明:输出哈夫曼树的终态④哈夫曼编码和译码void HuffmanEncoding(参数) {定义变量;{处理命令;}}说明:哈夫曼编码char*decode(参数){定义变量;while{接受命令;处理命令;}}说明:哈夫曼译码(3)主要模块程序流程图下面介绍三个主要的程序模块流程图:①主函数流程图:图3.1流程图注释:该图比较简单,主要是调用各个函数模块,首先代开已经存在的文件,然后统计总的字符数以及出现的各个字符和频率。

然后才开始建立哈夫曼树,接着在哈夫曼树的基础上对其进行编码,编码之后才是译码。

最后输出结束。

图3.2流程图注释:该图是表示构造哈夫曼树的过程。

首先输入num个叶结点的权值,当i=num是循环结束。

然后进行哈夫曼树的构建,当i=2*num-1是循环结束。

最后输出所得到的字符统计情况。

图3.3流程图解释:该流程图表四哈夫曼编码情况。

首先初始化,Cd[--start]=0,start=num。

然后进行编码,使用了一个三目运算符。

cd[--start]=(T[p].lchild==c) ? '0' : '1',即当cd[--start]=T[p].lchild= =c时,cd[--start]=0;当cd[--start]=T[p].lchild!= =c时,cd[--start]=1。

这个编码循环一直到i=num时结束。

4 系统实现各模块关键代码及算法的解释:①主调函数代码解释:这是main函数里的各个函数调用情况。

fileopen(string); //从硬盘中读取文件num=jsq(string,cnt,str); //统计字符种类及各类字符出现的频率DhuffmanTree(HT,cnt,str);printf("HuffmanTree的初态:\n");print1(HT); //输出哈夫曼树的初态ChuffmanTree(HT,HC,cnt,str);//建立哈夫曼树HuffmanEncoding(HT,HC); //生成哈夫曼编码printf("HuffmanTree的终态:\n");print2(HT); //输出哈夫曼树的终态s=decode(HC); //读编码文件译码printf("译码后的字符串:\n");printf("%s\n",s); //输出译码后的字符串②建立HuffmanTree代码解释:该函数为在ht[1....k]中选择parent为0且权值最小的两个根结点的算法,其序号为s1和s2。

void select(HuffmanTree T,int k,int &s1,int &s2){int i,j;int min1=101;for(i=1;i<=k;i++)if(T[i].weight<min1 &&T[i].parent==0){j=i;min1=T[i].weight;}s1=j;min1=32767;for (i=1;i<=k;i++)if(T[i].weight<min1 && T[i].parent==0 && i!=s1){j=i;min1=T[i].weight;}s2=j;}代码解释:下面函数用来统计字符串中各种字母的个数以及字符的种类。

当字符在A和Z之间时即被计数,并用str[j]保存字母到数组中,用cnt[j]统计每种字符个数。

j返回总共读取的字符数目。

int jsq(char *s,int cnt[],char str[]){int i,j,k;char *p;int temp[27];for(i=1;i<=26;i++)temp[i]=0;for(p=s; *p!='\0';p++){{if(*p>='A'&&*p<='Z')k=*p-64;temp[k]++;}} //统计各种字符的个数for(i=1,j=0;i<=26;++i)if(temp[i]!=0 ){j++;str[j]=i+64; //送对应的字母到数组中cnt[j]=temp[i]; //存入对应字母的权值}return j; //j是输入字母总数}代码解释:下面函数用来构造哈夫曼树HT。

相关主题