当前位置:文档之家› 北邮数据结构实验—Huffman编码解码器.docx

北邮数据结构实验—Huffman编码解码器.docx

北京邮电大学电信工程学院数据结构实验报告实验名称: ____Huffman 编码 /解码器 _____学生姓名: __________________班级: __________________班内序号: __________________学号: __________________日期: ___________________-1.实验要求利用二叉树结构实现哈夫曼编/ 解码器。

基本要求:1.初始化 (Init) :能够对输入的任意长度的字符串s 进行统计,统计每个字符的频度,并建立哈夫曼树2.建立编码表 (CreateTable):利用已经建好的哈夫曼树进行编码,并将每个字符的编码输出。

3.编码 (Encoding) :根据编码表对输入的字符串进行编码,并将编码后的字符串输出。

4.译码 (Decoding) :利用已经建好的哈夫曼树对编码后的字符串进行译码,并输出译码结果。

5.计算输入的字符串编码前和编码后的长度,并进行分析,讨论赫夫曼编码的压缩效果。

2. 程序分析2.1 存储结构静态三叉链表Weight Lchild Rchild parent2.2 程序流程(或程序结构、或类关系图等表明程序构成的内容,一般为流程图等 )2.2.1.流程图开始输入进行编码的字符串统计各个字符的频度,并对各叶子节点的权重赋值初始化各节点的Lchild , Rchild 和 parent进行哈弗曼编码是否最后一个字符是输出各字符编码对字符串进行编码找到当前字符编码,复制到总编码中是否最后一个字符是输出各字符串编码对哈弗曼码进行译码输出译码结果是否判断双亲节点否-该节点是否为根节点否若为左孩子若为右孩子编码前插入0编码前插入1-输出占用情况结束2.2.1.伪代码1.输入进行编码的字符串2.遍历字符串,并为叶子节点权重赋值3.依次对各字符进行哈弗曼编码,自下往上,若是双亲节点左孩子则编码前插入‘0’,若是双亲节点右孩子则编码钱插入‘1’。

4.显示各字符的哈弗曼编码。

5.对字符串进行编码,挨个遍历字符,找到相应的编码,复制到总的编码里,最后输出字符串的编码。

6.对字符串的哈弗曼码进行译码。

自上往下,若是‘0’,则递归到左孩子,若是‘1’,则递归到右孩子,知道叶子节点,输出该叶子节点代表字符,再继续遍历。

7.分析内存占用情况。

若用ASCII 编码,每个字符占 1 个字节,即8bit ,该情况下占用内存就是(字符长度)*8 。

若用哈弗曼编码,占用内存是各(字符频度)* (每个字符占用位数)之和。

2.3 关键算法分析该程序关键算法即哈弗曼编码,语句如下:void CHTree::huffmancode(){int i;if(n<=1)return;m=2*n-1;for(i=1;i<=n;i++)//叶子节点的初始化{ ht[i].parent=0;ht[i].lchild=0;ht[i].rchild=0;}for(;i<=m;i++) //非叶子节点的初始化{ht[i].weight=0;ht[i].parent=0;ht[i].lchild=0;ht[i].rchild=0;}-for(i=n+1;i<=m;++i)//构造哈夫曼树{s1=select(i-1);// 函数在 ht[1] 到 ht[i-1] 中选择 parent 为 0 且 weight 最小的结点,并将结点序号返 s,并将 ht[s1].parent 设为 -1s2=select(i-1);ht[s1].parent=i;ht[s2].parent=i;ht[i].lchild=s1;ht[i].rchild=s2;ht[i].weight=ht[s1].weight+ht[s2].weight;}int c,f;for(i=1;i<=n;++i) {for(c=i,f=ht[i].parent;f!=0;c=f,f=ht[f].parent)//逆向求叶子结点的哈夫曼编码if(ht[f].lchild==c){str[i].insert(0,"0",0,1);} //在字符串str[i] 的第 0 位置插入字符“ 0”else{str[i].insert(0,"1",0,1);} //在字符串str[i] 的第 0 位置插入字符“1”}}分析:这段语句实现的功能是根据统计出来的各字符的频度,建立哈弗曼。

建立哈弗曼树的过程如程序所展示,每次选取权重最小且无双亲节点的节点组合,并将其权重之和赋给其双亲节点,加入到总结中进行下次判断。

哈弗曼树建立完全以后,开始对各字符进行编码,从下往上,以叶子节点为起始点,若它是双亲节点的左孩子,其编码前插入‘0’,若是右孩子则插入‘ 1’。

再判断双亲节点使其双亲节点的左孩子还是右孩子,以此类推直到根节点。

依次对每个字符进行上述过程编码。

算法复杂度:最好情况为只有根结点和叶子节点:O( n)最坏情况为满二叉树情况:O( n*logn/2 )-3.程序运行结果分析首先,要求用户输入进行编码的字符串,遍历字符串,并为叶子节点权重赋值。

然后,依次对各字符进行哈弗曼编码,自下往上,若是双亲节点左孩子则编码前插入‘0’,若是双亲节点右孩子则编码钱插入‘ 1’。

屏幕上显示各字符的哈弗曼编码。

接下来对字符串进行编码,挨个遍历字符,找到相应的编码,复制到总的编码里,最后输出字符串的编码。

对字符串的哈弗曼码进行译码。

自上往下,若是‘0’,则递归到左孩子,若是‘1’,则递归到右孩子,知道叶子节点,输出该叶子节点代表字符,再继续遍历。

最后分析内存占用情况。

若用ASCII 编码,每个字符占 1 个字节,即8bit,该情况下占用内存就是(字符长度)*8 。

若用哈弗曼编码,占用内存是各(字符频度)*(每个字符占用位数)之和。

3.总结4.1 实验的难点和关键点本实验的难点和关键点是进行哈弗曼的编码与译码。

编码之前先要遍历字符串,并统计各字符出现的频度。

这里就要区分目前的字符是否出现过,若出现过则字符权重加一,若没有出现则在结构体数组的当前末尾添加该元素。

统计完频度以后开始编码。

根据哈弗曼树的特点,每次选取结点里权重最小,且双亲不为0 的节点结合,依次添加直至根节点。

编码过程是从下往上。

对于某字符所在叶子节点,若是双亲节点左孩子则编码前插入‘0’,若是双亲节点右孩子则编码钱插入‘ 1’。

直到双亲节点移动到根节点,所得到的编码即为该字符的编码。

译码过程是编码的逆过程。

依次读取哈弗曼码,自上往下,若是‘0’,则递归到左孩-子,若是‘ 1’,则递归到右孩子,知道叶子节点,输出该叶子节点代表字符,再继续遍历。

4.2 心得体会通过哈弗曼树的程序编写,更加深入了解了树这种数据结构的特点,并且熟悉了这种数据结构的应用。

同时,也对哈弗曼编码的优越性能有了根本的解释。

附:程序代码#include<iostream>#include<string>using namespace std;#define max 1000// 哈夫曼数存储的最大叶子节点数int judge;// 初始化过程中用于判断字符是否出现过struct HTNode{char c;int weight;int lchild,rchild,parent;};class CHTree{public:CHTree(){ht=NULL;} ;void Init();void huffmancode();int select(int i);void Display();void canculate();void encoding();void decoding();private:HTNode* ht;int m;int n;// 叶子结点数int s1;int s2;string a;// 存储输入的字符串string code;// 存储对字符串的编码string str[max];// 存储叶子结点的哈夫曼编码};void CHTree::Init()-{int i=1;// 用于记录叶子节点个数int j=0;int x=0,ru;cout<<" 请输入进行编码的字符串:"<<endl;cin>>a;int l=a.length();ht=(HTNode*)malloc((max)*sizeof(HTNode));//分配 MAXSIZE个叶子结点的存储空间while(x<l) // 统计字符出现的次数{judge=1;for(j=0;j<i;j++){if(ht[j].c==a[x]){//如果字符a[x]已经出现过,则记录,权值加1ht[j].weight++;judge=0;break;}}if(judge){// 若字符没有出现过,字符入列,且权值设为1 n=i;//记录叶子节点数ht[i].weight=1;ht[i].c=a[x];i++; }x++;}}int CHTree::select(int i)// 函数在 ht[1] 到 ht[i] 中选择 parent 为 0 且 weight 最小的结点,并将结点序号返回{int j=1;int k=1;int s;while(ht[j].parent!=0){j++;s=j;}k=j+1;while(k<=i){while(ht[k].parent!=0) k++;if(k>i)return s;if(ht[j].weight>ht[k].weight){ht[j].parent=0;// 如果第二次和第二次以后循环中发现有比ht[j] 权值还小的,将欢迎下载8-s=j;ht[j].parent=-1;// 如果 ht[j] 是权值较小的,将ht[j] 的 parent 记为 -1,}else{s=j;ht[j].parent=-1;}k++;}return s; }void CHTree::huffmancode(){int i;if(n<=1)return;m=2*n-1;for(i=1;i<=n;i++)//叶子节点的初始化{ ht[i].parent=0;ht[i].lchild=0;ht[i].rchild=0;}for(;i<=m;i++) //非叶子节点的初始化{ht[i].weight=0;ht[i].parent=0;ht[i].lchild=0;ht[i].rchild=0;}for(i=n+1;i<=m;++i)//构造哈夫曼树{s1=select(i-1);// 函数在 ht[1] 到 ht[i-1] 中选择 parent 为 0 且 weight 最小的结点,并将结点序号返 s,并将 ht[s1].parent 设为 -1s2=select(i-1);ht[s1].parent=i;ht[s2].parent=i;ht[i].lchild=s1;ht[i].rchild=s2;ht[i].weight=ht[s1].weight+ht[s2].weight;}int c,f;for(i=1;i<=n;++i) {for(c=i,f=ht[i].parent;f!=0;c=f,f=ht[f].parent)//逆向求叶子结点的哈夫曼编码if(ht[f].lchild==c){str[i].insert(0,"0",0,1);} //在字符串str[i] 的第 0 位置插入字符“ 0”else{str[i].insert(0,"1",0,1);} //在字符串str[i] 的第 0 位置插入字符“1”}-void CHTree::Display(){cout<<"huffman 编码如下: \n";cout<<" 字符 "<<'\t'<<" 权值 "<<'\t'<<" 哈夫曼编码 "<<endl;for(int i=1;i<=n;i++){cout<<ht[i].c<<'\t'<<ht[i].weight<<'\t'<<str[i]<<endl;}}void CHTree::canculate(){int m=0;for(int i=1;i<=n;i++){m+=(ht[i].weight)*(str[i].length());//该字符所占位数为频度和每个字符huffman 码长度乘积}cout<<"\n\n内存分析:\n"<<"原始编码所占内存数为"<<8*sizeof(char)*(a.length())<<"bit"<<endl;cout<<"huffman 编码所占内存数为"<<m<<"bit"<<endl;}void CHTree::encoding(){for(int i=0;i<a.length();i++){//循环变量i用于遍历输入字符串的字符for(int j=1;j<=n;j++){//循环变量j用于寻找huffman编码中与该字符的相匹配的字符编码if(a[i]==ht[j].c)code+=str[j];}}cout<<"\n\n 字符编码为 "<<code<<endl;}void CHTree::decoding(){int i=0;int m=code.length();cout<<"\n\n 对编码译码后所得字符:";while(i<m){int parent=2*n-1;// 根结点在 HTree 中的下表while(ht[parent].rchild!=0||ht[parent].lchild!=0)// 自根结点向叶子节点匹配编码,叶子节点左右孩子均为0,此时输出字符{if(code[i]=='0')parent=ht[parent].lchild;elseparent=ht[parent].rchild;i++;}cout<<ht[parent].c;}-}void main(){CHTree h;h.Init(); // 初始化,统计输入字符的频度,赋值各叶子节点的权重h.huffmancode();// 建立 huffman 树h.Display();// 显示各字符对应的huffman 码h.encoding();// 对输入的字符进行编码h.decoding();// 对以上编码进行解码h.canculate();// 计算分析编码前与编码后的所占内存system("pause");}。

相关主题