数据结构实验报告实验名称:实验三树学生姓名:班级:班内序号:学号:日期:2012年12月7号1、实验要求利用二叉树结构实现赫夫曼编/解码器。
基本要求:1、初始化(Init):能够对输入的任意长度的字符串s进行统计,统计每个字符的频度,并建立赫夫曼树2、建立编码表(CreateT able):利用已经建好的赫夫曼树进行编码,并将每个字符的编码输出。
3、编码(Encoding):根据编码表对输入的字符串进行编码,并将编码后的字符串输出。
4、译码(Decoding):利用已经建好的赫夫曼树对编码后的字符串进行译码,并输出译码结果。
5、打印(Print):以直观的方式打印赫夫曼树(选作)6、计算输入的字符串编码前和编码后的长度,并进行分析,讨论赫夫曼编码的压缩效果。
测试数据:I love data Structure, I love Computer。
I will try my best to study data Structure.提示:1、用户界面可以设计为“菜单”方式:能够进行交互。
2、根据输入的字符串中每个字符出现的次数统计频度,对没有出现的字符一律不用编码。
2、程序分析2.1存储结构(1)二叉树template <class T>class BiTree{public:BiTree(); //构造函数,其前序序列由键盘输入~BiTree(void); //析构函数BiNode<T>* Getroot(); //获得指向根结点的指针protected:BiNode<T> *root; //指向根结点的头指针};//声明类BiTree及定义结构BiNodeData:二叉树是由一个根结点和两棵互不相交的左右子树构成。
二叉树中的结点具有相同数据类型及层次关系。
示意图:lchild parent rchild(2)静态三叉链表struct HNode//哈夫曼树的静态三叉链表 {unsigned int weight; //结点权值unsigned int parent; //双亲指针unsigned int Lchild; //左孩子指针unsigned int Rchild; //右孩子指针};示意图:(3) 编码表的节点结构 struct HCode //字符及其编码结构{char data;char code[100];};示意图:2.2关键算法分析一:关键算法(一)初始化函数void Huffman::Init(int a[],int n)(1)算法自然语言1.创建一个长度为2*n -1的三叉链表2.将存储字符及其权值的链表中的字符逐个写入三叉链表的前n个结点的data域,并将对应结点的孩子域和双亲域赋为空3.从三叉链表的第n个结点开始,i=n3.1从存储字符及其权值的链表中取出两个权值最小的结点x,y,记录其下标x,y。
3.2将下标为x和y的哈夫曼树的结点的双亲设置为第i个结点3.3将下标为x的结点设置为i结点的左孩子,将下标为y的结点设置为i结点的右孩子,i结点的权值为x结点的权值加上y结点的权值,i结点的双亲设置为空4. 根据哈夫曼树创建编码表(2)源代码void Huffman::Init(int a[],int n) //创建哈夫曼树{ //二叉树只有度为和度为的结点时,总结点数为(n-1)个HTree=new HNode[2*n-1]; //根据权重数组a[1—>n]初始化哈夫曼树int i,x,y;for(i=0;i<n;i++) //n个叶子结点{HTree[i].weight=a[i];HTree[i].Lchild=-1;HTree[i].Rchild=-1;HTree[i].parent=-1;}for(int i=n;i<2*n-1;i++) //开始建哈夫曼树,从底层向顶层搭建{SelectMin(HTree,i,x,y); //从--(i-1)中选出两个权值最小的结点HTree[x].parent=i;HTree[y].parent=i; //左右孩子权值相加为父结点的权值HTree[i].weight=HTree[x].weight+HTree[y].weight;HTree[i].Lchild=x;HTree[i].Rchild=y;HTree[i].parent=-1;}}(3)时间复杂度在选取两个权值最小的结点的函数中要遍历链表,时间复杂度为O(n),故该函数的时间复杂度为O(n^2)(二)统计字符出现频度的代码(1)算法自然语言①用cin.getline()函数获取一段字符串。
同时设置一个权值数组weight,以及暂时统计和存放权值的数组s。
②用strlen()函数获取未编码时的字符串长度。
③从字符串的起始位置进行权值统计,即获得str[i]每个字符的ASⅡ编码,并在s[(int)str[i]]数组中进行+1统计,为字符出现一次。
④i进行自加,统计下面字符出现的频度,在相应的数组元素中进行+1统计。
⑤继续循环,直到字符串结束。
(2)源代码(在main()函数中实现)int i,j=0,v;int s[200]={0};int weight[M]; //权值数组cout<<"请输入一段字符串,按回车键结束:"<<endl;cin.getline(str,1000,'\n'); //由用户输入一段字符串cout<<endl;Len1=strlen(str); //得到未编码时的字符串长度for(i=0;str[i]!='\0';i++) //统计每个字符的权值s[(int)str[i]]++; //(int)str[i]为每个字符的ASⅡ编码for(i=0;i<200;i++)if(s[i]!=0) //如果权值不为{c[j]=i; //ASⅡ编码为i的字符写入字符数组c weight[j]=s[i]; //权值s数组赋给权值weight数组j++;}n=j; //叶子结点个数for(v=0;v<n;v++) //循环输出字符权值cout<<c[v]<<"的权值为:"<<weight[v]<<endl;(3)时间复杂度:若输入的字符串长度为n,则时间复杂度为O(n)(三)选择两个最小权值的函数(1)算法自然语言①先暂时将前两个叶子结点作为权值最小的两个结点i1,i2②从第三个叶子结点开始,每一个结点的权值与i1,i2进行比较,如果此结点权值比i1权值要小,则将i1结点赋给i2,此结点赋给i1。
③如果此结点权值比i2要小,此结点赋给i2。
④每进行一次循环,总结点个数-1.(两个结点进行权值合并)⑤继续执行循环,直到循环到根结点,循环结束。
(2)源代码void Huffman::SelectMin(HNode*hTree,int n,int &i1,int &i2){int i,j; //找一个比较的起始值for(i=0;i<n;i++) //找i1{if(hTree[i].parent==-1){i1=i;break;}}i++;for(;i<n;i++) //找i2{ //先让前两个叶子结点分别为i1,i2if(hTree[i].parent==-1){i2=i;break;}}if(hTree[i1].weight>hTree[i2].weight) //i1指向最小的{j=i2;i2=i1;i1=j;}i++;for(;i<n;i++) //开始找最小的两个{if(hTree[i].parent==-1&&hTree[i].weight<hTree[i1].weight){ //如果之后的叶子结点权值小于前两个,那么进行交换i2=i1; //把i1赋给i2i1=i;}else if(hTree[i].parent==-1&&hTree[i].weight<hTree[i2].weight){i2=i; //始终保证i2权值大于i1}}}(3)时间复杂度若输入的字符串长度为n,则时间复杂度为O(n)(四)创建编码表(1)算法自然语言1.生成一个编码表2.从终端结点开始,如果此结点是其父结点的左孩子,则标“0”;如果是其父结点的右孩子,则标“1”。
3.将父结点赋给孩子结点,并将新的孩子结点的父结点作为当前父结点,重复2操作。
4.继续循环,直到根结点,即不满足循环条件时,将编码表的最后一位置0.5.将编码字符逆置。
将编码串的最后一位置换成新编码串的第一位,倒数第二位置换成新编码串的第二位,直到置换完毕。
6.将新的编码串重新赋给编码表。
7.输出字符的哈夫曼编码。
8.循环将字符编码后的长度赋给Len3数组。
(2)源代码void Huffman::CreateTable(char data[],int n){HCodeTable=new HCode[n]; //生成编码表for(int i=0;i<n;i++){HCodeTable[i].data=data[i];int child=i;int parent=HTree[i].parent;int k=0; //从终端结点开始编码,代表每个编码串的长度while(parent!=-1){if(child==HTree[parent].Lchild)HCodeTable[i].code[k]='0'; //左孩子标“0”elseHCodeTable[i].code[k]='1'; //右孩子标“1”k++;child=parent; //向上追溯parent=HTree[child].parent;}HCodeTable[i].code[k]='\0'; //当编码到根结点时循环结束,编码串最后一位置表结束{ //将编码字符逆置char code[M];int u;for(u=0;u<k;u++)code[u]=HCodeTable[i].code[k-u-1];//上述编码串的最后一位变成新的编码表中编码串的第一位for(u=0;u<k;u++)HCodeTable[i].code[u]=code[u]; //将新的编码串重新赋给编码表cout<<c[i]<<"的哈夫曼编码为:";cout<<HCodeTable[i].code<<endl;Len3[i]=k; //每个字符编码后的长度}}}(3)时间复杂度若输入的字符串长度为n,则时间复杂度为O(n)。