数据结构之AVL树
左边为调整前得节点,我们可以看出k1的左右子树已不再满足AVL平衡 条件,调整后的为右图。 我们可以看出,解决办法是将z上移一层,并将x下移一层,由于在原树 中k2 > k1,所以k1成为k2的左子树,而y是大于k1的,所以成为k1的右 子树。 为了设计算法,我们这里来看一个更易理解的:插入的是节点“6”
1.3
插入操作
插入的核心思路是通过递归找到合适的位置,插入新结点,然后看新结
点是否平衡(平衡因子是否为2),如果不平衡的话,就分成三种大情 况以及两种小情况: 1. 在结点的左儿子(X < T->item) 在左儿子的左子树 (X < T->l-> item),“外边”,要 做单旋转。 在左儿子的右子树 (X > T->l-> item),“内部”,要 做双旋转。 2. 在结点的右儿子(X > T->item) 在右儿子的左子树(X < T->r-> item),“内部”,要 做双旋转。 在右儿子的右子树(X > T->r-> item),“外边”,要 做单旋转。 3. (X == T->item) ,对该节点的计数进行更新。 当进行了旋转之后,必定会有结点的“父结点”是需要更新的,例如: 2 / \ 1 4 / \ 3 5 \ 6 上图是调整前的,下图是调整后的: 4 / \ 2 5 / \ \ 1 3 6 可以看出,根结点2不平衡,是由于它的右儿子的右子树插入了新的结 点6造成的。因此,这属于“外边”的情况,要进行一次单旋转。于是 我们就把结点4调整上来作为根结点,再把结点2作为4的左儿子,最后 把结点2的右儿子修改为原来的结点4的左儿子。 实现代码: AVLTree Insert(Item X, AVLTree T ) { if( T == NULL ) { /* Create and return a one-node tree */
1.3.2
双旋转
情况2:对该结点的左儿子的右子树进行了一次插入。 这种情况是单旋转调整不回来的,如下图:
图(1) 左--右双旋转如下:
图(2) 这里我们将图(1)的Y子树看成如图(2),以k2为子树根节点的树, 我们将其子树分成比D低,这里我我先对k3的左子树进行一次情形四的
右旋转,然后在进行一次情形1的左旋转,详细步骤如下:(红色框里面 的即是要进行单旋转的) 实现代码: //情形2 AVLTree DoubleRotateWithLeft( PAVLNode k3 ) { /* Rotate between K1 and K2 */ k3->l = SingleRotateWithRight( k3->l ); /* Rotate between K3 and K2 */ return SingleRotateWithLeft(k3); } 情况3:对该结点的右儿子的左子树进行了一次插入。 右—左双旋转如下:
T = (PAVLNode)malloc( sizeof(AVLNode ) ); if( T == NULL ) perror("malloc failed"); else { T->item = X; T->h = 0; T->l = T->r = NULL; T->count = 1; } } else if(compare(&X,&T->item) == -1)//插入情况1 { T->l = Insert( X, T->l ); if( Height( T->l ) - Height( T->r ) == 2 ) if(compare(&X, &T->l->item ) == -1)//左边左子树 单旋转 T = SingleRotateWithLeft( T ); else T = DoubleRotateWithLeft( T );//左边右子树 } else if( compare(&X,&T->item) == 1 ) //插入情况2 { T->r = Insert( X, T->r ); if( Height( T->r ) - Height( T->l ) == 2 ) if(compare(&X , &T->r->item) == 1)//右边右子树 单旋转 T = SingleRotateWithRight( T ); else T = DoubleRotateWithRight( T );//右边左子树 } else//插入情况3 T->count++; /* Else X is in the tree already; we'll do nothing */ T->h = MAX( Height( T->l ), Height( T->r ) ) + 1; return T; }
k1->r = k2; k2->h = MAX( Height( k2->l ), Height( k2->r ) ) + 1; k1->h = MAX( Height( k1->l ), k2->h ) + 1; return k1; /* New root */ } 情况4:对该结点的右儿子的右子树进行了一次插入。
1.2
为什么要用AVL树?
有人也许要问:为什么要有AVL树呢?它有什么作用呢? 我们先来看看二叉搜索树吧(因为AVL树本质上是一棵二叉搜索树), 假设有这么一种极端的情况:二叉搜索树的结点为1、2、3、4、5,也 就是: 1 \ 2 \ 3 \ 4 \ 5
聪明的你是不是发现什么了呢?呵呵,显而易见——这棵二叉搜索树其 实等同于一个链表了,也就是说,它在查找上的优势已经全无了——在 这种情况下,查找一个结点的时间复杂度是O(N)! 好,那么假如是AVL树(别忘了AVL树还是二叉搜索树),则会是: 2 / \ 1 4 / \ 3 5 可以看出,AVL树的查找平均时间复杂度要比二叉搜索树低——它是 O(logN)。也就是说,在大量的随机数据中AVL树的表现要好得多。
我们先对k1的右子树进行一次左旋转(情形1,然后再对k1进行一次右 旋转(情形4)。 实现代码: //情形3 AVLTree DoubleRotateWithRight( PAVLNode k1 ) { /* Rotate between K3 and K2 */ k1->r = SingleRotateWithLeft( k1->r ); /* Rotate between K1 and K2 */ return SingleRotateWithRight( k1 ); }
算法设计:由于是情形1对该结点的右儿子的右子树进行了一次插入, 该节点为“4”,我们同第一种情形类似。 实现代码: //情形4 AVLTree SingleRotateWithRight(PAVLNode k1) {
PAVLNode k2; k2 = k1->r; k1->r = k2->l; k2->l = k1; k1->h = MAX( Height( k1->l ), Height( k1->r ) ) + 1; k2->h = MAX( Height( k2->r ), k1->h ) + 1; return k2; /* New root */ }
算法设计:由于是情形1对该结点的左儿子的左子树进行了一次插入, 该节点是“8”,首先我们不考虑其父节点的情况,因为我们创建节点是 递归创建的,可以不用考虑其父节点与其的连接,这在后面递归创建的 时候会说到,由于“8”的右孩子将不会发生变化,但是其左孩子设 为“7”的右孩子,将7的右孩子设为“8”及其子树,然后返回“7”节点的指 针。 实现代码: //情形1 AVLTree SingleRotateWithLeft(PAVLNode k2) { PAVLNode k1; k1 = k2->l; k2->l = k1->r;
1.3
旋转
假设有一个结点的平衡因子为2(在AVL树中,最大就是2,因为结点是 一个一个地插入到树中的,一旦出现不平衡的状态就会立即进行调整, 因此平衡因子最大不可能超过2),那么就需要进行调整。由于任意一 个结点最多只有两个儿子,所以当高度不平衡时,只可能是以下四种情 况造成的: 1. 对该结点的左儿子的左子树进行了一次插入。 2. 对该结点的左儿子的右子树进行了一次插入。 3. 对该结点的右儿子的左子树进行了一次插入。 4. 对该结点的右儿子的右子树进行了一次插入。 情况1和4是关于该点的镜像对称,同样,情况2和3也是一对镜像对称。 因此,理论上只有两种情况,当然了,从编程的角度来看还是四种情 况。 第一种情况是插入发生在“外边”的情况(即左-左的情况或右-右的情 况),该情况可以通过对树的一次单旋转来完成调整。第二种情况是插 入发生在“内部”的情况(即左-右的情况或右-左的情况),该情况要 通过稍微复杂些的念
AVL树的复杂程度真是比二叉搜索树高了整整一个数量级——它的原理 并不难弄懂,但要把它用代码实现出来还真的有点费脑筋。下面我们来 看看:
1.1
AVL树是什么?
AVL树本质上还是一棵二叉搜索树(因此读者可以看到我后面的代码是 继承自二叉搜索树的),它的特点是: 1. 本身首先是一棵二叉搜索树。 2. 带有平衡条件:每个结点的左右子树的高度之差的绝对值 (平衡因子)最多为1。 例如: 5 5 / \ / \ 2 6 2 6 / \ \ / \ 1 4 7 1 4 / / 3 3 上图中,左边的是AVL树,而右边的不是。因为左边的树的每个结点的 左右子树的高度之差的绝对值都最多为1,而右边的树由于结点6没有子 树,导致根结点5的平衡因子为2。
1.3.1
单旋转