本章介绍伸展树。它和"二叉查找树"和"AVL树"一样,都是特殊的二叉树。在了解了"二叉查找树"和"AVL树"之后,学习伸展树是一件相当容易的事情。和以往一样,本文会先对伸展树的理论知识进行简单介绍,然后给出C语言的实现。后序再分别给出C++和Java版本的实现;这3种实现方式的原理都一样,选择其中之一进行了解即可。若文章有错误或不足的地方,希望您能不吝指出!
第1部分 伸展树的介绍
伸展树(Splay Tree)是一种二叉排序树,它能在O(log n)内完成插入、查找和删除操作。它由Daniel Sleator和Robert Tarjan创造。
(01) 伸展树属于二叉查找树,即它具有和二叉查找树一样的性质:假设x为树中的任意一个结点,x节点包含关键字key,节点x的key值记为key[x]。如果y是x的左子树中的一个结点,则key[y] <= key[x];如果y是x的右子树的一个结点,则key[y] >= key[x]。
(02) 除了拥有二叉查找树的性质之外,伸展树还具有的一个特点是:当某个节点被访问时,伸展树会通过旋转使该节点成为树根。这样做的好处是,下次要访问该节点时,能够迅速的访问到该节点。
假设想要对一个二叉查找树执行一系列的查找操作。为了使整个查找时间更小,被查频率高的那些条目就应当经常处于靠近树根的位置。于是想到设计一个简单方法,在每次查找之后对树进行重构,把被查找的条目搬移到离树根近一些的地方。伸展树应运而生,它是一种自调整形式的二叉查找树,它会沿着从某个节点到树根之间的路径,通过一系列的旋转把这个节点搬移到树根去。
相比于"二叉查找树"和"AVL树",学习伸展树时需要重点关注是"伸展树的旋转算法"。
第2部分 伸展树的C实现
1. 节点定义
typedef int Type;
typedef struct SplayTreeNode {
Type key; // 关键字(键值)
struct SplayTreeNode *left; // 左孩子
struct SplayTreeNode *right; // 右孩子
} Node, *SplayTree;
伸展树的节点包括的几个组成元素:
(01) key -- 是关键字,是用来对伸展树的节点进行排序的。
(02) left -- 是左孩子。
(03) right -- 是右孩子。
外部接口
// 前序遍历"伸展树"
void preorder_splaytree(SplayTree tree);
// 中序遍历"伸展树"
void inorder_splaytree(SplayTree tree);
// 后序遍历"伸展树"
void postorder_splaytree(SplayTree tree);
// (递归实现)查找"伸展树x"中键值为key的节点
Node* splaytree_search(SplayTree x, Type key);
// (非递归实现)查找"伸展树x"中键值为key的节点
Node* iterative_splaytree_search(SplayTree x, Type key);
// 查找最小结点:返回tree为根结点的伸展树的最小结点。
Node* splaytree_minimum(SplayTree tree);
// 查找最大结点:返回tree为根结点的伸展树的最大结点。
Node* splaytree_maximum(SplayTree tree);
// 旋转key对应的节点为根节点。
Node* splaytree_splay(SplayTree tree, Type key);
// 将结点插入到伸展树中,并返回根节点
Node* insert_splaytree(SplayTree tree, Type key);
// 删除结点(key为节点的值),并返回根节点
Node* delete_splaytree(SplayTree tree, Type key);
// 销毁伸展树
void destroy_splaytree(SplayTree tree);
// 打印伸展树
void print_splaytree(SplayTree tree, Type key, int direction);
2. 旋转
旋转的代码
/*
* 旋转key对应的节点为根节点,并返回根节点。
*
* 注意:
* (a):伸展树中存在"键值为key的节点"。
* 将"键值为key的节点"旋转为根节点。
* (b):伸展树中不存在"键值为key的节点",并且key < tree->key。
* b-1 "键值为key的节点"的前驱节点存在的话,将"键值为key的节点"的前驱节点旋转为根节点。
* b-2 "键值为key的节点"的前驱节点存在的话,则意味着,key比树中任何键值都小,那么此时,将最小节点旋转为根节点。
* (c):伸展树中不存在"键值为key的节点",并且key > tree->key。
* c-1 "键值为key的节点"的后继节点存在的话,将"键值为key的节点"的后继节点旋转为根节点。
* c-2 "键值为key的节点"的后继节点不存在的话,则意味着,key比树中任何键值都大,那么此时,将最大节点旋转为根节点。
*/
Node* splaytree_splay(SplayTree tree, Type key)
{
Node N, *l, *r, *c;
if (tree == NULL)
return tree;
N.left = N.right = NULL;
l = r = &N;
for (;;)
{
if (key < tree->key)
{
if (tree->left == NULL)
break;
if (key < tree->left->key)
{
c = tree->left; /* 01, rotate right */
tree->left = c->right;
c->right = tree;
tree = c;
if (tree->left == NULL)
break;
}
r->left = tree; /* 02, link right */
r = tree;
tree = tree->left;
}
else if (key > tree->key)
{
if (tree->right == NULL)
break;
if (key > tree->right->key)
{
c = tree->right; /* 03, rotate left */
tree->right = c->left;
c->left = tree;
tree = c;
if (tree->right == NULL)
break;
}
l->right = tree; /* 04, link left */
l = tree;
tree = tree->right;
}
else
{
break;
}
}
l->right = tree->left; /* 05, assemble */
r->left = tree->right;
tree->left = N.right;
tree->right = N.left;
return tree;
}
上面的代码的作用:将"键值为key的节点"旋转为根节点,并返回根节点。它的处理情况共包括:
(a):伸展树中存在"键值为key的节点"。
将"键值为key的节点"旋转为根节点。
(b):伸展树中不存在"键值为key的节点",并且key < tree->key。
b-1) "键值为key的节点"的前驱节点存在的话,将"键值为key的节点"的前驱节点旋转为根节点。
b-2) "键值为key的节点"的前驱节点存在的话,则意味着,key比树中任何键值都小,那么此时,将最小节点旋转为根节点。
(c):伸展树中不存在"键值为key的节点",并且key > tree->key。
c-1) "键值为key的节点"的后继节点存在的话,将"键值为key的节点"的后继节点旋转为根节点。
c-2) "键值为key的节点"的后继节点不存在的话,则意味着,key比树中任何键值都大,那么此时,将最大节点旋转为根节点。
下面列举个例子分别对a进行说明。
在下面的伸展树中查找10,共包括"右旋" --> "右链接" --> "组合"这3步。
第一步: 右旋
对应代码中的"rotate right"部分
第二步: 右链接
对应代码中的"link right"部分
第三步: 组合 对应代码中的"assemble"部分
提示:如果在上面的伸展树中查找"70",则正好与"示例1"对称,而对应的操作则分别是"rotate left", "link left"和"assemble"。
其它的情况,例如"查找15是b-1的情况,查找5是b-2的情况"等等,这些都比较简单,大家可以自己分析。
3. 插入
/*
* 将结点插入到伸展树中(不旋转)
*
* 参数说明:
* tree 伸展树的根结点
* z 插入的结点
* 返回值:
* 根节点
*/
static Node* splaytree_insert(SplayTree tree, Node *z)
{
Node *y = NULL;
Node *x = tree;
// 查找z的插入位置
while (x != NULL)
{
y = x;
if (z->key < x->key)
x = x->left;
else if (z->key > x->key)
x = x->right;
else
{
printf("不允许插入相同节点(%d)!\n", z->key);
// 释放申请的节点,并返回tree。
free(z);
return tree;
}
}
if (y==NULL)
tree = z;
else if (z->key < y->key)
y->left = z;
else
y->right = z;
return tree;
}
/*
* 创建并返回伸展树结点。
*
* 参数说明:
* key 是键值。
* parent 是父结点。
* left 是左孩子。
* right 是右孩子。
*/
static Node* create_splaytree_node(Type key, Node *left, Node* right)
{
Node* p;
if ((p = (Node *)malloc(sizeof(Node))) == NULL)
return NULL;
p->key = key;
p->left = left;
p->right = right;
return p;
}
/*
* 新建结点(key),然后将其插入到伸展树中,并将插入节点旋转为根节点
*
* 参数说明:
* tree 伸展树的根结点
* key 插入结点的键值
* 返回值:
* 根节点
*/
Node* insert_splaytree(SplayTree tree, Type key)
{
Node *z; // 新建结点
// 如果新建结点失败,则返回。
if ((z=create_splaytree_node(key, NULL, NULL)) == NULL)
return tree;
// 插入节点
tree = splaytree_insert(tree, z);
// 将节点(key)旋转为根节点
tree = splaytree_splay(tree, key);
}
外部接口: insert_splaytree(tree, key)是提供给外部的接口,它的作用是新建节点(节点的键值为key),并将节点插入到伸展树中;然后,将该节点旋转为根节点。
内部接口: splaytree_insert(tree, z)是内部接口,它的作用是将节点z插入到tree中。splaytree_insert(tree, z)在将z插入到tree中时,仅仅只将tree当作是一棵二叉查找树,而且不允许插入相同节点。
4. 删除
删除接口
/*
* 删除结点(key为节点的键值),并返回根节点。
*
* 参数说明:
* tree 伸展树的根结点
* z 删除的结点
* 返回值:
* 根节点(根节点是被删除节点的前驱节点)
*
*/
Node* delete_splaytree(SplayTree tree, Type key)
{
Node *x;
if (tree == NULL)
return NULL;
// 查找键值为key的节点,找不到的话直接返回。
if (splaytree_search(tree, key) == NULL)
return tree;
// 将key对应的节点旋转为根节点。
tree = splaytree_splay(tree, key);
if (tree->left != NULL)
{
// 将"tree的前驱节点"旋转为根节点
x = splaytree_splay(tree->left, key);
// 移除tree节点
x->right = tree->right;
}
else
x = tree->right;
free(tree);
return x;
}
delete_splaytree(tree, key)的作用是:删除伸展树中键值为key的节点。
它会先在伸展树中查找键值为key的节点。若没有找到的话,则直接返回。若找到的话,则将该节点旋转为根节点,然后再删除该节点。
注意:关于伸展树的"前序遍历"、"中序遍历"、"后序遍历"、"最大值"、"最小值"、"查找"、"打印"、"销毁"等接口与"二叉查找树"基本一样,这些操作在"二叉查找树"中已经介绍过了,这里就不再单独介绍了。当然,后文给出的伸展树的完整源码中,有给出这些API的实现代码。这些接口很简单,Please RTFSC(Read The Fucking Source Code)!
第3部分 伸展树的C实现(完整源码)
点击查看:源代码
伸展树的测试程序运行结果如下:
== 依次添加: 10 50 40 30 20 60
== 前序遍历: 60 30 20 10 50 40
== 中序遍历: 10 20 30 40 50 60
== 后序遍历: 10 20 40 50 30 60
== 最小值: 10
== 最大值: 60
== 树的详细信息:
60 is root
30 is 60's left child
20 is 30's left child
10 is 20's left child
50 is 30's right child
40 is 50's left child
== 旋转节点(30)为根节点
== 树的详细信息:
30 is root
20 is 30's left child
10 is 20's left child
60 is 30's right child
50 is 60's left child
40 is 50's left child
测试程序的主要流程是:新建伸展树,然后向伸展树中依次插入10,50,40,30,20,60。插入完毕这些数据之后,伸展树的节点是60;此时,再旋转节点,使得30成为根节点。 依次插入10,50,40,30,20,60示意图如下:
将30旋转为根节点的示意图如下: