第13章 红黑树(3)

2013年6月25日 没有评论

13.3 插入

我们可以在O(lg n)时间将一个结点插入到含有n结点的红黑树。为了插入结点,我们将TREE-INSERT方法(第12.3节)做稍稍的修改把树T当做普通的二叉查找树插入结点z,然后将z着成红色。(练习13.3-1让你解释一下为什么我们选择红色而不是黑色。)为了保持红黑树的性质,我们调用辅助方法RB-INSERT-FIXUP去着色和旋转。调用RB-INSERT(T,z)将结点z插入树T中,其中z结点已经包含填充了key。

TREE-INSERT和RB-INSERT方法有四个地方不一样。第一,所有TREE-INSERT使用NIL的地方都被替换成了T.nil。第二,在RB-INSERT的第14到15行,我们将z.left和z.right设置成了T.nil,是为了维护合适的树结构。第三,在第16行,我们将z着成红色。第四,由于将z着成红色将会导致红黑树的某个性质发生了违例,所有我们在第17行调用RB-INSERT-FIXUP(T,z)去恢复红黑树的性质。

为了理解RB-INSERT-FIXUP是如何工作的,我们将代码分成三个主要步骤去解释。首先,我们要判断在RB-INSERT中将z着成红色会出现哪些违反红黑树的性质的情况。其次,我们将考查第1到15行的while循环的目的。最后,我们将分析while循环体的的三种情况看它们是如何达到目的的。图13.4展示了RB-INSERT-FIXUP在红黑树上的执行过程的一个例子。
在调用RB-INSERT-FIXUP之前红黑树的哪些性质将不能保持?性质1将会继续保持,同理性质3,因为新插入的红色结点的两个孩子是T.nil。性质5,内容是从指定结点出发到叶子结点的每条简单路径上的黑色结点的数量是相同,这个性质也跟之前一样的,是因为结点z替换了(黑色)哨兵结点,并且z结点带有哨兵结点的红色结点。因此,只有性质2,要求根结点是黑色的,和性质4,红色结点不能有红色结点的孩子。这两个可能的不能保持的情况都是由z着成红色造成的。性质2是当z是根结点的时候不能保持,性质4是当z的双亲是红色的不能保持。图13.4(a)展示了z插入后违反性质4的一个例子。

图13.4 RB-INSERT-FIXUP操作。(a)插入后的结点z。因为z和它的双亲都是红色的,所以发一次性质4违例。因为z的叔叔是红色的,所以适应于情形1。我们重新将结点着色并且将指针z从树上向上提升,结果如(b)所示。跟上面的情形一样,z的它的双亲双都是红色的,但是z的叔叔是黑色的。因为z是z.p的右孩子,所以适用于情形2。我们做一次左旋,结果如图(c)所示。现在z是双亲的左孩子,那它适用于情形3。重新着色并右转直到成为图(d)中的树,它一棵合法的红黑树。
第1到15行的while循环在每次迭代的开始都维护了下面三个不变式:

  1. 结点z是红色的
  2. 如果z.p是根,那么z.p是黑色的。
  3. 如果红黑树的性质招到破坏,那么最多只有一个性质被破坏,性质2或者性质4被破坏。如果是性质2,那是因为z是根并且是红色。如果性质4被破坏那是因为z和z.p都是红色的。

c部分,处理这些违反红黑树性质的部分,在RB-INSERT-FIXUP恢复红黑树性质上比(a),(b)部分更为重要,我们用它来了解程序代码中的情况。因为我们注意力聚集在z结点及它在树中的周围结点上,从(a)部分我们知道z是红色的。我们可以利用(b)部分知道z.p.p是存在的,我们在第2,3,7,8,13中引用到它。(译者注,因为b部分说根是黑色的,而且z.p也是红色的,所以z.p.p肯定存在。)
我们证明在第一次迭代时循环不变式是真的,每次迭代都维护这个不变式,在循环结束时,这个不变式将给我们提供一个很好性质。
我们从初始化和终止开始讨论。然后我们详细考查循环体是如何工作的,我们将讨论每次迭代的循环维护这个不变式。随后,我们将表明每次循环迭代后都有两种可能的结果:z指针向上移动或者做一些旋转后循环终止。
初始化:在第一次迭代前,我们用一棵合法的红黑树开始,然后我们插入了红色结点z。我们各种情况下调用RB-INSERT-FIXUP时不变式都是成立的:
当调用RB-INSERT-FIXUP时,z是被添加的红色结点。
如果z.p是根,那么z.p开始时就是黑色调用RB-INSERT-FIXUP不用修改。
当我们调用RB-INSERT-FIXUP时,我们已经看到性质1,3,5保持不变。
如果树的性质2不能保持,那么说明添加了红色的根结点z,z是树中的唯一一个内部结点。因为双亲和两个孩子都是哨兵结点,它们都是黑色的,树就不会违反性质4。因些违反性质2的情况,是整棵树中唯一一处破坏红黑树性质的地方。
如果树的性质4不能保持,由于结点z的孩子是黑色的哨兵并且在添加z前整个棵树没有其它的违反红黑性质的地方,那么这种违反一定是z和z.p都是红色的。而且,没有 对红黑树的其它性质的违反。
终止:当循环结束时,它是因为z.p是黑色才结束的。(如果z是根结点,那z.p是哨
兵T.nil,它也是黑色的)因此,在循环结束时,树不会违反性质4。通过循环不变式,仅仅只有性质2可能不满足。第16行也恢复了这个性质。所以在RB-INSERT-FIXUP结束时,所有的红黑树性质都满足了。
维护:在while循环里我们实际上需要考虑到6种情形,但有三种情形与另外三种情形是对称的,取决于第二行的z的双亲z.p是z的祖亲z.p.p的左孩子还是右孩子。我们仅仅给出了z.p是左孩子的解决方案的代码。结点z.p.p是存在的,是由于b部分的循环不等式,如是z.p是根,那么z.p是黑色的。因为我们仅当z.p是红色才会进入循环迭代,我们知道z.p肯定不是根。意味着z.p.p是存在的。
我们根据z双亲的兄弟或称作“叔叔”的颜色来区分情形1与情形3。第3行让y指向z的叔叔z.p.p.right,第4行测试y的颜色。如是y是红色的,我们执行情形1。否则,执行跳到情形2和情形3。所有的三种情况,z的祖亲是黑色的,是因为z.p是红色的,只有z和z.p是违反性质4。

情形1:z的叔叔是红色的

图13.5展示了情形1(第5到8行),z.p和y都是红色的时候属于这种情形。因为z.p.p和y是黑色的,我们将z.p和y都着成黑色,用来修复z和z.p都是红色的问题,并且我们z.p.p着成红色来保持性质5。我们把z.p.p当成新的结点z来重得while循环。在树上z指针向上移动了两层。
现在,我们证明情形1在下一次迭代前维护了循环不等式。我们用z来表示当前迭代中的结点z,那z’ = z.p.p来表示第1行下次迭代被为结点z的结点。

  1. 因为本次迭代将z.p.p着成了红色,结点z’在下一次迭代开始时是红色的。
  2. 结点z’.p是本次迭代的z.p.p.p,它的颜色没有改变。如是这个结点是根,它在本次迭代前是黑色的,并且在下次迭代开始是也保持黑色。
  3. 我们已经讨论了情形1维护了性质5,它不会破坏性质1或者3。


图13.5 RB-INSERT-FIXUP情形1的处理过程。性质4被破坏了,由于z和它的双亲z.p都是红色的。不管z是右孩子还是左孩子,我们操作方法都是一样的。每一个子树α,β,γ,δ和ε都有一个黑色的根,并且它们有相同的black-height。情形1改变了一些结点的颜色,为了保持性质5:从一结点向下到叶子结点都有相同数量的黑结点。while循环所z.p.p当成新的z继续下去。所以违反性质4都只可能发现在新红色z和它的双亲之间,如它的双亲是红色的,处理方法跟上面的一样。

情形2:z的叔叔是黑色的并且z是右孩子
情形3:z的叔叔是黑色的并且z是左孩子

在情形2和情形3中,z的叔叔的颜色是黑色的。我们通过z是z.p的左孩子还是右孩子来区分这两种情形。第10到11行形成了情形2,在图13.6中与情形上放在一起。在情形2中,结点z是双亲的右孩子。我们立即使用一次左旋变成了情形3(第12到14行),这种情形z变成了左孩子。因为z和z.p都是红色的,旋转影响了结点的black-height和性质5。不管直接的情形3还是通过情形2转化而来的,z的叔叔都是黑色的,否则的话将会执行情形1了。另外,z.p.p是存在的,在执行第2和3行时,我们已经讨论了这个结点是存在的,并且在第10行将z向上提升了一层然后在第11行向下降了一层,z.p.p仍然没有变化。在情形3中,我们将一些结点的颜色改变了并且做了一次右旋,这些是为了保持性质5,然后在一条线上就不存在两个红色的结点,就这样完成了。因为现在z.p是黑色的了,while循环不再进行下一次的迭代了。

图13.6 RB-INSERT-FIXUP情形2和3的处理过程。跟情形1一样,不管是情形2还是情形3由于z和z的双亲都是红色的而破坏了性质4。它的任意一棵子树α,β,γ,δ都有一个黑色的根(α,β,γ是根据性质4,δ如果不是黑色将执行情形1),并且它有相同的black-height。我们通过一次左旋将情形2转化成情形3,保持了性质5:从一结点向下到叶子结点都有相同数量的黑结点。情形3一些点颜色被改变了并且做了一次右转,也是为了保持性质5。然后while循环结束了,因为性质4满足了:在一条线上不再有两个红色结点。
现在我们来证明情形2与情形3保持了循环不等式。(正如我们讨论过的,z.p将会在第1的下次测试z.p将会是黑色,并且循环体将不再执行。)

  1. 情形2使z指向z.p,z.p是红色的。z和它的颜色在情形2和3中不再变化。
  2. 情形3使z.p着成黑色,所以如果z.p是下次迭代开始的根,那么它就是黑色的。
  3. 跟情形1一样,性质1、3和5在情形2,3中也得以保持。由于在情形2和3中,结点z不是根,我们知道这不会破坏性质2,由于唯一结着成红色的结点在情形3变成一个黑色结点的子女。情形2和3修正了性质4的破坏,同时它们也不会引进新的破坏。

在讨论每次循环迭代维护不变式时,我们也证明了RB-INSERT-FIXUP正确地恢复了红黑树的性质。

分析

RB-INSERT的运行时间是多少呢?由于n结点的红黑树的高度是O(lg n),RB-INSERT第1到16行花费了O(lg n)时间。在RB-INSERT-FIXUP中,while循环只有遇到情形1的时候才会重复循环,然后z向树上移动两层。while循环执行的总次数因此是O(lg n)。因此RB-INSERT总共花了O(lg n)的时间。更有意思的是,它旋转次数决不会多于两次,因为如果执行了情形2或者情形3,while循环就结束了。

练习

13.3-1 在RB-INSERT的第16行,我们将新插入的结点z设置成了红色。观察如果我们选择将z的颜色设置成黑色,那么红黑树的性质4会不会破坏。为什么我不选择将z设置成红色?
13.3-2 成功将key为41,38,31,12,19,8都插入空的红黑树后,画出这棵红黑树。
13.3-3 假设在图13.5和图13.6中任意子树α,β,γ,δ和ε的back-height是k。标记每个结点的black-height去验证图示的转换能保持性质5。
13.3-4 Teach教授担心RB-INSERT-FIXUP可能会设置T.nil.color为红色,这样的话当z是根的时候循环将不会结点。通过证明RB-INSERT-FIXUP决不会将T.nil.color设置成红色来说明这位教授的担心是没有必要的。
13.3-4 假设红黑树是通过RB-INSERT插入n结点形成的。证明如果n>1,那么树中至少有一棵红结点。
13.3-6 考虑一下,如果红黑树表示没有存储双亲结点的指针,应该如何有效地实现RB-INSERT。
全文下载:第13章 红黑树

第13章 红黑树(2)

2013年6月17日 2 条评论

13.2 旋转

查找树操作TREE-INSERTTREE-DELETE,运行在nkey的红黑树上,花费时间O(lg n)。由于改动了树,所以结果树可能不符合13.1节列举的红黑树的性质。为了恢复这些性质,我们必须改变树中一些结点的颜色和修改一指针结构。
我们通过旋转来修改指针结构,它是一个局部操作使查找树保持二叉查找树的属性。图13.2展示了两种旋转:左旋和右旋。当我们对结点x进行左旋时,我们假设yx的右孩子并且不是T.nil; x可以是树中任意右孩子不空的结点。左旋的“轴”是沿着xy的。它使y成为子树的根,x成为y的左孩子,y左孩子成为x的右孩子。
LEFT-ROTATE伪代码假设x.rightT.nilroot的双亲为T.nil

      图13.2 二叉查找树的左旋操作。左旋操作LEFT-ROTATE(T,x)通过修改常数个指针来改变两个结点的结构把右边的结点的结构变成左边的结构。相反的右旋操作RIGHT-ROTATE(T,y)将左边的结构变成右边的结构。α、β和γ表示任意形态的子树。旋转操作要保持二叉树的性质:α子树上的所有keys要小x.key,x.key要小于β子树上的所有keysβ子树的keys要小于y.keyy.key要小于γ子树上的所有的keys

图13.3 展示了LEFT-ROTATE如何修改二叉查找树的实例。代码跟RIGHT-ROTATE是对称的。LEFT-ROTATERIGHT-ROTATE的运行时间者是O(1)。一次旋转只修改了指针;结点其它属性都保持不变。

13.3 方法LEFT-ROTATE(T,x)如何修改一棵二叉查找树的实例。中序遍历输入树和中序遍历修改过后的树产生相同的key序列。

练习

13.2-1 写出RIGHT-ROTATE方法。
13.2-2 证明在任意n结点的二叉查找树上,刚好有n-1种可能的旋转。
13.2-3 a,b,c分别是α、β和γ的任意结点,在图13.2的左侧。如图在结点x上做一次左旋转a,b,c的深度是如何变化的?
13.2-4 证明任意n结点的二叉查找树经过O(n)次旋转得其它任意形态的n结点二叉查找树。(提示:首先证明最多通过n-1次右旋可以将树的结构变成右链的形态。)
13.2-5 我们说如果通过一系列的调用RIGHT-ROTATE可以从二叉查找树T1转换成T2,那么二叉查找树T1右转(right-convert)T2 。举出一个例子T1T2,使得T1不能右转成T2。然后证明如果树T1右转成T2,那么它可以通过调用O(n^2)RIGHT-ROTATE得到。
全文下载:第13章 红黑树

第13章 红黑树(1)

2013年6月13日 没有评论

12章我们讨论了在高度为h的二叉查找树能够在O(h)时间完成任何动态集操作,比如查找(SEARCH,前躯(PREDECESSOR,后继(SUCCESSOR),最小值(MINIMUM),最大值(MAXIMUM,插入(INSERT)和删除(DELETE)操作。因此,如果树高矮的时候这些动态集的操作是很快的。如果树高很高的话,那么这些动态集的操作就没有链表快了。红黑树是众多“均衡”查找树中的一种,它可以保证基本的动态集操作在最坏的情况下运行时间为O(lg n)

13.1 红黑树的性质

红黑树是一棵二叉查找树,并且每个结点都附加一个额外的存储位:结点颜色,它的值可以是红色或者黑色。通过对根到叶子路径上结点图色的限制,红色黑树保证没有哪一条路径是其它路径的二倍长,所以这棵树大致上是平衡的。
现在每个结点都包含属性color,key,left,rightp。如果结点没有孩子或者双亲结点不存在(译者著:根结点没有双亲结点,普通的叶子结点没有孩子),那么该结点的这些属性(译者著:孩子或者双亲指针)值是NIL。我们把这些NIL当作二叉树中指向叶子(外部结点)的指针,正常包含key的结点为树的内部结点。
红黑树是一种二叉查找树,并且还满足下面的红黑性质:

  1. 每个结点不是红色就是黑色。
  2. 根结点是黑色的。
  3. 每个叶子结点(NIL)都是黑色的。
  4.  如果一个结点是红色的,那么它所有的孩子都是黑色的。
  5. 对于每一个结点,从当前结点到后代的叶子的路径上包含黑色结点的数量是相同的。

13.1(a)展示了一棵红黑树的例子。
    为了方便处理边界条件,在实现红黑树的代码里,我们使用了一个哨兵结点也替换NIL(查看第238页)。对于一棵红黑树T,哨兵T.nil是跟树中普通结点有同样属性的一个对象。它的颜色是黑色,它的其它属性-p,left,rightkey-可以是任意值。如图13.1(b)所示,所有NIL指针都替换成指向哨兵结点T.nil.
    我们使用哨兵结点是为了我们可以把x结点的NIL孩子看成是x的一个普通的孩子。尽管我们可以在树中我可以用不同的哨兵结点替换每一个NIL,第一个NIL的双亲都这样定义,但是这样将会很浪费空间。所以,我们使用一个哨兵结点T.nil代替所有NIL-所有以的叶子结点和根结点的双亲。哨兵结点的属性p,left,rightkey都是无关紧要的,为了方便我们在方法里还是设置了它们。
    我们基本上只对内部结点有兴趣,是因为它们含有key值。本章剩下的部分,当我们绘制红黑树的时候,我们会忽略叶子,如图13.1(c)所示。
    我们把从结点x,不包括到x,向下到叶子结点的结点的任意路径上黑色结点的个数称为结点的black-height,记作bh(x)。通过性质5black-height概念是明确的,结点所有下降的路径上都有数量相同的黑色结点。我们把红黑树rootblack-height定义成这棵红黑色树的black-height
    下面引理说明了为什么红黑树是一种好的搜索树。

引理13.1

具有n内部结点的红黑树的高度最高为2lg(n+1)

证明

首先,我们论证对于以任意结点x为根的子树包含至少2^bh(x) – 1个内部结点。我们通过照给x的高度来证明这个论点。如是x的高度是0,那x一定是叶子(T.nil),以x为根的子树的确包含至少2^bh(x) – 1=2^0-1=0个内部结点。接下来归纳,如果结点x的高度为正数并且是两个孩子的内部结点。每个孩子只的black-heightbh(x)或者bh(x-1),这取决于他们自身的颜色。由于x的孩子的高度肯定比x自身要低,我们用归纳假设得出每个孩子至少包含2^(bh(x)-1) – 1个内部结点。那么以x为根的子树包含至少2^(bh(x)-1) – 1 + 2^(bh(x)-1) – 1 +1 = 2^bh(x)-1个内部结点,这就证明了上面的提出的论点。
    为了完成引理的证明,假设树高为h。根据性质4,从根的出发到达叶子结点的任意路径,不包括根结点,至少有一半结点是黑色的。因此,根结点的black-height至少h/2;所以
    n ≥ 2^(h/2) – 1.
1移到左边再把两边取对数,lg(n+1) h/2,h2log(n+1)
    由这个引理可以得出,我们可以用红黑色树去实现运行时间为O(lg n)动态集操作查找(SEARCH,最小值(MINIMUM,最大值(MAXIMUM,后继(SUCCESSOR)和前驱(PREDECESSOR),因为在高度为h(第12章介绍的那样)的二叉查找树中每个操作的运行时间为Oh,n结点的任意红黑树是高为O(lg n)的二叉树。(当然,在第12章中使用NIL指针要替换成T.nil。)对于给定的红黑树用第12章的TREE-INSERTTREE-DELETE算法运行时间也是O(lg n),但是这两个算法不能直接支持动态集操作INSERTDELETE,因为它们不保证修改过的二叉树是否仍然是红黑树。然而,在13.313.4节,我们将看到如何在O(lg n)运行时间内实现这两种操作。

13.1 这是一棵红黑树,黑色表示黑结点,阴影表示红结点。红黑树中的每一个结点,不是红色的就是黑色的,红结点的孩子都是黑色的,从某结点到叶子结点的所有路径中的有相同数量的黑结点。(a)每一个叶子,用NIL来表示,是黑色的。每一个非NIL结点都标记它的black-heightNIL结点的black-heigth0.(b)同样的红黑树,但是用一个T.nil替换了所有的NILL,它总是黑色的,并且它的black-height被忽略。根结点的双亲是哨兵。(c)同样的红黑色树,但是叶子结点和根的双亲被完全忽略了。在本章的剩余部分,我们将用这种方式绘制红黑树。

练习

13.1-1 按照13.1(a)的方式,绘制高度为3的完全二叉查找树,key值为{1,2,…,15}添加NIL叶子结点并分别画出black-height234三种不同方式的红黑树。
13.1-2 画出向图13.1中的树调用TREE-INSERTkey36的结点后的红黑树。如果插入的结点着成红色它还是一棵红黑树吗?如果着成黑色呢?
13.1-3 让我定义一种relaxed red-black树,它一棵二叉查找树,并且满足红黑树的性质1345。换句说,根可能是红色或者黑色。假设有一棵relaxed red-blackT,它的根是红色的。如果我们将根着成黑色树T其它的都不变,那么着色后它是一棵红黑树吗?
13.1-4 假设在红黑色树我们让每个红色结点都被它的黑色双亲结点“吸纳”,那么红色结点的孩子都变成黑色双亲的孩子。(忽略key的变化)所有红色结点被吸纳后,黑色结点可能的度是多少?你能说出结果这个棵树的高度是多少吗?
13.1-5 证明在红黑树中从结点x开始到叶子最长路径的长度最多是从结点x开始到叶子的最短路径的两倍。
13.1-6 在高度为k的红黑树中内部结点数量最多是多少?最少是多少?
13.1-7 请描述下nkey构成的红黑树,它的红色内部结点与黑色内部结点比值最大,这个最大比值是多少?那比值最小的红黑树是什么样的,比值是多少?
全文下载:第13章 红黑树

第12章 二叉查找树(3)

2013年6月4日 没有评论

12.3 二叉树的插入和删除

插入和删除操作将会导致由二叉树表示的动态集合改变。要反应出这种变化,数据结构也会作出相应变化,但在修改的同时,二叉树的性质还要继续保持。正如我们看到的那样向树中插入一个新元素相对比较简单,但是处理删除操作就更加复杂了。
插入
向二叉查找树T插入一个新的元素v,我们使用TREE-INSERT方法。方法传入一个z,并且z.key=v,z.left=NIL,z.right=NIL.这个方法会将会修改T和z的一些属性,并将z插入到树的合适的位置。


图12.3 向二叉查找树中插入key为13的数据项。浅色阴影部分标明了一条从根到插入数据项的自上而下的简易路径。虚线表明了向树中添加项的链接。

图12.3展示了TREE-INSERT的工作原理。跟TREE-SEARCH和ITERATIVE-TREE-SEARCH一样,TREE-INSERT也是从根开始指针x向下遍历找到NIL替换成输入项z。这个方法维护跟踪指针y作为x的双亲。初始化完成后,第3-7行的while循环中使两个指针沿树直下而上,向左还是向右取决非于z.key与x.key的比较,直到x变成NIL。该NIL的位置就是我希望的项z插入的位置。我们还需要尾随的指针y,因为当我找到z插入的NIL位置,搜索程序往结点后一步找到需要修改的结点。第8-13行设置了相应的指针使z插入。
跟其他的二叉查找树的原始操作一样,TREE-INSERT在高为h的树中运行时间是O(h)。

删除
在二叉查找树T中删除结点z的所有方法中有三种情况,正如我们将看到的那样,有一种情况有一点复杂。

  • 如果z没有孩子,我们简单的删除它并修改它的双亲,用NIL作为孩子来代替z。
  • 如果z只有一个孩子,我们通过修改z双亲,用该孩子替换z,提升这个孩子代替z在树中的位置。
  • 如果z有两个孩子,我们先找到z的后继y,y一定在z的右子树,然后用y替换z的位置,然后z原来的右子树变成y的新右子树,z的左子树变成y的新左子树。这种情况有一点小复杂,因为正我们所看到的,y必须是z的右孩子。

删除二叉查找树T中的指定结点z的的方法需要两个参数指针T和z.它的过程跟之前描述的三种情况有点点不同,如图12.4考虑到了四种情况。

  • 如果z没有左孩子(图中的a部分),我们将右孩子替换z,右孩子也有可能是NIL。当z的右孩子为NIL,这种情况等同于z没有孩子那个情形处理。当z的右孩子为非NIL,这种情况的处理相当于z只有一个孩子,并且这个孩子是右孩子。
  • 如果z只有一个孩子,这个孩子是左孩子(图中的b部分),那我们就用z的左孩子替换z。
  • 除此之外,z即有左孩子又有右孩子。我们找到z的后继y,y分布在z的右子树上并且没有左孩子(查看练习12.2-5)。我们想把y拼接到当前输出的位置这样就替换了z的位置。
    • 如果y是z的右孩子(图示c部分),那我们就用y替换z, 只剩下了y的右孩子。
    • 除此之外,y在z的右子树里面,并不是z的右孩子(图示d部分).这种情况,我们首先我们用y来替换z的右孩子,然后再用y来替换z.

为了方便在二叉查找树中移动子树,我们定义了一个子方法TRANSPLANT,用v为根结点的子树替换以u为根结点的子树,u的双亲变成v的双亲,并且u的双亲连接v作为它合适的孩子(译者注:如果u是双亲的左孩子,那么v就是双亲左孩子,反之亦然)。

第1-2行处理u是根的情况。除此之外,u的双亲不是有左子树就是有右子树(译者注:u如果有双亲,那么u的双亲至少有一个孩子)。第3-4行如果u是一个左孩子更新u.p.left,第5行表示如果u是右孩子更新u.p.right.我们允许v为NIL,第6-7如果v为非NIL,更新v.p。TRANSPLANT没有尝试去更新v.left和v.right;要不更去更新,取决于TRANSPLANT的调用者。

图12.4 从二叉查找树中删除结点z。z结点可能是根结点,结点的q的左孩子或者结点q的右孩子。(a)z没有左孩子。我们拿它的右孩子r替换z,r可能是空或者非空。(b)结点z有左孩子l但没有右孩子。我们拿l替换z.(c)结点z有两个孩子;它的左孩子为l,它的右孩子为就是它的后继y,y的右孩子为结点x.我们用y来替换z,y的左孩子变成了l,剩下的x作为y的右孩子。(d)结点z有两个孩子(左孩子为l并且右孩子为r),并且它的后继y≠r,y在它的右子树里,右子树根结点为r。我们用y的右孩子x替换y,并且我设置y为r的双亲。然后我们设置y为q的孩子,设置y为l的双亲。

利用上面的方法TRANSPLANT,下面方法是从二叉查找树T删除结点z:

TREE-DELET方法处理了下面的四种情况。第1-2行得理结点z有左孩子,第3-4行处理z有左孩子但没有右孩子的情形。第5-12处理剩下z有两个孩子的两种情况。第5找到y,y是z的后继。因为z右子树非空,它的后继一定是右子树key最小的结点;因此调用方法TREE-MINIMUM(z.right)。从前面的介绍,我们可以知道y没有左孩子(译者注:因为y是z右子树中key最小的结点,故y没有左孩子)。我们想把y拼接到当前输出的位置并且替换树中的z。如果y是z的右孩子,第10-12行用y替换了作为z双亲的孩子替换了z,用z的左孩子替换了 y的左孩子。如是y不是z的左孩子(译者注:这里应该“如果y不是z的右孩子”)第7-9行用y的右孩子作为y双亲的孩子替换y然后把z的右孩子变成y的右孩子,然后第10-12行用y作为z的双亲的孩子替换z,用z的左孩子替换y的左孩子。

TREE-DELETE除了第5行调用了TREE-MINIMUM之行,其它每一行代码,包括调用TRANSPLANT都花费常数时间。因此TREE-DELETE在高为h的树运行时间为O(h).
总之,我们证明了下面的定理。
定理12.2
在高度为h的二叉查找树上,我们实现的动态集操作,INSERT,DELETE运行时间都是O(h)。
练习12.2
12.3-1  给出TREE-INSERT方法的递归版本。
12.3-2 假想我们反复向二叉树插入不同的元素来构建一棵二叉查找树。证明从中查找某一个结点所要检查结点的数量等于首次向树中插入该结点所要检查结点的数量加1.
12.3-3 我们可以通过构建二叉查找树(使用TREE-INSERT反复一个一个地插入数字)对给定有数字集合进行排序,然后中序打印遍历打印这些数字。对于这种排序算法它的最坏情况与最好情况的运行时间是多少?
12.3-4 对二叉查找树的删除先从二叉查找树中删除x再删除y和先从二叉树删除y再删除y的操作是可交换吗?证明是或者举出一个反例。
12.3-5 假设替换结点属性x.p成x.succ,x.p指向双亲结点,x.succ指向x的后继指点。使用这个属性给出二叉查找树T的SEARH,INSERT和DELETE操作的方法。在高为h二叉查找树中,这些方法运行时间是O(h)。(提示:你可以实现一个子方法返回双亲结点)。
12.3-6 在TREE-DELETE中删除结点z时,我们可以选择前驱结点y而不是后继结点。如果这样做TREE-DELETE要做哪些改变?有些人提出一个公平策略,前驱和后继具有相同的优先级,而获取更高的性能。如何修改TREE-DELETE实现这个公平策略。
全文下载:Chapter_12-Binary_Search_Trees

第12章 二叉查找树(2)

2013年5月28日 没有评论

12.2 二叉树的搜索

我们经常需要在二叉查找树查找某个key。除了查找(SEARCH)操作之外,二叉查找树也支持譬如最小值(MINIMUM),最大值(MAXIMUM),后继(SUCCESSOR)和前驱(PREDECESSOR)的查找。在本节,我们将会考查这些操作并且给出如何在高度为h的二叉查找树中,用O(h)时间内完成这些操作。

查找

我们使用下面的方法在二叉查找树中查找指定的key的结点。指定树的根结点root和键值k, TREE-SEARCH返回键值为k的指针,如果不存在k则返回NIL。

图12.2 搜索二叉查找树。要在树中查找key为13的结点,搜索路径为从树出发15->6->7->13。树中最小key值为2,它沿树根的left指针上可以找到。最大key值20,它沿树根的right指针上可以找到。结点key为15的后继是key为17的结点,因为key为17的结点是key为15结点的右子树上key最小的结点。Key为13的结点没有右子树,因此它的后继是它最低的祖先,该祖先的左孩子也是一个祖先。在本例中,key为15的结点是13的后继。

上面的方法从树根开始查找并沿树枝的路径向下搜索,如图12.2所示。每个遍历到地结点,它都会拿这结点的值跟目标对比,如两个值相等,搜索结束。如果k小于前结点的x->key,将会在x的左子树继续搜索,因为根据二叉查找树的性质表明了k不可能x的右子树中。同理,如果k大于前结点的x->key,将会在x的右子树继续搜索。递归遍历的结点形了一条由树根向下的路径。因此TREE-SEARCH运行时间是O(h),h为树的高度。

我们可以用while循环迭代“铺开”递归过程重写上面的算法。在大多数计算机中,这个算法的迭代版本会更高效一点。

最小值和最大值

在二叉查找树上,我们可以从根结点出发沿着结点的left指针直到某个结点的left为空,就可以找到二叉树中key最小的那个元素,如图12.2所示。下面的方法返回以指定结点x为根的二叉树中key最小的元素,假设x为非空。

二叉的性质保持TREE-MINIMUM方法是正确的。如果一个结点没有左子树,那么结点x的右子树上的所有结点的key都不小于x->key,那么根结点key肯定是它们当中的最小值。如果结点x有左子树,那么右子树上没有节点的key比x->key小并且左子树上的结点都不大于x->key,所以以x为根节点的子树上最小值一定在以左子树x->left为根的子树中。

同上,TREE-MAXIMUM方法的伪代码:

同TREESEARCH一样,上述的两个方法在高度为h的树中都要花费O(n),访问的结点形成了一条由根出的向上的一条简易的路径。

后继和前驱

给出一棵二叉查找树上指定的结点,有时候我们需要找到这个结点的中序遍历的顺序的后继。(译者注:二叉查找的中序遍历序列下是有序的)。如果所有结点的key都是不相同的结点x的后继是那些key大于x->key之中最小那个的结点。二叉树的结构特点,使我们不需要比较key就能找到指定结点的后继。下面的方法返回结点x的后继,如果x的key是二叉树中最大的则返回NIL。

我们在TREE-SUCCESSOR方法中的两种情况下退出返回。如果x结点的右子树非空,那么结点x的后继就是它右子树中最左那的结点,在第2行我们可看到调用了TREE-MINIMUM(x->right)。举个例子,在图12.2中key为15的结点后继是key为17的结点。

另一种情况,如练习12.2-6让你去实现的那样,如果x结点的右子树是空的并且x有祖先y,那y是x的祖先中最小的那个祖先,并且y的左孩子也是x的祖先。在图12.2中,key为13的结点的后继是key为15。为了找到y,我们简单的从x向上查找直到我们找到某个结点是双亲结点的左孩子为止;TREE-SUCCESSOR中第3到7行就为了处理这种情况。
TREE-SUCCESSOR在高为h的树上的运行时间是O(h),因为我们是沿着树向上或者向下的一条简单的路径。TREE-PREDECESSOR,跟TREE-SUCCESSOR同理,运行时间也是O(h)。
即使所有key不都是完全相同,我们也把TREE-PREDECESSOR(x)返回结点作为x的前驱,TREE-SUCCESSOR(x)返回的作为后继。

总之,我们通过上面的叙述证明这样一个定理:

定理12.2 在高度为h的二叉查找树上,我们实现的动态集操作,SEARCH,MINIMUM,MAXIMUM,SUCCESSOR和PREDECESSOR运行时间都是O(h)。

练习
12.2-1 假设我们有一棵二叉查找树,元素值是都是在1到1000之间,我们想查找数字363.下面哪个查找序列属于正确的访问序列。
a. 2, 252, 401, 398, 330, 344, 397, 363.
b. 924, 220, 911, 244, 898, 258, 362, 363.
c. 925, 202, 911, 240, 912, 245, 363.
d. 2, 399, 387, 219, 266, 382, 381, 278, 363.
e. 935, 278, 347, 621, 299, 392, 358, 363.
12.2-2 写出递归版本的TREE-MINIMUM和TREE-MAXIMUM
12.2-3 写出TREE-PREDECESSOR方法
12.2-4 Bunyan教授认为他发现了二叉查找树的一个重要的性质。假设在二叉查找树上查找key为k的结点,并且key为k的结点是一个叶子结点。那么有三个集合:A,搜索路径的左边结点集合;B,搜索路径上的结点;C是搜索路径右边的结点集合。Buyan教授认为对于三个集合的任意值a∈A,b∈B,c∈C一定满足a≤b≤c。对于上面的观点,请给出最小可能一个的反例。
12.2-5 证明:对于二叉查找树,如果一个结点有两个孩子,那么它的后继没有左孩子并且它的前驱没有右孩子。
12.2-6 二叉查找树T是没有重复key的集合。证明如果结点x的右子树为空并且x有后继y,那么y是x的最低祖先,并且y的左孩子也是x的祖先。(注意每个结点都是自己的祖先)。
12.2-7 有一种非常规的方法中序遍历n个结点的二叉查找树。通过TREE-MINIMUM找到最小元素然后通过n-1次调用TREE-SUCCESSOR。证明这种算法运行时间为O(n)。
12.2-8 证明不论从高度为h的二叉查找树的哪个结点开始,连续k次调用TREE-SUCCESSOR将花费O(k+h)时间。(译者注:前一次调用的结果作为后一次的调用参数)。
12.2-9 T是没有重复key的二叉查找树。如果x为它的一个叶子结点,y为x的双亲。证明y.key是T中大于x.key的集合中最小的或者y.key是T中小于x.key的集合中最大的。
全文下载:Chapter_12-Binary_Search_Trees

哲学家就餐问题(C语言)

2013年5月2日 没有评论

哲学家就餐问题
有五个哲学家共用一张圆桌,分别坐在周围的五张椅子上,在桌上有五个碗和五只筷子,他们的生活方式是思考和进餐。平时,哲学家进行思考,饥饿时就便试图去他们左右的筷子来就餐。只有在他拿到两个筷子时才能就餐。

服务生解法
所有哲学家想吃饭都必须告诉服务生,吃完饭同时也告诉服务生。由服务生根据筷子的使用情况决定是否准予吃饭。
下载:waiter.c 

编译: gcc waiter.c -lpthread -o waiter
运行:./waiter

分类: C/C++, Linux 标签:

在windwos下的编译Nginx(2)

2013年3月27日 没有评论

请您自行安装vc2010
参照下面的文章安装:http://www.codeman.net/?p=24
下载代码与vs2010工程:
nginx-1.3.15
打开vs2010文件夹中的nginx.sln即可编译和调试nginx
如果您想使用VC2005或者其它IDE编译,要把握下面的要点:
1.配置源码,生成ngx_modules.c,ngx_auto_headers.h,ngx_auto_config.h(使用./auto/configure 命令,如果提示没有pcre和zlib,没有关系使用./auto/configure --with-cc=cl --with-pcre=./ --with-zlib=./
2.确定要使用哪些源文件:参看objs/Makefile文件下的*.objs有哪些即可
3.配置包含目录
4.配置包含库
注:
下载的vs2010文件夹里自带了两个库pcre与zlib头文件均位于vs2010/include下,库文件位于vs2010/lib下
source:
svn://svn.nginx.org/nginx/trunk

version:
1.3.15 (subversion 5140)

configure command:
./auto/configure –with-cc=cl –with-pcre=./ –with-zlib=./

include 47 mudules:
ngx_core_module
ngx_errlog_module
ngx_conf_module
ngx_events_module
ngx_event_core_module
ngx_iocp_module
ngx_select_module
ngx_regex_module
ngx_http_module
ngx_http_core_module
ngx_http_log_module
ngx_http_upstream_module
ngx_http_static_module
ngx_http_autoindex_module
ngx_http_index_module
ngx_http_auth_basic_module
ngx_http_access_module
ngx_http_limit_conn_module
ngx_http_limit_req_module
ngx_http_geo_module
ngx_http_map_module
ngx_http_split_clients_module
ngx_http_referer_module
ngx_http_rewrite_module
ngx_http_proxy_module
ngx_http_fastcgi_module
ngx_http_uwsgi_module
ngx_http_scgi_module
ngx_http_memcached_module
ngx_http_empty_gif_module
ngx_http_browser_module
ngx_http_upstream_ip_hash_module
ngx_http_upstream_least_conn_module
ngx_http_upstream_keepalive_module
ngx_http_write_filter_module
ngx_http_header_filter_module
ngx_http_chunked_filter_module
ngx_http_range_header_filter_module
ngx_http_gzip_filter_module
ngx_http_postpone_filter_module
ngx_http_ssi_filter_module
ngx_http_charset_filter_module
ngx_http_userid_filter_module
ngx_http_headers_filter_module
ngx_http_copy_filter_module
ngx_http_range_body_filter_module
ngx_http_not_modified_filter_module

分类: 翻译 标签:

WPS for Linux

2013年3月10日 没有评论

强列推荐

wget http://wdl.cache.ijinshan.com/wps/download/Linux/unstable/wps-office-8.1.0.3724-0.1.b1p2.i686.rpm

rpm -i wps-office-8.1.0.3724-0.1.b1p2.i686.rpm

WPS for linux

分类: 翻译 标签:

strncpy与strncmp

2012年9月17日 没有评论

strncmp与strcmp
二者都字符串比较,前者有限定最多只能比较n个字符
如:

  1. strcmp(“hello”,“hel”);    //none zero
  2. strncmp(“hello”,“hel”,3); //zero

strncmp与memcmpy
二者都限定最多比较n个字符,但前者如果遇到’\ 0’结束比较
如:

  1. strncmp(“ababc”,“abcba”,6); //zero
  2. memcmp(“ababc”,“abcba”,6);  //none zero

strncpy与strcpy
二者均为字符串复制,但前者限定最多只能复制n个字符(不会自动追加’\ 0’)
如:

  1. char b[]=“abcdef”;
  2. strcpy(b,“hello”);     //b: hello\ 0
  3. strncpy(b,“hello”,5);  //b: hellof
  4. strcpy(s,d)等价于strncpy(s,d,strlen(s)+1);

strncpy与memcpy
二者均为固定内存复制,但前者如果遇到\ 0会停止复制
如:

  1. char b[7]=“hello”;
  2. char d[7] = {0};
  3. strncpy(d,b,7); //d: “he\ 0\ 0\ 0\ 0\ 0”
  4. memcpy(d,b,7);  //d: “he\ 0llo\ 0”
分类: C/C++, Linux 标签:

Nginx源码分析(一)

2012年3月12日 没有评论

1.错误定义

分析源码从最简单的地方入手,首先来看nginx的错误码定义,代码在ngx_errno.h,ngx_errno.h文件中。一共就两个函数。

  1. u_char *ngx_strerror(ngx_err_t err, u_char *errstr, size_t size);
  2. ngx_uint_t ngx_strerror_init(void);

系统启动时会初始化全局变量ngx_sys_errlist,这是一个全局ngx_str_t数组,数组大小为NGX_SYS_NERR,每个元素都一个结构体为:

  1. typedef struct {
  2.     size_t      len;//data成员的大小
  3.     u_char     *data;//一个字符串
  4. } ngx_str_t;

初始化:ngx_uint_t ngx_strerror_init
所以初始化的函数是填充每一个元素,该元素的数组下标即为错误码,元素len成员是指元素data字符串的大小,data是该错误码(数组下标)的文字描述,通过函数strerror(err)来取得错误码的信息串。
获取错误码对应的信息串:ngx_strerror
在ngx_sys_errlist找到err对应位置的错误信息,如果错误码不在数组下标范围则返回未知错误,同时检查传入的长度,太小于将会截断错误信息串。

分类: Linux, Nginx 标签: