一 什么是線段樹?
線段樹也叫區間樹;線段樹是一種二叉搜索樹,它將一個區間劃分成一些單元區間,每個單元區間對應線段樹中的一個葉結點;
二 為什么要使用線段樹?
在解釋這個問題先讓我們看一個經典的問題,區間染色;
假設有一面墻,長度為n,每次選擇一段墻來進行染色,如下圖所示:
首先定義一端長度為n的墻;區間染色1然后將4-9這個區間染成黃色;區間染色2在將7-15染成綠色;區間染色3再將1-5染成藍色;區間染色4再將6-12染成紅色;區間染色5
最后問題來了:
1 問m次操作后我們可以看見多少種顏色?
2 m次操作后,我們可以在[i, j]區間看見多少種顏色?
不管怎樣,對于這個問題來說,我們關注的是一個一個的區間,其實對于這個問題只需要兩種操作就可以搞定,一個是染色操作(也就是所謂的區間更新),一個是查詢操作(區間查詢);但是由于我們這個是使用的數組來定義的一面墻,所以查詢和更新的操作的時間復雜度都為O(n)級別的,如果我們直接使用數組進行操作系統的系統開銷就太大了;因為對于這個問題我們關注點的是一個一個的區間,所以線段樹在這里就有了用武之地了;
接下來我們在看一個計算機領域經典的區間查詢問題區間查詢1查詢一個區間[i, j]的最大值 最小值或者該區間的數字之和;
之前我們的數據結構都是對單個的數據進行操作,顯然是不適用于這這樣的場景的;這里如果我們將這個問題換成對區間內的數據進行操作會是怎么樣的?其實這個問題的本質就是基于區間的統計查詢。
放在現在的互聯網環境下也有很多這樣的問題需要使用到區間查詢的操作來完成?
其實這樣的問題我們需要注意的是:我們關注的仍然是動態的情況,在這種情況下我們使用線段樹會是一個很好的選擇;因為動態統計的時候會伴有兩個操作一個更新一個查詢,如果使用數組來進行操作會極大的增加性能開銷;接下來我們來對比一下線段樹和數組在對這類問題方面的性能開銷
比如:一個電商網站去年一年注冊的用戶中消費最高的用戶是誰?消費最少的用戶是誰?
性能對比
三 線段樹概念詳解
以上的實例我們都可以將數組直接轉換成線段樹,這個一個數組,通過以上的實例我們不難發現在線段樹中是沒有添加和刪除操作的,所以轉換以后的線段樹是這樣的轉換過程1前邊也說過線段樹是二分搜索樹的一種,不同的地方在與線段樹每個節點存儲的是一個區間,我們以求區間數字之和的問題來進行解析,上圖中每一個節點存儲一個區間的數據,例如根節點存儲的就是整個數組的數據,左右兩個子節點存儲的就是[0 - 3][4 - 7]這個區間的數據,以此類推;如果我們要操作這些區間數據我們只需要找到這些節點即可,以數組中[4 - 7]這個區間為例:線段樹圖示對于線段樹來說有時候我們需要查詢的區間需要進行一次合成的操作,比如說在這個實例中我們要查詢區間[2 - 5]的數據,就會變成下邊的情況:線段樹求和圖示線段樹求和圖示我們需要先找到A[2 - 3]和A[4 - 5]這兩個節點,然后對這兩個節點在進行合并的操作;
所以在大數量的情況下,如果我們要操作區間數據的話,使用線段樹可以很高效的解決我們的問題,而不會像使用數組那樣需要先遍歷一邊所有的元素,這就是線段樹的優勢所在。
四 線段樹的基礎表示
1 在之前的例子中我們看到了線段樹是一個二分搜索樹,但是線段樹不一定是一顆滿的二叉樹,比如說如下圖所示:這是一位,我們的數組是10個元素的數組,根節點保存著10個元素的數據,根節點下邊的左右子節點分別保存5個元素,但是左右子節點在往下分的話因為5不能被整除的元素就導致其下邊的節點必然會出現元素個數不一致的情況,就像這樣的情況:當數組為10個元素的時候線段樹的圖示1從圖示中可以看出,這個線段樹的葉子節點不一定是在最下邊一層的,這也表示線段樹不一定是滿的二叉樹同時也不一定是完全二叉樹,但是線段樹確實一顆平衡二叉樹;當數組為10個元素的時候線段樹的圖示2
平衡二叉樹:從根節點開始到葉子節點的深度的差值(最大深度和最小深度)不超過1,從這里我們也可以得出我們的堆也是一顆平衡二叉樹,因為完全二叉樹本身就是一種平衡二叉樹;
- 平衡二叉樹的好處就是不會像二分搜索樹那樣退化成一個鏈表,在平衡二叉樹上進行搜索是非常高效的;
- 我們可以使用數組來表示平衡二叉樹,因為我們可以將數組A看成是一個完全二叉樹,雖然它最底層的葉子節點有一些是沒有的,我們可以將這些節點看成null,這樣這個平衡二叉樹就會變成完全二叉樹,而完全二叉樹我們完全可以使用數組來表示;
- 那么問題就來了,如果這個區間有n個元素,我們使用數組表示需要多少個節點?
如圖所示,如果區間中有n個元素的話,我們的空間需要2n,因為上邊的空間是下邊空間之和,但是這有一個最壞的情況,就是我們的數組是奇數的,比如說大小為5這樣的情況,那么此時的線段樹存儲空間就應該是下邊這樣的線段樹存儲空間圖示1因為區間元素個數為n的話,我們需要2n的空間來進行存儲,如果多出一個元素的話我們就需要4n的空間來進行存儲,最后我們的線段樹模型就應該像下邊圖示的那樣線段樹存儲空間圖示2我們將空的節點全部復制為null,這樣就可以讓它滿足完全二叉樹的定義;線段樹存儲空間圖示3
注意:在這里我們是浪費了一些存儲空間的,由于我們定義的線段樹是沒有插入操作的也就是說是靜態的,那么我們為了性能是完全可以犧牲掉這些空間的;
代碼實現線段樹基礎:
package com.mufeng.segmentTree;
/**
* Created by wb-yxk397023 on 2018/7/8.
*/
public class SegmentTree<E> {
// 線段樹使用的數組
private E[] tree;
private E[] data;
public SegmentTree(E[] arr){
data = (E[]) new Object[arr.length];
for (int i = 0; i < arr.length; i++){
data[i] = arr[i];
}
tree = (E[]) new Object[4 * arr.length];
}
/**
* 獲取數組長度
* @return
*/
public int getSize(){
return data.length;
}
/**
* 獲取當前索引上的元素
* @param index
* @return
*/
public E get(int index){
if (index < 0 || index >= data.length){
throw new IllegalArgumentException("Index is illega.");
}
return data[index];
}
/**
* 返回完全二叉樹的數組表示中,一個索引上元素的左節點索引;
* @param index
* @return
*/
private int leftChild(int index){
return 2 * index + 1;
}
/**
* 返回完全二叉樹的數組表示中,一個索引上元素的右節點索引;
* @param index
* @return
*/
private int rightChild(int index){
return 2 * index + 2;
}
}
五 創建線段樹
- 首先以求和為例我們先來看一下線段樹的模型
線段樹求和模型1在這個圖示中,我們的數組長度為10,所以線段樹的根節點存儲的就是10個元素的和,下邊的左右子節點以及各個節點存儲的都是相應區間元素的和,如果要創建這樣的一個線段樹我們就需要使用遞歸的方法進行創建;
代碼實現創建過程
private Merger<E> merger;
public SegmentTree(E[] arr, Merger<E> merger){
this.merger = merger;
data = (E[]) new Object[arr.length];
for (int i = 0; i < arr.length; i++){
data[i] = arr[i];
}
tree = (E[]) new Object[4 * arr.length];
buildSegmentTree(0, 0, data.length - 1);
}
/**
* 在treeIndex的位置創建表示區間[l....r]的線段樹
* @param treeIndex
* @param l
* @param r
*/
private void buildSegmentTree(int treeIndex, int l, int r){
if (l == r){
tree[treeIndex] = data[l];
return;
}
int leftTreeIndex = leftChild(treeIndex);
int rightTreeIndex = rightChild(treeIndex);
int mid = l + (r - l) / 2;
buildSegmentTree(leftTreeIndex, l, mid);
buildSegmentTree(rightTreeIndex, mid + 1, r);
tree[treeIndex] = merger.merge(tree[leftTreeIndex], tree[rightTreeIndex]);
}
Merger接口的實現
package com.mufeng.segmentTree;
/**
* Created by wb-yxk397023 on 2018/7/8.
*/
public interface Merger<E> {
E merge(E a, E b);
}
重寫toString
/**
* 重寫toString方法
* @return
*/
@Override
public String toString(){
StringBuilder res = new StringBuilder();
res.append('[');
for (int i = 0; i < tree.length; i++){
if (tree[i] != null){
res.append(tree[I]);
}else {
res.append("null");
}
if (i != tree.length - 1){
res.append(", ");
}
}
res.append(']');
return res.toString();
}
測試
package com.mufeng;
import com.mufeng.segmentTree.SegmentTree;
public class Main {
public static void main(String[] args) {
Integer[] nums = {-2, 0, 3, -5, 2, -1};
SegmentTree<Integer> segTree = new SegmentTree<>(nums, (a, b) -> a + b);
System.out.println(segTree);
}
}
六 線段樹中的區間查詢
基于遞歸我們可以很輕松的實現線段樹的區間查詢操作,比如說基于這個線段樹我們要查詢區間為2-5的統計信息;線段樹的區間查詢1我們可以先從根節點進行查詢;線段樹的區間查詢2根據圖示我們可以得出要查詢[2,5]這個區間的數據就需要查詢根節點下左右兩個節點的元素,左節點查詢[2,3],右節點查詢[4,5];線段樹的區間查詢3線段樹的區間查詢4由于左右[2,3]和[4,5]這兩個節點都有父節點,在這里我們就可以使用遞歸進行查詢;
代碼實現線段樹區間的查詢操作:
/**
* 返回區間[queryL,queryR]的值
* @param queryL
* @param queryR
* @return
*/
public E query(int queryL, int queryR){
if(queryL < 0 || queryL >= data.length ||
queryR < 0 || queryR >= data.length || queryL > queryR)
throw new IllegalArgumentException("Index is illegal.");
return query(0, 0, data.length - 1, queryL, queryR);
}
/**
* 線段樹區間查詢的核心方法
* 在以treeID為根的線段樹中[l...r]的范圍里,查找[queryL...queryR]的值
* @param treeIndex
* @param l
* @param r
* @param queryL
* @param queryR
* @return
*/
private E query(int treeIndex, int l, int r, int queryL, int queryR){
if (l == queryL && r == queryR){
return tree[treeIndex];
}
int mid = l + (r - l) / 2;
int leftTreeIndex = leftChild(treeIndex);
int rightTreeIndex = rightChild(treeIndex);
if (queryL >= mid + 1){
return query(rightTreeIndex, mid + 1, r, queryL, queryR);
}else if (queryR <= mid){
return query(leftTreeIndex, l, mid, queryL, queryR);
}
E legtResult = query(leftTreeIndex, l, mid, queryL, mid);
E rightResult = query(rightTreeIndex, mid + 1, r, mid + 1, queryR);
return merger.merge(legtResult, rightResult);
}
測試:
public static void main(String[] args) {
Integer[] nums = {-2, 0, 3, -5, 2, -1};
SegmentTree<Integer> segTree = new SegmentTree<>(nums,
(a, b) -> a + b);
System.out.println(segTree);
System.out.println(segTree.query(0, 2));
System.out.println(segTree.query(2, 5));
System.out.println(segTree.query(0, 5));
}
七 線段樹中的更新的操作
1?? 代碼實現更新操作
/**
* 將index位置上的值更新為e
* @param index
* @param e
*/
public void set(int index, E e){
if (index < 0 || index >= data.length){
throw new IllegalArgumentException("Index is illega.");
}
data[index] = e;
set(0, 0, data.length - 1, index, e);
}
/**
* 在以treeIndex為根的線段樹中,更新index的值為e
* @param treeIndex
* @param l
* @param r
* @param index
* @param e
*/
private void set(int treeIndex, int l, int r, int index, E e){
if (l == r){
data[treeIndex] = e;
return;
}
int mid = l + (r - l) / 2;
int leftTreeIndex = leftChild(treeIndex);
int rightTreeIndex = rightChild(treeIndex);
if (index >= mid + 1){
set(rightTreeIndex, mid + 1, r, index, e);
}else {
set(leftTreeIndex, l, mid, index, e);
}
tree[treeIndex] = merger.merge(tree[leftTreeIndex], tree[rightTreeIndex]);
}