數據結構-線段樹

一 什么是線段樹?

線段樹也叫區間樹;線段樹是一種二叉搜索樹,它將一個區間劃分成一些單元區間,每個單元區間對應線段樹中的一個葉結點;

二 為什么要使用線段樹?

在解釋這個問題先讓我們看一個經典的問題,區間染色;

假設有一面墻,長度為n,每次選擇一段墻來進行染色,如下圖所示:
區間染色1
首先定義一端長度為n的墻;
區間染色2

然后將4-9這個區間染成黃色;
區間染色3
在將7-15染成綠色;
區間染色4
再將1-5染成藍色;
區間染色5
再將6-12染成紅色;
最后問題來了:

1 問m次操作后我們可以看見多少種顏色?
2 m次操作后,我們可以在[i, j]區間看見多少種顏色?
不管怎樣,對于這個問題來說,我們關注的是一個一個的區間,其實對于這個問題只需要兩種操作就可以搞定,一個是染色操作(也就是所謂的區間更新),一個是查詢操作(區間查詢);但是由于我們這個是使用的數組來定義的一面墻,所以查詢和更新的操作的時間復雜度都為O(n)級別的,如果我們直接使用數組進行操作系統的系統開銷就太大了;因為對于這個問題我們關注點的是一個一個的區間,所以線段樹在這里就有了用武之地了;

接下來我們在看一個計算機領域經典的區間查詢問題
區間查詢1

查詢一個區間[i, j]的最大值 最小值或者該區間的數字之和;
之前我們的數據結構都是對單個的數據進行操作,顯然是不適用于這這樣的場景的;這里如果我們將這個問題換成對區間內的數據進行操作會是怎么樣的?其實這個問題的本質就是基于區間的統計查詢。

放在現在的互聯網環境下也有很多這樣的問題需要使用到區間查詢的操作來完成?
比如:一個電商網站去年一年注冊的用戶中消費最高的用戶是誰?消費最少的用戶是誰?

其實這樣的問題我們需要注意的是:我們關注的仍然是動態的情況,在這種情況下我們使用線段樹會是一個很好的選擇;因為動態統計的時候會伴有兩個操作一個更新一個查詢,如果使用數組來進行操作會極大的增加性能開銷;接下來我們來對比一下線段樹和數組在對這類問題方面的性能開銷
性能對比

三 線段樹概念詳解

以上的實例我們都可以將數組直接轉換成線段樹,
轉換過程1

這個一個數組,通過以上的實例我們不難發現在線段樹中是沒有添加和刪除操作的,所以轉換以后的線段樹是這樣的
線段樹圖示
前邊也說過線段樹是二分搜索樹的一種,不同的地方在與線段樹每個節點存儲的是一個區間,我們以求區間數字之和的問題來進行解析,上圖中每一個節點存儲一個區間的數據,例如根節點存儲的就是整個數組的數據,左右兩個子節點存儲的就是[0 - 3][4 - 7]這個區間的數據,以此類推;如果我們要操作這些區間數據我們只需要找到這些節點即可,以數組中[4 - 7]這個區間為例:
線段樹求和圖示
對于線段樹來說有時候我們需要查詢的區間需要進行一次合成的操作,比如說在這個實例中我們要查詢區間[2 - 5]的數據,就會變成下邊的情況:
線段樹求和圖示

我們需要先找到A[2 - 3]和A[4 - 5]這兩個節點,然后對這兩個節點在進行合并的操作;
所以在大數量的情況下,如果我們要操作區間數據的話,使用線段樹可以很高效的解決我們的問題,而不會像使用數組那樣需要先遍歷一邊所有的元素,這就是線段樹的優勢所在。

四 線段樹的基礎表示

1 在之前的例子中我們看到了線段樹是一個二分搜索樹,但是線段樹不一定是一顆滿的二叉樹,比如說如下圖所示:
當數組為10個元素的時候線段樹的圖示1

這是一位,我們的數組是10個元素的數組,根節點保存著10個元素的數據,根節點下邊的左右子節點分別保存5個元素,但是左右子節點在往下分的話因為5不能被整除的元素就導致其下邊的節點必然會出現元素個數不一致的情況,就像這樣的情況:
當數組為10個元素的時候線段樹的圖示2
從圖示中可以看出,這個線段樹的葉子節點不一定是在最下邊一層的,這也表示線段樹不一定是滿的二叉樹同時也不一定是完全二叉樹,但是線段樹確實一顆平衡二叉樹;
平衡二叉樹:從根節點開始到葉子節點的深度的差值(最大深度和最小深度)不超過1,從這里我們也可以得出我們的堆也是一顆平衡二叉樹,因為完全二叉樹本身就是一種平衡二叉樹;
  1. 平衡二叉樹的好處就是不會像二分搜索樹那樣退化成一個鏈表,在平衡二叉樹上進行搜索是非常高效的;
  1. 我們可以使用數組來表示平衡二叉樹,因為我們可以將數組A看成是一個完全二叉樹,雖然它最底層的葉子節點有一些是沒有的,我們可以將這些節點看成null,這樣這個平衡二叉樹就會變成完全二叉樹,而完全二叉樹我們完全可以使用數組來表示;
  1. 那么問題就來了,如果這個區間有n個元素,我們使用數組表示需要多少個節點?
    線段樹存儲空間圖示1

    如圖所示,如果區間中有n個元素的話,我們的空間需要2n,因為上邊的空間是下邊空間之和,但是這有一個最壞的情況,就是我們的數組是奇數的,比如說大小為5這樣的情況,那么此時的線段樹存儲空間就應該是下邊這樣的
    線段樹存儲空間圖示2
    因為區間元素個數為n的話,我們需要2n的空間來進行存儲,如果多出一個元素的話我們就需要4n的空間來進行存儲,最后我們的線段樹模型就應該像下邊圖示的那樣
    線段樹存儲空間圖示3
    我們將空的節點全部復制為null,這樣就可以讓它滿足完全二叉樹的定義;

    注意:在這里我們是浪費了一些存儲空間的,由于我們定義的線段樹是沒有插入操作的也就是說是靜態的,那么我們為了性能是完全可以犧牲掉這些空間的;

代碼實現線段樹基礎:

package com.mufeng.segmentTree;

/**
 * Created by wb-yxk397023 on 2018/7/8.
 */
public class SegmentTree<E> {

    // 線段樹使用的數組
    private E[] tree;

    private E[] data;

    public SegmentTree(E[] arr){
        data = (E[]) new Object[arr.length];

        for (int i = 0; i < arr.length; i++){
            data[i] = arr[i];
        }

        tree = (E[]) new Object[4 * arr.length];
    }

    /**
     * 獲取數組長度
     * @return
     */
    public int getSize(){
        return data.length;
    }

    /**
     * 獲取當前索引上的元素
     * @param index
     * @return
     */
    public E get(int index){
        if (index < 0 || index >= data.length){
            throw new IllegalArgumentException("Index is illega.");
        }
        return data[index];
    }

    /**
     * 返回完全二叉樹的數組表示中,一個索引上元素的左節點索引;
     * @param index
     * @return
     */
    private int leftChild(int index){
        return 2 * index + 1;
    }

    /**
     * 返回完全二叉樹的數組表示中,一個索引上元素的右節點索引;
     * @param index
     * @return
     */
    private int rightChild(int index){
        return 2 * index + 2;
    }
}

五 創建線段樹

  1. 首先以求和為例我們先來看一下線段樹的模型
    線段樹求和模型1

    在這個圖示中,我們的數組長度為10,所以線段樹的根節點存儲的就是10個元素的和,下邊的左右子節點以及各個節點存儲的都是相應區間元素的和,如果要創建這樣的一個線段樹我們就需要使用遞歸的方法進行創建;

代碼實現創建過程
private Merger<E> merger;

    public SegmentTree(E[] arr, Merger<E> merger){

        this.merger = merger;

        data = (E[]) new Object[arr.length];

        for (int i = 0; i < arr.length; i++){
            data[i] = arr[i];
        }

        tree = (E[]) new Object[4 * arr.length];
        buildSegmentTree(0, 0, data.length - 1);
    }

    /**
     * 在treeIndex的位置創建表示區間[l....r]的線段樹
     * @param treeIndex
     * @param l
     * @param r
     */
    private void buildSegmentTree(int treeIndex, int l, int r){
        if (l == r){
            tree[treeIndex] = data[l];
            return;
        }

        int leftTreeIndex = leftChild(treeIndex);
        int rightTreeIndex = rightChild(treeIndex);

        int mid = l + (r - l) / 2;

        buildSegmentTree(leftTreeIndex, l, mid);
        buildSegmentTree(rightTreeIndex, mid + 1, r);

        tree[treeIndex] = merger.merge(tree[leftTreeIndex], tree[rightTreeIndex]);
    }

Merger接口的實現

package com.mufeng.segmentTree;

/**
 * Created by wb-yxk397023 on 2018/7/8.
 */
public interface Merger<E> {
    E merge(E a, E b);
}
重寫toString
/**
     * 重寫toString方法
     * @return
     */
    @Override
    public String toString(){
        StringBuilder res = new StringBuilder();
        res.append('[');
        for (int i = 0; i < tree.length; i++){
            if (tree[i] != null){
                res.append(tree[I]);
            }else {
                res.append("null");
            }

            if (i != tree.length - 1){
                res.append(", ");
            }
        }
        res.append(']');
        return res.toString();
    }
測試
package com.mufeng;

import com.mufeng.segmentTree.SegmentTree;

public class Main {

        public static void main(String[] args) {

            Integer[] nums = {-2, 0, 3, -5, 2, -1};
            
            SegmentTree<Integer> segTree = new SegmentTree<>(nums, (a, b) -> a + b);
            
            System.out.println(segTree);
        }
}
測試結果

六 線段樹中的區間查詢

基于遞歸我們可以很輕松的實現線段樹的區間查詢操作,
線段樹的區間查詢1

比如說基于這個線段樹我們要查詢區間為2-5的統計信息;
線段樹的區間查詢2
我們可以先從根節點進行查詢;
線段樹的區間查詢3
根據圖示我們可以得出要查詢[2,5]這個區間的數據就需要查詢根節點下左右兩個節點的元素,左節點查詢[2,3],右節點查詢[4,5];
線段樹的區間查詢4

由于左右[2,3]和[4,5]這兩個節點都有父節點,在這里我們就可以使用遞歸進行查詢;

代碼實現線段樹區間的查詢操作:

/**
     * 返回區間[queryL,queryR]的值
     * @param queryL
     * @param queryR
     * @return
     */
    public E query(int queryL, int queryR){

        if(queryL < 0 || queryL >= data.length ||
                queryR < 0 || queryR >= data.length || queryL > queryR)
            throw new IllegalArgumentException("Index is illegal.");

        return query(0, 0, data.length - 1, queryL, queryR);
    }

    /**
     * 線段樹區間查詢的核心方法
     * 在以treeID為根的線段樹中[l...r]的范圍里,查找[queryL...queryR]的值
     * @param treeIndex
     * @param l
     * @param r
     * @param queryL
     * @param queryR
     * @return
     */
    private E query(int treeIndex, int l, int r, int queryL, int queryR){

        if (l == queryL && r == queryR){
            return tree[treeIndex];
        }

        int mid = l + (r - l) / 2;
        int leftTreeIndex = leftChild(treeIndex);
        int rightTreeIndex = rightChild(treeIndex);

        if (queryL >= mid + 1){
            return query(rightTreeIndex, mid + 1, r, queryL, queryR);
        }else if (queryR <= mid){
            return query(leftTreeIndex, l, mid, queryL, queryR);
        }

        E legtResult = query(leftTreeIndex, l, mid, queryL, mid);
        E rightResult = query(rightTreeIndex, mid + 1, r, mid + 1, queryR);

        return merger.merge(legtResult, rightResult);
    }

測試:

public static void main(String[] args) {

        Integer[] nums = {-2, 0, 3, -5, 2, -1};

        SegmentTree<Integer> segTree = new SegmentTree<>(nums,
                (a, b) -> a + b);
        System.out.println(segTree);

        System.out.println(segTree.query(0, 2));
        System.out.println(segTree.query(2, 5));
        System.out.println(segTree.query(0, 5));
    }
測試結果

七 線段樹中的更新的操作

1?? 代碼實現更新操作
/**
     * 將index位置上的值更新為e
     * @param index
     * @param e
     */
    public void set(int index, E e){
        if (index < 0 || index >= data.length){
            throw new IllegalArgumentException("Index is illega.");
        }

        data[index] = e;

        set(0, 0, data.length - 1, index, e);
    }

    /**
     * 在以treeIndex為根的線段樹中,更新index的值為e
     * @param treeIndex
     * @param l
     * @param r
     * @param index
     * @param e
     */
    private void set(int treeIndex, int l, int r, int index, E e){
        if (l == r){
            data[treeIndex] = e;
            return;
        }

        int mid = l + (r - l) / 2;
        int leftTreeIndex = leftChild(treeIndex);
        int rightTreeIndex = rightChild(treeIndex);

        if (index >= mid + 1){
            set(rightTreeIndex, mid + 1, r, index, e);
        }else {
            set(leftTreeIndex, l, mid, index, e);
        }

        tree[treeIndex] = merger.merge(tree[leftTreeIndex], tree[rightTreeIndex]);
    }
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,030評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,310評論 3 415
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 175,951評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,796評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,566評論 6 407
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,055評論 1 322
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,142評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,303評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,799評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,683評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,899評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,409評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,135評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,520評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,757評論 1 282
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,528評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,844評論 2 372

推薦閱讀更多精彩內容

  • 線段樹定義: 線段樹是一種二叉搜索樹,又叫區間樹,它將一個區間劃分成一些單元區間,每個單元區間對應線段樹中的一個...
    habit_learning閱讀 946評論 0 0
  • 轉自:http://www.cnblogs.com/TenosDoIt/p/3453089.html#b 一 概述...
    碧影江白閱讀 1,566評論 1 2
  • 1 序 2016年6月25日夜,帝都,天下著大雨,拖著行李箱和同學在校門口照了最后一張合照,搬離寢室打車去了提前租...
    RichardJieChen閱讀 5,114評論 0 12
  • 一 什么是優先隊列? 1?? 優先隊列其實就是隊列的一種,不過優先隊列是區別于普通隊列的;普通隊列是一種先進先出,...
    十丈_紅塵閱讀 604評論 0 1
  • 望一江秋日寒水 聞一聲老鴉凄鳴 飲一杯肝腸寸斷 醉一場生死輪回 泣一時悲歡離合 嘆一人對影獨酌 別一生前緣難續 悔...
    喆喆_1abd閱讀 283評論 0 0