徹底搞懂二分查找

1.簡介

二分查找即搜索一個數，如果存在，返回其索引，否則返回 -1。基本框架：

int binarySearch(int[] nums, int target) {
    int left = 0, right = ...;
    while(...) {
        int mid = (left + right) / 2;//小細節
        if (nums[mid] == target) {
            ...
        } else if (nums[mid] < target) {
            left = ...
        } else if (nums[mid] > target) {
            right = ...
        }
    }
    return ...;
}

分析二分查找的一個技巧是：不要出現 else，而是把所有情況用 else if 寫清楚，這樣可以清楚地展現所有細節。本文都會使用 else if，目的就是講清楚，大家理解后可自行簡化。

2.常見問題

while里到底是 <= 還是 <
mid是+1還是不變？
target有多個的時候怎么辦？

3.沒有重復值

int binarySearch(int[] nums, int target) {
    int left = 0; 
    int right = nums.length - 1; // 注意
    while(left <= right) {
        int mid = left + (right - left) / 2;
        if(nums[mid] == target)
            return mid; 
        else if (nums[mid] < target)
            left = mid + 1; // 注意
        else if (nums[mid] > target)
            right = mid - 1; // 注意
    }
    return -1;
}

1、為什么 while 循環的條件中是 <=，而不是 <？

答：因為初始化 right 的賦值是 nums.length - 1，即最后一個元素的索引，而不是 nums.length。

這二者可能出現在不同功能的二分查找中，區別是：前者相當于兩端都閉區間 [left, right]，后者相當于左閉右開區間 [left, right)，因為索引大小為 nums.length 是越界的。

我們這個算法中使用的是前者 [left, right] 兩端都閉的區間。這個區間其實就是每次進行搜索的區間。

什么時候應該停止搜索呢？當然，找到了目標值的時候可以終止：

    if(nums[mid] == target)
        return mid;

但如果沒找到，就需要 while 循環終止，然后返回 -1。那 while 循環什么時候應該終止？搜索區間為空的時候應該終止，意味著你沒得找了，就等于沒找到嘛。

while(left <= right) 的終止條件是 left == right + 1，寫成區間的形式就是 [right + 1, right]，或者帶個具體的數字進去 [3, 2]，可見這時候區間為空，因為沒有數字既大于等于 3 又小于等于 2 的吧。所以這時候 while 循環終止是正確的，直接返回 -1 即可。

while(left < right) 的終止條件是 left == right，寫成區間的形式就是 [left, right]，或者帶個具體的數字進去 [2, 2]，這時候區間非空，還有一個數 2，但此時 while 循環終止了。也就是說這區間 [2, 2] 被漏掉了，索引 2 沒有被搜索，如果這時候直接返回 -1 就是錯誤的。

當然，如果你非要用 while(left < right) 也可以，我們已經知道了出錯的原因，就打個補丁好了：

    //...
    while(left < right) {
        // ...
    }
    return nums[left] == target ? left : -1;

2、為什么 left = mid + 1，right = mid - 1？我看有的代碼是 right = mid 或者 left = mid，沒有這些加加減減，到底怎么回事，怎么判斷？

答：這也是二分查找的一個難點，不過只要你能理解前面的內容，就能夠很容易判斷。

剛才明確了「搜索區間」這個概念，而且本算法的搜索區間是兩端都閉的，即 [left, right]。那么當我們發現索引 mid 不是要找的 target 時，下一步應該去搜索哪里呢？

當然是去搜索 [left, mid-1] 或者 [mid+1, right] 對不對？因為 mid 已經搜索過，應該從搜索區間中去除。

3、此算法有什么缺陷？

答：至此，你應該已經掌握了該算法的所有細節，以及這樣處理的原因。但是，這個算法存在局限性。

比如說給你有序數組 nums = [1,2,2,2,3]，target 為 2，此算法返回的索引是 2，沒錯。但是如果我想得到 target 的左側邊界，即索引 1，或者我想得到 target 的右側邊界，即索引 3，這樣的話此算法是無法處理的。

這樣的需求很常見，你也許會說，找到一個 target，然后向左或向右線性搜索不行嗎？可以，但是不好，因為這樣難以保證二分查找對數級的復雜度了。

我們后續的算法就來討論這兩種二分查找的算法。

4.尋找左側邊界的二分搜索

以下是最常見的代碼形式，其中的標記是需要注意的細節：

int left_bound(int[] nums, int target) {
    if (nums.length == 0) return -1;
    int left = 0;
    int right = nums.length; // 注意

    while (left < right) { // 注意
        int mid = (left + right) / 2;
        if (nums[mid] == target) {
            right = mid;
        } else if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] > target) {
            right = mid; // 注意
        }
    }
     // target 比所有數都大
    if (left == nums.length) return -1;
    // 類似之前算法的處理方式
    return nums[left] == target ? left : -1;
}

1、為什么 while 中是 < 而不是 <=?

答：用相同的方法分析，因為 right = nums.length 而不是 nums.length - 1。因此每次循環的「搜索區間」是 [left, right) 左閉右開。

while(left < right) 終止的條件是 left == right，此時搜索區間 [left, left) 為空，所以可以正確終止。

PS：這里先要說一個搜索左右邊界和上面這個算法的一個區別，也是很多讀者問的：剛才的 right 不是 nums.length - 1 嗎，為啥這里非要寫成 nums.length 使得「搜索區間」變成左閉右開呢？

因為對于搜索左右側邊界的二分查找，這種寫法比較普遍，我就拿這種寫法舉例了，保證你以后遇到這類代碼可以理解。你非要用兩端都閉的寫法反而更簡單，我會在后面寫相關的代碼，把三種二分搜索都用一種兩端都閉的寫法統一起來，你耐心往后看就行了。

2、為什么沒有返回 -1 的操作？如果 nums 中不存在 target 這個值，怎么辦？

答：因為要一步一步來，先理解一下這個「左側邊界」有什么特殊含義：

image.png

對于這個數組，算法會返回 1。這個 1 的含義可以這樣解讀：nums 中小于 2 的元素有 1 個。

比如對于有序數組 nums = [2,3,5,7], target = 1，算法會返回 0，含義是：nums 中小于 1 的元素有 0 個。

再比如說 nums = [2,3,5,7], target = 8，算法會返回 4，含義是：nums 中小于 8 的元素有 4 個。

綜上可以看出，函數的返回值（即 left 變量的值）取值區間是閉區間 [0, nums.length]，所以我們簡單添加兩行代碼就能在正確的時候 return -1：

while (left < right) {
    //...
}
// target 比所有數都大
if (left == nums.length) return -1;
// 類似之前算法的處理方式
return nums[left] == target ? left : -1;

3、為什么 left = mid + 1，right = mid ？和之前的算法不一樣？

答：這個很好解釋，因為我們的「搜索區間」是 [left, right) 左閉右開，所以當 nums[mid] 被檢測之后，下一步的搜索區間應該去掉 mid 分割成兩個區間，即 [left, mid) 或 [mid + 1, right)。

4、為什么該算法能夠搜索左側邊界？

答：關鍵在于對于 nums[mid] == target 這種情況的處理：

    if (nums[mid] == target)
        right = mid;

可見，找到 target 時不要立即返回，而是縮小「搜索區間」的上界 right，在區間 [left, mid) 中繼續搜索，即不斷向左收縮，達到鎖定左側邊界的目的。

5、為什么返回 left 而不是 right？

答：都是一樣的，因為 while 終止的條件是 left == right。

6、能不能想辦法把 right 變成 nums.length - 1，也就是繼續使用兩邊都閉的「搜索區間」？這樣就可以和第一種二分搜索在某種程度上統一起來了。

答：當然可以，只要你明白了「搜索區間」這個概念，就能有效避免漏掉元素，隨便你怎么改都行。下面我們嚴格根據邏輯來修改：

因為你非要讓搜索區間兩端都閉，所以 right 應該初始化為 nums.length - 1，while 的終止條件應該是 left == right + 1，也就是其中應該用 <=：

int left_bound(int[] nums, int target) {
    // 搜索區間為 [left, right]
    int left = 0, right = nums.length - 1;
    while (left <= right) {
        int mid = left + (right - left) / 2;
        // if else ...
    }

因為搜索區間是兩端都閉的，且現在是搜索左側邊界，所以 left 和 right 的更新邏輯如下：

if (nums[mid] < target) {
    // 搜索區間變為 [mid+1, right]
    left = mid + 1;
} else if (nums[mid] > target) {
    // 搜索區間變為 [left, mid-1]
    right = mid - 1;
} else if (nums[mid] == target) {
    // 收縮右側邊界
    right = mid - 1;
}

由于 while 的退出條件是 left == right + 1，所以當 target 比 nums 中所有元素都大時，會存在以下情況使得索引越界：

image.png

因此，最后返回結果的代碼應該檢查越界情況：

if (left >= nums.length || nums[left] != target)
    return -1;
return left;

至此，整個算法就寫完了，完整代碼如下：

int left_bound(int[] nums, int target) {
    int left = 0, right = nums.length - 1;
    // 搜索區間為 [left, right]
    while (left <= right) {
        int mid = left + (right - left) / 2;
        if (nums[mid] < target) {
            // 搜索區間變為 [mid+1, right]
            left = mid + 1;
        } else if (nums[mid] > target) {
            // 搜索區間變為 [left, mid-1]
            right = mid - 1;
        } else if (nums[mid] == target) {
            // 收縮右側邊界
            right = mid - 1;
        }
    }
    // 檢查出界情況
    if (left >= nums.length || nums[left] != target)
        return -1;
    return left;
}

這樣就和第一種二分搜索算法統一了，都是兩端都閉的「搜索區間」，而且最后返回的也是 left 變量的值。只要把住二分搜索的邏輯，兩種形式大家看自己喜歡哪種記哪種吧。

4、尋找右側邊界的二分查找

類似尋找左側邊界的算法，這里也會提供兩種寫法，還是先寫常見的左閉右開的寫法，只有兩處和搜索左側邊界不同，已標注：

int right_bound(int[] nums, int target) {
    if (nums.length == 0) return -1;
    int left = 0, right = nums.length;

    while (left < right) {
        int mid = (left + right) / 2;
        if (nums[mid] == target) {
            left = mid + 1; // 注意
        } else if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] > target) {
            right = mid;
        }
    }
    return left - 1; // 注意
}

1、為什么這個算法能夠找到右側邊界？

答：類似地，關鍵點還是這里：

if (nums[mid] == target) {
    left = mid + 1;

當 nums[mid] == target 時，不要立即返回，而是增大「搜索區間」的下界 left，使得區間不斷向右收縮，達到鎖定右側邊界的目的。

2、為什么最后返回 left - 1 而不像左側邊界的函數，返回 left****？而且我覺得這里既然是搜索右側邊界，應該返回 right 才對。

答：首先，while 循環的終止條件是 left == right，所以 left 和 right 是一樣的，你非要體現右側的特點，返回 right - 1 好了。

至于為什么要減一，這是搜索右側邊界的一個特殊點，關鍵在這個條件判斷：

if (nums[mid] == target) {
    left = mid + 1;
    // 這樣想: mid = left - 1

image.png

因為我們對 left 的更新必須是 left = mid + 1，就是說 while 循環結束時，nums[left] 一定不等于 target 了，而 nums[left-1] 可能是 target。

至于為什么 left 的更新必須是 left = mid + 1，同左側邊界搜索，就不再贅述。

3、為什么沒有返回 -1 的操作？如果 nums 中不存在 target 這個值，怎么辦？

答：類似之前的左側邊界搜索，因為 while 的終止條件是 left == right，就是說 left 的取值范圍是 [0, nums.length]，所以可以添加兩行代碼，正確地返回 -1：

while (left < right) {
    // ...
}
if (left == 0) return -1;
return nums[left-1] == target ? (left-1) : -1;

4、是否也可以把這個算法的「搜索區間」也統一成兩端都閉的形式呢？這樣這三個寫法就完全統一了，以后就可以閉著眼睛寫出來了。

答：當然可以，類似搜索左側邊界的統一寫法，其實只要改兩個地方就行了：

int right_bound(int[] nums, int target) {
    int left = 0, right = nums.length - 1;
    while (left <= right) {
        int mid = left + (right - left) / 2;
        if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] > target) {
            right = mid - 1;
        } else if (nums[mid] == target) {
            // 這里改成收縮左側邊界即可
            left = mid + 1;
        }
    }
    // 這里改為檢查 right 越界的情況，見下圖
    if (right < 0 || nums[right] != target)
        return -1;
    return right;
}

當 target 比所有元素都小時，right 會被減到 -1，所以需要在最后防止越界：

image.png

至此，搜索右側邊界的二分查找的兩種寫法也完成了，其實將「搜索區間」統一成兩端都閉反而更容易記憶，你說是吧？

5、邏輯統一

來梳理一下這些細節差異的因果邏輯：

第一個，最基本的二分查找算法：

因為我們初始化 right = nums.length - 1
所以決定了我們的「搜索區間」是 [left, right]
所以決定了 while (left <= right)
同時也決定了 left = mid+1 和 right = mid-1

因為我們只需找到一個 target 的索引即可
所以當 nums[mid] == target 時可以立即返回

第二個，尋找左側邊界的二分查找：

因為我們初始化 right = nums.length
所以決定了我們的「搜索區間」是 [left, right)
所以決定了 while (left < right)
同時也決定了 left = mid + 1 和 right = mid

因為我們需找到 target 的最左側索引
所以當 nums[mid] == target 時不要立即返回
而要收緊右側邊界以鎖定左側邊界

第三個，尋找右側邊界的二分查找：

因為我們初始化 right = nums.length
所以決定了我們的「搜索區間」是 [left, right)
所以決定了 while (left < right)
同時也決定了 left = mid + 1 和 right = mid

因為我們需找到 target 的最右側索引
所以當 nums[mid] == target 時不要立即返回
而要收緊左側邊界以鎖定右側邊界

又因為收緊左側邊界時必須 left = mid + 1
所以最后無論返回 left 還是 right，必須減一

對于尋找左右邊界的二分搜索，常見的手法是使用左閉右開的「搜索區間」，我們還根據邏輯將「搜索區間」全都統一成了兩端都閉，便于記憶，只要修改兩處即可變化出三種寫法：

int binary_search(int[] nums, int target) {
    int left = 0, right = nums.length - 1; 
    while(left <= right) {
        int mid = left + (right - left) / 2;
        if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] > target) {
            right = mid - 1; 
        } else if(nums[mid] == target) {
            // 直接返回
            return mid;
        }
    }
    // 直接返回
    return -1;
}

int left_bound(int[] nums, int target) {
    int left = 0, right = nums.length - 1;
    while (left <= right) {
        int mid = left + (right - left) / 2;
        if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] > target) {
            right = mid - 1;
        } else if (nums[mid] == target) {
            // 別返回，鎖定左側邊界
            right = mid - 1;
        }
    }
    // 最后要檢查 left 越界的情況
    if (left >= nums.length || nums[left] != target)
        return -1;
    return left;
}


int right_bound(int[] nums, int target) {
    int left = 0, right = nums.length - 1;
    while (left <= right) {
        int mid = left + (right - left) / 2;
        if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] > target) {
            right = mid - 1;
        } else if (nums[mid] == target) {
            // 別返回，鎖定右側邊界
            left = mid + 1;
        }
    }
    // 最后要檢查 right 越界的情況
    if (right < 0 || nums[right] != target)
        return -1;
    return right;
}

六、參考
1.labuladong的算法精講

最后編輯于：2020.03.21 23:46:47

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 227,837評論 6贊 531
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,196評論 3贊 414
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 175,688評論 0贊 373
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,654評論 1贊 309
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,456評論 6贊 406
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 54,955評論 1贊 321
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,044評論 3贊 440
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,195評論 0贊 287
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,725評論 1贊 333
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,608評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,802評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,318評論 5贊 358
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,048評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,422評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,673評論 1贊 281
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,424評論 3贊 390
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,762評論 2贊 372

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

徹底搞懂二分查找

徹底搞懂二分查找

1.簡介

2.常見問題

3.沒有重復值

4.尋找左側邊界的二分搜索

4、尋找右側邊界的二分查找

5、邏輯統一

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

徹底搞懂二分查找

1.簡介

2.常見問題

3.沒有重復值

4.尋找左側邊界的二分搜索

4、尋找右側邊界的二分查找

5、邏輯統一

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频