排序（1）-排序的基礎(chǔ)知識(shí)和復(fù)雜度O(n^2）的排序算法

排序通常是我們學(xué)習(xí)到的第一個(gè)算法，排序算法的應(yīng)用十分廣泛。下面我們就來(lái)學(xué)習(xí)關(guān)于排序算法的種種知識(shí)。
首先，先給出一個(gè)思考題，插入排序和冒泡排序是非常常見(jiàn)的排序方式，它們的時(shí)間復(fù)雜度都是O(n²)，但是在實(shí)際的軟件開(kāi)發(fā)中，我們常常傾向于使用插入排序而不是冒泡排序，這是為什么呢？學(xué)習(xí)完本節(jié)內(nèi)容，你會(huì)得到答案。

如何分析一個(gè)排序算法？

對(duì)于排序算法，我們一般會(huì)從這幾個(gè)方面衡量：

排序算法的執(zhí)行效率（不僅僅包括時(shí)間復(fù)雜度）：

1.最好情況、最壞情況、平均情況的時(shí)間復(fù)雜度

分析一個(gè)排序算法，你要給出最好情況、最壞情況、平均情況下的時(shí)間復(fù)雜度，并且你還要說(shuō)明怎樣的數(shù)據(jù)會(huì)造成“最好”和“最壞”的情況。
為什么要區(qū)分這三種復(fù)雜度呢？第一，有些排序算法在三中情況下的性能表現(xiàn)差異很大，所以我們最好都坐一下區(qū)分。第二，要排序的數(shù)據(jù)中，有序程度是不同的，這種程度對(duì)排序的執(zhí)行會(huì)有影響，我們需要直到排序算法在不同數(shù)據(jù)下的性能表現(xiàn)。

2.關(guān)注時(shí)間復(fù)雜度的系數(shù)、常數(shù)、低階

有些排序算法具有相同的時(shí)間復(fù)雜度，在這種情況下我們?nèi)绾慰剂克鼈冎g的性能差異呢？這時(shí)我們就需要把系數(shù)、常數(shù)、低階都考慮進(jìn)來(lái)。

3.比較次數(shù)和交換（或移動(dòng)）次數(shù)

基于比較的排序算法在執(zhí)行過(guò)程中，會(huì)涉及比較和元素移動(dòng)兩種操作，這也是我們需要考量的。

排序算法的內(nèi)存消耗（空間復(fù)雜度）：

對(duì)于空間復(fù)雜度為O(1)的排序算法，我們稱(chēng)之為原地排序。

排序算法的穩(wěn)定性：

穩(wěn)定性：待排序的序列中存在值相等的元素，經(jīng)過(guò)排序之后，他們的先后順序不發(fā)生改變。
你可能會(huì)疑惑穩(wěn)定性對(duì)排序有什么意義呢？其實(shí)，單純的數(shù)字排序確實(shí)不需要穩(wěn)定性，但是在實(shí)際編程中，你可能對(duì)其它屬性也有所要求。

比如說(shuō)，我們現(xiàn)在要為電商交易系統(tǒng)中的“訂單”進(jìn)行排序。訂單有兩個(gè)屬性：下單時(shí)間和訂單金額。假設(shè)我們有龐大的訂單數(shù)據(jù)，我們希望按照金額從小到大排序。對(duì)金額相同的訂單，希望按照下單時(shí)間從早到晚有序，對(duì)于這樣的一個(gè)需求，我們?cè)趺崔k呢？

第一種想法是：先對(duì)金額進(jìn)行排序，然后找到金額相同的訂單再按照下單時(shí)間排序，這個(gè)想法沒(méi)有問(wèn)題，但是實(shí)際操作起來(lái)比較繁瑣。
第二種想法：我們可以借助排序的穩(wěn)定性，通過(guò)兩次排序完成：首先，按照下單時(shí)間為訂單排序，然后再使用穩(wěn)定的排序算法，按照訂單金額重新排序。經(jīng)過(guò)這兩次排序之后，就達(dá)到了要求。
我們用一個(gè)圖幫助你理解：

排序穩(wěn)定性的意義.jpg

幾種復(fù)雜度為O(n²)的排序算法

冒泡排序

你可以這樣理解冒泡：在一組數(shù)據(jù)中，依次兩兩比較，將大的數(shù)據(jù)放到上方（數(shù)據(jù)的后方），當(dāng)一趟比較完成，最大的數(shù)就會(huì)在最上方（冒泡）。假設(shè)這組數(shù)據(jù)中共有n個(gè)數(shù)據(jù)，則進(jìn)行n次冒泡就可以得到有序的數(shù)據(jù)。
你可以用這個(gè)圖理解：

一趟冒泡排序.jpg

上面是一趟冒泡，當(dāng)進(jìn)行n次冒泡后：

冒泡全過(guò)程.jpg

排序完成。
上面的這種冒泡有優(yōu)化的空間：如果在某一趟冒泡中沒(méi)有發(fā)生數(shù)據(jù)交換，那么這個(gè)數(shù)據(jù)已經(jīng)有序，我們可以通過(guò)一個(gè)標(biāo)記實(shí)現(xiàn)：

冒泡的變動(dòng)標(biāo)記.jpg

下面是專(zhuān)欄作者給出的冒泡排序代碼：

// 冒泡排序，a表示數(shù)組，n表示數(shù)組大小
public void bubbleSort(int[] a, int n) {
  if (n <= 1) return;
 
 for (int i = 0; i < n; ++i) {
    // 提前退出冒泡循環(huán)的標(biāo)志位
    boolean flag = false;
    for (int j = 0; j < n - i - 1; ++j) {
      if (a[j] > a[j+1]) { // 交換
        int tmp = a[j];
        a[j] = a[j+1];
        a[j+1] = tmp;
        flag = true;  // 表示有數(shù)據(jù)交換      
      }
    }
    if (!flag) break;  // 沒(méi)有數(shù)據(jù)交換，提前退出
  }
}

對(duì)照思路，我用python也寫(xiě)了冒泡：

def mp_sort(l):
    for i in range(len(l)):
        flag = False
        for j in range(len(l) - i - 1):
            if l[j] > l[j + 1]:
                l[j], l[j + 1] = l[j + 1], l[j]
                flag = True
        if not flag:
            break

讓我們分析一下冒泡排序：

空間復(fù)雜度：冒泡排序只使用了常量級(jí)的空間，空間復(fù)雜度為O(n)，是原地排序算法。
穩(wěn)定性：當(dāng)兩個(gè)元素相等的時(shí)候，我們可以不對(duì)元素進(jìn)行交換，所以，是穩(wěn)定的排序算法。
時(shí)間復(fù)雜度：
最好情況：數(shù)組已經(jīng)有序，只需要進(jìn)行一趟檢測(cè)，復(fù)雜度為O(1)
最壞情況：數(shù)組完全倒序，復(fù)雜度為O(n²)
平均情況：如果要完全依照概率分析，分析十分復(fù)雜，所以這里使用一種簡(jiǎn)單的分析思路：
有序度：數(shù)組中具有有序元素對(duì)的個(gè)數(shù)，其中有序元素對(duì)：

有序元素對(duì)：a[i] <= a[j], 如果i < j

下圖：

有序度.jpg

滿(mǎn)有序度：如果一個(gè)數(shù)組有 n 個(gè)數(shù)，且數(shù)組完全有序，其有序度為 n*(n-1)/2 ，這種完全有序的數(shù)組的有序度叫做滿(mǎn)有序度。（只需要記住那個(gè)公式即可）
逆序度：和有序度的定義相反，我們也可以通過(guò)計(jì)算得到： 逆序度 = 滿(mǎn)有序度 - 有序度

我們假設(shè)要排序的數(shù)組的初始狀態(tài)是 4，5，6，3，2，1 ，其中，有序元素對(duì)有 (4，5) (4，6)(5，6)，所以有序度是 3。n=6，所以排序完成之后終態(tài)的滿(mǎn)有序度為 n*(n-1)/2=15。

過(guò)程如下：

冒泡有序度.jpg

你會(huì)發(fā)現(xiàn)，在冒泡排序中，每交換一次，有序度就 +1 ，也就是說(shuō)，不管算法怎么改進(jìn)，交換次數(shù)都是確定的，交換次數(shù)就等于逆序度。在最好情況下，逆序度為 0 ，在最壞情況下，逆序度為 n*(n-1)/2=15，我們?nèi)∫粋€(gè)中間值 n*(n-1)/2=15，來(lái)假設(shè)有序度既不是很高也不是很低的情況。
換句話說(shuō)，平均情況下，需要 n*(n-1)/2=15 次交換操作，比較操作比交換操作多，而復(fù)雜度的上限是O(n²)，所以平均情況下的時(shí)間復(fù)雜度為O(n²)。

上面的過(guò)程并不嚴(yán)格，但還是很實(shí)用，在快排中我們還會(huì)用到這種方法來(lái)分析平均時(shí)間復(fù)雜度。

插入排序

插入思想：如果你要向一個(gè)有序數(shù)組中插入一個(gè)數(shù)據(jù)，你要怎么辦？

數(shù)據(jù)插入.jpg

插入排序就是基于這種插入思想構(gòu)成的算法：將整個(gè)數(shù)組分為兩個(gè)區(qū)間：已排序區(qū)間和未排序區(qū)間。我們依次取出未排序區(qū)間的第一個(gè)數(shù)插入到已排序區(qū)間中，經(jīng)過(guò)n次插入后排序完成：

插入排序的過(guò)程.jpg

話不多說(shuō)，直接給代碼：

// 插入排序，a表示數(shù)組，n表示數(shù)組大小
public void insertionSort(int[] a, int n) {
  if (n <= 1) return;

  for (int i = 1; i < n; ++i) {
    int value = a[i];
    int j = i - 1;
    // 查找插入的位置
    for (; j >= 0; --j) {
      if (a[j] > value) {
        a[j+1] = a[j];  // 數(shù)據(jù)移動(dòng)
      } else {
        break;
      }
    }
    a[j+1] = value; // 插入數(shù)據(jù)
  }
}

def insert_sort(l):
    for i in range(len(l)):
        temp = l[i]
        j = i - 1
        while j >= 0:
            if l[j] > temp:
                l[j+1] = l[j]
            else:
                break
            j-=1
        l[j+1] = temp

插入排序的性能分析：

是否為原地排序算法：是
是否為穩(wěn)定排序算法：是
時(shí)間復(fù)雜度：
最好情況：O(n)
最壞情況：O(n²)
平均時(shí)間復(fù)雜度：
我們依舊借助有序度做近似分析：你會(huì)發(fā)現(xiàn)，算法移動(dòng)數(shù)據(jù)的次數(shù) 等于逆序度：

插入排序的有序度.jpg

分析過(guò)程類(lèi)似，最后得到平均時(shí)間復(fù)雜度為O(n²)。

思考解答

前面我們提到，即使冒泡和插入兩種排序算法的時(shí)間復(fù)雜度一樣，但是人們更加喜歡使用插入排序。
下面就直接引用專(zhuān)欄作者的話：

我們前面分析冒泡排序和插入排序的時(shí)候講到，冒泡排序不管怎么優(yōu)化，元素交換的次數(shù)是一個(gè)固定值，是原始數(shù)據(jù)的逆序度。插入排序是同樣的，不管怎么優(yōu)化，元素移動(dòng)的次數(shù)也等于原始數(shù)據(jù)的逆序度。

但是，從代碼實(shí)現(xiàn)上來(lái)看，冒泡排序的數(shù)據(jù)交換要比插入排序的數(shù)據(jù)移動(dòng)要復(fù)雜，冒泡排序需要 3 個(gè)賦值操作，而插入排序只需要 1 個(gè)。我們來(lái)看這段操作：

冒泡排序中數(shù)據(jù)的交換操作：
if (a[j] > a[j+1]) { // 交換
   int tmp = a[j];
   a[j] = a[j+1];
   a[j+1] = tmp;
   flag = true;
}

插入排序中數(shù)據(jù)的移動(dòng)操作：
if (a[j] > value) {
  a[j+1] = a[j];  // 數(shù)據(jù)移動(dòng)
} else {
  break;
}

我們把執(zhí)行一個(gè)賦值語(yǔ)句的時(shí)間粗略地計(jì)為單位時(shí)間（unit_time），然后分別用冒泡排序和插入排序?qū)ν粋€(gè)逆序度是 K 的數(shù)組進(jìn)行排序。用冒泡排序，需要 K 次交換操作，每次需要 3 個(gè)賦值語(yǔ)句，所以交換操作總耗時(shí)就是 3K 單位時(shí)間。而插入排序中數(shù)據(jù)移動(dòng)操作只需要 K 個(gè)單位時(shí)間。

這個(gè)只是我們非常理論的分析，為了實(shí)驗(yàn)，針對(duì)上面的冒泡排序和插入排序的 Java 代碼，我寫(xiě)了一個(gè)性能對(duì)比測(cè)試程序，隨機(jī)生成 10000 個(gè)數(shù)組，每個(gè)數(shù)組中包含 200 個(gè)數(shù)據(jù)，然后在我的機(jī)器上分別用冒泡和插入排序算法來(lái)排序，冒泡排序算法大約 700ms 才能執(zhí)行完成，而插入排序只需要 100ms 左右就能搞定！

所以，雖然冒泡排序和插入排序在時(shí)間復(fù)雜度上是一樣的，都是 O(n2)，但是如果我們希望把性能優(yōu)化做到極致，那肯定首選插入排序。

以上就是這部分的內(nèi)容，希望你有所收獲。

注：本文章的主要內(nèi)容來(lái)自我對(duì)極客時(shí)間app的《數(shù)據(jù)結(jié)構(gòu)與算法之美》專(zhuān)欄的總結(jié)，我大量引用了其中的代碼和截圖，如果想要了解具體內(nèi)容，可以前往極客時(shí)間

最后編輯于：2020.03.15 22:24:47

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點(diǎn)，簡(jiǎn)書(shū)系信息發(fā)布平臺(tái)，僅提供信息存儲(chǔ)服務(wù)。

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 228,119評(píng)論 6贊 531
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 98,382評(píng)論 3贊 415
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人，你說(shuō)我怎么就攤上這事。” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 176,038評(píng)論 0贊 373
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我，道長(zhǎng)，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 62,853評(píng)論 1贊 309
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 71,616評(píng)論 6贊 408
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 55,112評(píng)論 1贊 323
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音，去河邊找鬼。笑死，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,192評(píng)論 3贊 441
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 42,355評(píng)論 0贊 288
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 48,869評(píng)論 1贊 334
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 40,727評(píng)論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 42,928評(píng)論 1贊 369
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,467評(píng)論 5贊 358
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 44,165評(píng)論 3贊 347
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 34,570評(píng)論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 35,813評(píng)論 1贊 282
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個(gè)月前我還...
沈念sama閱讀 51,585評(píng)論 3贊 390
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 47,892評(píng)論 2贊 372

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频