排序(1)-排序的基礎(chǔ)知識(shí)和復(fù)雜度O(n^2)的排序算法

排序通常是我們學(xué)習(xí)到的第一個(gè)算法,排序算法的應(yīng)用十分廣泛。下面我們就來(lái)學(xué)習(xí)關(guān)于排序算法的種種知識(shí)。
首先,先給出一個(gè)思考題,插入排序和冒泡排序是非常常見(jiàn)的排序方式,它們的時(shí)間復(fù)雜度都是O(n2),但是在實(shí)際的軟件開(kāi)發(fā)中,我們常常傾向于使用插入排序而不是冒泡排序,這是為什么呢?學(xué)習(xí)完本節(jié)內(nèi)容,你會(huì)得到答案。

如何分析一個(gè)排序算法?

對(duì)于排序算法,我們一般會(huì)從這幾個(gè)方面衡量:

排序算法的執(zhí)行效率(不僅僅包括時(shí)間復(fù)雜度):

1.最好情況、最壞情況、平均情況 的時(shí)間復(fù)雜度

分析一個(gè)排序算法,你要給出最好情況、最壞情況、平均情況下的時(shí)間復(fù)雜度,并且你還要說(shuō)明怎樣的數(shù)據(jù)會(huì)造成“最好”和“最壞”的情況。
為什么要區(qū)分這三種復(fù)雜度呢?第一,有些排序算法在三中情況下的性能表現(xiàn)差異很大,所以我們最好都坐一下區(qū)分。第二,要排序的數(shù)據(jù)中,有序程度是不同的,這種程度對(duì)排序的執(zhí)行會(huì)有影響,我們需要直到排序算法在不同數(shù)據(jù)下的性能表現(xiàn)。

2.關(guān)注時(shí)間復(fù)雜度的系數(shù)、常數(shù)、低階

有些排序算法具有相同的時(shí)間復(fù)雜度,在這種情況下我們?nèi)绾慰剂克鼈冎g的性能差異呢?這時(shí)我們就需要把系數(shù)、常數(shù)、低階 都考慮進(jìn)來(lái)。

3.比較次數(shù)和交換(或移動(dòng))次數(shù)

基于比較的排序算法在執(zhí)行過(guò)程中,會(huì)涉及 比較 和 元素移動(dòng)兩種操作,這也是我們需要考量的。

排序算法的內(nèi)存消耗(空間復(fù)雜度):

對(duì)于空間復(fù)雜度為O(1)的排序算法,我們稱(chēng)之為原地排序

排序算法的穩(wěn)定性:

穩(wěn)定性:待排序的序列中存在值相等的元素,經(jīng)過(guò)排序之后,他們的先后順序不發(fā)生改變。
你可能會(huì)疑惑穩(wěn)定性對(duì)排序有什么意義呢?其實(shí),單純的數(shù)字排序確實(shí)不需要穩(wěn)定性,但是在實(shí)際編程中,你可能對(duì)其它屬性也有所要求。

比如說(shuō),我們現(xiàn)在要為電商交易系統(tǒng)中的“訂單”進(jìn)行排序。訂單有兩個(gè)屬性:下單時(shí)間 和 訂單金額。假設(shè)我們有龐大的訂單數(shù)據(jù),我們希望按照金額從小到大排序。對(duì)金額相同的訂單,希望按照下單時(shí)間從早到晚有序,對(duì)于這樣的一個(gè)需求,我們?cè)趺崔k呢?

第一種想法是:先對(duì)金額進(jìn)行排序,然后找到金額相同的訂單再按照下單時(shí)間排序,這個(gè)想法沒(méi)有問(wèn)題,但是實(shí)際操作起來(lái)比較繁瑣。
第二種想法:我們可以借助排序的穩(wěn)定性,通過(guò)兩次排序完成:首先,按照下單時(shí)間為訂單排序,然后再使用穩(wěn)定的排序算法,按照訂單金額重新排序。經(jīng)過(guò)這兩次排序之后,就達(dá)到了要求。
我們用一個(gè)圖幫助你理解:

排序穩(wěn)定性的意義.jpg

幾種復(fù)雜度為O(n2)的排序算法

冒泡排序

你可以這樣理解冒泡:在一組數(shù)據(jù)中,依次兩兩比較,將大的數(shù)據(jù)放到上方(數(shù)據(jù)的后方),當(dāng)一趟比較完成,最大的數(shù)就會(huì)在最上方(冒泡)。假設(shè)這組數(shù)據(jù)中共有n個(gè)數(shù)據(jù),則進(jìn)行n次冒泡就可以得到有序的數(shù)據(jù)。
你可以用這個(gè)圖理解:


一趟冒泡排序.jpg

上面是一趟冒泡,當(dāng)進(jìn)行n次冒泡后:
冒泡全過(guò)程.jpg

排序完成。
上面的這種冒泡有優(yōu)化的空間:如果在某一趟冒泡中沒(méi)有發(fā)生數(shù)據(jù)交換,那么這個(gè)數(shù)據(jù)已經(jīng)有序,我們可以通過(guò)一個(gè)標(biāo)記實(shí)現(xiàn):
冒泡的變動(dòng)標(biāo)記.jpg

下面是專(zhuān)欄作者給出的冒泡排序代碼:

// 冒泡排序,a表示數(shù)組,n表示數(shù)組大小
public void bubbleSort(int[] a, int n) {
  if (n <= 1) return;
 
 for (int i = 0; i < n; ++i) {
    // 提前退出冒泡循環(huán)的標(biāo)志位
    boolean flag = false;
    for (int j = 0; j < n - i - 1; ++j) {
      if (a[j] > a[j+1]) { // 交換
        int tmp = a[j];
        a[j] = a[j+1];
        a[j+1] = tmp;
        flag = true;  // 表示有數(shù)據(jù)交換      
      }
    }
    if (!flag) break;  // 沒(méi)有數(shù)據(jù)交換,提前退出
  }
}

對(duì)照思路,我用python也寫(xiě)了冒泡:

def mp_sort(l):
    for i in range(len(l)):
        flag = False
        for j in range(len(l) - i - 1):
            if l[j] > l[j + 1]:
                l[j], l[j + 1] = l[j + 1], l[j]
                flag = True
        if not flag:
            break

讓我們分析一下冒泡排序:

  • 空間復(fù)雜度:冒泡排序只使用了常量級(jí)的空間,空間復(fù)雜度為O(n),是原地排序算法
  • 穩(wěn)定性:當(dāng)兩個(gè)元素相等的時(shí)候,我們可以不對(duì)元素進(jìn)行交換,所以,是穩(wěn)定的排序算法。
  • 時(shí)間復(fù)雜度:
    最好情況:數(shù)組已經(jīng)有序,只需要進(jìn)行一趟檢測(cè),復(fù)雜度為O(1)
    最壞情況:數(shù)組完全倒序,復(fù)雜度為O(n2)
    平均情況:如果要完全依照概率分析,分析十分復(fù)雜,所以這里使用一種簡(jiǎn)單的分析思路:
    有序度:數(shù)組中具有有序元素對(duì)的個(gè)數(shù),其中有序元素對(duì):

有序元素對(duì):a[i] <= a[j], 如果i < j

下圖:


有序度.jpg

滿(mǎn)有序度:如果一個(gè)數(shù)組有 n 個(gè)數(shù),且數(shù)組完全有序,其有序度為 n*(n-1)/2 ,這種完全有序的數(shù)組的有序度叫做滿(mǎn)有序度。(只需要記住那個(gè)公式即可)
逆序度:和有序度的定義相反,我們也可以通過(guò)計(jì)算得到: 逆序度 = 滿(mǎn)有序度 - 有序度

我們假設(shè)要排序的數(shù)組的初始狀態(tài)是 4,5,6,3,2,1 ,其中,有序元素對(duì)有 (4,5) (4,6)(5,6),所以有序度是 3。n=6,所以排序完成之后終態(tài)的滿(mǎn)有序度為 n*(n-1)/2=15。

過(guò)程如下:
冒泡有序度.jpg

你會(huì)發(fā)現(xiàn),在冒泡排序中,每交換一次,有序度就 +1 ,也就是說(shuō),不管算法怎么改進(jìn),交換次數(shù)都是確定的,交換次數(shù)就 等于 逆序度。在最好情況下,逆序度為 0 ,在最壞情況下,逆序度為 n*(n-1)/2=15,我們?nèi)∫粋€(gè)中間值 n*(n-1)/2=15,來(lái)假設(shè)有序度既不是很高也不是很低的情況。
換句話說(shuō),平均情況下,需要 n*(n-1)/2=15 次交換操作,比較操作比交換操作多,而復(fù)雜度的上限是O(n2),所以平均情況下的時(shí)間復(fù)雜度為O(n2)。

上面的過(guò)程并不嚴(yán)格,但還是很實(shí)用,在快排中我們還會(huì)用到這種方法來(lái)分析平均時(shí)間復(fù)雜度。

插入排序

插入思想:如果你要向一個(gè)有序數(shù)組中插入一個(gè)數(shù)據(jù),你要怎么辦?
數(shù)據(jù)插入.jpg

插入排序就是基于這種插入思想構(gòu)成的算法:將整個(gè)數(shù)組分為兩個(gè)區(qū)間:已排序區(qū)間 和 未排序區(qū)間。我們依次取出未排序區(qū)間的第一個(gè)數(shù)插入到已排序區(qū)間中,經(jīng)過(guò)n次插入后排序完成:
插入排序的過(guò)程.jpg

話不多說(shuō),直接給代碼:

// 插入排序,a表示數(shù)組,n表示數(shù)組大小
public void insertionSort(int[] a, int n) {
  if (n <= 1) return;

  for (int i = 1; i < n; ++i) {
    int value = a[i];
    int j = i - 1;
    // 查找插入的位置
    for (; j >= 0; --j) {
      if (a[j] > value) {
        a[j+1] = a[j];  // 數(shù)據(jù)移動(dòng)
      } else {
        break;
      }
    }
    a[j+1] = value; // 插入數(shù)據(jù)
  }
}
def insert_sort(l):
    for i in range(len(l)):
        temp = l[i]
        j = i - 1
        while j >= 0:
            if l[j] > temp:
                l[j+1] = l[j]
            else:
                break
            j-=1
        l[j+1] = temp

插入排序的性能分析:

  • 是否為原地排序算法:是
  • 是否為穩(wěn)定排序算法:是
  • 時(shí)間復(fù)雜度:
    最好情況:O(n)
    最壞情況:O(n2)
    平均時(shí)間復(fù)雜度:
    我們依舊借助有序度做近似分析:你會(huì)發(fā)現(xiàn),算法移動(dòng)數(shù)據(jù)的次數(shù) 等于 逆序度:
    插入排序的有序度.jpg

    分析過(guò)程類(lèi)似,最后得到平均時(shí)間復(fù)雜度為O(n2)。

思考解答

前面我們提到,即使冒泡和插入兩種排序算法的時(shí)間復(fù)雜度一樣,但是人們更加喜歡使用插入排序。
下面就直接引用專(zhuān)欄作者的話:

我們前面分析冒泡排序和插入排序的時(shí)候講到,冒泡排序不管怎么優(yōu)化,元素交換的次數(shù)是一個(gè)固定值,是原始數(shù)據(jù)的逆序度。插入排序是同樣的,不管怎么優(yōu)化,元素移動(dòng)的次數(shù)也等于原始數(shù)據(jù)的逆序度。

但是,從代碼實(shí)現(xiàn)上來(lái)看,冒泡排序的數(shù)據(jù)交換要比插入排序的數(shù)據(jù)移動(dòng)要復(fù)雜,冒泡排序需要 3 個(gè)賦值操作,而插入排序只需要 1 個(gè)。我們來(lái)看這段操作:

冒泡排序中數(shù)據(jù)的交換操作:
if (a[j] > a[j+1]) { // 交換
   int tmp = a[j];
   a[j] = a[j+1];
   a[j+1] = tmp;
   flag = true;
}

插入排序中數(shù)據(jù)的移動(dòng)操作:
if (a[j] > value) {
  a[j+1] = a[j];  // 數(shù)據(jù)移動(dòng)
} else {
  break;
}

我們把執(zhí)行一個(gè)賦值語(yǔ)句的時(shí)間粗略地計(jì)為單位時(shí)間(unit_time),然后分別用冒泡排序和插入排序?qū)ν粋€(gè)逆序度是 K 的數(shù)組進(jìn)行排序。用冒泡排序,需要 K 次交換操作,每次需要 3 個(gè)賦值語(yǔ)句,所以交換操作總耗時(shí)就是 3K 單位時(shí)間。而插入排序中數(shù)據(jù)移動(dòng)操作只需要 K 個(gè)單位時(shí)間。

這個(gè)只是我們非常理論的分析,為了實(shí)驗(yàn),針對(duì)上面的冒泡排序和插入排序的 Java 代碼,我寫(xiě)了一個(gè)性能對(duì)比測(cè)試程序,隨機(jī)生成 10000 個(gè)數(shù)組,每個(gè)數(shù)組中包含 200 個(gè)數(shù)據(jù),然后在我的機(jī)器上分別用冒泡和插入排序算法來(lái)排序,冒泡排序算法大約 700ms 才能執(zhí)行完成,而插入排序只需要 100ms 左右就能搞定!

所以,雖然冒泡排序和插入排序在時(shí)間復(fù)雜度上是一樣的,都是 O(n2),但是如果我們希望把性能優(yōu)化做到極致,那肯定首選插入排序。


以上就是這部分的內(nèi)容,希望你有所收獲。

注:本文章的主要內(nèi)容來(lái)自我對(duì)極客時(shí)間app的《數(shù)據(jù)結(jié)構(gòu)與算法之美》專(zhuān)欄的總結(jié),我大量引用了其中的代碼和截圖,如果想要了解具體內(nèi)容,可以前往極客時(shí)間

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,119評(píng)論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,382評(píng)論 3 415
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 176,038評(píng)論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 62,853評(píng)論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,616評(píng)論 6 408
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 55,112評(píng)論 1 323
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,192評(píng)論 3 441
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 42,355評(píng)論 0 288
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,869評(píng)論 1 334
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,727評(píng)論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,928評(píng)論 1 369
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,467評(píng)論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,165評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 34,570評(píng)論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 35,813評(píng)論 1 282
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,585評(píng)論 3 390
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,892評(píng)論 2 372