快速排序和BFPRT算法的孽緣 2019-10-17(未經(jīng)允許禁止轉(zhuǎn)載)

快速排序

從名字可以看出是個(gè)速度很快的排序。快排說穿了就是確定主元的正確位置的過程,其余元素只關(guān)注分布是否正確,而不關(guān)注位置是否正確。

快排的實(shí)現(xiàn)原理:

快排利用雙指針實(shí)現(xiàn)
首先確定一個(gè)主元(隨機(jī)選擇,但一般選擇數(shù)組第一個(gè)元素;實(shí)際上快排不關(guān)心如何選取主元,但主元的選擇確實(shí)關(guān)乎性能),然后low 、high指針分別指向頭尾,從high開始,判斷high指向的元素是否小于主元,若小于,則將該元素的值賦給low指向的位置(將小于主元的元素丟到數(shù)組左邊),同時(shí)low向后移動(dòng)一個(gè)單位,判斷l(xiāng)ow指向的元素是否大于主元,若大于,則將該元素的值賦給high指向的位置(將大于主元的元素丟到數(shù)組右邊)。如此反復(fù),直到low和high指向同一位置,這就是主元的正確位置。這樣將數(shù)組掃描一輪之后,主元就確定在了正確的位置,同時(shí)主元左邊的元素都比它小,右邊的元素都比它大
結(jié)合圖解的具體過程可以參考https://blog.csdn.net/nrsc272420199/article/details/82587933

從數(shù)據(jù)結(jié)構(gòu)上理解快排的時(shí)間復(fù)雜度O(n * log n)

快排可以看成構(gòu)造一棵近似的完全二叉樹的過程。每進(jìn)行一次遞歸,樹就生長(zhǎng)一個(gè)高度。一般情況下,主元會(huì)把數(shù)組分成左右兩部分,這樣樹的高度一般為log n,除非運(yùn)氣差到家,每一次找的主元都是最小值或最大值(這樣每一個(gè)結(jié)點(diǎn)都只有左子樹或者右子樹,而非二叉)。因此一般認(rèn)為需要遞歸log n次。而每一次需要遍歷的次數(shù)都約等于n。因此快排的時(shí)間復(fù)雜度為O(n * log n)

二叉樹理解快排.png

如圖,對(duì)亂序的0-9進(jìn)行快排,快排過程形成了一棵樹。樹的每一層需要遍歷的次數(shù)都約等于n,同時(shí)可認(rèn)為遞歸了log2 N次,那么快排的時(shí)間復(fù)雜度為O(n * log n)

快排的核心代碼實(shí)現(xiàn)如下

def fastSort(self, nums: List[int], low, high) -> int:
        if low < high:
            base = nums[low]
            left = low
            right = high
           # 核心代碼:3while
            while left < right:
                while left < right and nums[right] > base:
                    right -= 1            
                nums[left] = nums[right]    
                while left < right and nums[left] <= base:
                    left += 1
                nums[right] = nums[left]
            nums[left] = base
            self.fastSort(nums, left+1, high)
            self.fastSort(nums, low, left-1)
        return

BFPRT算法

目的:求一個(gè)亂序數(shù)組中第i大的元素

常規(guī)思路或者說暴力思路:
排序后直接利用i取下標(biāo)得到目標(biāo)元素。就算利用快速排序,時(shí)間復(fù)雜度也至少是N*log N

有沒有時(shí)間復(fù)雜度更小的方法?或者說,我們有沒有什么方式優(yōu)化上面的常規(guī)思路。有的

我們獲取第i大的元素,只需要保證第i大的元素位置正確,不需要對(duì)這個(gè)元素兩側(cè)的元素做具體排序。這和快排的單次操作是一致的。所以,BFPRT算法從快排中誕生了

BFPRT算法的實(shí)現(xiàn)

  • 將數(shù)組的n個(gè)元素每5個(gè)一組(取5好像是和cpu寄存器數(shù)量有關(guān)),劃分為n/5組,有多的則多余元素為一組。每組排序后取出每個(gè)組的中位數(shù)
  • 找出這些中位數(shù)的中位數(shù),定為主元(如果第一步得到偶數(shù)個(gè)中位數(shù),約定主元是較小的中位數(shù))。
  • 按主元對(duì)數(shù)組進(jìn)行劃分。假設(shè)主元是第k小的元素,那么有n-k個(gè)元素在劃分的高區(qū)
  • 如果i等于k,返回主元。如果i小于k,則在低區(qū)遞歸調(diào)用算法來找出第i小的元素。如果i大于k,則在高區(qū)遞歸查找第i-k小的元素

我們可以發(fā)現(xiàn),BFPRT算法與快速排序的區(qū)別僅僅在于主元的選取方式不同,是優(yōu)化的快排算法。BFPRT算法中,由于主元由中位數(shù)的中位數(shù)確定,因此主元更偏居中的位置,避免了快排中可能出現(xiàn)的最壞情況--即主元都在排序區(qū)間的邊界

BFPRT算法,作為優(yōu)化的快排,是在快排構(gòu)造的近似完全二叉樹的基礎(chǔ)上進(jìn)行剪枝。它的最壞情況是,總保留7/10 * n 的那一支,剪去3/10 * n 的那一支。這樣,即使最壞的情況下,我們也不斷有3/10的一支直接被剪掉,不需要任何操作,顯然時(shí)間復(fù)雜度是比快排優(yōu)的,即優(yōu)于O(n * log n)

有人證明了BFPRT算法最差的時(shí)間復(fù)雜度也是O(n),數(shù)學(xué)感覺比較復(fù)雜,這里不展開了。。。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,572評(píng)論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,071評(píng)論 3 414
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,409評(píng)論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,569評(píng)論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,360評(píng)論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 54,895評(píng)論 1 321
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,979評(píng)論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,123評(píng)論 0 286
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,643評(píng)論 1 333
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,559評(píng)論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,742評(píng)論 1 369
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,250評(píng)論 5 356
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 43,981評(píng)論 3 346
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,363評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,622評(píng)論 1 280
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,354評(píng)論 3 390
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,707評(píng)論 2 370

推薦閱讀更多精彩內(nèi)容

  • 概述 排序有內(nèi)部排序和外部排序,內(nèi)部排序是數(shù)據(jù)記錄在內(nèi)存中進(jìn)行排序,而外部排序是因排序的數(shù)據(jù)很大,一次不能容納全部...
    蟻前閱讀 5,206評(píng)論 0 52
  • 1 初級(jí)排序算法 排序算法關(guān)注的主要是重新排列數(shù)組元素,其中每個(gè)元素都有一個(gè)主鍵。排序算法是將所有元素主鍵按某種方...
    深度沉迷學(xué)習(xí)閱讀 1,421評(píng)論 0 1
  • 1.插入排序—直接插入排序(Straight Insertion Sort) 基本思想: 將一個(gè)記錄插入到已排序好...
    依依玖玥閱讀 1,265評(píng)論 0 2
  • 概述 排序有內(nèi)部排序和外部排序,內(nèi)部排序是數(shù)據(jù)記錄在內(nèi)存中進(jìn)行排序,而外部排序是因排序的數(shù)據(jù)很大,一次不能容納全部...
    zwb_jianshu閱讀 1,175評(píng)論 0 0
  • 概述 排序有內(nèi)部排序和外部排序,內(nèi)部排序是數(shù)據(jù)記錄在內(nèi)存中進(jìn)行排序,而外部排序是因排序的數(shù)據(jù)很大,一次不能容納全部...
    printf200閱讀 775評(píng)論 0 0