1. 分而治之
分而治之(divide and conquer,D&C)——一種著名的遞歸式問題解決方法。快速排就是一種使用D&C的排序算法。
1-1
1-2
1-3
1-4
1-5
這里重申一下D&C的工作原理:
(1) 找出簡單的基線條件;
(2) 確定如何縮小問題的規模,使其符合基線條件。D&C并非可用于解決
問題的算法,而是一種解決問題的思路。
實例代碼
# 用遞歸計算[2, 4, 6]
def sum1(list1):
if list1 == []:
return 0
return list1[0] + sum1(list1[1:])
print(sum1([2, 4, 6]))
# 用遞歸計算列表包含的元素數
def count1(list1):
if list1 == []:
return 0
return 1 + count(list1[1:])
#找出列表中最大數
def max_1(list):
if len(list) == 2: # 基線條件
return list[0] if list[0] > list[1] else list[1]
sub_max = max_1(list[1:])
return list[0] if list[0] > sub_max else sub_max
print(max_1([2, 3, 5, 7]))
# 注意 : 編寫涉及數組的遞歸函數時,基線條件通常是數組為空或只包含一個元素。陷入困境時,請檢查基線條件是不是這樣的。
2.快速排序
快速排序是一種常用的排序算法,比選擇排序快得多。例如,C語言標準庫中的函數qsort實現的就是快速排序??焖倥判蛞彩褂昧薉&C。
如何對包含三個元素的數組進行排序了,步驟如下。
(1) 選擇基準值(pivot)。
(2) 將數組分成兩個子數組:小于基準值的元素和大于基準值的元素。
(3) 對這兩個子數組進行快速排序。
代碼實現
def quicksort(array):
if len(array) < 2:
return array # 基線條件:空或只包含一個元素的數組是“有序”的
else:
pivot = array[0] # 遞歸條件
# 由所有小于基準值的元素組成的子數組
less = [i for i in array[1:] if i <= pivot]
# 由所有大于基準值的元素組成的子數組
greater = [i for i in array[1:] if i > pivot]
return quicksort(less) + [pivot] + quicksort(greater)
print(quicksort([3, -1, 9, 7]))
3. 再談大O表示法
快速排序的獨特之處在于,其速度取決于選擇的基準值。
在討論快速排序的運行時間前,我們再來看看最常見的大O運行時間。
image.png
還有一種名為合并排序(merge sort)的排序算法,其運行時間為O(n log n),比選擇排序快得多!快速排序的情況比較棘手,在最糟情況下,其運行時間為O(n2)。與選擇排序一樣慢!但這是最糟情況。在平均情況下,快速排序的運行時間為O(n log n)。
你可能會有如下疑問:
- 這里說的最糟情況和平均情況是什么意思呢?
- 若快速排序在平均情況下的運行時間為O(n log n),而合并排序的運行時間總是O(n log n),為何不使用合并排序?它不是更快嗎?
4. 比較合并排序和快速排序
4-1
這兩個函數都迭代整個列表一次,因此它們的運行時間都為O(n)。你認為哪個函數的速度更快呢?
我認為print_items要快得多,因為它沒有在每次打印元素前都暫停1秒鐘。因此,雖然使用大O表示法表示時,這兩個函數的速度相同,但實際上print_items的速度更快。
在大O表示法O(n)中,n實際上指的是這樣的。
4-2
c是算法所需的固定時間量,被稱為常量。
例如,print_ items所需的時間可能是10毫秒 *n,而print_items2所需的時間為1秒 * n。通常不考慮這個常量,因為如果兩種算法的大O運行時間不同,這種常量將無關緊要。
就拿二分查找和簡單查找來舉例說明。假設這兩種算法的運行時間包含如下常量。
4-3
你可能認為,簡單查找的常量為10毫秒,而二分查找的常量為1秒,因此簡單查找的速度要快得多?,F在假設你要在包含40億個元素的列表中查找,所需時間將如下。
4-4
正如你看到的,二分查找的速度還是快得多,常量根本沒有什么影響。
但有時候,常量的影響可能很大,對快速查找和合并查找來說就是如此??焖俨檎业某A勘群喜⒉檎倚。虼巳绻鼈兊倪\行時間都為O(n log n),快速查找的速度將更快。
實際上,快速查找的速度確實更快,因為相對于遇上最糟情況,它遇上平均情況的可能性要大得多。
此時你可能會問,何為平均情況,何為最糟情況呢?
5. 平均情況和最糟情況
5-1
5-2
- 因為你每次都將數組分成兩半,所以不需要那么多遞歸調用。你很快就到達了基線條件,因此調用棧短得多。
- 第一個示例展示的是最糟情況,而第二個示例展示的是最佳情況。在最糟情況下,棧長為O(n),而在最佳情況下,棧長為O(log n)。
小結
1. D&C將問題逐步分解。使用D&C處理列表時,基線條件很可能是空數組或只包含一個元素的數組。
2. 實現快速排序時,請隨機地選擇用作基準值的元素。快速排序的平均運行時間為O(n log n)。
3. 大O表示法中的常量有時候事關重大,這就是快速排序比合并排序快的原因所在。
4. 比較簡單查找和二分查找時,常量幾乎無關緊要,因為列表很長時,O(log n)的速度比O(n)
快得多。