Introduction
作為科班出身的程序員,算法還是得懂一點點的。------佚名(我)。
動態規劃是一個看起來很高大上的名字,讓人一聽就很想知道這到底是個啥,所以我常常需要跟身邊好奇的朋友們解釋一下。成功的讓朋友們理解了動態規劃的基本思想后,我決定寫一篇博客來幫助更多好奇的人??。
動態規劃既是一種數學優化方法,也是一種計算機編程方法, 該方法由理查德·貝爾曼于20世紀50年代開發,并已在航空航天工程和經濟學等多個領域得到應用。
本文將以計算斐波那契數和爬樓梯問題為例,描述記憶化搜索及動態規劃的基本思想,使讀者對動態規劃有一個基本的理解。
Top-down Approach
斐波那契數列是一個人稱“兔子數列”的數列,形如1,1,2,3,5,......從數列的第n(n >= 3)個數開始,第n個數的值為第n-1和第n-2個數的和。由于斐波那契數列非常的簡單直觀,它常被用作講解記憶化搜索思想的例子。
在一個斐波那契額數列中,給定任意索引n, 如何求該位置的斐波那契數呢?最簡單的方法,用遞歸:
private static int fibonacci(int n) {
if (n == 1 || n == 2) {
return 1;
} else {
return fibonacci(n - 1) + fibonacci(n - 2);
}
}
這個算法的時間復雜度是怎么樣的呢,直觀的來看可能看不出來,如果將遞歸調用使用樹來進行表示的話:
可以發現一共進行了n層的調用,每往下走一層,節點數翻一倍(當然這棵二叉樹不是滿的,不論是國內定義的還是國外定義的滿),這表示這個算法的時間復雜度達到了指數級別。
仔細觀察遞歸樹我們可以發現,這棵樹中有很多重復的節點,或許我們可以使用緩存來減少遞歸調用,比如,使用某種數據結構記錄n-2的值:
public class Main {
private static int[] memoryTable;
public static void main(String[] args) {
int n = 0;
memoryTable = new int[n + 1];
if (n >= 1) memoryTable[1] = 1;
if (n >= 2) memoryTable[2] = 1;
System.out.println("n's Fibonacci: " + fibonacci(n));
}
private static int fibonacci(int n) {
if (n <= 0) {
return -1;
}
if (memoryTable[n] == 0) {
memoryTable[n] = fibonacci(n - 1) + fibonacci(n - 2);
}
return memoryTable[n];
}
}
那么,根節點的右邊那個子樹就可以直接被省略掉,遞歸樹就變成了這樣:
使用一個大小為n + 1的數組來緩存計算過了的值犧牲了O(n)的空間(通常來說完全可以接受),算法被優化到了線性時間復雜度。這種存儲已計算值的方法被稱為“ memoization”。在Top-down approach里我們自頂向下的將一個問題分解成子問題并逐個求解,通過記錄子問題的解來進行優化。
Bottom-up Approach
給定一個樓梯,你可以一次爬一階或者一次爬兩階,但是每一次離開第n階的時候需要花費cost[n]的體力,求如何花費最少的體力爬到頂,你可以從第一階或者第二階開始網上爬。比如[30, 20, 60]?;ㄙM體力最少的方式就是從第二階往上爬一步,共耗費20體力。通過舉例分析我們可以發現這個問題有這樣的幾個特性:
1.該問題最終的最優解可以通過結合子問題的最優解來得到。在第n階的時候,我們只能從第n - 1階和第n - 2階爬上來,所以我們只需要遞歸的求解爬到第n - 1階和第n - 2階最少需要多少步,然后取其中小的那一個就能得到爬到第n階最少需要多少步。
2.嘗試遞歸的求解的時候會發現我們會不斷的計算重復的子問題。從1我們可以看出來這個問題的遞歸樹和求斐波那契數的問題的遞歸樹是一樣的,所以我們可以跟之前一樣通過用一個數組來存儲已經計算過的值來進行優化。
這個問題的第一個特性叫做“Optimal substructure”,第二個特性叫做“Overlapping sub-problems”。同時具有這兩個特性的問題才可能能夠通過動態規劃來進行求解。
通過以上分析,我們可以得出一個求解這個問題的規律:
這個規律又叫狀態轉移方程,其中dp代表離開某一階需要消耗的體力。
有了狀態轉移方程之后,我們其實可以不用寫遞歸,直接用遞推的方式從第一步推到第n步就可以得到結果:
public int minCostClimbingStairs(int[] cost) {
int[] dp = new int[cost.length];
for (int i = 0; i < cost.length; i++) {
if (i == 0 || i == 1) dp[i] = cost[i];
else dp[i] = cost[i] + Math.min(dp[i - 1], dp[i - 2]);
}
return Math.min(dp[dp.length - 1], dp[dp.length - 2]);
}
這種根據狀態轉移方程從最小的子問題開始一步一步推出最終結果的方式叫做Bottom-up Approach。
觀察代碼我們發現每一次我們在計算一個新的狀態的時候都只用前面兩個狀態,所以我們其實可以不用數組,直接用兩個變量記錄前兩個狀態的值就行了:
public int minCostClimbingStairs(int[] cost) {
int b = cost[1], c = cost[0];
for (int i = 2, a; i < cost.length; ++i, c=b, b = a) a = cost[i] + Math.min(b, c);
return Math.min(b, c);
}
我們發現Bottom-up Approach比Top-down Approach更進一步,把空間復雜度從O(n)優化到了O(1)。
Conclusion and Prospect
本文通過兩個例子對動態規劃的思想進行了一個基本描述,重點描述了實現動態規劃的Top-down Approach和Bottom-up Approach,針對具體問題進行了算法的時間復雜度和空間復雜度分析。本文還講解了適合使用動態規劃進行解法優化的問題的特性。
動態規劃的應用非常廣泛,而且具體問題可能會比較復雜,希望熟練掌握的同學可以去各大OJ找題自虐一下??。懶得找的同學可以直接試一下這道谷歌的面試題。
References
[1] Dynamic programming的維基百科
[2]Min Cost Climbing Stairs
Acknowledgments
感謝那些在看到我讀算法書的時候跑過來問我你懂動態規劃嗎或者是在聽說動態規劃后忍不住要刨根問底的好奇寶寶們,是你們引發了我的思考。