作者:梅拉妮·米歇爾(Melanie Mitchell)
譯者:唐璐
原著名稱:《Complexity: A Guided Tour》
出版:湖南科學技術出版社,2011-8-1
原著出版時間:2009年
來源:下載的 mobi 版本
豆瓣評分:9.0(956人評價)
傅盛前幾天寫了一篇「傅盛讀《復雜》有感:所有現實復雜事物,是否有底層統一規律?【好書推薦】」,推薦了這本書,鑒于傅盛在互聯網閱讀圈的影響力,毫不猶豫就讀了起來,屬于繼《失控》《哥德爾、艾舍爾、巴赫——集異壁之大成》之后,讀到的第三本燒腦的書
作者 Melanie Mitchell 在維基百科上留下了一些個人信息,是一位非常活躍的學者,可以 follow:
個人頁面:http://web.cecs.pdx.edu/~mm/
Twitter:https://twitter.com/MelMitchell1
作者是 侯世達(Douglas Hofstadter) 的學生,侯世達是《哥德爾、艾舍爾、巴赫——集異壁之大成》的作者,文章這樣描述了兩人的關系:
20世紀80年代初,我大學剛剛畢業,還不是很明確今后該做些什么,我到紐約的一所中學當數學老師。這份工作的薪水很低,而紐約物價昂貴,因此我削減了不必要的開支。但我還是買了一本新出的書,作者是印第安納大學(Indiana University)的一位計算機系教授,題目有點奇怪,《哥德爾、艾舍爾、巴赫——集異璧之大成》。因為我的專業是數學,又參觀過許多博物館,所以知道哥德爾和艾舍爾是誰,而且我也喜歡古典音樂,所以對巴赫也很熟悉。但是將他們的名字放到一起作為書的標題就讓我搞不懂了,這勾起了我的好奇心。
沒想到侯世達的書改變了我的一生。從題目看不出來,書的內容是思維和意識是如何從大量簡單神經元的分散行為中涌現出來的,這類似于細胞、蟻群和免疫系統的涌現行為。這本書讓我第一次了解了復雜系統的一些主要思想。
侯世達想用類似的原理建造有智能和“自我意識”的計算機程序。這很快也成了讓我充滿激情的目標,我決定去跟侯世達研究人工智能。
問題是,我只是一個剛剛大學畢業的無名小卒,而侯世達則是獲得了普利策獎(Pulitzer Prize)和美國國家圖書獎(National Book Award)的著名暢銷書作家。我給他寫了一封信,說我想跟他讀研究生。但是我沒有收到回信(后來才知道他沒有收到那封信),因此我只好等待時機,并且學了一些AI的知識。
一年后我搬到了波士頓,換了工作,并學習了計算機課程,為我將來的事業做準備。有一天我碰巧看到侯世達將要到麻省理工學院(MIT)演講的海報。這真讓人興奮,我立刻決定前往,擠進了狂熱的書迷中(不僅僅只有我被侯世達的書改變了),希望能和他近距離接觸。我終于擠到了前面,握到了侯世達的手,還告訴他我想參與他的AI研究,希望能申請印第安納大學。他告訴我他實際上就住在波士頓,這一年他在MIT人工智能實驗室訪問。當時因為后面還有很多書迷在等著,侯世達就讓我去旁邊和他以前的一個學生詳談,轉而接待其他讀者。
我很失望,但是并沒有放棄。我設法找到了侯世達在MIT人工智能實驗室的電話號碼,并且撥了幾次。每次都是秘書接的電話,她告訴我侯世達不在,讓我有事可以留口信。我留了口信,但是沒有收到答復。
此后有一天晚上,我躺在床上琢磨該怎么辦。我突然想到,我打電話的時候都是在白天,他都不在那里。既然侯世達白天總是不在,那他什么時候會在呢?肯定是在晚上!當時已是晚上11點,不過我還是起來撥了那個熟悉的號碼。接電話的正是侯世達。
他很友好,和藹可親。我們談了一會兒,他邀請我第二天去他的辦公室談,看我能在他的研究小組里做些什么。我如約而至,然后我們談論了侯世達當時正在研究的課題——寫一個能進行類比的計算機程序。
有時候要想有所收獲,得有點斗牛犬的精神。
摘錄:
還原論是對這個世界最自然的理解方式。它是說“如果你理解了整體的各個部分,以及把這些部分‘整合’起來的機制,你就能夠理解這個整體”。只要是精神正常的人就不會反對還原論。
——侯世達(Douglas Hofstadter),《哥德爾、艾舍爾、巴赫——集異壁之大成》
還原論的計劃在許多現象面前都止步不前:天氣和氣候似乎無法還原的不可預測性;生物以及威脅它們的疾病的復雜性和適應性;社會的經濟、政治和文化行為;現代技術與通訊網絡的發展和影響;智能的本質以及用計算機實現智能的可能前景。對復雜行為如何從簡單個體的大規模組合中出現進行解釋時,混沌、系統生物學、進化經濟學和網絡理論等新學科勝過了還原論,反還原論者的口號——“整體大于部分之和”—也隨之變得越來越有影響力。
20世紀中葉,許多科學家意識到,這類現象無法被歸入單個學科,而需要在新的科學基礎之上從交叉學科的角度進行理解。一些人開始嘗試建立新的基礎,這其中包括控制論、協同學、系統科學,以及最近才出現的——復雜系統科學。
1984年,來自不同學科的24位科學家和數學家在新墨西哥州圣塔菲的高原沙漠會聚一堂,討論“科學中涌現的綜合”。他們的目標是籌劃建立一家新的研究機構,“致力于研究各種高度復雜和相互作用的系統,這些系統只有在交叉學科的背景下才能研究清楚”并“推動知識的統一和共擔責任的意識,與目前盛行的知識界的各自為政作斗爭”。就這樣,圣塔菲研究所作為復雜系統的研究中心被建立起來了。
1984年我還沒有聽說過“復雜系統”一詞,雖然頭腦中巳經有了類似的想法。我當時是密歇根大學計算機系的一年級研究生,研究方向是人工智能,也就是讓計算機像人一樣思維。事實上,我的一個目標就是理解人類如何思維—萬億個微小的腦細胞以及它們的電和化學通訊如何涌現出抽象思維、情感、創造性,甚至意識。我曾深深迷戀于物理學和還原論的目標,后來才領悟到,目前的物理學對于智能可以做的很少,即便是專門研究大腦細胞的神經科學,也無法理解思維如何從大腦活動中涌現出來。很顯然還原論者對認知的研究是誤入歧途—我們根本無法在單個神經元和突觸的層面上理解認知。
因此,雖然我以前沒有聽說過復雜系統研究,它卻很快引起了我的強烈共鳴。同時我也感到,我自己的研究領域—計算機科學—在這里可以大有作為。受研究計算的先驅們影響,我覺得計算的思想要比操作系統、編程語言、數據庫之類的東西深刻得多,計算的本質與生命和智能的內在本質有密切的關聯。我很幸運,在密歇根大學,“自然系統中的計算”是系里的核心課程,與軟件工程和編譯器設計一樣。
巴西:亞馬孫雨林。幾十萬只行軍蟻(army ant)在行進。沒有誰掌控這支軍隊,不存在指揮官。單個螞蟻幾乎沒有什么視力,也沒有多少智能,但是這些行進中的螞蟻聚集在一起組成了扇形的蟻團,一路風卷殘云,吃掉遇到的一切獵物。不能馬上吃掉的就會被蟻群帶走。在行進了一天并摧毀了足球場大小的濃密雨林中一切食物后,螞蟻會修筑夜間庇護所—由工蟻連在一起組成的球體,將幼蟻和蟻后圍在中間保護起來。天亮后,蟻球又會散成一只只螞蟻,各就各位進行白天的行軍。
專門研究螞蟻習性的生物學家弗蘭克斯(Nigel Franks)寫道,“單只行軍蟻是已知的行為最簡單的生物”,“如果將100只行軍蟻放在一個平面上,它們會不斷往外繞圈直到體力耗盡死去”。然而,如果將上百萬只放到一起,群體就會組成一個整體,形成具有所謂“集體智能(collective intelligence)”的“超生物(superorganism)”。
免疫系統是又一個例子。在免疫系統中,相對簡單的組分一起產生出包含信號傳遞和控制的復雜行為,并不斷進行適應。
同大腦一樣,不同動物的免疫系統復雜程度也各不相同,但總體上的原則是一樣的。免疫系統由許多不同的細胞組成,分布在身體各處(血液、骨髓、淋巴結等)。這些細胞在沒有中央控制的情況下一起高效地工作。
免疫系統中的主角是白細胞,也稱為淋巴細胞。白細胞能通過其細胞體上的受體識別與某種可能入侵者(比如細菌)相對應的分子。大量白細胞哨兵在血液中不停巡邏,如果被激活—也就是特定受體偶然遇到了與其匹配的入侵者——就發出警報。一旦淋巴細胞被激活,就會分泌出大量能夠識別類似入侵者的分子——抗體。這些抗體會到處去搜尋和摧毀入侵者。被激活的淋巴細胞的分裂速度也會加快,從而產生出更多后代淋巴細胞,幫助搜尋入侵者和釋放抗體。后代淋巴細胞會不斷繁衍,從而讓身體能記住入侵者特征,再次遇到這種入侵者時就能具有免疫力。
有一類細胞被稱為B細胞(B是指它們產生自骨髓,Bone marrow),它具有一種奇特的性質:B細胞與某種入侵者匹配得越好,它產生的后代細胞就越多。通過隨機變異,子細胞與母細胞會稍有不同,而這些子細胞產生后代的能力也與它們同入侵者相匹配的程度成正比。這樣就形成了達爾文自然選擇機制,B細胞變得與入侵者越來越匹配,從而產生出能極為高效地搜尋和摧毀微生物罪犯的抗體。
還有許多種類的細胞也參與了免疫反應的大合奏。T細胞(產生自胸腺,Thymus)對于調節B細胞的反應很重要。巨噬細胞四處游蕩,尋找已被抗體標記的東西,然后將其摧毀。有些細胞讓免疫能長期有效。此外系統中還有一部分是用來防止免疫系統攻擊身體的正常細胞。
亞里士多德是目前所知的最早論述運動理論的人之一,他的理論流行了1500多年。他的理論有兩個主要原理,后來發現都是錯的。首先,他認為地面上的運動與天上的不同。他認為地面上的物體在受到力推動時才會沿直線運動;沒有力,物體就會保持靜止。而在天上,行星等天體是圍繞著地球不斷做圓周運動。另外,亞里士多德認為,在地面上,不同物質組成的物體運動方式也不一樣。比如,他認為石頭落向地面是因為石頭主要是由土元素組成,而煙會上升則是因為煙是由氣元素組成。在天上也是一樣,越重的物體中的土元素越多,下落也越快。
同以前許多理論家一樣,亞里士多德在構造理論時沒有考慮實驗驗證。他的方法是用邏輯和常識引導理論;用實驗對理論進行驗證的重要性當時還沒有被認識到;亞里士多德的思想影響很大,一直統治著西方科學,直到16世紀——伽利略登上歷史舞臺。
伽利略、他之前的哥白尼以及與他同時代的開普勒是實驗和觀察科學的先驅。哥白尼提出行星不是圍繞地球而是圍繞太陽運行。(伽利略在宣揚這種觀點時受到了天主教會的強烈阻撓,最后被迫公開宣布放棄。直到1992年教會才正式承認對伽利略的迫害是錯誤的。)在16世紀初,開普勒發現行星的運行軌跡不是圓而是橢圓,他還發現了關于這種橢圓運動的幾條定律。
哥白尼和開普勒只研究了天體的運動,而伽利略則不僅研究天上的運動,也研究地面上的,他做了一些我們現在在中學物理課上會學到的實驗:單擺、沿斜面滾動的小球、自由落體、鏡面光線反射。不過伽利略可沒有我們現在使用的那些精密實驗設備,據說他通過數脈搏計算單擺的擺動周期,還在比薩斜塔上下落物體以測量重力的效應。這些經典實驗徹底改變了對運動的理解,并且直接駁斥了長期盛行的亞里士多德的觀點。與直覺不同,靜止并不是物體的自然狀態;相反,要施加力才能讓運動物體停下來。不管物體多重,在真空中下落的速度都是一樣的。最具革命性的是,地面上的運動定律居然也能解釋天上的運動。自從伽利略之后,有了實驗觀察作為基礎,科學革命的發生就不可避免了。
動力學歷史上最重要的人物是牛頓,牛頓生于伽利略死后那一年。他可以說是憑一己之力創建了動力學。為了創建動力學,他還要先發明微積分——描述運動和變化的數學。
牛頓的偉大之處在于他認識到這些定律不僅適用于地面上的物體,對天上的物體也同樣適用。勻速運動定律是伽利略首先提出來的,但是他認為只適用于地面上的物體。而牛頓則認為這條定律對行星應該也適用,并且認識到需要用力(引力)來解釋橢圓運動方向的不斷變化。牛頓的另一重要貢獻是提出了萬有引力定律:兩個物體之間的引力與兩者質量的乘積成正比,與兩者距離的平方成反比。牛頓深刻認識到這條定律適用于宇宙中一切事物,無論是行星還是蘋果,這個認識是現代科學的基石。正如他說的:“自然簡單而自足,對宏大物體的運動成立的,對微小物體也同樣成立。”
牛頓力學描繪了一幅“鐘表宇宙”的圖景:設定好初始狀態,然后就遵循著三條定律一直運行下去。數學家拉普拉斯認識到其中蘊含了可以如鐘表般精準預測的觀念:他在1814年斷言,根據牛頓定律,只要知道宇宙中所有粒子的當前位置和速度,原則上就有可能預測任何時刻的情況。在20世紀40年代計算機被發明出來之后,這種“原則上”的可能似乎有可能變成現實了。
然而,20世紀的兩個重要發現表明,拉普拉斯的精確預測的夢想,即使在原則上也是不可能的。1927年,海森堡(Werner Heisenberg)提出了量子力學中的“測不準原理”,證明不可能在準確測量粒子位置的同時,又準確測量其動量(質量乘以速度)。對于其位置知道得越多,對于其動量就知道得越少,反過來也是一樣。不過,海森堡原理還只是限制了對量子世界微觀粒子的測量,大多數人都只是覺得它挺有趣,但是對宏觀尺度上的預測——比如天氣預報——應該沒有多大影響。
然而混沌的發現給了精確預測的夢想最后一擊。混沌指的是一些系統——混沌系統——對于其初始位置和動量的測量如果有極其微小的不精確,也會導致對其的長期預測產生巨大的誤差。也就是常說的“對初始條件的敏感依賴性”。
對于一些自然系統,并沒有這個問題。如果你對初始條件的測量不是十分精確,你的預測即使不全對,也會八九不離十。例如天文學家在測量行星位置時即使誤差較大,也還是能準確預測曰食。而對初始條件的敏感依賴性指的是,如果系統是混沌的,在測量初始位置時即使只有極其微小的誤差,在預測其未來的運動時也會產生巨大的誤差。對于這樣的系統(颶風就是例子),一點點誤差,不管多小,也會導致長期預測很不精確。
這一點很不符合直覺,事實上,很長一段時間里,科學家們都認為這不可能。然而,混沌現象在很多系統中都被觀測到了,心臟紊亂、湍流、電路、水滴,還有許多其他看似無關的現象。現在混沌系統的存在已成為科學中公認的事實。
第一個明確的混沌系統的例子可能是19世紀末由法國數學家龐加萊(Henri Poincaié)給出。龐加萊是現代動力系統理論的奠基者,可能也是貢獻最大的人,大力推動了牛頓力學的發展。龐加萊在試圖解決一個比預測颶風簡單得多的問題時發現了對初始條件的敏感依賴性。他試圖解決的是所謂的三體問題(three-body problem):用牛頓定律預測通過引力相互作用的三個物體的長期運動。牛頓已經解決了二體問題。但沒想到三體問題要復雜得多。在向瑞典國王表示敬意的一次數學競賽中,龐加萊將其解決了。競賽主辦方提供2500瑞典克朗獎勵解決“多體”問題:用牛頓定律預測任意多個相互吸引的物體的未來運動。提出這個問題是為了確定太陽系是否穩定,行星是會維持還是會偏離目前的軌道?龐加萊想先試著解決三體問題。
他并沒有完全成功——這個問題實在太復雜了。但是他的嘗試很精彩,所以最后還是贏得了獎金。牛頓發明了微積分,而龐加萊為了解決這個問題也創建了一個新的數學分支—代數拓撲(algebraic topology)。拓撲學是幾何學的擴展,正是在研究三體問題的幾何結果的過程中,龐加萊發現了對初始條件的敏感依賴性。下面是他對此的總結:
如果我們能知道自然界的定律和宇宙在初始時刻的精確位置,我們就能精確預測宇宙在此后的情況。但是即便我們弄清了自然界的定律,我們也還是只能近似地知道初始狀態。如果我們能同樣近似地預測以后的狀態,這也夠了,我們也就能說現象是可以預測的,而且受到定律的約束。但并不總是這樣,初始條件的細微差別有可能會導致最終現象的極大不同。前者的微小誤差會導致后者的巨大誤差。預測變得不可能……
換句話說,即便我們完全知道了運動定律,兩組不同的初始條件(在這里是物體的初始位置、質量和速度),即使差別很小,有時候也會導致系統隨后的運動極為不同。龐加萊在三體問題中發現了一個這樣的例子。
直到電子計算機出現之后,科學界才開始認識這類現象的意義。龐加萊遠遠超越了他所處的時代,他意識到對初始條件的敏感依賴性將會阻礙對天氣的長期預報。他的遠見于1963年被證實,氣象學家洛倫茲(Edward Lorenz)發現,即使是很簡單的計算機氣象模型,也會有對初始條件的敏感依賴性。現在雖然有了高度復雜的氣象計算模型,天氣預報也最多只能做到大致準確預測一個星期。目前還不清楚這個局限是否是天氣的混沌本質導致的,也不知道通過收集更多數據和構造更好的模型,可以將這個局限推進多遠。
數學生物學家梅對這些驚人的特性進行了總結,與龐加萊遙相呼應:
簡單的確定性方程(1)(即邏輯斯蒂映射)能產生類似于隨機嗓聲的確定性軌道,這個事實有著讓人困擾的實際含義。例如,這就意味著種群調查數據中那種明顯的不穩定波動不一定表明環境的變化莫測或是采樣有錯誤:它們有可能就是像方程(1)這樣完全確定性的種群數量變化關系所導致的……另外,還可以看到,在混沌中,不管初始條件有多接近,在足夠長的時間之后,它們的軌道還是會相互分開。這意味著,即使我們的模型很簡單,所有的參數也都完全確定,長期預測也仍然是不可能的。
簡而言之,系統存在混沌也就意味著,拉普拉斯式的完美預測不僅在實踐中無法做到,在原則上也是不可能的,因為我們永遠也無法知道X。小數點后的無窮多位數值。這是一個非常深刻的負面結論,它與量子力學一起,摧毀了19世紀以來的樂觀心態—認為牛頓式宇宙就像鐘表一樣沿著可預測的路徑運行。
但是對邏輯斯蒂映射的研究是不是也會產生一些正面作用呢?對于試圖發現隨時間變化的系統的一般原則的動力系統理論,它能有所助益嗎?事實上,對邏輯斯蒂等映射的深入研究也已經得到了同樣深刻的正面結果——從中發現了混沌系統的普遍特征。
英國物理學家麥克斯韋(James Clerk Maxwell)提出了著名的麥克斯韋方程,從而統一了電學和磁學。他是當時世界上最受尊敬的科學家,也是古往今來最偉大的科學家之一。
1871年,麥克斯韋在《論熱能》(Theory of Heat)一書中提出了一個難題,題為“熱力學第二定律的局限”。麥克斯韋假設有一個箱子被一塊板子隔成兩部分,板子上有一個活門,如圖3.1所示。活門有一個“小妖”把守,小妖能測量氣體分子的速度。對于右邊來的分子,如果速度快,他就打開門讓其通過,速度慢就關上門不讓通過。對于左邊來的分子,則速度慢的就讓其通過,速度快的就不讓通過。一段時間以后,箱子左邊分子的速度就會很快,右邊則會很慢,這樣熵就減少了。
根據第二定律,要減少熵就得做功。小妖又做了什么功呢?當然,他開門關門無數次。但是麥克斯韋假設了小妖使用的門既無質量也無摩擦,因此開門關門要不了多少功,可以忽略不計(對這種門提出了可行的設計)。那么小妖還做了其他的功嗎?
麥克斯韋的回答是沒有:“熱系統(左邊)變得更熱,冷系統(右邊)變得更冷,然而卻沒有做功,只有一個眼光銳利、手腳麻利的智能生物在工作。”
為什么沒做功,熵也減少了呢?這豈不是違反了熱力學第二定律?麥克斯韋的小妖難住了19世紀末和20世紀初許多杰出的頭腦。麥克斯韋自己的回答是第二定律(熵隨時間增加)根本就不是一條定律,而是在大量分子情形下成立的統計效應,在個體分子尺度上并不必然成立。
但是當時和后來許多物理學家都強烈反對。他們認為第二定律絕對沒錯,肯定是那個小妖玩了貓膩。既然熵減少了,肯定以某種難以確定的方式做了功,否則不可能。
很多人都想解決這個悖論,但是直到60年后這個問題才被圓滿解決。1929年,突破出現了:杰出的匈牙利物理學家西拉德(Leo Szilard)提出,做功的是小妖的“智能”,更精確地說,是通過測量獲取信息的行為。
西拉德是第一個將熵與信息聯系起來的人,這個關聯后來成了信息論的基礎和復雜系統的關鍵思想。西拉德寫了一篇題為“熱力學系統在智能生物的干預下的熵的減少”的著名論文,文中西拉德認為測量過程(小妖要通過測量獲取“比特”信息,比如趨近的分子速度是慢是快)需要能量,因此必然會產生一定的熵,數量不少于分子變得有序而減少的熵。這樣由箱子、分子和小妖組成的整個系統就仍然遵守熱力學第二定律。
西拉德在此過程中也順便定義了信息比特的概念——通過回答是/否(對小妖是“快/慢”)獲得的信息。他可能是第一個這樣做的人。
現在回過頭來看,獲取信息需要額外做功可能是很顯然的事情,起碼不那么讓人吃驚。但是在麥克斯韋的時代,甚至到60年后西拉德寫文章的時候,人們仍然強烈傾向于將物理和精神過程視為完全獨立。也許正是這種牢固的直覺使得像麥克斯韋這樣睿智的人也沒有看出小妖的“智能”或“觀測能力”對箱子-分子-小妖系統的熱力學有影響。直到20世紀發現“觀察者”在量子力學中扮演了關鍵角色之后,信息與物理的關系才開始被理解。
西拉德的理論后來由法國物理學家布里淵(Leon Brillouin)和伽柏(Denis Gabor)進行了擴展和一般化。此后許多科學家都認為,布里淵的理論徹底揭示了測量是如何產生熵,從而終結了小妖。
然而,事情還沒有結束。在西拉德的論文發表50年后,西拉德和布里淵的論證都被發現有一些漏洞。20世紀80年代,數學家班尼特(Charles Bennett)證明,有非常巧妙的方式可以觀察和記住信息——對小妖來說,也就是弄清分子是快是慢——而不用增加熵。班尼特的證明成了可逆計算(reversible computing)的基礎,他證明在理論上可以進行任何計算而不用耗費能量。班尼特的發現似乎意味著小妖又回來了,因為測量可以不用耗費能量。不過,班尼特認為,物理學家蘭道(Rolf Landauer)在20世紀60年代做出的一項發現可以挽救熱力學第二定律:并不是測量行為,而是擦除記憶的行為,必然會增加熵。擦除記憶是不可逆的;如果被擦除了,那么一旦信息沒有了,不進行額外的測量就無法恢復。班尼特證明,小妖如果要工作,到一定的時候就必須擦除記憶,如果這樣,擦除的動作就會產生熱,增加的熵剛好抵消小妖對分子進行分選而減少的熵。
蘭道和班尼特彌補了西拉德論證的漏洞,但思路仍然是一致的:小妖測量和進行判斷時(必然會進行擦除),不可避免地會增加熵,從而第二定律仍然成立。(不過仍然有一些物理學家不認可蘭道和班尼特的論證,小妖的問題依然存在爭議。)
麥克斯韋發明小妖是將其作為一個簡單的思維實驗,以證明熱力學第二定律不是一條定律,而只是統計效應。然而,同其他許多優秀的思維實驗一樣,小妖的影響很深遠;對小妖難題的解決成為兩個新領域的基礎——信息論和信息物理學。
在前面我將“熵”定義為對無法做功而只能轉換成熱的能量的測量。這個熵的概念最初是由克勞休斯(Rudolph Clausius)于1865年定義的。在克勞休斯的年代,熱被認為是某種可以從一個系統流向另一個系統的流質,而溫度則是系統受熱流影響的一種屬性。
此后數十年里,科學界開始出現一種新的關于熱的觀念:系統是由分子組成,而熱則是分子運動——或者說動能——的產物。這種新觀念主要歸功于玻爾茲曼(Ludwig Boltzmann),他創建了一門新學科,現在被稱為統計力學。
統計力學認為宏觀尺度上的屬性(例如熱)是由微觀屬性產生(例如無數分子的運動)。比如,想象房間里充滿了運動的空氣分子。經典力學分析是確定每個分子的位置和速度,以及作用在分子上的力,并根據這些確定每個分子未來的位置和速度。當然,如果有500億億個分子,要解出來可得花不少時間—實際上是完全不可能的,并且根據量子力學,在原則上也不可能。而統計力學的方法則不關心各個分子具體的位置、速度以及未來的變化,而是去預測大量分子整體上的平均位置和速度。
簡而言之,經典力學試圖用牛頓定律分析所有的單個微觀對象(例如分子)。而熱力學則只給出了宏觀現象——熱、能量和熵——的定律,沒有說明微觀分子是這些宏觀現象的源頭。統計力學則在兩個極端之間搭建了一座橋梁,解釋了宏觀現象是如何從對大量微觀對象的整體上的統計產生。
統計方法有一個問題——它只給出系統的可能行為。例如,如果房間里的空氣分子隨機運動,那么它們將極有可能擴散到整個房間,從而保證我們所有人都可以呼吸到空氣。我們預計會這樣,并且生命維系于此,而且也從沒有失敗。然而,根據統計力學,由于分子是隨機運動,這樣就存在一個極小的概率在某個時間分子都飛到一個角落里。然后那個角落里的人會被高氣壓壓死,而我們其他人則會窒息而死。不過據我所知,這樣的事情還從未發生過。這并不違反牛頓定律,只是極為不可能。玻爾茲曼認為,如果有足夠多的微觀對象進行平均,他的統計方法就幾乎一直都能給出正確答案,而事實上也確實如此。但是在玻爾茲曼的時代,大部分物理學家都只接受絕對正確的物理定律,“幾乎一直”正確的物理定律是不會被接受的。此外,玻爾茲曼認為存在分子和原子這樣的微觀對象也讓他的同行們感到不可理喻。玻爾茲曼于1906年自殺離世,有人認為這是大多數科學家對他的思想排斥所導致的。他死后不久,他的思想就被廣泛認同了;現在他被認為是歷史上最偉大的科學家之一。
科學上許多最基本的思想都是由技術進步促進。19世紀的熱力學研究就是由改進蒸汽機時遇到的挑戰驅使。而數學家香農(Claude Shannon)發展信息論也是受20世紀的通訊革命推動,尤其是電報和電話的發展。1940年,香農改進了玻爾茲曼的思想,以適用于更為抽象的通訊領域。香農在美國電話電報公司(AT&T)貝爾實驗室工作。AT&T當時面臨的最重要的問題就是如何通過電報和電話線快速有效地傳送信息。
香農從數學上解決了這個問題,從而開創了一個新領域—信息論。1948年,香農發表了論文“通訊的數學理論”,在文中香農給出了信息的一個狹義定義,并且證明了一個非常重要的定理,定理給出了通過給定通道傳輸的最大可能傳輸率,無論信道是否存在噪聲。這個最大傳輸率就是信道容量(channel capacity)。
香農的信息定義中有一個發送者向接收者發送信息。例如圖3.7有兩個發送者通過電話與接收者交談的例子。發送者說的每個詞都是香農意義上的信息。電話并不理解所說的詞,而只是傳送編碼聲音的電脈沖,香農對信息的定義也完全忽略信息的意義,而只考慮發送者向接收者發送信息的速度。
香農問:“發送者傳送了多少信息給接收者呢?”與玻爾茲曼的思想類似,香農將宏觀狀態(這里是發送者)的信息定義為可以由發送者發送的可能微觀狀態(可能信息的集合)的數量的函數。我的兒子尼可還在瞞跚學步時,我會讓他通過電話同奶奶講話。他喜歡講電話,不過只會說一個字——“da”。他發給奶奶的信息是“da da da da da……”換句話說,尼可的宏觀狀態只有一種可能的微觀狀態(“da”序列),因此雖然這個宏觀狀態很有趣,信息量卻為零。奶奶知道聽到的會是什么。我的兒子杰克兩歲了,他也喜歡講電話,不過他的詞匯量大些,因此會告訴奶奶他干的事情,經常讓奶奶對他講的話吃驚。顯然發送者杰克的信息量要多得多,因為可能的微觀狀態——即各種不同的信息組成的集合——要多得多。
香農對信息量的定義與玻爾茲曼對熵更一般化的定義幾乎一樣。在1948年的經典文章中,香農用信息源的熵定義信息量(這個熵的概念通常被稱為香農熵,以區別于玻爾茲曼給出的熵的定義)。
19世紀時,數學和科學被認為無所不能。希爾伯特和他的追隨者認為他們即將實現萊布尼茨的夢想:發現自動判定命題的方法,并證明數學無所不能。類似的,在第2章我們看到,拉普拉斯相信,根據牛頓定律,科學家原則上能預測宇宙將發生的一切。
然而,20世紀早期在數學和物理上的發現表明,這個無所不能實際上并不存在。量子力學和混沌摧垮了精確預測的希望,哥德爾和圖靈的結果則摧垮了數學和計算無所不能的希望。然而,圖靈對停機問題的解決卻為另一個偉大發現——可編程電子計算機——開辟了舞臺,計算機后來給科學研究以及我們的生活帶來了翻天覆地的變化。
在20世紀30年代發表他們的成果之后,圖靈和哥德爾的命運迥異,同當時許多人一樣,在希特勒和第三帝國出現后,他們的命運被徹底改變了。哥德爾受到時斷時續的精神問題困擾,他在維也納一直待到1940年,最后為了不被征入德軍服兵役,移民到美國。(據他的傳記作者王浩說,在準備美國入籍面試時,他發現了美國憲法中的不一致性,結果他的朋友愛因斯坦在陪他去面試時只好不斷同他聊天,以引開他的注意力。)
哥德爾和愛因斯坦一樣,加入了聲名卓著的普林斯頓高等研究院,并繼續在數理邏輯領域作出重要貢獻。然而,在20世紀60-70年代,他的精神狀況不斷惡化。去世前,他得了嚴重的妄想癥,認為有人要毒害他。他拒絕進食,最終死于饑餓。
圖靈也訪問了高等研究院并得到了職位,但他決定回到英國。在第二次世界大戰中,他加入了英國絕密的破解德軍謎團密碼(Enigma)的計劃。以他的邏輯和統計學專長,再加上在電子計算上的成就,圖靈領導研發了破譯機器,最終幾乎破解了所有使用謎團密碼的情報。這使得英國在同德國作戰時具有很大優勢,并成為最終戰勝納粹的重要因素。
戰后,圖靈在曼徹斯特大學參與研制了第一批可編程電子計算機(基于通用圖靈機的思想)。此后他的興趣又回到探索大腦和身體的“計算”原理,他研究了神經學和生理學,并在發育生物學理論上做了有影響的工作,還探討了智能計算機的可能性。然而他的生活與當時的社會道德習慣相抵觸:他沒有隱瞞自己的同性戀傾向。在20世紀50年代的英國同性戀是非法的,圖靈因為與男性發生關系而被逮捕,并被判決接受藥物“治療”以改變他的“狀況”。他也被取消了接觸政府機密的權力。這些事件最終導致他在1954年自殺。有意思的是,哥德爾是因為怕被下毒把自己餓死,圖靈則是吃了有氰化物的蘋果把自己毒死。圖靈死的時候年僅41歲。
1831年,在選擇自己未來職業的時候(選擇似乎包括鄉村醫生和鄉村牧師),達爾文得到一個工作機會,在小獵犬號測繪船(H.M.S.Beagle)上擔任“博物學家”和“陪船長吃飯”。船長是一位“紳士”,旅途覺得寂寞,又不想和階層低下的船員一起吃飯,就想找個紳士陪他吃飯。結果找到了達爾文。
達爾文在小獵犬號上待了將近5年(1831-1836),大部分時候在南非,除了陪船長吃飯,他還收集了許多植物、動物和化石標本,并且不斷閱讀、思考、寫作。幸運的是他寫了很多信,還保存了很多筆記,里面有很多觀察、思考和閱讀筆記。此后一生中他一直詳細記錄自己的思想。達爾文如果活到現在,肯定會熱衷于寫博客。
在隨小獵犬號航行期間和之后,達爾文從多個學科的書籍和文章中汲取了大量思想。他信奉萊爾(Charles Lyell)的《地質學原理》(Principles of Geology,1830),認為各種地貌(山脈、峽谷和巖石的形成)是受風力、水流、火山爆發、地震等因素不斷侵蝕而成,而不是圣經中所說的諾亞洪水這樣的災難造成的。這種漸進主義觀點——微小因素日積月累也會有很大的影響——不容于當時的原教旨主義者,但是萊爾的證據讓達爾文很信服,特別是航海經歷讓他看到了各種地質作用。
馬爾薩斯(Thomas Malthus)的《人口學原理》(Essay on the Principle ofPopulation,1798)讓達爾文意識到群體數量的增長會導致對食物等資源的競爭。馬爾薩斯論述的是人類數量的增長,達爾文卻吸收其思想用來解釋所有生物不斷“為生存而斗爭”,從而導致進化。
達爾文還讀了亞當·斯密的自由市場圣經——《國富論》(The Wealth ofNations,1776)。他通過這本書了解了斯密的經濟的看不見的手的思想,大量個體只關心自己的私利,卻使得整個社會的利益最大化。
另外,留下來的筆記還表明,達爾文當時已經意識到自己的理論對于人類地位的哲學意義。他寫道:“柏拉圖……在《斐多篇》(Phaed)中說我們‘與生俱來的思想’不可能來自經驗,而是來自前世——但前世可能是猴子。”
競爭不僅是進化的中心要素,也是科學研究本身的主要動力。達爾文對發表成果的猶豫很快就消失了,因為他發現他可能會被搶先。1858年,達爾文收到了英國另一位自然學家華萊士(Alfred Russell Wallace)的手稿,《論變種無限地偏離原始類型的傾向》(On the Tendency of Varieties to Depart Indefinitelyfrom the Original Type)。達爾文驚奇地發現華萊士也獨立得出了自然選擇導致進化的思想。達爾文在給萊爾的信中表達了自己的擔心:“我的所有成果,不管意義有多大,也許都得不到承認。”然而,他還是慷慨地幫助華萊士發表了他的論文,只是要求自己的成果也能同時發表,雖然他擔心這個要求“有些可鄙”。
萊爾也認為,達爾文和華萊士應當同時發表他們的成果,以解決優先權問題。這個合作成果于1858年夏在林奈學會(Linnean Society)宣讀。1859年底,達爾文出版了400多頁的《物種起源》。
但優先權問題還是沒有徹底解決。達爾文不知道,早在《起源》出版之前28年,一位不為人知的蘇格蘭人馬修(Patrick Matthew)出版了一本標題和內容都很晦澀的書,《論海軍木材和樹木栽培》(On Naval Timber and Arboriculture),書的附錄中他提出了與達爾文的自然選擇非常類似的思想。1860年,馬修在雜志《加蒂納記事》(Gardiner's Chronicle)上看到了達爾文的思想,就給雜志寫了一封信申明他有優先權。達爾文心里也非常不安,他在信中回應道:“我完全承認馬修先生多年前就提出了我對于物種起源提出的自然選擇解釋……我只能向馬修先生道歉,因為我完全不知道他的著作。”
那么自然選擇的思想到底該歸功于誰呢?顯然,這又是一個同時獨立發現的例子,一旦思想的時機成熟,就必然會有人想到。達爾文的同行赫胥黎(Thomas Huxley)就曾責罵自己:“真蠢,我怎么沒有想到!”
堿基的配對特性,A配T,C配G,也是DNA復制的關鍵。在有絲分裂開始時,酶會將DNA的雙螺旋解開。然后其他酶會讀取兩條DNA上的核苷酸,并將新的核苷酸附到上面(在細胞中新的核苷酸會不斷被制造出來),A連到T,C連到G。這樣,DNA就被復制成了兩個新的DNA雙螺旋,每個新細胞都得到一份完整的DNA拷貝。細胞中有許多機制保證復制正常進行,但是偶爾也會發生錯誤(堿基配對錯誤,大約1000億個核苷酸產生一次),從而導致變異。
馮·諾依曼最初的自復制自動機(馮·諾依曼只給出了數學描述,并沒有真的建造)也是既包含有自我復制的程序也包含解釋自身程序的機制。因此是完整的自我復制機器。這也解釋了為何馮·諾依曼的構想要比我的自我復制程序復雜得多。馮·諾依曼提出構想是在20世紀50年代,當時生物自我復制的機制還沒有被完全理解,這更加表明了馮·諾依曼天才的洞察力。馮·諾依曼對自動機的設計以及其正確性的數學證明在他去世前已基本完成。1957年,他因癌癥去世,年僅53歲,可能是因為在參與研制原子彈時受到了核輻射。馮·諾依曼的同事巴克斯(Arthur Burks)完成了最后的證明。1966年,巴克斯將全部成果編輯成為《自復制自動機理論》(Theory of Self-Reproducing Automata)~-書出版。馮·諾依曼設計的自復制自動機是人工生命科學真正的先驅之一,從原則上證明了自我復制的機器的確是可能的,并且提供了自我復制的“邏輯”,后來證明其與生物的自我復制機制驚人的相似。
馮·諾依曼認識到這個結論具有深遠的影響。他擔心公眾對這種自復制機器的反應,不愿看到大眾媒介報道“未來這種自復制機器的可能性”。可惜好景不長。1999年,計算機科學家庫茲韋爾(Ray Kurzweil)和莫拉韋茨(Hans Moravec)在《靈魂機器的時代》(The Age of Spiritual Machines)和《機器人》(Robot)這兩本書中鼓吹了這種具有超級智能并且能自我復制的機器人的可能性,他們認為這種機器人在不遠的將來就會被制造出來,他們的書并非虛構,但是相當牽強。2000年,Sun公司的創始人之一喬伊(BillJoy)在《連線》(Wired)雜志上發表了一篇后來很有名的文章——《為何未來不需要我們》,文中描述了自復制納米機器的可能性。目前這些預言都還沒有應驗。不過復雜的自復制機器也許很快就會成為現實:康奈爾大學的機器人專家利普森(Hod Lipson)和他的同事已經制造出了一些簡單的自復制機器人。
除了馮·諾依曼,匈牙利還有一批年齡相仿的科學家后來都成了舉世聞名的學者,這被稱為“匈牙利現象”。這個群體中包括西拉德,第3章我們已經見過他,物理學家維格納(Eugene Wigner)、特勒(Edward Teller)和伽柏,數學家厄多斯(Paul Edos)、科蒙尼(John Kemeny)和拉克斯(Peter Lax)。許多人都奇怪為何當時會聚集這么多耀眼的天才。據馮·諾依曼的傳記作者麥克雷(Norman MacRae)說,“匈牙利6位諾貝爾獎獲得者有5位是生于1875年到1905年間的猶太人,有一次諾貝爾獎得主維格納被問到,為何在他那一代匈牙利涌現了這么多天才,結果他回答說,他不明白這個問題,匈牙利當時只出現過一位天才,那就是馮·諾依曼。”
第1代有200個隨機生成的策略,可以想象它們都很糟糕。最好的策略適應度才-81,最糟糕的到了-825。(可能這么低嗎?)
我用幾個任務測試了一下羅比采用這一代中最糟糕的策略時的行為。在一些環境設定中,羅比移動了幾步就卡住了,之后在整個任務過程中都停止不動。在一些情況下,則不停地撞墻,直到任務結束。有時候則一直不斷地去撿罐子,雖然當前位置上沒有罐子。顯然這些策略在進化過程中很快就會被淘汰掉。
我也測試了一下這一代中最好的策略,還是很糟糕,比最差的好不了多少。不過比起來它還是有兩個優點:不那么容易一直撞墻了,而且偶爾碰到罐子的時候還能把罐子撿起來!作為這一代中最好的策略,它有很大的機會被選中用來繁殖!一旦被選中,它的子代就會繼承這些優點(同時也會繼承許多缺點)。
到第10代,群體中最佳策略的適應度已經變成正數了。這個策略經常會停滯不動,有時候還會在兩個格子之間不停地來回移動。但基本不怎么撞墻,同第1代的前輩一樣,偶爾也會撿罐子。
GA就這樣不斷改進最佳適應度。到200代時,最好的策略已經具有向罐子移動并撿起罐子這個最重要的能力—至少大部分時候是這樣。不過,如果周圍沒有罐子,它也會浪費很多時間用來隨機游走,這一點同M相似。到250代時,做得已經和M一樣好了;等到了400代,適應度超過了400分,這時的策略如果少做一些隨機移動,就能和G一樣好。到800代時,GA發現了將罐子留作相鄰罐子的路標的技巧,到900代時,沿著圍墻轉的技巧就基本完善了,到1000代時會進一步做些修正。
雖然羅比機器人的例子相當簡單,但它與實際應用的GA區別已不是很大。同羅比的例子一樣,在實際應用中,GA經常能演化出有用的答案,但是很難看出為什么會有用。這是因為GA找到的好答案與人類想出的相當不同。美國國家航空航天局(NASA)的遺傳算法專家羅恩(Jason Lohn)曾這樣說:“進化算法是探索設計死角的偉大工具。你向具有25年工業經驗的專家展示(你的設計),他們會說‘哦,這個真的能工作?’……我們經常發現進化出來的設計完全無法理解。”
羅恩的設計也許是無法理解,但的確能工作。2004年,羅恩和他的同事因為用GA設計出了新的NASA航天器天線被授予“人類競爭”獎(Human Competitive Award),這表明GA的設計改進了人類工程師的設計。
1998年,庫克在圣塔菲研究所的一次會議上作報告,我第一次知道了他的結果。我當時的反應同我的大多數同事差不多,“太酷了!太巧妙了!不過沒有什么實際或科學意義。”
和生命游戲一樣,規則110也是極為簡單的確定性系統產生出無法預測的復雜行為的例子。但在實際中很難設置一個初始狀態來產生出所希望的復雜計算。而且規則110會比生命游戲更慢。
沃爾夫勒姆對這個結果的看法完全不同。在2002年出版的《一種新科學》(A New Kind of Science)中,沃爾夫勒姆將規則110的通用性視為“新的自然定律”——他提出的計算等價性原理(Principle of Computational Equivalence)——的有力證據。沃爾夫勒姆提出的這個原理包括4部分:
- 思考自然界中的過程的正確方法是將它們視為計算。
- 像規則110這樣極為簡單的規則(或“程序”)都能進行通用計算,這表明通用計算的能力在自然界中廣泛存在。
- 通用計算是自然界中計算的復雜性的上限。也就是說,自然系統或過程不可能產生出“不可計算”的行為。
- 自然界中各種過程實現的計算在復雜程度上都幾乎等價。
明白了沒有?我必須承認,很難解釋清楚這個原理的意思,沃爾夫勒姆這本1200頁的鴻篇巨著,一個主要目的就是闡釋這個原理,并說明它如何適用于各個科學領域。我通讀了這本書,但還是沒有完全明白沃爾夫勒姆的意思。不過我還是盡力解釋一下。
沃爾夫勒姆說的“自然界中的過程就是計算”指的是某種東西。在任意給定時刻,元胞自動機都在通過將其規則應用于其當前狀態來處理信息。沃爾夫勒姆認為,自然系統正是以這樣的方式運作——它們包含信息,并根據簡單規則處理這些信息。在《一種新科學》中,沃爾夫勒姆探討了量子力學、進化和發育生物學、經濟等領域,他想說明這些領域都能描述為使用簡單規則進行的計算。本質上,他的“新科學”指的是這樣的思想,宇宙和其中的萬事萬物都能用這種簡單的程序進行解釋。這就是大寫的計算,非常大。
有一天,我對8歲的兒子杰克說:“杰克,把襪子穿上。”他把襪子頂到頭上,“你看,我把襪子穿上了!”他覺得很好玩。而我則意識到他的搞怪行為說明了人類和計算機之間一個很大的區別。
“把襪子穿到頭上”的玩笑之所以好笑(至少對8歲的孩子來說是這樣),是因為它違反了我們都知道的常識:人類的大部分言辭原則上講都有些模棱兩可,但是當你和別人說話時,他們還是知道你的意思。如果我對我丈夫說:“親愛的,你知道我的鑰匙在哪里嗎?”如果他僅僅回答說:“知道”,我會很惱火——顯然我的意思是“告訴我,我的鑰匙在哪里”。當我最好的朋友說她感到在工作中寸步難行時,我回應說“心有同感”,她會知道我的意思不是說我覺得她的工作寸步難行,而是說我自己的工作。這種相互理解就是所謂的“常識”,說得更正式點是“對上下文敏感”。
20世紀80年代初,我大學剛剛畢業,還不是很明確今后該做些什么,我到紐約的一所中學當數學老師。這份工作的薪水很低,而紐約物價昂貴,因此我削減了不必要的開支。但我還是買了一本新出的書,作者是印第安納大學(Indiana University)的一位計算機系教授,題目有點奇怪,《哥德爾、艾舍爾、巴赫——集異璧之大成》。因為我的專業是數學,又參觀過許多博物館,所以知道哥德爾和艾舍爾是誰,而且我也喜歡古典音樂,所以對巴赫也很熟悉。但是將他們的名字放到一起作為書的標題就讓我搞不懂了,這勾起了我的好奇心。
沒想到侯世達的書改變了我的一生。從題目看不出來,書的內容是思維和意識是如何從大量簡單神經元的分散行為中涌現出來的,這類似于細胞、蟻群和免疫系統的涌現行為。這本書讓我第一次了解了復雜系統的一些主要思想。
侯世達想用類似的原理建造有智能和“自我意識”的計算機程序。這很快也成了讓我充滿激情的目標,我決定去跟侯世達研究人工智能。
問題是,我只是一個剛剛大學畢業的無名小卒,而侯世達則是獲得了普利策獎(Pulitzer Prize)和美國國家圖書獎(National Book Award)的著名暢銷書作家。我給他寫了一封信,說我想跟他讀研究生。但是我沒有收到回信(后來才知道他沒有收到那封信),因此我只好等待時機,并且學了一些AI的知識。
一年后我搬到了波士頓,換了工作,并學習了計算機課程,為我將來的事業做準備。有一天我碰巧看到侯世達將要到麻省理工學院(MIT)演講的海報。這真讓人興奮,我立刻決定前往,擠進了狂熱的書迷中(不僅僅只有我被侯世達的書改變了),希望能和他近距離接觸。我終于擠到了前面,握到了侯世達的手,還告訴他我想參與他的AI研究,希望能申請印第安納大學。他告訴我他實際上就住在波士頓,這一年他在MIT人工智能實驗室訪問。當時因為后面還有很多書迷在等著,侯世達就讓我去旁邊和他以前的一個學生詳談,轉而接待其他讀者。
我很失望,但是并沒有放棄。我設法找到了侯世達在MIT人工智能實驗室的電話號碼,并且撥了幾次。每次都是秘書接的電話,她告訴我侯世達不在,讓我有事可以留口信。我留了口信,但是沒有收到答復。
此后有一天晚上,我躺在床上琢磨該怎么辦。我突然想到,我打電話的時候都是在白天,他都不在那里。既然侯世達白天總是不在,那他什么時候會在呢?肯定是在晚上!當時已是晚上11點,不過我還是起來撥了那個熟悉的號碼。接電話的正是侯世達。
他很友好,和藹可親。我們談了一會兒,他邀請我第二天去他的辦公室談,看我能在他的研究小組里做些什么。我如約而至,然后我們談論了侯世達當時正在研究的課題——寫一個能進行類比的計算機程序。
有時候要想有所收獲,得有點斗牛犬的精神。
侯世達有一個天賦,他能將復雜的問題簡化,然而又留住問題的精髓。在研究類比問題時,侯世達創造一個微型世界,這個世界雖然是微型的,卻保留了問題大部分有趣的方面。微觀世界中包含在字母符號串之間進行的類比。
舉個例子,思考下面的問題:如果abc變成abd,ijk應該變成什么呢?大部分人會將變化描述為“將最右邊的字母用其后繼字母替換,”因此答案是ijl。但其他答案也有可能,比如說:
ijd(“將最右邊的字母用d替換”——就好像杰克將襪子“穿上”)
ijk(“將c用d替換;在ijk中沒有c”)
abd(“不管什么字母串’都用abd替換”)
顯然有無窮多種可能的答案,雖然可能性要小些,比如(“將c用d替換,將k用兩個x替換”),但幾乎所有人都認為ijl是最佳答案。不過這畢竟是個沒有實際意義的抽象問題,因此如果你真覺得ijd好些,我也沒法讓你相信ijl更好。但是人類似乎進化出了在現實世界中進行類比的能力,以便更好的生存和繁衍,而他們的類比能力似乎也能應用于抽象領域。這意味著幾乎所有人都會從內心同意有一個特定的抽象層次是“最合適的”,因而得出答案ijl。那些從內心會相信ijd是更好答案的人可能在進化過程中已經被淘汰了,這解釋了為什么現在這樣認為的人寥寥無幾。
在科學中,模型是對某種“實在”現象的簡化表示。科學家們說是在研究自然,但實際上他們做的大部分事情都是在對自然進行建模,并對所建立的模型進行研究。
以牛頓的引力定律為例:兩個物體之間的引力正比于它們質量的乘積。這是對一種特定現象的數學描述——也就是數學模型。還有一種模型是用較為簡單的概念來描述現象實際是如何運作的,也就是所謂的原理。在牛頓的時代,他的引力定律受到質疑,就是因為他沒有解釋引力的原理。也就是說,他沒有用“大小、形狀和運動”等物理對象的屬性對其進行解釋——根據笛卡兒的思想,這些基本要素是所有物理模型必要而且充分的組成部分。牛頓自己推測過引力的可能原理,例如,他“猜想地球就像海綿一樣,不斷吸收天空降落下來的輕質流體,這種流體作用到地球上的物體上,導致它們下降”。這種概念框架可以稱為原理模型。200年后,愛因斯坦提出了一種不同的引力原理模型,廣義相對論,在其中引力被概念化為四維時空的幾何特性。現在,一些物理學家又在鼓吹弦論,提出引力是由細小、振動的弦導致的。
模型是我們思維的方式,是用我們熟悉的概念解釋觀察到的現象,所用到的概念是我們的頭腦能夠理解的(就弦論來說,則是少數非常聰明的人能夠理解的)。模型也是預測未來的途徑:比如說,牛頓的引力定律仍然被用來預測行星軌道,而愛因斯坦的廣義相對論則成功預測了那些所預測的軌道的偏差。
許多生物學家和社會學家都用理想模型來研究為什么在由自私個體組成的群體中會進化出合作。
生物歸根結底都是自私的——它們要想在進化中獲得成功,就必須能活足夠長的時間,保持足夠的健康,還要能吸引異性,以繁衍后代。大部分生物為了達到這些目的會毫不猶豫地與其他生物進行斗爭,采用各種伎倆,殺死或殺傷其他生物。通常的看法認為進化選擇會使得自私或自衛本能得以傳遞給下一代并在種群中擴散。
然而與這種看法相反,在生物王國和社會的各個層面上都有許多明顯不符合自私原則的例子。從底層看,在進化歷程的一定階段時刻,單細胞生物會互相合作以形成更復雜的多細胞生物。后來,又進化出了蟻群這樣的社會性生物,大部分螞蟻為了蟻群的整體利益工作,甚至放棄了繁衍的能力,只讓蟻后來繁衍后代。后來,靈長類動物群體中又涌現出了更加復雜的社會,社會團結一致對外,復雜的貿易,最終出現了人類國家、政府、法律和國際條約。
生物學家、社會學家、經濟學家和政治學家都面臨著類似的問題,本質上自私的個體中是怎么產生出合作的。這不僅僅是個科學問題,也是政治問題:例如,是否有可能創造條件讓國家之間產生并維持合作,一起應對核擴散、艾滋病、全球變暖等國際問題?
阿克塞爾羅德想知道什么樣的策略是好策略,因此他組織了兩次囚徒困境競賽。他讓各學科的研究人員提出各自的策略,并根據策略設計能進行囚徒困境博弈的計算機程序,然后在比賽中讓這些程序互相博弈。
回想一下第9章討論的機器人羅比,策略指的其實就是一組規則,規定了在各種情形中應該采取何種行動。對于囚徒困境來說,策略就是根據對手以前的行為決定下一步是合作還是背叛的規則。
第一次競賽收到了14個程序;第二次增加到了63個。每個程序都相互博弈200個回合,根據表14.1中的收益矩陣計算總分。程序可以有記憶——每個程序都能存儲一些之前與對手的博弈記錄。有些提交來的策略相當復雜,使用統計方法分析其他策略的“心理”。然而,兩次競賽中獲勝的策略—平均得分最高—都是所提交的策略中最簡單的策略:針鋒相對(TIT FOR TAT)。這個策略是數學家拉普波特(Anatol Rapoport)提交的,第一個回合合作,然后在后面的回合中采取對手在前一回合中所使用的策略。也就是說針鋒相對策略愿意合作,并且對愿意合作的對手以禮相待。但如果對方背叛,針鋒相對策略就會回之以背叛,直到對手又開始合作為止。
讓人吃驚的是,這樣簡單的策略竟然打敗了其他所有策略,尤其是第2次競賽時參賽者已經知道了針鋒相對策略,可以有針對性地與它對抗。然而,在參賽的幾十位專家中,沒有人能設計出更好的策略。
根據競賽結果,阿克塞爾羅德得出了一些一般性結論。他注意到所有成績好的策略都有友善的特點—他們從不先背叛對方。友善的策略中得分最低的是“絕不寬恕”策略:它開始時合作,但一旦對方背叛,它以后就會一直背叛。而針鋒相對策略會以一次背叛懲罰對手的上一次背叛,但如果對手又開始合作,它就會原諒對方,也開始合作。阿克塞爾羅德還注意到,雖然大多數成功的策略既友善也能寬恕對手,但是它們也具有報復性——它們會在背叛發生后很快就進行懲罰。針鋒相對策略不僅友善、寬恕和進行報復,它還有一個很重要的特性:行為明確,具有可預見性。對手很容易就能知道針鋒相對采取的策略,因此也就能預知它會如何對對手的行為作出反應。這種可預見性對于促進合作很重要。
有趣的是,阿克塞爾羅德在競賽之后又進行了一系列實驗,用遺傳算法演化囚徒困境的策略。策略的適應度就是它與種群中其他策略反復博弈之后的得分。遺傳算法演化出的策略行為與針鋒相對也是一樣的。
阿克塞爾羅德進行了添加社會規范的囚徒困境實驗,實驗中規范表現為在背叛被其他人發現時的社會譴責(用負分表示)。在阿克塞爾羅德的多方博弈中,個體的每次背叛,都有一定的概率被其他個體發現。除了決定合作或背叛的策略,每個個體還有在發現其他個體的背叛行為時決定是否進行懲罰(減分)的策略。
具體說,每個個體的策略由兩個數字組成:背叛的概率(無恥度)和發現背叛行為時進行懲罰的概率(正義度)。在最初的群體中,概率值被隨機賦予。
在每一代,群體進行一次循環博弈:群體中每個個體與其他所有個體博弈一次,每當出現背叛,背叛行為都有一定概率被其他個體發現。一旦被發現,發現背叛行為的個體就會根據自身的正義度以一定概率對背叛個體進行懲罰。
在每次循環之后,會發生進化過程:根據適應度(得分)選擇父代策略,從而產生出下一代策略。父代通過變異復制產生后代:每個后代的無恥度和嫉惡度在父代的基礎上稍微變化。如果開始時群體中大多數個體的正義度都設為0(也就是沒有社會規范),那背叛者就會越來越多。阿克塞爾羅德最初希望能發現促進群體中合作進化的規范——也就是說,進化出正義度以對抗無恥度。
然而,結果是僅僅有規范并不足以保證產生合作。在后來的實驗中,阿克塞爾羅德又加入了元規范(metanorms),在其中有執法者來懲罰非執法者。不知道你們明不明白我的意思,就好像逛超市的時候,如果我沒有阻止我的小孩在過道里嬉鬧,還撞到了其他顧客,有些這樣的人就會以鄙視的眼神看著我。這樣的元規范對我很有效。阿克塞爾羅德也發現元規范很有用—如果周圍有懲罰者,非懲罰者就會演化得更傾向于懲罰,而被懲罰的背叛者也會演化得更愿意合作。用阿克塞爾羅德的話說,“元規范能促進并保持群體中的合作。
1995年,胡伯爾曼(Bemardo Huberman)和格蘭斯(Natalie Glance)重復了諾瓦克和梅的空間囚徒困境模型。他們的仿真只有一處改動。在原來的模型中,每一步格子上所有策略的博弈都同時進行,然后再在鄰居中選擇適應度最高的策略。(諾瓦克和梅必須在非并行計算機上模擬這種并行性。)胡伯爾曼和格蘭斯則讓一些博弈可以異步進行——也就是說,一些策略先進行博弈并選擇,然后另一些策略再接著做,這樣輪著來。這樣簡單的變化,應該說是讓模型更符合實際了,他們卻發現結果經常是整個網格中合作者完全被不合作者取代。穆科吉(Arijit Mukheji)、拉詹(Vijay Rajan)和斯萊格勒(James Slagle)也獨立得到了類似的結果。他們還發現,只要存在一點失誤或是欺騙(例如,合作者無意或是有意地背叛),合作就無法繼續。諾瓦克、梅和他們的合作者博恩霍艾弗(Sebastian Bonhoeffor)則回應說,這樣的改變只有在收益矩陣取一定的值時才會導致合作者消失,而在其他情況下則不會,至少在很長的時間內都不會消失。
2005年,加蘭(Jose Manuel Galan)和利茲壝奎爾多(Luis Izquiedo)發表了他們重復阿克塞爾羅德的規范和元規范模型實驗的結果。在阿克塞爾羅德的實驗后已經過去了20年,計算機的性能已得到大幅提升,他們可以讓仿真運行更多的周期,也可以徹底研究如果改變收益矩陣、變異概率等條件會導致什么結果。他們的結果與阿克塞爾羅德的一些結果相吻合,但也有一些結果相當不同。例如,他們發現雖然元規范在短期內會促進和維持合作,但如果仿真很長時間,不合作者最終還是會占據優勢。他們還發現結果對收益矩陣等條件相當敏感。
我們應當怎樣理解這一切呢?我認為就像伯克斯和德雷珀說的:所有模型都是錯的,但是有一些對于嘗試研究極為復雜的系統卻很有用。獨立的重復實驗能夠發現理想模型中隱藏的一些不切實際的假設和對某些參數的敏感性。當然重復實驗本身也應當被重復檢驗,就像實驗科學一樣。最后,建模者也必須明確指出模型的局限性,以免模型的結果被誤讀,生搬硬套,或是過分渲染。我用囚徒困境的模型作為例子來說明這些觀點,其他復雜系統的簡化模型同樣應當注意這些。
我住在俄勒岡州波特蘭,這個市區大約有200萬人。我在波特蘭州立大學(Portland State University,PSU)任教,學校有將近25000名學生,超過1200名教師。幾年前,我們家換了新房子,離學校較遠。有一次我同我們的新鄰居桃樂茜聊天,她是位律師。我告訴她我在波特蘭州立大學教書。她說:“不知道你認不認識我父親。他叫喬治·勒恩達理斯(George Lendaris)。”我很吃驚。勒恩達理斯是我在PSU的同事,整個學校只有三四個老師研究人工智能,其中就包括我們倆。就在前天,我還和他見了面,討論合作申請經費。這世界真小!
幾乎所有人都有過這種“小世界”經歷,很多比我遇到的更具戲劇性。我丈夫高中最好的朋友和我在人工智能課上采用的課本的作者是堂兄弟。在圣塔菲住在離我三棟房子里的一位女士是我在洛杉肌的高中英語老師的好友。我相信你也有過類似的經歷。
這種出人意料的關系到底有多常見呢?20世紀50年代,哈佛大學的心理學家米爾格蘭姆(Stanley Milgram,圖15.1)對這個問題產生了興趣,他想弄清在美國一個人平均要通過幾個熟人關系才能到達另一個人。他設計了一個實驗,實驗中一些普通人被要求將一封信寄給一位陌生人,他可以將信交給他認為最有可能將信送達的熟人,熟人又轉交給熟人的熟人,直到信通過熟人關系形成的鏈條送到收信人手中。
米爾格蘭姆在報紙上刊登廣告,在堪薩斯州和內布拉斯加州招募了一群“發信人”,告訴他們“收信人”的姓名、職位和所在城市,發信人要把信送給他不認識的這位收信人。米爾格蘭姆選擇的收信人中,有一個例子是波士頓的一位股票經紀人,還有一個例子是坎布里奇(Cambridge)附近一位神學學生的妻子。發信人被要求將信送給他認識的某位熟人,再請這位熟人繼續傳送。傳送過程被記錄在信上,如果信送到了收信人手里,米爾格蘭姆就計算信經過了幾個熟人關系。米爾格蘭姆記述了一個例子:
在信封被交給堪薩斯州一位發信人4天后,圣公會神學院的一位教師在街上攔住了我們的收信人。他將一個牛皮信封塞給她,“愛麗絲,這是你的。”一開始她以為這是一封沒有送到發信人手里被退回來的信,從沒有離開過坎布里奇,但是當我們看上面的記錄時,我們驚喜地發現信是堪薩斯州的一位農夫寄來的。他將信交給了他們當地圣公會的牧師,這位牧師又將信寄給了在坎布里奇任教的這位牧師,這位牧師再將信交給了收信人。這樣從發信人經過兩個熟人關系就到了收信人!
在這項著名的實驗中,米爾格蘭姆發現,在送達的信件中,從發信人平均經過5個熟人就送到了收信人。這個發現后來廣為人知,被稱為“六度分隔(six degrees of separation)”。
后來心理學家柯蘭菲爾德(Judith Kleinfeld)研究發現,米爾格蘭姆的發現被曲解了——事實上,大部分信件從沒有到達收信人手中,而在米爾格蘭姆的其他研究中,到達收信人的信件經過的平均熟人關系也不止5個。然而,六度分隔的小世界思想還是成了我們文化的傳奇。正如柯蘭菲爾德指出的)
科技文獻引用網絡的增長是偏好附連效應的一個例子。在這個網絡中節點是科技文獻;一篇論文如果被另一篇論文引用,就得到一條入連接。因此論文被引用的次數越多,連接度就越高。人們一般認為被引用次數越多,論文就越重要;在科學界,這個指標會決定你的職位、加薪,等等。不過,偏好附連似乎經常在其中扮演重要角色。設想你和科學家喬各自獨立地就同一個問題寫了很出色的論文。如果我在我的論文中碰巧引用了你的文章,卻沒有引用喬的,其他人如果只讀了我的文章就很有可能會引用你的文章(經常是讀都沒讀)。其他人如果讀到了他們的文章,也會更有可能引用你的而不是喬的文章。局勢會越來越有利于你,不利于喬,盡管喬的論文和你的論文質量一樣好。偏好附連機制會導致作家格拉德威爾(Malcolm Gladwell)所說的引爆點(tipping points)——論文引用、時尚流行等過程通過正反饋循環開始劇烈增長的點。另外,引爆點也可以指系統中的某處失效引發系統全面加速潰敗,后面我們將討論這種情況。
連鎖失效的例子在現實網絡世界中很常見。下面是新聞里最近報道的兩個例子:
2003年8月:美國中西部和東北部發生大規模斷電,是由俄亥俄州一家發電廠發生故障引發的連鎖失效導致的。據報道,由于天氣過于炎熱,導致電線負荷過高,引起線路下垂,碰到了樹枝,觸發了線路自動斷路,負載被轉移到電網其他部分,使得其他部分也因過載而失效。過載失效迅速傳播,最后導致加拿大和美國東部5千萬居民斷電,有些地區斷電長達3天。
2007年8月:美國海關計算機系統崩潰了近10個小時,導致17000多名旅客滯留在洛杉肌國際機場。事故是由一臺計算機的網卡故障引起的。這個故障很快導致其他網卡也連鎖失效,不到1個小時,整個系統都崩潰了。海關職員無法處理到達的國際旅客,其中一些人不得不在飛機上等了5個多小時。
第3個例子表明不僅電力網絡會發生連鎖失效,公司網絡也一樣。
1998年8-9月:私人金融對沖基金美國長期資本管理公司(Long-TermCapital Management,LTCM)得到數家大型金融公司擔保從事風險投資,結果將公司的權益價值幾乎賠光。美聯儲擔心它的虧損會導致全球金融市場崩潰,因為為了償債,LTCM會不得不賣掉大部分資產,導致股票等有價證券的價格下跌,從而迫使其他公司也拋售資產,導致價格進一步下跌,直至崩潰。1998年9月末,為了防止出現這種局面,美聯儲召集了其主要債權銀行對LTCM進行援助。
前面我們說到,在節點隨機失效時,對網絡的平均最短路徑長度不會有很大影響。這種特性在連鎖失效的情況下并不成立,因為一個節點的失效會導致其他節點也失效。連鎖失效是“引爆點”的又一個例子,小事件觸發加速正反饋,結果小問題導致嚴重后果。許多人擔心黑客和電腦恐怖分子威脅全球網絡基礎,但連鎖失效帶來的威脅可能更大。隨著我們的社會越來越依賴計算機網絡、網絡投票機、導彈防御系統、電子銀行,等等,連鎖失效的情況也越來越常見,威脅也越來越大。正如研究這種系統的專家安東諾普洛斯(Andreas Antonopoulos)指出的,“威脅來自復雜性本身”。
因此!對連鎖失效及其應對策略的總體研究現在是網絡科學最活躍的研究領域。兩個影響最大的理論分別是自組織臨界性(Self-Organized Criticality,SOC)和高容錯性(Highly Optimized Tolerance,HOT)。SOC和HOT理論也提出了不同于偏好附連的機制解釋無尺度網絡的產生。這兩個理論各自提出了一組進化和工程系統連鎖失效的普適機制。
進化發育生物學的一個驚人例證就是燕雀鳥喙的進化。第5章曾講過,達爾文發現加拉帕格斯群島燕雀的喙的大小和形狀差別很大。直到不久前,大部分進化生物學家都還認為這種差別是幾種基因隨機變異逐漸積累的漸變過程。但最近發現了一個名為BMP4的基因可以通過調控生成骨骼的基因來控制喙的大小和形狀。鳥在發育過程中BMP4的表達越強烈,喙就越強大。另一種名為鈣調素(calmodulin)的基因則被發現與長細形的喙有關。卡羅爾·尹(Carol Kaesuk Yoon)在《紐約時報》上撰文介紹,“為了證明BMP4基因確實能觸發生長粗壯、能打開堅果的喙,研究者在小雞胚胎發育出喙時人為加快了BMP4的產生。結果小雞長出了寬厚而結實的喙,類似于能啄開堅果的燕雀……像BMP4一樣,鈣調素基因的表達越強,雀喙就會長得越長。如果在小雞胚胎中人為增加韓調素,小雞就會長出變長的喙,就像啄食仙人掌的燕雀……這樣科學家就發現,無需幾十上百種基因,只需這兩種,就有可能讓鳥喙變得或是厚重、或是短粗、或是細長。”結論是鳥喙(及其他特征)形態的巨大變化可以很快發生,而無須等待時間漫長的隨機變異。
進化發育生物學挑戰進化傳統觀念的另一個例子是趨同進化(convergent evolution)。在中學生物課上我們學過,章魚眼睛和人類眼睛——形態差異很大——是趨同進化的例子。這兩個物種的眼睛是相互獨立進化出來的,是自然選擇作用于兩種不同環境的產物,兩種環境中眼睛都具有適應優勢。
然而,最近有證據表明,這兩種眼睛的進化并不像以前認為的那樣獨立。人類、章魚、蒼蠅等物種都具有名為PAX6的基因,這種基因能引導眼睛的發育。瑞士生物學家格林(Walter Gehring)做了一個古怪而富有啟發的實驗,實驗中格林將老鼠的PAX6基因取出插入到果蠅的染色體中。在不同實驗中,PAX6被插入染色體的三個不同部位:這三個部位分別引導腿、翅膀和觸須的發育。結果非常怪異:果蠅的腿、翅膀和觸須上長出了類似眼的結構。這種結構像果蠅的眼,而不是老鼠的眼。格林得出結論:眼睛不是多次獨立進化出來的,而是只有一次,有一個具有PAX6基因的共同祖先。這個結論在進化生物學家中仍然極具爭議。
雖然主導基因引導的基因調控網絡能產生多樣性,它們也對進化施加了一些限制。進化發育生物學家認為任何生物的身體形態類型都受主導基因高度約束,這也是為什么自然界中只有少數基本的身體結構類型。如果基因組很不相同的話,也許會有新的身體結構類型,但實際上進化無法讓我們變成那樣,因為我們非常依賴現在的調控基因。我們的進化可能性是有局限的。根據進化發育生物學的觀點,“所有特性都能無限變化”的觀念是錯誤的。