前言:
深度學習在新世紀的第二個十年強勢崛起,連接學派暫時領先。然而人工智能始終源于多學科交叉,所以常常是外部力量改變了學科本身,那么人工智能的新變革會在哪里發生?讓我們拭目以待。
前文概要:從80年代開始,機器學習進入人工智能舞臺的中心,開啟了符號學派、連接學派、行為學派三足鼎立的時代,直到深度學習在新世紀蘇醒過來……
人工智能之夢
——夢醒何方(2010至今)
就這樣,在爭論聲中,人工智能走進了21世紀的第二個十年,似乎一切都沒有改變。但是,幾件事情悄悄地發生了,它們重新燃起了人們對于人工智能之夢的渴望。
深度學習
21世紀的第二個十年,如果要評選出最惹人注目的人工智能研究,那么一定要數深度學習(Deep Learning)了。
2011年,谷歌X實驗室的研究人員從YouTube視頻中抽取出1000萬張靜態圖片,把它喂給“谷歌大腦”——一個采用了所謂深度學習技術的大型神經網絡模型,在這些圖片中尋找重復出現的模式。三天后,這臺超級“大腦”在沒有人類的幫助下,居然自己從這些圖片中發現了“貓”。
2012年11月,微軟在中國的一次活動中,展示了他們新研制的一個全自動的同聲翻譯系統——采用了深度學習技術的計算系統。演講者用英文演講,這臺機器能實時地完成語音識別、機器翻譯和中文的語音合成,也就是利用深度學習完成了同聲傳譯。
2013年1月,百度公司成立了百度研究院,其中,深度學習研究所是該研究院旗下的第一個研究所。
……
這些全球頂尖的計算機、互聯網公司都不約而同地對深度學習表現出了極大的興趣。那么究竟什么是深度學習呢?
事實上,深度學習仍然是一種神經網絡模型,只不過這種神經網絡具備了更多層次的隱含層節點,同時配備了更先進的學習技術,如圖1-13所示。
然而,當我們將超大規模的訓練數據喂給深度學習模型的時候,這些具備深層次結構的神經網絡仿佛搖身一變,成為了擁有感知和學習能力的大腦,表現出了遠遠好于傳統神經網絡的學習和泛化的能力。
當我們追溯歷史,深度學習神經網絡其實早在20世紀80年代就出現了。然而,當時的深度網絡并沒有表現出任何超凡能力。這是因為,當時的數據資源遠沒有現在豐富,而深度學習網絡恰恰需要大量的數據以提高它的訓練實例數量。
到了2000年,當大多數科學家已經對深度學習失去興趣的時候,又是那個杰夫·辛頓帶領他的學生繼續在這個冷門的領域里堅持耕耘。起初他們的研究并不順利,但他們堅信他們的算法必將給世界帶來驚奇。
驚奇終于出現了,到了2009年,辛頓小組獲得了意外的成功。他們的深度學習神經網絡在語音識別應用中取得了重大的突破,轉換精度已經突破了世界紀錄,錯誤率比以前減少了25%。可以說,辛頓小組的研究讓語音識別領域縮短了至少10年的時間。就這樣,他們的突破吸引了各大公司的注意。蘋果公司甚至把他們的研究成果應用到了Siri語音識別系統上,使得iPhone5全球熱賣。從此,深度學習的流行便一發不可收拾。
那么,為什么把網絡的深度提高,配合上大數據的訓練就能使得網絡性能有如此大的改善呢?答案是,因為人腦恰恰就是這樣一種多層次的深度神經網絡。例如,已有的證據表明,人腦處理視覺信息就是經過多層加工完成的。所以,深度學習實際上只不過是對大腦的一種模擬。
模式識別問題長久以來是人工智能發展的一個主要瓶頸。然而,深度學習技術似乎已經突破了這個瓶頸。有人甚至認為,深度學習神經網絡已經可以達到2歲小孩的識別能力。有理由相信,深度學習會將人工智能引入全新的發展局面。本書第6章將詳細介紹深度學習這一全新技術,第14章將介紹集智俱樂部下的一個研究小組對深度學習技術的應用——彩云天氣,用人工智能提供精準的短時間天氣預報。
模擬大腦
我們已經看到,深度學習模型成功的秘訣之一就在于它模仿了人類大腦的深層體系結構。那么,我們為什么不直接模擬人類的大腦呢?事實上,科學家們已經行動起來了。
例如,德國海德爾堡大學的FACETS(Fast Analog Computing with Emergent Transient States)計劃就是一個利用硬件來模擬大腦部分功能的項目。他們采用數以千計的芯片,創造出一個包含10億神經元和1013突觸的回路的人工腦(其復雜程度相當于人類大腦的十分之一)。與此對應,由瑞士洛桑理工學院和IBM公司聯合發起的藍色大腦計劃則是通過軟件來模擬人腦的實踐。他們采用逆向工程方法,計劃2015年開發出一個虛擬的大腦。
然而,這類研究計劃也有很大的局限性。其中最大的問題就在于:迄今為止,我們對大腦的結構以及動力學的認識還相當初級,尤其是神經元活動與生物體行為之間的關系還遠遠沒有建立。例如,盡管科學家早在30年前就已經弄清楚了秀麗隱桿線蟲(Caenorhabditis elegans)302個神經元之間的連接方式,但到現在仍然不清楚這種低等生物的生存行為(例如進食和交配)是如何產生的。盡管科學家已經做過諸多嘗試,比如連接組學(Connectomics),也就是全面監測神經元之間的聯系(即突觸)的學問,但是,正如線蟲研究一樣,這幅圖譜僅僅是個開始,它還不足以解釋不斷變化的電信號是如何產生特定認知過程的。
于是,為了進一步深入了解大腦的運行機制,一些“大科學”項目先后啟動。2013年,美國奧巴馬政府宣布了“腦計劃”(Brain Research through Advancing Innovative Neurotechnologies,簡稱BRAIN)的啟動。該計劃在2014年的啟動資金為1億多美元,致力于開發能記錄大群神經元甚至是整片腦區電活動的新技術。
無獨有偶,歐盟也發起了“人類大腦計劃”(The Human Brain Project),這一計劃為期10年,將耗資16億美元,致力于構建能真正模擬人腦的超級計算機。除此之外,中國、日本、以色列也都有雄心勃勃的腦科學研究計劃出爐。這似乎讓人們想到了第二次世界大戰后的情景,各國爭相發展“大科學項目”:核武器、太空探索、計算機等。腦科學的時代已經來臨。關于人腦與電腦的比較,請參見本書第7章。
“人工”人工智能
2007年,一位谷歌的實習生路易斯·馮·安(Luis von Ahn)開發了一款有趣的程序“ReCapture” 卻無意間開創了一個新的人工智能研究方向:人類計算。
ReCapture的初衷很簡單,它希望利用人類高超的模式識別能力,自動幫助谷歌公司完成大量掃描圖書的文字識別任務。但是,如果要雇用人力來完成這個任務則需要花費一大筆開銷。于是,馮·安想到,每天都有大量的用戶在輸入驗證碼來向機器證明自己是人而不是機器,而輸入驗證碼事實上就是在完成文本識別問題。于是,一方面是有大量的掃描的圖書中難以識別的文字需要人來識別;另一方面是由計算機生成一些扭曲的圖片讓大量的用戶做識別以表明自己的身份。那么,為什么不把兩個方面結合在一起呢?這就是ReCapture的創意(如圖1-14所示),馮·安聰明地讓用戶在輸入識別碼的時候悄悄幫助谷歌完成了文字識別工作!
這一成功的應用實際上是借助人力完成了傳統的人工智能問題,馮·安把它叫作人類計算(Human Computation),我們則把它形象地稱為“人工”人工智能。除了ReCapture以外,馮·安還開發了很多類似的程序或系統,例如ESP游戲是讓用戶通過競爭的方式為圖片貼標簽,從而完成“人工”人工分類圖片;Duolingo系統則是讓用戶在學習外語的同時,順便翻譯一下互聯網,這是“人工”機器翻譯。
也許,這樣巧妙的人機結合才是人工智能發展的新方向之一。因為一個完全脫離人類的人工智能程序對于我們沒有任何獨立存在的意義,所以人工智能必然會面臨人機交互的問題。而隨著互聯網的興起,人和計算機交互的方式會更加便捷而多樣化。因此,這為傳統的人工智能問題提供了全新的解決途徑。
然而,讀者也許會質疑,這種摻合了人類智能的系統還能叫作純粹的人工智能嗎?這種質疑事實上有一個隱含的前提,就是人工智能是一個獨立運作的系統,它與人類環境應相互隔離。但當我們考慮人類智能的時候就會發現,任何智能系統都不能與環境絕對隔離,它只有在開放的環境下才能表現出智能。同樣的道理,人工智能也必須向人類開放,于是引入人的作用也變成了一種很自然的事情。關于這個主題,我們將在本書第8章和第9章中進一步討論。
結語
本章介紹了人工智能近60年所走過的曲折道路。也許,讀者所期待的內容,諸如奇點臨近、超級智能機器人、人與機器的共生演化等激動人心的內容并沒有出現,但是,我能保證的,是一段真實的歷史,并力圖做到準確無誤。
盡管人工智能這條道路蜿蜒曲折,荊棘密布,但至少它在發展并不斷壯大。最重要的是,人們對于人工智能的夢想永遠沒有破滅過。也許人工智能之夢將無法在你我的有生之年實現,也許人工智能之夢始終無法逾越哥德爾定理那個碩大無朋的“如來佛手掌”,但是,人工智能之夢將永遠驅動著我們不斷前行,挑戰極限。
推薦閱讀
關于希爾伯特、圖靈、哥德爾的故事和相關研究可以閱讀《哥德爾、艾舍爾、巴赫:集異璧之大成》一書。
關于馮·諾依曼,可以閱讀他的傳記:《天才的拓荒者:馮·諾依曼傳》。關于維納,可以參考他的著作《控制論》。
若要全面了解人工智能,給大家推薦兩本書:Artificial Intelligence: A Modern Approach和Artificial Intelligence: Structures and Strategies for Complex Problem Solving。
了解機器學習以及人工神經網絡可以參考Pattern Recognition和Neural Networks and Learning Machines。
關于行為學派和人工生命,可以參考《數字創世紀:人工生命的新科學》以及人工生命的論文集。
若要深入了解貝葉斯網絡,可以參考Causality: Models, Reasoning, and Inference。
深入了解胡特的通用人工智能理論可以閱讀Universal Artificial Intelligence: Sequential Decisions Based on Algorithmic Probability。
關于深度學習方面的知識可參考網站:http://deeplearning.net/reading-list/,其中有不少綜述性的文章。
人類計算方面可以參考馮·安的網站:http://www.cs.cmu.edu/~biglou/。
參考文獻
1?候世達,嚴勇,劉皓. 哥德爾、艾舍爾、巴赫:集異璧之大成. 莫大偉 譯. 北京:商務印書館,1997.
2?諾曼·麥克雷. 天才的拓荒者:馮·諾伊曼傳. 范秀華,朱朝輝 譯. 上海:上??萍冀逃霭嫔?,2008.
3?維納. 控制論:或關于在動物和機器中控制和通信的科學. 郝季仁 譯. 北京:北京大學出版社,2007.
4?Luger G F. Artificial intelligence: structures and strategies for complex problem solving (6th Edition). Addison-Wesley, 2008.
5?Russel S K, Norvig P. Artificial Intelligence: A Modern Approach (2nd Edition). Prentice Hall, 2002.
6?Theodoridis S, Koutroumbas K. Pattern Recognition (2nd edition). Academic Press, 2008.
7?Haykin S O. Neural Networks and Learning Machines (3rd Edition). Prentice Hall, 2000.
8?李建會,張江. 數字創世紀:人工生命的新科學. 北京:科學出版社,2006.
9?Pearl J. Causality: models, reasoning, and inference. Cambridge University Press, 2000.
10?Hutter M. Universal Artificial Intelligence:Sequential Decisions based on Algorithmic Probability. Springer, 2005.
作者簡介
張江,集智俱樂部主要發起人和核心成員,2014~2015年度集智輪值主席。現在北京師范大學系統科學學院任教,教授。主要從事有關計算機模擬和人工智能的教學工作以及復雜系統的相關研究工作。研究興趣包括異速生長律、開放流網絡、注意力流與互聯網等。代表作品有:論文Allometry and dissipation of ecological flow networks(PLoS ONE 2013, 8(9): e72525.)、論文The Metabolism and Growth of Web Forums (PLoS ONE 20149(8): e102646),著有《數字創世紀:人工生命的新科學》(科學出版社,2006)一書。
(完)
張江:《人工智能之夢》系列
人工智能之夢——夢醒何方(2010至今)
原書:《科學的極致:漫談人工智能》豆瓣評分8.3
https://book.douban.com/subject/26546914/
共計四期的《人工智能之夢》到此全部結束,本系列以時間順序整體介紹了人工智能六十年的歷史,許多細節一筆帶過。后續的 AI 簡史,我們將對人工智能具體應用或技術領域的發展,例如深度學習等,做更加深入的介紹。敬請期待。
集智AI學園QQ群:426390994
學園網站:campus.swarma.org
商務合作|zhangqian@swarma.org
投稿轉載|wangjiannan@swarma.org