AI 簡史系列:2010至今

前言:

深度學習在新世紀的第二個十年強勢崛起,連接學派暫時領先。然而人工智能始終源于多學科交叉,所以常常是外部力量改變了學科本身,那么人工智能的新變革會在哪里發生?讓我們拭目以待。

前文概要:從80年代開始,機器學習進入人工智能舞臺的中心,開啟了符號學派、連接學派、行為學派三足鼎立的時代,直到深度學習在新世紀蘇醒過來……

人工智能之夢

——夢醒何方(2010至今)

就這樣,在爭論聲中,人工智能走進了21世紀的第二個十年,似乎一切都沒有改變。但是,幾件事情悄悄地發生了,它們重新燃起了人們對于人工智能之夢的渴望。

深度學習

21世紀的第二個十年,如果要評選出最惹人注目的人工智能研究,那么一定要數深度學習(Deep Learning)了。

2011年,谷歌X實驗室的研究人員從YouTube視頻中抽取出1000萬張靜態圖片,把它喂給“谷歌大腦”——一個采用了所謂深度學習技術的大型神經網絡模型,在這些圖片中尋找重復出現的模式。三天后,這臺超級“大腦”在沒有人類的幫助下,居然自己從這些圖片中發現了“貓”。

2012年11月,微軟在中國的一次活動中,展示了他們新研制的一個全自動的同聲翻譯系統——采用了深度學習技術的計算系統。演講者用英文演講,這臺機器能實時地完成語音識別、機器翻譯和中文的語音合成,也就是利用深度學習完成了同聲傳譯。

2013年1月,百度公司成立了百度研究院,其中,深度學習研究所是該研究院旗下的第一個研究所。

……

這些全球頂尖的計算機、互聯網公司都不約而同地對深度學習表現出了極大的興趣。那么究竟什么是深度學習呢?

事實上,深度學習仍然是一種神經網絡模型,只不過這種神經網絡具備了更多層次的隱含層節點,同時配備了更先進的學習技術,如圖1-13所示。

然而,當我們將超大規模的訓練數據喂給深度學習模型的時候,這些具備深層次結構的神經網絡仿佛搖身一變,成為了擁有感知和學習能力的大腦,表現出了遠遠好于傳統神經網絡的學習和泛化的能力。

當我們追溯歷史,深度學習神經網絡其實早在20世紀80年代就出現了。然而,當時的深度網絡并沒有表現出任何超凡能力。這是因為,當時的數據資源遠沒有現在豐富,而深度學習網絡恰恰需要大量的數據以提高它的訓練實例數量。

到了2000年,當大多數科學家已經對深度學習失去興趣的時候,又是那個杰夫·辛頓帶領他的學生繼續在這個冷門的領域里堅持耕耘。起初他們的研究并不順利,但他們堅信他們的算法必將給世界帶來驚奇。

驚奇終于出現了,到了2009年,辛頓小組獲得了意外的成功。他們的深度學習神經網絡在語音識別應用中取得了重大的突破,轉換精度已經突破了世界紀錄,錯誤率比以前減少了25%。可以說,辛頓小組的研究讓語音識別領域縮短了至少10年的時間。就這樣,他們的突破吸引了各大公司的注意。蘋果公司甚至把他們的研究成果應用到了Siri語音識別系統上,使得iPhone5全球熱賣。從此,深度學習的流行便一發不可收拾。

那么,為什么把網絡的深度提高,配合上大數據的訓練就能使得網絡性能有如此大的改善呢?答案是,因為人腦恰恰就是這樣一種多層次的深度神經網絡。例如,已有的證據表明,人腦處理視覺信息就是經過多層加工完成的。所以,深度學習實際上只不過是對大腦的一種模擬。

模式識別問題長久以來是人工智能發展的一個主要瓶頸。然而,深度學習技術似乎已經突破了這個瓶頸。有人甚至認為,深度學習神經網絡已經可以達到2歲小孩的識別能力。有理由相信,深度學習會將人工智能引入全新的發展局面。本書第6章將詳細介紹深度學習這一全新技術,第14章將介紹集智俱樂部下的一個研究小組對深度學習技術的應用——彩云天氣,用人工智能提供精準的短時間天氣預報。

模擬大腦

我們已經看到,深度學習模型成功的秘訣之一就在于它模仿了人類大腦的深層體系結構。那么,我們為什么不直接模擬人類的大腦呢?事實上,科學家們已經行動起來了。

例如,德國海德爾堡大學的FACETS(Fast Analog Computing with Emergent Transient States)計劃就是一個利用硬件來模擬大腦部分功能的項目。他們采用數以千計的芯片,創造出一個包含10億神經元和1013突觸的回路的人工腦(其復雜程度相當于人類大腦的十分之一)。與此對應,由瑞士洛桑理工學院和IBM公司聯合發起的藍色大腦計劃則是通過軟件來模擬人腦的實踐。他們采用逆向工程方法,計劃2015年開發出一個虛擬的大腦。

然而,這類研究計劃也有很大的局限性。其中最大的問題就在于:迄今為止,我們對大腦的結構以及動力學的認識還相當初級,尤其是神經元活動與生物體行為之間的關系還遠遠沒有建立。例如,盡管科學家早在30年前就已經弄清楚了秀麗隱桿線蟲(Caenorhabditis elegans)302個神經元之間的連接方式,但到現在仍然不清楚這種低等生物的生存行為(例如進食和交配)是如何產生的。盡管科學家已經做過諸多嘗試,比如連接組學(Connectomics),也就是全面監測神經元之間的聯系(即突觸)的學問,但是,正如線蟲研究一樣,這幅圖譜僅僅是個開始,它還不足以解釋不斷變化的電信號是如何產生特定認知過程的。

于是,為了進一步深入了解大腦的運行機制,一些“大科學”項目先后啟動。2013年,美國奧巴馬政府宣布了“腦計劃”(Brain Research through Advancing Innovative Neurotechnologies,簡稱BRAIN)的啟動。該計劃在2014年的啟動資金為1億多美元,致力于開發能記錄大群神經元甚至是整片腦區電活動的新技術。

無獨有偶,歐盟也發起了“人類大腦計劃”(The Human Brain Project),這一計劃為期10年,將耗資16億美元,致力于構建能真正模擬人腦的超級計算機。除此之外,中國、日本、以色列也都有雄心勃勃的腦科學研究計劃出爐。這似乎讓人們想到了第二次世界大戰后的情景,各國爭相發展“大科學項目”:核武器、太空探索、計算機等。腦科學的時代已經來臨。關于人腦與電腦的比較,請參見本書第7章。

“人工”人工智能

2007年,一位谷歌的實習生路易斯·馮·安(Luis von Ahn)開發了一款有趣的程序“ReCapture” 卻無意間開創了一個新的人工智能研究方向:人類計算。

ReCapture的初衷很簡單,它希望利用人類高超的模式識別能力,自動幫助谷歌公司完成大量掃描圖書的文字識別任務。但是,如果要雇用人力來完成這個任務則需要花費一大筆開銷。于是,馮·安想到,每天都有大量的用戶在輸入驗證碼來向機器證明自己是人而不是機器,而輸入驗證碼事實上就是在完成文本識別問題。于是,一方面是有大量的掃描的圖書中難以識別的文字需要人來識別;另一方面是由計算機生成一些扭曲的圖片讓大量的用戶做識別以表明自己的身份。那么,為什么不把兩個方面結合在一起呢?這就是ReCapture的創意(如圖1-14所示),馮·安聰明地讓用戶在輸入識別碼的時候悄悄幫助谷歌完成了文字識別工作!

這一成功的應用實際上是借助人力完成了傳統的人工智能問題,馮·安把它叫作人類計算(Human Computation),我們則把它形象地稱為“人工”人工智能。除了ReCapture以外,馮·安還開發了很多類似的程序或系統,例如ESP游戲是讓用戶通過競爭的方式為圖片貼標簽,從而完成“人工”人工分類圖片;Duolingo系統則是讓用戶在學習外語的同時,順便翻譯一下互聯網,這是“人工”機器翻譯。

也許,這樣巧妙的人機結合才是人工智能發展的新方向之一。因為一個完全脫離人類的人工智能程序對于我們沒有任何獨立存在的意義,所以人工智能必然會面臨人機交互的問題。而隨著互聯網的興起,人和計算機交互的方式會更加便捷而多樣化。因此,這為傳統的人工智能問題提供了全新的解決途徑。

然而,讀者也許會質疑,這種摻合了人類智能的系統還能叫作純粹的人工智能嗎?這種質疑事實上有一個隱含的前提,就是人工智能是一個獨立運作的系統,它與人類環境應相互隔離。但當我們考慮人類智能的時候就會發現,任何智能系統都不能與環境絕對隔離,它只有在開放的環境下才能表現出智能。同樣的道理,人工智能也必須向人類開放,于是引入人的作用也變成了一種很自然的事情。關于這個主題,我們將在本書第8章和第9章中進一步討論。

結語

本章介紹了人工智能近60年所走過的曲折道路。也許,讀者所期待的內容,諸如奇點臨近、超級智能機器人、人與機器的共生演化等激動人心的內容并沒有出現,但是,我能保證的,是一段真實的歷史,并力圖做到準確無誤。

盡管人工智能這條道路蜿蜒曲折,荊棘密布,但至少它在發展并不斷壯大。最重要的是,人們對于人工智能的夢想永遠沒有破滅過。也許人工智能之夢將無法在你我的有生之年實現,也許人工智能之夢始終無法逾越哥德爾定理那個碩大無朋的“如來佛手掌”,但是,人工智能之夢將永遠驅動著我們不斷前行,挑戰極限。

推薦閱讀

關于希爾伯特、圖靈、哥德爾的故事和相關研究可以閱讀《哥德爾、艾舍爾、巴赫:集異璧之大成》一書。

關于馮·諾依曼,可以閱讀他的傳記:《天才的拓荒者:馮·諾依曼傳》。關于維納,可以參考他的著作《控制論》。

若要全面了解人工智能,給大家推薦兩本書:Artificial Intelligence: A Modern Approach和Artificial Intelligence: Structures and Strategies for Complex Problem Solving。

了解機器學習以及人工神經網絡可以參考Pattern Recognition和Neural Networks and Learning Machines。

關于行為學派和人工生命,可以參考《數字創世紀:人工生命的新科學》以及人工生命的論文集。

若要深入了解貝葉斯網絡,可以參考Causality: Models, Reasoning, and Inference。

深入了解胡特的通用人工智能理論可以閱讀Universal Artificial Intelligence: Sequential Decisions Based on Algorithmic Probability。

關于深度學習方面的知識可參考網站:http://deeplearning.net/reading-list/,其中有不少綜述性的文章。

人類計算方面可以參考馮·安的網站:http://www.cs.cmu.edu/~biglou/。

參考文獻

1?候世達,嚴勇,劉皓. 哥德爾、艾舍爾、巴赫:集異璧之大成. 莫大偉 譯. 北京:商務印書館,1997.

2?諾曼·麥克雷. 天才的拓荒者:馮·諾伊曼傳. 范秀華,朱朝輝 譯. 上海:上??萍冀逃霭嫔?,2008.

3?維納. 控制論:或關于在動物和機器中控制和通信的科學. 郝季仁 譯. 北京:北京大學出版社,2007.

4?Luger G F. Artificial intelligence: structures and strategies for complex problem solving (6th Edition). Addison-Wesley, 2008.

5?Russel S K, Norvig P. Artificial Intelligence: A Modern Approach (2nd Edition). Prentice Hall, 2002.

6?Theodoridis S, Koutroumbas K. Pattern Recognition (2nd edition). Academic Press, 2008.

7?Haykin S O. Neural Networks and Learning Machines (3rd Edition). Prentice Hall, 2000.

8?李建會,張江. 數字創世紀:人工生命的新科學. 北京:科學出版社,2006.

9?Pearl J. Causality: models, reasoning, and inference. Cambridge University Press, 2000.

10?Hutter M. Universal Artificial Intelligence:Sequential Decisions based on Algorithmic Probability. Springer, 2005.

作者簡介

張江,集智俱樂部主要發起人和核心成員,2014~2015年度集智輪值主席。現在北京師范大學系統科學學院任教,教授。主要從事有關計算機模擬和人工智能的教學工作以及復雜系統的相關研究工作。研究興趣包括異速生長律、開放流網絡、注意力流與互聯網等。代表作品有:論文Allometry and dissipation of ecological flow networks(PLoS ONE 2013, 8(9): e72525.)、論文The Metabolism and Growth of Web Forums (PLoS ONE 20149(8): e102646),著有《數字創世紀:人工生命的新科學》(科學出版社,2006)一書。

(完)


張江:《人工智能之夢》系列

人工智能之夢——夢的開始(1900-1956)

人工智能之夢——夢的延續(1956-1980)

人工智能之夢——群龍問鼎(1980-2010)

人工智能之夢——夢醒何方(2010至今)

原書:《科學的極致:漫談人工智能》豆瓣評分8.3

https://book.douban.com/subject/26546914/

共計四期的《人工智能之夢》到此全部結束,本系列以時間順序整體介紹了人工智能六十年的歷史,許多細節一筆帶過。后續的 AI 簡史,我們將對人工智能具體應用或技術領域的發展,例如深度學習等,做更加深入的介紹。敬請期待。

集智AI學園QQ群:426390994

學園網站:campus.swarma.org

商務合作|zhangqian@swarma.org

投稿轉載|wangjiannan@swarma.org

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,224評論 6 529
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 97,916評論 3 413
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 175,014評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,466評論 1 308
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,245評論 6 405
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,795評論 1 320
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,869評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,010評論 0 285
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,524評論 1 331
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,487評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,634評論 1 366
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,173評論 5 355
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,884評論 3 345
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,282評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,541評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,236評論 3 388
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,623評論 2 370

推薦閱讀更多精彩內容

  • 前言: 10月24日開始,集智AI學園陸續推送“人工智能簡史”系列文章,講述人工智能從孕育、誕生到坎坷成長的百年歷...
    Jake_張江閱讀 2,128評論 0 2
  • “親愛的,你說,如果我堅持,我們是有可能在一起的,對嗎?” 某一天晚上零點,突然接到朋友這樣一條短信。一瞬間,我又...
    筱陌_閱讀 599評論 0 0