【全球AI日報】第四范式首席科學家楊強教授:人工智能的下一個技術風口與商業風囗

圖片發自簡書App

?

作為華人界首個國際人工智能協會AAAI Fellow、至今為止唯一的AAAI 華人執委,以及IEEE Fellow、AAAS Fellow、IAPR Fellow,楊強教授在專注學術研究的同時,也更關注如何讓人工智能技術落地轉化為生產力的問題。

?

作為第四范式首席科學家、范式大學的導師,楊強教授近日在第四范式公司內部進行了一場主題為“人工智能的下一個三年”的培訓,深入淺出地分享了自己在人工智能產業推廣上的經驗,并預判了人工智能即將爆發的技術風口與商業風口。此前,楊強教授與第四范式曾提出人工智能的五個必要條件,為人工智能行業提供了權威的準入標準。

?

以下內容根據楊強教授主題演講編寫,略微有所刪減。

?

一、AlphaGo為我們帶來了什么

?

大家記得在2016年3月,AlphaGo橫空出世對戰李世乭,這對于人工智能的社會影響非常大。這里,我們問一下:AlphaGo到底為我們帶來了什么?

?

在AlphaGo的搜索中,Deepmind團隊引入了一個新概念——即用深度學習和強化學習的結合來做兩種任務的判別,即來判別現在所在的棋盤是好是壞,同時來預測未來有利的走向。講到這里大家應該能看出AlphaGo的算法和未來商業模式的關聯,即:通過對大數據的分析,讓我們對“現在狀態”有了一個靠譜的理解;這個狀態可以是棋盤、可以是足球運動中兩隊交鋒的狀態,也可以是當前營銷的一個狀態。同時,下圍棋中的一步,可以理解成對未來走向的預判,在商業活動中,這可以是營銷活動中的下一步。這里很重要的一點,是區分我們商業行為中的兩個任務,即對現實的判斷和對商業未來走向的預估。這兩個任務同樣重要,也同樣都需要大數據的支持。 因為圍棋是一個封閉式的游戲(即沒有外界因素的干擾),為了得到更多的數據,AlphaGo也引入了自我博弈。所謂自我博弈就是自己玩游戲,你會得到不斷的反饋,然后來更新自己的策略,經過無數次這樣的比賽,最后會得到一個好的策略,你的最終輸出是一個行為的策略。所以AlphaGo 也告訴我們,在一個封閉場景中,可以用自我博弈的模擬方法得到更多的數據。

?

從AlphaGo到人工智能的應用流程

?

我們如果沿著下圍棋的步驟走,就要面對這些問題:你的人工智能算法的目標是什么?有沒有數據?數據在哪里?問題的邊界是否清晰?什么叫合理的走法、什么叫犯規的走法?你的特征在哪里?又如何得到這些特征?是否可以得到一個持續的反饋?這樣的一個流程是AlphaGo設計團隊所走過的路。不妨把這些步驟記下來,變成一個workflow,看看其他的領域是不是可以重復AlphaGo的成功。 比如,如果用AlphaGo治療癌癥,如何治療呢?治療癌癥一般是用放射性來殺掉癌細胞,而每一個癌癥患者需要的劑量、角度、頻次可能都不一樣,如果能把所有的這些信息都記錄下來,再記錄治療結果,因為結果不是馬上就知道的,而是經過一段時間才知道,這樣就有了數據、有了特征、有了問題持續的反饋,并且有了非常清楚的目標,即在副作用最小的情況下殺死癌細胞。并且這個workflow是可以重復的。

?

第四范式首席科學家楊強教授:人工智能的下一個技術風口與商業風口

?

AI的發展歷史還有前30年,這些年的積累也很有用

?

剛剛我們說了AlphaGo的一路歷程,但我們對人工智能的理解不應該片面地認為人工智能就是機器學習。人工智能的發展歷史還有前30年,前30年是從50年代中一直發展到80年代中。這30年AI是在干什么呢?是在做人工輸入的規則型的知識表達研究,以及基于這些規則的符號空間的推理和搜索。我認為,這個人工規則型的知識表達在AI的應用當中也是必不可少的,因為在眾多領域當中還會碰到冷啟動的問題,以及如何規范一個領域的邊界的問題。這就是說,邏輯推理,邏輯知識表達,以及在符號空間的搜索的人工智能這個分支,在今后幾年會和統計學習相結合,會大有發展。 這種發展會也涉及技術和商業兩個層面。

?

二、AI的技術風口在哪?

?

我們大家會關心的一個問題, 是人工智能的技術在哪些方向可能會有大的突破。

?

深度學習

?

第四范式首席科學家楊強教授:人工智能的下一個技術風口與商業風口

?

首先,是深度學習會繼續發展。這里的發展不僅是在層次的增加,還包括深度學習的可解釋性、以及對深度學習所獲的的結論的自我因果表達。例如,如何把非結構化的數據作為原始數據,訓練出一個統計模型,再把這個模型變成某種知識的表達——這是一種表示學習。這種技術對于非結構化數據,尤其對于自然語言里面的知識學習,是很有幫助的。另外,深度學習模型的結構設計是深度學習的一個難點。這些結構在今天都是非常需要由人來設計的。還有一個研究問題是如何讓邏輯推理和深度學習一起工作,這樣也可以增加深度學習的可解釋性。比如,建立一個貝葉斯模型需要有很多的設計者的經驗,到現在為止,基本上是由人來設定的。如果我們能從深度學習的學習過程中衍生出一個貝葉斯模型,那么,學習、解釋和推理就可以統一起來了。

?

遷移學習

?

遷移學習也是我和戴文淵(第四范式創始人、首席執行官)一直在做的工作。給定一個深度學習的網絡,比如一個encoder網絡和一個decoder網絡,我們可以看它學習和遷移的過程,作為新的數據來訓練另外一個可解釋的模型,也可以作為一個新的遷移學習算法的輸出。即一個學生A在觀察另外一個學生B學習,A的目的是學習B的學習方法,B就不斷地在學新的領域,每換一個領域就為A提供一個新的數據樣本,A利用這些新的樣本就能學會在領域之間做遷移。所以這種過程叫做觀察網絡。有了這種一邊學習、一邊學習學習方法的算法,就可以在機器學習的過程中,學會遷移的方法。

?

自然語言的表示學習與機器閱讀

?

表示學習是當數據和任務沒有直接相關時也可以學,一個重要的例子叫做self-taught learning,即我們通過很多supervise的數據、圖像,可以學出一種最好的表達。用這個表達加上任務,就可以很快地學會這種知識表示。這時非結構化的數據就相當有用了。比如,給出一段話讓機器去閱讀,機器學習可以自動地發現一些值得關注的點。比如,給定一個文章中的實體和一個未知變量有這樣的關系,然后用戶可以問你這個未知變量是什么。能夠達到這樣的效果是因為深度模型已經具有了一種關注,這種關注是可以通過觀眾的學習(Attention)來表達。其結果就好像我們一目了然地看了一本書,我們會把關鍵詞和它們的關系抓取出來。這實際上是利用類似人的一種直覺來進行學習。

?

人機對話系統

?

應該說有一個領域已經發展到了臨界點,就是人機對話系統領域。現在在這個領域,某些相對垂直的方面已經收取了足夠多的數據,一個是客服,一個是汽車(車內的人車對話);還有一種是特定場景的特定任務,像Amazon Echo,你可以跟它講話,可以說“你給我放個歌吧”或者“你播一下新聞”,Amazon Echo里面是圍了一圈的8個麥克風,這個陣列可以探測到人是否在和它說話,比如我和別人說話的時候,臉轉過去,它就不會有反應。這種喚醒功能是非常準確的。它的另外一個功能是當你的雙手沒辦法去控制手機的時候,可以用語音來控制,案例場景是客廳和廚房,在美國Amazon Echo特別受家庭主婦的歡迎,所以像這種特定的場景,如果收集了足夠的數據,是可以訓練出這樣強大的對話系統來的。

?

強化遷移學習

?

我們可以想象,未來深度學習、強化學習和遷移學習的結合,可以實現以下幾個突破——反饋可以延遲、可以個性化,把一個通用模型施加到任何個體上面,這樣一個復合模型可以叫做強化遷移學習模型。

?

人工智能的可靠性模型

?

AI as Reliable Services是AAAI 前主席Thomas Dietterich在AAAI 2016上給出的一個主題,人工智能只能作為一些例證證明能夠做哪些事情,比如下棋,無人駕駛,但很多時候它還是不可靠的。它不像現在的一個商用軟件一樣,能讓你放心地去使用,以保證它的錯誤率肯定不會超過很小的比例。相反,AI 在犯錯的時候可能錯得非常厲害,所以用平均值來代表一個準確率是不恰當的,相反,應該更多地要考慮它的置信區間。換言之,小白用戶拿一些人工智能的模塊來搭一個系統,這個系統就應該能被搭出來,而且它的效果應該是在一個固定的范圍以內的,所以人工智能應該像軟件工程一樣做出來。

?

第四范式核心產品“先知平臺”一直就在往這個方向發展,先知把人工智能的模塊工程化、并在一定程度上保證了可靠性,從而讓普通用戶用來搭建自己的人工智能系統。

?

三、AI的商業風口在哪?

?

上面我們考慮了人工智能的技術發展。下面我們看看商業領域。我們剛才列舉了AI 成功的5大必要條件:高質量的大數據、清晰的問題定義和領域邊界、懂人工智能且擅長應用和算法的跨界人才、足夠的計算資源、持續的外部反饋。滿足這五個條件的領域,才有可能在未來出現人工智能的爆發。

?

智能客服

?

人機交互的智能客服,產生了很多外界公開的數據以及內部的數據、知識庫等,都可以用來制造機器人。尤其是可以用客服過去的數據來做訓練,這個數據量現在在垂直領域是逐漸在增加的。現在的對話系統也已經逐漸成為深度學習和強化學習的焦點。

?

新聞領域

?

另外一個比較看好的領域是新聞領域,新聞的分發和自動寫作。有很多編輯、解說、自動校對、作家等,其實是數據量足夠多的,有這么多的文本,而且外界反饋也越來越多了。給一篇文章,可以用機器學習來做自動摘要。 這樣一個工作的外部反饋來自哪里呢?實際上我們寫的那些paper就是一個外部反饋,因為每篇paper都有摘要,如果一篇paper被收了,就說明摘要寫的還不錯,所以外部反饋還是可以實現的。

?

這里分享一個有趣的實驗,是香港科大同學做的“自動寫小說”項目。主要有兩個步驟,一步是讓它讀很多書,一步是這樣訓練出一個模型,這個模型再讓它變成一個生成式的模型,這樣就能用來寫小說了。舉個例子,我們提供《射雕英雄傳》和《笑傲江湖》,把這兩個結合起來,就可以寫一部新的小說了。

?

特定任務的智能機器人

?

例如Amazon 的KIVA機器人,大家可能知道Amazon一個很大的優勢就是所有的倉儲都是由機器人來完成的,但是它也有工人,被雇來用手做抓取,因為現在機器人的抓取是非常難的,那么人和機器的優點就結合起來了。此外,醫療機器人也是非常專業的一個領域,它可以給人開刀縫線,但它不是自動的,而是通過遠程控制的,但控制的精密度非常高,如果它收集到足夠量的數據,是可以達到自動的效果的,以后我們可能開刀就由機器人來代勞了。

?

在醫護領域,無障礙輔助的應用領域痛點特別強烈,現在數據量可能還不是特別多,因為畢竟這一群體還是少數人,但是痛點很強,所以未來也許會有數據。

?

AI+有機食品

?

我們在香港曾去訪問過一個有機食品工廠,這個實驗室里的每一株菜,周邊的所有環境全都記錄起來,比如濕度、溫度、光照,然后就可以收集這樣的數據訓練一個機器學習的模型,最后用這個模型來做蔬菜。所以得來的蔬菜滋味可以控制,要脆感還是要甜的,都可以通過模型學習出來。

?

FINTECH智能投顧

?

最后來說一說金融,其實金融是一個非常好的領域,第四范式在金融領域也積累了很多成功案例。金融領域里的任務都是非常清楚的,而且每個任務的數據都有痕跡、有數據足跡,數據的維度也是多維度的數據,有外界的、也有內界的,非結構數據比較多,例如文本和報告。數據也是形成了孤島,鏈條也非常長,并且鏈條里面都有銜接。

?

在金融領域現在美國比較時髦的一個概念叫投研、投顧和投資。投研是說研究整個市場的基本面,就好像我們研究輿情分析一樣,但輿情只是其中的一部分;投顧是說在美國的銀行給很多客戶做理財分析,然后做理財的配置,這些工作可以由機器人來做;投資是說機器人自己就是一個客戶,它可以去投資。

?

四、多年后的AI社會

?

最后說一下我認為多年后的AI社會是怎么樣的。我覺得未來應該是幾個人在運行一個公司,每一個人都能率領成千上萬個機器人,這些機器人在做不同的事情,也是它被訓練得很擅長的事情。我們現在在一個傳統行業里,往往是20%的人在做80%的工作,那么這20%的人就是未來的運營公司的人,剩下80%的人所做的工作將交由機器來完成。一個公司的自動化,智能化程度,也代表了這個公司在商業上的反應速度和競爭力。

?

人工智能給人類帶來的變革是非常深遠的,人工智能不僅僅是一場比賽、一個應用,而是整個社會真正地徹底地在改變。機器和人將成為一個共同的“軍隊”不斷地攻克堡壘,推動人類進程向更好的方向發展。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,663評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,125評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,506評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,614評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,402評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,934評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,021評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,168評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,690評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,596評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,784評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,288評論 5 357
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,027評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,404評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,662評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,398評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,743評論 2 370

推薦閱讀更多精彩內容