“火炬上的深度學習”之緣起

無論你愿不愿意,人工智能時代都已經來臨。

從一開始,這個時代就展現出了一些不同尋常的特征。比如,如今的學術發展前沿已經從高校和研究院所轉移到了科技巨頭企業;再比如,一些人工智能創業公司在進行基礎科學研發。這里面最典型的代表就是Google旗下的Deep Mind公司,他們簡直就是一支基礎科學研究團隊,而不像商業公司。同樣的道理,人工智能的教育和培訓也存在著許多與以往的教育和培訓不同的地方。

說起人工智能培訓,我不得不對如今所呈現的這種魚龍混雜的狀態感到憂慮。目前,絕大部分人工智能培訓都可以分成兩類,一類是響應國家號召,面向中小學的人工智能教育。說實在,這類教育可能更多地應偏向于編程或機器人教育,而這和人工智能還是是兩碼事兒。由于目前的人工智能開源工具尚沒有出現類似Scratch這樣簡化的平臺,所以要讓小學生學會使用TensorFlow還有相當長的路要走。

另外一類就是面向IT工程師轉型的教育培訓。這類培訓面臨的一個最大問題就是到底教什么、學什么?學算法嗎?可是如果你真正接觸人工智能的相關工作就會發現,絕大多數公司需要的并不是開發算法的人,而是那些清洗數據、處理數據、有豐富調參經驗的工程師。換句話說,真正應該教的,面向就業的東西就應該是各式各樣的清理數據、調參的工程經驗。然而,這些東西又是很難用授課的方式來教的,因為面向毫無經驗的學員,你羅列了一套一套諸如Dropout、BatchNorm等技巧不僅對他們毫無用處,反而會讓他們感到厭倦。

那就帶著他們做項目唄。對于一個師徒制的小團體來說,帶著幾個學生承接一個項目來做應該是沒有問題的。但是,這似乎并不能算是教育或培訓了,而更多的是工程開發。所以,Kaggle選擇的就是數據科學競賽這種形式來對接產業中的項目需求和需要練手入門的程序員們,而沒有走培訓教育的道路。(www.kaggle.com)

正是對這些問題的思考,以及目前人工智能培訓中的痛點,我帶領著集智AI學園的小伙伴們開發了《火炬上的深度學習》課程,嘗試為人工智能教育提供一套不同以往的解決方案。我認為人工智能教學更主要的不是算法,更不是只有在實際的工程中才能用得著的那些優化Trick,而是對算法更深層次的理解以及對實際問題的建模思路。當你能夠在更高的維度掌握算法和建模思路的時候,你就會自然知道如何來套用哪一系列的優化技巧來解決問題,因為你已經從本質上對人工智能有了透徹的了解。

比如,在《火炬課》上的《單車預測器》一節之中,我講解了如何解剖一個簡單的神經網絡。

通過手動編程,我們可以窺探一個神經網絡內部的運作機理,從而發現什么時候神經元會被激活,以及它所對應的數據之中的特征會是什么。這一節的內容受到了學員們的一致好評。對神經網絡的解剖不僅僅破除了他們頭腦中無法打開神經網絡黑箱的迷信,也幫助他們更透徹地理解了神經網絡是如何繞開傳統的If else編程,而實現從數據中自動探測模式的。

面對大部分學員都缺乏實操經驗的問題,《火炬課》為他們精心設計了一系列小項目。這類項目首先與真實工程非常不同:你不需要超大規模的運算和數據就能解決,甚至可以在自己的筆記本電腦上跑一兩小時而完成;另一方面,這類項目又具有足夠的難度,以使得你必須掌握一定的技巧,對相關算法和技術理解到一定程度才能完成。在科學中,這種項目被稱為最小模型,我們就是讓學員進行大量的最小模型訓練從而理解深度神經網絡的工作原理。

換句話說,我們的課程更注重站在第一性原理的角度來思考人工智能,而不僅僅是對它的簡單應用。

我認為,這種具備了基本分析問題素質的人才是人工智能時代最稀缺的人才!

也許你會說,我不需要理解原理,只要懂得如何調用那些機器學習平臺不就可以玩轉深度學習嗎?為什么非要懂得里面的原理呢?如果你真的實踐過深度學習項目就會發現,編寫一個深度學習算法最主要的工作就是把數據轉換成神經網絡能夠處理的張量,而你所要做的就是根據不同的實際問題選擇不同的數據形式。這一看似不起眼的步驟,在很大程度上決定了你模型的效率。就比如說,給你一串字符,你用什么張量形式喂給神經網絡呢?你可以選擇獨熱編碼的方式,也可以先將字符嵌入為向量,還有可能簡單的采用詞帶模型來描述它。不同的方法會因條件、問題而異,也會深刻影響到后續問題的解決效率。

在《火炬》課中,我會突出另一個重點是,要學會將表面不相關的問題全部轉化成標準的機器學習問題,從而用現成的模型來解決。未來,我甚至想專門設計一門課就叫做“機器學習建模”,它與傳統的數學建模課很像,但不同的就是我們的模型全部都采用機器學習。

也許你會嘲笑我說,這種教學方法過于書生氣。真正熱愛研究探索的人才不會用你來教,人家早就自學成才了;抑或是那些工程師需要的就是混口飯吃的技術,而不需要更多理解理論層面的東西,所以你的課不會有市場。

從我接觸到的學生、學員還有更多的集智粉絲來看,事實并不是這樣的。有很多高校中的研究生甚至博士生完全學不到類似人工智能、大數據這樣的知識。高校中的課堂內容絕大部分還是相當陳舊的課本知識,而且大部分都過于強調理論而不是實戰。所以,這些中國的“精英學子”并不像我們想象的那樣風光,他們對業界的最新技術與工程師們一樣渴求。

另一方面,我接觸過的好學的工程師比比皆是。有太多的人不滿足于掌握簡單的技術,他們更對基礎科學充滿了好奇和興趣。現在這個時代技術更新太快,無論是多么高的高手都會有一種焦慮感,這種焦慮促使他們開始反思從工程化思維到科學思維的躍遷。

我們的課程滿足了這些人的需求,而我認為這樣的人必將會成為未來中國創新式社會的主流。

我堅信就像人工智能時代終將取代互聯網時代一樣,未來的高科技行業會越來越多地體現出基礎研究和應用研究再到市場的無縫融合。這意味著,科學研究的能力將會更加平民化。未來,小學生就足以撰寫像模像樣的科研論文。我力圖做的事,也正是將這種科研能力盡可能地賦予更多的人。

?微信公眾號:swarmAI

集智AI學園QQ群:426390994

學園網站:campus.swarma.org

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,401評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,011評論 3 413
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,263評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,543評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,323評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,874評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,968評論 3 439
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,095評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,605評論 1 331
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,551評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,720評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,242評論 5 355
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,961評論 3 345
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,358評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,612評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,330評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,690評論 2 370

推薦閱讀更多精彩內容