無論你愿不愿意,人工智能時代都已經來臨。
從一開始,這個時代就展現出了一些不同尋常的特征。比如,如今的學術發展前沿已經從高校和研究院所轉移到了科技巨頭企業;再比如,一些人工智能創業公司在進行基礎科學研發。這里面最典型的代表就是Google旗下的Deep Mind公司,他們簡直就是一支基礎科學研究團隊,而不像商業公司。同樣的道理,人工智能的教育和培訓也存在著許多與以往的教育和培訓不同的地方。
說起人工智能培訓,我不得不對如今所呈現的這種魚龍混雜的狀態感到憂慮。目前,絕大部分人工智能培訓都可以分成兩類,一類是響應國家號召,面向中小學的人工智能教育。說實在,這類教育可能更多地應偏向于編程或機器人教育,而這和人工智能還是是兩碼事兒。由于目前的人工智能開源工具尚沒有出現類似Scratch這樣簡化的平臺,所以要讓小學生學會使用TensorFlow還有相當長的路要走。
另外一類就是面向IT工程師轉型的教育培訓。這類培訓面臨的一個最大問題就是到底教什么、學什么?學算法嗎?可是如果你真正接觸人工智能的相關工作就會發現,絕大多數公司需要的并不是開發算法的人,而是那些清洗數據、處理數據、有豐富調參經驗的工程師。換句話說,真正應該教的,面向就業的東西就應該是各式各樣的清理數據、調參的工程經驗。然而,這些東西又是很難用授課的方式來教的,因為面向毫無經驗的學員,你羅列了一套一套諸如Dropout、BatchNorm等技巧不僅對他們毫無用處,反而會讓他們感到厭倦。
那就帶著他們做項目唄。對于一個師徒制的小團體來說,帶著幾個學生承接一個項目來做應該是沒有問題的。但是,這似乎并不能算是教育或培訓了,而更多的是工程開發。所以,Kaggle選擇的就是數據科學競賽這種形式來對接產業中的項目需求和需要練手入門的程序員們,而沒有走培訓教育的道路。(www.kaggle.com)
正是對這些問題的思考,以及目前人工智能培訓中的痛點,我帶領著集智AI學園的小伙伴們開發了《火炬上的深度學習》課程,嘗試為人工智能教育提供一套不同以往的解決方案。我認為人工智能教學更主要的不是算法,更不是只有在實際的工程中才能用得著的那些優化Trick,而是對算法更深層次的理解以及對實際問題的建模思路。當你能夠在更高的維度掌握算法和建模思路的時候,你就會自然知道如何來套用哪一系列的優化技巧來解決問題,因為你已經從本質上對人工智能有了透徹的了解。
比如,在《火炬課》上的《單車預測器》一節之中,我講解了如何解剖一個簡單的神經網絡。
通過手動編程,我們可以窺探一個神經網絡內部的運作機理,從而發現什么時候神經元會被激活,以及它所對應的數據之中的特征會是什么。這一節的內容受到了學員們的一致好評。對神經網絡的解剖不僅僅破除了他們頭腦中無法打開神經網絡黑箱的迷信,也幫助他們更透徹地理解了神經網絡是如何繞開傳統的If else編程,而實現從數據中自動探測模式的。
面對大部分學員都缺乏實操經驗的問題,《火炬課》為他們精心設計了一系列小項目。這類項目首先與真實工程非常不同:你不需要超大規模的運算和數據就能解決,甚至可以在自己的筆記本電腦上跑一兩小時而完成;另一方面,這類項目又具有足夠的難度,以使得你必須掌握一定的技巧,對相關算法和技術理解到一定程度才能完成。在科學中,這種項目被稱為最小模型,我們就是讓學員進行大量的最小模型訓練從而理解深度神經網絡的工作原理。
換句話說,我們的課程更注重站在第一性原理的角度來思考人工智能,而不僅僅是對它的簡單應用。
我認為,這種具備了基本分析問題素質的人才是人工智能時代最稀缺的人才!
也許你會說,我不需要理解原理,只要懂得如何調用那些機器學習平臺不就可以玩轉深度學習嗎?為什么非要懂得里面的原理呢?如果你真的實踐過深度學習項目就會發現,編寫一個深度學習算法最主要的工作就是把數據轉換成神經網絡能夠處理的張量,而你所要做的就是根據不同的實際問題選擇不同的數據形式。這一看似不起眼的步驟,在很大程度上決定了你模型的效率。就比如說,給你一串字符,你用什么張量形式喂給神經網絡呢?你可以選擇獨熱編碼的方式,也可以先將字符嵌入為向量,還有可能簡單的采用詞帶模型來描述它。不同的方法會因條件、問題而異,也會深刻影響到后續問題的解決效率。
在《火炬》課中,我會突出另一個重點是,要學會將表面不相關的問題全部轉化成標準的機器學習問題,從而用現成的模型來解決。未來,我甚至想專門設計一門課就叫做“機器學習建模”,它與傳統的數學建模課很像,但不同的就是我們的模型全部都采用機器學習。
也許你會嘲笑我說,這種教學方法過于書生氣。真正熱愛研究探索的人才不會用你來教,人家早就自學成才了;抑或是那些工程師需要的就是混口飯吃的技術,而不需要更多理解理論層面的東西,所以你的課不會有市場。
從我接觸到的學生、學員還有更多的集智粉絲來看,事實并不是這樣的。有很多高校中的研究生甚至博士生完全學不到類似人工智能、大數據這樣的知識。高校中的課堂內容絕大部分還是相當陳舊的課本知識,而且大部分都過于強調理論而不是實戰。所以,這些中國的“精英學子”并不像我們想象的那樣風光,他們對業界的最新技術與工程師們一樣渴求。
另一方面,我接觸過的好學的工程師比比皆是。有太多的人不滿足于掌握簡單的技術,他們更對基礎科學充滿了好奇和興趣。現在這個時代技術更新太快,無論是多么高的高手都會有一種焦慮感,這種焦慮促使他們開始反思從工程化思維到科學思維的躍遷。
我們的課程滿足了這些人的需求,而我認為這樣的人必將會成為未來中國創新式社會的主流。
我堅信就像人工智能時代終將取代互聯網時代一樣,未來的高科技行業會越來越多地體現出基礎研究和應用研究再到市場的無縫融合。這意味著,科學研究的能力將會更加平民化。未來,小學生就足以撰寫像模像樣的科研論文。我力圖做的事,也正是將這種科研能力盡可能地賦予更多的人。
?微信公眾號:swarmAI
集智AI學園QQ群:426390994
學園網站:campus.swarma.org