機器學習內家心法資源整理(持續更新)

原文更新在俺的GitHub上,如果覺得好點個star謝謝。
機器學習/人工智能/自然語言處理資料教程集合

前面基本是我看過的書籍和教程推薦,在最后面有我的學習路線,避免多走彎路,實現高效系統學習。

目錄:

基礎概念和認知:

機器學習 機器學習是近20多年興起的一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動“學習”的算法。機器學習算法是一類從數據中自動分析獲得規律,并利用規律對未知數據進行預測的算法。因為學習算法中涉及了大量的統計學理論,機器學習與統計推斷學聯系尤為密切,也被稱為統計學習理論。算法設計方面,機器學習理論關注可以實現的,行之有效的學習算法。下面是ML比較完備的知識技能圖

ML知識技能圖

入門

心路歷程,別人的經驗讓我們少走彎路:

機器學習入門者學習指南-研究生型入門者的親身經歷

書籍

數學

ML&&NLP

  • 《機器學習》西瓜書 作者:周志華。 本人讀過入門級拿西瓜做案例很清晰,沒有數學基礎還是不要看,特別是程序員,因為周老師層次太高偏學術。

  • 《DeepLearning》花書,最近中文版要出版了,稱為圣書,這個可以慢慢啃,絕對要看的。

  • 《機器學習》作者Mitchell。Mitchell是機器學習的鼻祖,第一個提出機器學習概念的人。這本書很薄,很簡單。內容很陳舊,但是都是機器學習的經典問題。而且,這本書概念清晰正確(很可貴啊,又簡單又正確的書,說明作者功力很強)。

  • 《神經網絡與機器學習》作者:Simon Haykin。 事實上,現在常見的很多機器學習算法都發端于神經網絡,像SVM,深度學習,CNN等等。這本書詳細的介紹了神經網絡及其相關算法的所有細節。如果想深入了解的話,可以看一下。只想運用的話,也可以隨便翻翻算法的介紹。

  • 《模式識別與機器學習》馬春鵬 有數學基礎再搞,不然很難受

  • 《集體編程智慧》代碼豐富,結合理論搞

  • 《機器學習算法原理與編程實戰》有理論有代碼

  • 《機器學習實戰》推薦

  • 《數據挖掘導論》我學習過程中必不可少


視頻教程

一、基本功

數學基礎機器學習必要的數學基礎主要包括:

二、修行(推薦李宏毅然后后吳恩達深度學習課程,然后決定走CV OR NLP 再看CS231N 或者 CS224N)

博客等

WeChat公眾號:機器之心,數盟,量子位,新智元,

文章-論文

The Discipline of Machine LearningTom Mitchell 當年為在CMU建立機器學習系給校長寫的東西。
A Few Useful Things to Know about Machine Learning Pedro Domingos教授的大道理,也許入門時很多概念還不明白,上完公開課后一定要再讀一遍。

其它

矩陣求導
知乎找答案


我自己的學習計劃

已經大致了解這個領域所用到的知識,根據網上的參考進行1.0階段的學習,看了前面的知道我對PGM特別感興趣啊,所以感謝夕小瑤(wx:xixiaoyaoQAQ)按照她的提供的知識結構給自己定個計劃。 已經完成的都會帶有我在學習過程中見到比較好的資料,或者我自己總的,這樣減少大家在學習過程中找資料的成本

第一階段(五月到六月):基本模型

輔助用視頻Ng的courses《machine learning》,臺灣國立大學林老師《機器學習基石》、《數據挖掘導論》第4、5章

第二階段(七月~):最優化(已完成,主要是靠知乎和《統計學習方法》,還得繼續深入理解)

復習《概率論與數理統計》、理解《Deep Learning》中的4.3節和4.4節,《Numerical Optimazation》、《最優化理論與方法》袁亞湘,孫文瑜、《統計學習方法》、《數據 挖掘導論》、《機器學習實戰》、《智能優化方法》

  • 一階無約束優化算法
    • 梯度下降法(步長的確定方法、線搜索法,信賴域法)
  • 二階無約束優化算法
    • 牛頓法
    • 共軛梯度法
    • 擬牛頓法
  • 約束優化算法
    • 線性規劃(概念與應用、單純形法、內點法)
    • 二次規劃(概念與應用、對偶法、積極集法)
    • 拉格朗日乘子法的簡單認識
  • 感知機模型
  • K近鄰模型
  • 樸素貝葉斯模型
  • 決策樹模型
  • 支持向量機模型
  • 集成分類器
    • Bagging
    • Boosting
    • Random Forest
  • 遺傳算法
  • 模擬退火
  • 禁忌搜索算法
  • 蟻群算法
  • 粒子群優化算法
  • LDA/PCA
  • SVD

第三階段:模式識別與深度學習

  • 貝葉斯決策(《模式分類》)
  • 參數估計
  • 非參數方法
  • 線性判別函數
  • 淺層神經網絡
    • delta方法
    • BP算法及其優化
    • RBF網絡
  • 深度神經網絡(DL中文版書籍)
    • Hopfield網絡
    • 玻爾茲曼機
    • RBM
    • DBN
    • DBM
    • CNN
    • Autoencoder
    • RNN
    • LSTM
      (CNN~LSTM)李宏毅教授的課不要太好了。一聽就懂
  • 聚類
    • 高斯混合密度
    • K-means
    • 層次聚類
  • 決策樹與隨機森林
  • 特征提取與特征選擇

第四階段:

應該是各種框架和工程,比賽吧,哈哈,到這個階段就有自己的方向,現在自己也不知道干啥,哈哈哈

貫穿始終:

編程是一定要的,推薦先用Python把常用算法實現一遍,然后把NG深度學習課程作業敲一遍,自己寫神經網絡,你就會明了,一定要code,code,code。后面用tf+keras等都可以。

知識點:(每一周深入學習一種網絡)
《統計學習方法》、《Deep Learning》、《模式分類》

  • 前饋神經網絡

  • 自編碼器(Auto-Encoder)遞歸神經網絡(Recursive NN) / 循環神經網絡(RNN)/ 卷積神經網絡(CNN) / 神經張量網絡 (NTN)

  • 長短時記憶網絡(LSTM) / 卷積長短時神經網絡(convLSTM) / 張量遞歸神經網絡(MV-RNN)/遞歸神經張量網絡(RNTN)

  • 受限波爾茲曼機(RBM) / 玻爾茲曼機

  • 概率圖模型

  • 有向圖模型->貝葉斯網絡

  • 無向圖模型->馬爾科夫隨機場->條件隨機場

原文更新在俺的GitHub上,可能最新。可以進去看看。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,197評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,415評論 3 415
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,104評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,884評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,647評論 6 408
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,130評論 1 323
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,208評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,366評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,887評論 1 334
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,737評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,939評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,478評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,174評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,586評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,827評論 1 283
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,608評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,914評論 2 372

推薦閱讀更多精彩內容

  • 機器學習(Machine Learning)&深度學習(Deep Learning)資料(Chapter 1) 注...
    Albert陳凱閱讀 22,308評論 9 476
  • 大概很多人都會覺得,時裝模特和IT界的碼農(注:程序員)這兩個職業怎么想都像是地球的兩極,毫不相干。同時一個成功的...
    又餓又困閱讀 1,968評論 0 3
  • 有人說,知道卻做不到,等于不知道。 年紀越來越大,越來越傾向于認同這句話。雞湯喝過不少,喝的時候深以為然,斗志滿胸...
    薄荷草2016閱讀 202評論 0 1
  • 現在講利潤,利潤也稱凈利潤或凈收益。我們分兩個層面去講解。 從狹義的收入、費用來講,利潤包括收入和費用的差額,以及...
    aabebw閱讀 124評論 0 0
  • 健身卡效應:健身房的成本非常高,如果開卡的會員都 堅持來鍛煉,那健身房是會虧損的。但是,每個健身房都 活得很好。原...
    龍卷風227閱讀 176評論 0 0