來源:Datawhale
幾個月前,紅色石頭發文介紹過一份在 GitHub 上非常火爆的項目,名為:DeepLearning-500-questions,中文譯名:深度學習 500 問。作者是川大的一名優秀畢業生談繼勇。該項目以深度學習面試問答形式,收集了 500 個問題和答案。內容涉及了常用的概率知識、線性代數、機器學習、深度學習、計算機視覺等熱點問題。
該熱門項目一直在不斷更新,作者本著開源精神,不斷有新的貢獻者在完善項目。如今,全書已達 50 余萬字,分為 18 個章節。
首先,直接放上項目地址:
https://github.com/scutan90/DeepLearning-500-questions
目前該項目已有 2.6w stars 了!只要是內容都是干貨,超全!
下面,我們來看一看該項目有哪些硬核干貨吧!
全書目錄
該項目更確切地說是一本深度學習面試手冊,500 問,非常詳細。全書共分為 18 章,近 50 萬字,目錄如下:
數學基礎
機器學習基礎
深度學習基礎
經典網絡
卷積神經網絡(CNN)
循環神經網絡(RNN)
生成對抗網絡(GAN)
目標檢測
圖像分割
強化學習
遷移學習
網絡搭建及訓練
優化算法
超參數調試
GPU 和框架選型
自然語言處理(NLP)
模型壓縮、加速及移動端部署
后端架構選型、離線及實時計算
主要內容
全書內容非常豐富,持續更新和完善中。下面我們列舉一些知識點給讀者一睹為快!
1. 各種常見算法(第 2 章)
日常使用機器學習的任務中,我們經常會遇見各種算法,如下圖所示。
2. 支持向量機(第 2 章)
支持向量:在求解的過程中,會發現只根據部分數據就可以確定分類器,這些數據稱為支持向量。
支持向量機(Support Vector Machine,SVM):其含義是通過支持向量運算的分類器。
在一個二維環境中,其中點R,S,G點和其它靠近中間黑線的點可以看作為支持向量,它們可以決定分類器,即黑線的具體參數。
支持向量機是一種二分類模型,它的目的是尋找一個超平面來對樣本進行分割,分割的原則是邊界最大化,最終轉化為一個凸二次規劃問題來求解。
3. 常用的神經網絡結構(第 3 章)
下圖包含了大部分常用的模型:
4. 多分類 Softmax(第 3 章)
下圖包含了 Softmax 層的詳細過程和推導:
5. 經典網絡結構(第 4 章)
本章主要介紹幾個具有代表性的神經網絡模型。
LeNet-5
LeNet-5 模型是 Yann LeCun 于 1998 年提出來的,它是第一個成功應用于數字識別問題的卷積神經網絡。在 MNIST 數據中,它的準確率達到大約 99.2%。典型的 LeNet-5 結構包含卷積層、池化層和全連接層,順序一般是:卷積層->池化層->卷積層->池化層->全連接層->全連接層->輸出層。
同時給出了 LeNet-5 的網絡參數配置:
AlexNet
AlexNet 是 2012 年 ImageNet 競賽冠軍獲得者 Hinton 和他的學生 Alex Krizhevsky 設計的。AlexNet 可以直接對彩色的大圖片進行處理,對于傳統的機器學習分類算法而言,它的性能相當的出色。AlexNet 是由 5 個卷積層和 3 個全連接層組成,順序一般是:卷積層->池化層->卷積層->池化層->卷積層->卷積層->卷積層->池化層->全連接層->全連接層->輸出層。
AlexNet 的網絡參數配置:
6. 全連接、局部連接、全卷積與局部卷積(第 5 章)
全連接、局部連接、全卷積與局部卷積的對比和解釋如下:
評價
整個項目包含的內容非常多,這里就不再贅述。干貨很硬,大家不要錯過了這份資源。
總的來說,這份資源不是一本深度學習的系統教材,而是一份完整的、詳細的深度學習知識點精煉手冊。對于面試、自我測驗來說非常有幫助!一句話:硬核干貨,值得收藏!