2. 樸素貝葉斯
監督學習
- 馬是否屬于acerous?
關注特征 - 監督學習、非監督學習(異常檢測、聚類等)
- features -> ... -> labels
- 散點圖 -> 決策面(DS)
- 線性決策面(直線)
樸素貝葉斯&高斯貝葉斯
- 度量分類器效果
準確率 sklearn.metrics.accuracy_score -
樸素貝葉斯原理
敏感性、特異性
image.png
先驗概率、后驗概率
先驗和后驗
Posterior 應該寫為:
P(C, Pos) = P(C) ? P(Pos|C)
P(?C, Pos) = P(?C)? P(Pos|?C)
- Normalization
image.png
-
Bayes Rule
思路
貝葉斯用于分類
image.png
image.png
image.png
Navie原因——沒有考慮詞序(選項詞序、單詞、長度)
優勢:特征空間可以很大(比如2萬-20萬words)、易于運行、有效;
缺點:中斷影響Bayes,比如多個詞組成的有含義的詞,芝加哥 公牛,不適用。
Mini Project
下載項目初始文件(只需一次)
運行初始腳本
每節課接近尾聲時,都會有一段視頻和/或閱讀節點,向你介紹該節課的迷你項目
你將從一系列課程節點中了解如何做迷你項目,而且你還有機會在任務(類似于測試題)期間輸入答案
在你自己的計算機上根據閱讀節點中的說明開發代碼
你編寫的代碼將使你能夠回答測試題中的問題。
那么,接下來該做什么?
如果你了解 git,你可以復制初始文件:* git clone https://github.com/udacity/ud120-projects.git*
如果你不了解,優達學城有一門優秀(且簡短的)課程幫助你快速入門