支持向量機(jī)（SVM）

參考博客：http://blog.csdn.net/szlcw1/article/details/52259668

1.談?wù)剬?duì)支持向量機(jī)的理解

支持向量機(jī)是一種二分類模型，基本模型是找到特征空間中間隔最大的線性分類器。感知機(jī)模型只要找到分離超平面即可，而SVM不但要分離樣本，還要滿足間隔最大。
當(dāng)訓(xùn)練樣本線性可分時(shí)，通過硬間隔最大化得到一個(gè)線性可分SVM。
如果訓(xùn)練樣本只是接近線性可分，需要引入松弛變量，通過軟間隔最大化，得到線性SVM。
當(dāng)訓(xùn)練樣本線性不可分，需要引入核技巧將特征空間從低維映射到高維，使得樣本接近可分，并且通過軟間隔最大化，學(xué)習(xí)得到非線性支持向量機(jī)。

公式推導(dǎo)：硬間隔最大化（幾何間隔）-> 學(xué)習(xí)的對(duì)偶問題 -> 軟間隔最大化（引入松弛變量）-> 非線性支持向量機(jī)（核技巧）。

2. 引入對(duì)偶問題的作用：

對(duì)偶問題往往更易求解（當(dāng)尋找約束存在時(shí)的最優(yōu)點(diǎn)的時(shí)候，約束的存在雖然減小了需要搜尋的范圍，但是卻使問題變得更加復(fù)雜。為了使問題變得易于處理，我們的方法是把目標(biāo)函數(shù)和約束全部融入一個(gè)新的函數(shù)，即拉格朗日函數(shù)，再通過這個(gè)函數(shù)來尋找最優(yōu)點(diǎn)。先極小化L(w,b,a)，將w,b以a表示出來，再極大化a的函數(shù)。）
自然引入核函數(shù)，進(jìn)而推廣到非線性分類問題。（或者表達(dá)為：通過拉格朗日將目標(biāo)函數(shù)融入到一個(gè)新的函數(shù)中，然后在從minmax的原始問題，轉(zhuǎn)化為maxmin的對(duì)偶問題，一者因?yàn)槭堑慕平猓撸D(zhuǎn)化為對(duì)偶問題后，更容易求解；）

3. KKT條件

Paste_Image.png

4. SVM核函數(shù)

svm核函數(shù)的理解和選擇

5. SVM解決多分類問題

一對(duì)多法（one-versus-rest,簡(jiǎn)稱1-v-r SVMs）。訓(xùn)練時(shí)依次把某個(gè)類別的樣本歸為一類,其他剩余的樣本歸為另一類，這樣k個(gè)類別的樣本就構(gòu)造出了k個(gè)SVM。分類時(shí)將未知樣本分類為具有最大分類函數(shù)值的那類。
一對(duì)一法（one-versus-one,簡(jiǎn)稱1-v-1 SVMs）。其做法是在任意兩類樣本之間設(shè)計(jì)一個(gè)SVM，因此k個(gè)類別的樣本就需要設(shè)計(jì)k(k-1)/2個(gè)SVM。當(dāng)對(duì)一個(gè)未知樣本進(jìn)行分類時(shí)，最后得票最多的類別即為該未知樣本的類別。Libsvm中的多類分類就是根據(jù)這個(gè)方法實(shí)現(xiàn)的。
層次支持向量機(jī)（H-SVMs）。層次分類法首先將所有類別分成兩個(gè)子類，再將子類進(jìn)一步劃分成兩個(gè)次級(jí)子類，如此循環(huán)，直到得到一個(gè)單獨(dú)的類別為止。
對(duì)c和d兩種方法的詳細(xì)說明可以參考論文《支持向量機(jī)在多類分類問題中的推廣》（計(jì)算機(jī)工程與應(yīng)用。2004）
其他多類分類方法。除了以上幾種方法外，還有有向無環(huán)圖SVM（Directed Acyclic Graph SVMs，簡(jiǎn)稱DAG-SVMs）和對(duì)類別進(jìn)行二進(jìn)制編碼的糾錯(cuò)編碼SVMs。

6. SVM優(yōu)化方法-SMO

SMO（序列最小最優(yōu)算法）： SMO算法是支持向量機(jī)學(xué)習(xí)的一種快速方法，其特點(diǎn)是不斷地將原二次規(guī)劃問題分解為只有兩個(gè)變量的二次規(guī)劃子問題，并對(duì)子問題進(jìn)行解析求解，直到所有變量滿足KKT條件為止。這樣通過啟發(fā)式的方法得到原二次規(guī)劃問題的最優(yōu)解。因?yàn)樽訂栴}有解析解，所以每次計(jì)算子問題都很快，雖然子問題次數(shù)很多，但在總體上很是高效的。

Paste_Image.png

7. 為什么SVM對(duì)缺失數(shù)據(jù)敏感？

這里說的缺失數(shù)據(jù)是指缺失某些特征數(shù)據(jù)，向量數(shù)據(jù)不完整。SVM沒有處理缺失值的策略（決策樹有）。而SVM希望樣本在特征空間中線性可分，所以特征空間的好壞對(duì)SVM的性能很重要。缺失特征數(shù)據(jù)將影響訓(xùn)練結(jié)果的好壞。

8. LR和SVM的聯(lián)系與區(qū)別：

聯(lián)系：

LR和SVM都可以處理分類問題，且一般都用于處理線性二分類問題（在改進(jìn)的情況下可以處理多分類問題）
兩個(gè)方法都可以增加不同的正則化項(xiàng)，如l1、l2等等。所以在很多實(shí)驗(yàn)中，兩種算法的結(jié)果是很接近的。

區(qū)別：

LR是參數(shù)模型，SVM是非參數(shù)模型。
從目標(biāo)函數(shù)來看，區(qū)別在于邏輯回歸采用的是logistical loss，SVM采用的是hinge loss.這兩個(gè)損失函數(shù)的目的都是增加對(duì)分類影響較大的數(shù)據(jù)點(diǎn)的權(quán)重，減少與分類關(guān)系較小的數(shù)據(jù)點(diǎn)的權(quán)重。
SVM的處理方法是只考慮support vectors，也就是和分類最相關(guān)的少數(shù)點(diǎn)，去學(xué)習(xí)分類器。而邏輯回歸通過非線性映射，大大減小了離分類平面較遠(yuǎn)的點(diǎn)的權(quán)重，相對(duì)提升了與分類最相關(guān)的數(shù)據(jù)點(diǎn)的權(quán)重。
邏輯回歸相對(duì)來說模型更簡(jiǎn)單，好理解，特別是大規(guī)模線性分類時(shí)比較方便。而SVM的理解和優(yōu)化相對(duì)來說復(fù)雜一些，SVM轉(zhuǎn)化為對(duì)偶問題后,分類只需要計(jì)算與少數(shù)幾個(gè)支持向量的距離,這個(gè)在進(jìn)行復(fù)雜核函數(shù)計(jì)算時(shí)優(yōu)勢(shì)很明顯,能夠大大簡(jiǎn)化模型和計(jì)算。
logic 能做的 svm能做，但可能在準(zhǔn)確率上有問題，svm能做的logic有的做不了。

9. 核函數(shù)的選擇

口訣：
初級(jí)：高維用線性，不行換特征；低維試線性，不行換高斯
中級(jí)：線性試試看，不行換高斯，卡方有奇效，絕招MKL
玩家：Kernel度量相似性，自己做啊自己做

最后編輯于：2017.12.10 05:58:53

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點(diǎn)，簡(jiǎn)書系信息發(fā)布平臺(tái)，僅提供信息存儲(chǔ)服務(wù)。

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 229,619評(píng)論 6贊 539
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 99,155評(píng)論 3贊 425
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 177,635評(píng)論 0贊 382
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)。經(jīng)常有香客問我，道長(zhǎng)，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,539評(píng)論 1贊 316
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 72,255評(píng)論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 55,646評(píng)論 1贊 326
城市分裂傳說
那天，我揣著相機(jī)與錄音，去河邊找鬼。笑死，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,655評(píng)論 3贊 444
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 42,838評(píng)論 0贊 289
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 49,399評(píng)論 1贊 335
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 41,146評(píng)論 3贊 356
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 43,338評(píng)論 1贊 372
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,893評(píng)論 5贊 363
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 44,565評(píng)論 3贊 348
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,983評(píng)論 0贊 28
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 36,257評(píng)論 1贊 292
情欲美人皮
我被黑心中介騙來泰國(guó)打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個(gè)月前我還...
沈念sama閱讀 52,059評(píng)論 3贊 397
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 48,296評(píng)論 2贊 376

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

支持向量機(jī)（SVM）

支持向量機(jī)（SVM）

1.談?wù)剬?duì)支持向量機(jī)的理解

2. 引入對(duì)偶問題的作用：

3. KKT條件

4. SVM核函數(shù)

5. SVM解決多分類問題

6. SVM優(yōu)化方法-SMO

7. 為什么SVM對(duì)缺失數(shù)據(jù)敏感？

8. LR和SVM的聯(lián)系與區(qū)別：

9. 核函數(shù)的選擇

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

支持向量機(jī)（SVM）

1.談?wù)剬?duì)支持向量機(jī)的理解

2. 引入對(duì)偶問題的作用：

3. KKT條件

4. SVM核函數(shù)

5. SVM解決多分類問題

6. SVM優(yōu)化方法-SMO

7. 為什么SVM對(duì)缺失數(shù)據(jù)敏感？

8. LR和SVM的聯(lián)系與區(qū)別：

9. 核函數(shù)的選擇

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频