噪音魯棒的損失函數

一、前提知識

定義0——噪音、對稱噪音、非對稱噪音:

  • 噪音:在這里指的是標簽錯誤的樣本。例如在通過眾包進行數據打標的場景中噪音就是一個不可避免的問題。
  • 對稱噪音(symmetric/uniform noise):所有的樣本,都以同樣的概率會錯標成其他標簽;
  • 非對稱噪音(asymmetric/class-confitional noise):不同類別的樣本,其錯標的概率也不相同。

定義1——損失函數的抗噪性:

如果一個損失函數,在有噪音的情況下,其風險最小化的模型(minimizer)跟沒有噪音時是相同的,就稱這個損失函數是抗噪的(noise-tolerant)。換言之,有噪音的情況下的最優模型,跟沒噪音一樣。(聽起來是不是不可能?)

定義2——損失函數的對稱性:

我們設模型f(x)的損失函數為L,設分類問題的類別有k類,則稱這個損失函數L是對稱的,當它滿足下面的公式:
\sum_{i=1}^{k} L(f(\mathbf{x}), i)=C, \forall \mathbf{x} \in \mathcal{X}, \forall f

二、重大發現:有對稱性的損失函數,具有一定的抗噪能力

作者通過推導以及實驗,發現擁有對稱屬性的損失函數,對噪音的抵抗能力也更強。甚至,當噪音時對稱噪音時,該損失函數理論上是完全抗噪的。

理論推導:

下面我們來推導一下:

首先假設我們面對的是對稱噪音,噪音比為\eta.
設一個模型在沒有噪音時的目標函數R_{L},即損失函數在所有訓練樣本上的期望:
R_{L}(f)=\mathbb{E}_{\mathbf{x}, y_{\mathbf{x}}} L\left(f(\mathbf{x}), y_{\mathbf{x}}\right)
然后,設該模型在當前有噪音的情況下,目標函數是R_{L}^{\eta},公式為:
R_{L}^{\eta}(f)=\mathbb{E}_{\mathbf{x}, \hat{y}_{\mathbf{x}}} L\left(f(\mathbf{x}), \hat{y}_{\mathbf{x}}\right)

那么,如果損失函數是對稱的,我們可以有以下推導:


即可以得出結論:
R_{L}^{\eta}(f)=A+\alpha R_{L}(f)
其中A為常數,\alpha為跟噪音比\eta和類別k相關的系數。

由此可以知道,當\alpha > 0的時候(即當\eta<\frac{k-1}{k}時),R_{L}^{\eta}(f)R_{L}(f)是線性相關的,故他們的f的最優解也是一樣的!而只需要滿足對稱噪音的噪音比\eta<\frac{k-1}{k}即可。

這相當于,在二分類問題中噪音比不超過50%,三分類問題中噪音不超過66%,十分類問題中噪音不超過90% ,都跟沒噪音一樣!

基于直覺的理解:

推導出上面的結論,我當時也十分的驚訝,居然這么神奇。我們想一想,上面的結論中,最重要的假設是什么?有兩方面:

  1. 損失函數自身的對稱屬性
    這個屬性直觀的理解,可以通過下圖:


    上圖展示了一個四分類問題,損失函數對稱,就意味著如果一個樣本,它的真實標簽把所有標簽都遍歷一遍,計算其損失之和,這個和是個常數。

  2. 對稱噪音,即當一個樣本錯標時,它被分配到任意一個標簽的概率都是相同的。

在這樣的情況下,噪音的出現,在某種意義上,相當于一個樣本把所有標簽都遍歷了一遍。那么對整體的損失函數,只不過是增加了一個常數,因此不影響最終的優化結果。

現實的例子

通過上面的神奇的發現,我們不禁想問,擁有這么神奇的屬性的損失函數應該很少見吧。其實不是,常見的MAE(mean absolute error,平均絕對誤差),就是一個典型的擁有對稱性的損失函數。而我們最最常用的CCE(categorical cross-entropy loss,交叉熵損失函數)、MSE(mean squire error,均方誤差),則是非對稱的。

下面是他們的損失函數:
L\left(f(\mathbf{x}), \mathbf{e}_{\mathbf{j}}\right)=\left\{\begin{array}{ll} \sum_{i=1}^{k} e_{j i} \log \frac{1}{u_{i}}=\log \frac{1}{u_{j}} & \mathrm{CCE} \\ \left\|\mathbf{e}_{\mathbf{j}}-u\right\|_{1}=2-2 u_{j} & \mathrm{MAE} \\ \left\|\mathbf{e}_{\mathbf{j}}-u\right\|_{2}^{2}=\|u\|_{2}^{2}+1-2 u_{j} & \mathrm{MSE} \end{array}\right.

通過遍歷類別求和,驗證其對稱性:
\sum_{i=1}^{k} L\left(f(\mathbf{x}), \mathbf{e}_{\mathbf{i}}\right)=\left\{\begin{array}{ll} \sum_{i=1}^{k} \log \frac{1}{u_{i}} & \mathrm{CCE} \\ \sum_{i=1}^{k}\left(2-2 u_{i}\right)=2 k-2 & \operatorname{MAE} \\ k\|u\|_{2}^{2}+k-2 & \mathrm{MSE} \end{array}\right.
可以看出,MAE確實具有對稱性。

作者在MNIST和RCV1數據集上做了一些實驗,見下圖:


可以看出,在有噪音的情況下,CCE最大的特點就是,測試集上的accuracy像坐過山車一樣,很快到達坡頂,然后飛流直下。而MAE在測試集上則是緩緩地爬坡,沒有明顯的下降趨勢。

然而,MAE自然也有其缺點,其收斂十分艱難,從圖中可以看出,它在訓練集上的收斂速度很慢,甚至嚴重欠擬合。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,837評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,196評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,688評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,654評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,456評論 6 406
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,955評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,044評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,195評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,725評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,608評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,802評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,318評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,048評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,422評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,673評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,424評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,762評論 2 372

推薦閱讀更多精彩內容