LambdaMART筆記

LambdaMART是一種state-of-art的Learning to rank算法，由微軟在2010年提出[1]。在工業界，它也被大量運用在各類ranking場景中。LambdaMART可以看做GDBT版本的LambdaRank，而后者又是基于RankNet發展而來的。RankNet最重要的貢獻是提出了一種pairwise的用于排序的概率損失函數，而LambdaRank又在損失函數中巧妙的引入了NDCG等ranking metrics來優化排序效果。LambdaMART則是集大成者，它結合了上述兩篇文章中提出的Lambda函數以及GDBT這個效果經過實踐證明的ensemble算法，在各種排序問題中均能取得不錯的效果。下面是目前的一些開源實現：

Ranklib
Xgboost

RankNet

RankNet是2005年微軟提出的一種pairwise的Learning to rank算法，它從概率的角度來解決排序問題。RankNet提出了一種pairwise的概率損失函數，并可以應用于任意對參數可導的學習算法。在論文中，RankNet基于神經網絡實現，除此之外，GDBT等模型也可以應用該損失函數。
RankNet是一個pairwise的算法，它首先將訓練數據中同一Query下的doc兩兩組成pair，用{U_i，U_j}表示。模型的學習目標是得到一個打分函數f(x)，它的輸入是某個doc的特征向量x，輸出是一個實數，值越高代表該doc的排序位置應該越靠前。也就是說，當f(x_i)>f(x_j)時，U_i的排序位置應該在U_j之前，用U_i ? U_j表示。基于此，我們定義U_i比U_j排序位置更靠前的概率如下，其中，s=f(x).

我們的目標概率（理想情況，預測概率應該盡可能擬合的概率）如下：

為了方便計算，我們令：

這樣，根據U_i和U_j的標注得分，就可以計算P‘_ij。
有了目標概率和模型預測概率，使用交叉熵損失函數（cross entropy loss function）作為概率損失函數，它衡量了預測概率和目標概率在概率分布上的擬合程度：

求上式關于s_i的偏導，由于對稱性可以得到如下結論：

計算C關于模型參數w_k的偏導，并應用gradient descent求解：

總的來說，RankNet從概率角度定義了排序問題的loss function，并通過梯度下降法求解。所以RankNet依賴的模型必須是平滑的，保證梯度是可以計算的。在paper中，作者選擇一個兩層的神經網絡作為排序模型。除此之外，選擇GBDT也可以取得不錯的效果。

交叉熵
設隨機變量X服從的概率分布為p(x)，往往p(x)是未知的，我們通過統計方法得到X的近似分布q(x)，則隨機變量X的交叉熵為：

它衡量了q(x)和p(x)的擬合程度

加速學習算法

在上述的學習過程中，每一對樣本{U_i，U_j}都會更新一次參數w，如果采用BP神經網絡模型，每一次更新都需要先前向預測，再誤差后向反饋，訓練過程非常慢。因此，有了下面的加速算法；
對于給定的樣本對U_i，U_j，我們有如下推導：
![][07]
這里我們定義：
![][08]
梯度下降量的求解如下：
![][09]
其中，為了計算簡便，我們令{i,j}滿足U_i>U_j，所以有
![][10]
上兩式合并有：
![][12]
其中：
![][11]
這樣，我們將每更新一次w，計算一個樣本對{U_i，U_j}
改為了計算U_i所能組成的所有樣本對。加速算法可以看成是一種mini-batch的梯度下降算法。

LambdaRank

在RankNet中，我們使用了交叉熵概率損失函數，并作為最優化的目標。但對于IR問題，通常選擇NDCG、ERR作為評價指標，這兩者間存在一定的mismatch。另一方面，NDCG、ERR是非平滑、不連續的，無法求梯度，不能直接運用梯度下降法求解，將其直接作為優化目標是比較困難的。因此，LambdaRank選擇了直接定義cost function的梯度來解決上述問題。
LambdaRank是一個經驗算法，它直接定義的了損失函數的梯度λ，也就是Lambda梯度。Lambda梯度由兩部分相乘得到：(1)RankNet中交叉熵概率損失函數的梯度；(2)交換U_i，U_j位置后IR評價指標Z的差值。具體如下：
![][15]
Z可以是NDCG、ERR、MRR、MAP等IR評價指標
損失函數的梯度代表了文檔下一次迭代優化的方向和強度，由于引入了IR評價指標，Lambda梯度更關注位置靠前的優質文檔的排序位置的提升。有效的避免了下調位置靠前優質文檔的位置這種情況的發生。
LambdaRank相比RankNet的優勢在于考慮了評價指標，直接對問題求解，所以效果更好。

LambdaMART

LambdaRank中重新定義了損失函數的梯度，而這個Lambda梯度可以應用于任何使用梯度下降法求解的模型。自然，我們想到了將Lambda梯度和MART結合，這就是LambdaMART。

MART

學習過程

Ranklib

最后編輯于：2018.01.16 18:50:01

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 228,316評論 6贊 531
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,481評論 3贊 415
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事?！?“怎么了？”我有些...
開封第一講書人閱讀 176,241評論 0贊 374
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,939評論 1贊 309
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,697評論 6贊 409
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 55,182評論 1贊 324
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,247評論 3贊 441
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,406評論 0贊 288
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,933評論 1贊 334
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,772評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,973評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,516評論 5贊 359
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,209評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,638評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,866評論 1贊 285
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,644評論 3贊 391
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,953評論 2贊 373

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

LambdaMART筆記

LambdaMART筆記

RankNet

加速學習算法

LambdaRank

LambdaMART

MART

學習過程

Ranklib

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

LambdaMART筆記

RankNet

加速學習算法

LambdaRank

LambdaMART

MART

學習過程

Ranklib

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频