搜索引擎“相關推薦”策略介紹

廣義上搜索引擎的“相關推薦”包含這么幾個模塊:
1、suggest模塊:輸入query(關鍵詞)過程中出現在搜索框下方的智能推薦。
2、相關搜索模塊:就是搜索結果底部的那堆文字鏈模塊。
3、右側相關推薦模塊:出現在搜索結果右上角的圖文推薦模塊。
以上三個模塊所起到的作用各不相同,下面逐個拆解。

suggest模塊
與其它2個模塊不同,suggest是在搜索結果展示之前出現,所以它起到的主要作用是在用戶完成輸入query之前命中用戶的搜索需求,從而減少用戶的輸入成本
如用戶輸入“4”時,推薦“4399小游戲”;輸入“明朝”時,推薦“明朝那些事”;輸入“校花”時,推薦“校花的貼身高手”等等。
為了命中用戶需求的概率更高,suggest需要重點滿足幾個條件:
1、要相關,符合用戶輸入習慣,這是最基本的。
2、要足夠熱門,同等情況下搜索量越高越好,這里的搜索量指的是較長一段時間內的均值。
3、要足夠多樣化,集中于某個特定的主題,不如分散到多個主題。如搜索“明朝那些事”,全部出在線閱讀、txt下載、有聲閱讀這些下位需求,不如適當穿插“明朝那些事2(3、4)”等。
4、適當關注時效性。推薦的時候需要考慮近期搜索量增長很快的一些query,如搜索“劉曉慶”,前段時間劉曉慶吐槽機場面條貴那個事件就需要推薦。
5、如果技術允許,可以參考用戶的搜索日志做個性化推薦,這或許是目前各搜索引擎提升空間最大的地方,上面4個方面各主要搜索引擎都做的不錯了。有機會可以針對suggest的個性化專門寫一篇文章來分析。

相關搜索模塊
該模塊的典型使用場景是用戶輸入query后在搜索結果中沒有發現自己需要的內容,在拉到搜索結果底部時點擊相關搜索繼續尋找自己需要的內容。
做好該模塊的要素大體上和suggest差不多,相關性、熱門度、多樣性、時效性等都挺重要。但因為相關搜索模塊是在搜索結果顯示后才出現的,所以根據搜索結果對用戶需求的滿足程度不同,出現的相關搜索推薦也有所差異。
1、當用戶需求滿足度較好時,和query語義重復的推薦要做打壓,多推薦一些和query互補或者領域相關的內容。如“花千骨”,主需求是在線觀看該電視劇,當然搜索結果滿足的非常好。那么“花千骨全集”、“花千骨在線觀看”等語義重復的推薦就不要出了。這時適當偏離主需求的推薦就可以推薦,如“花千骨2015”、“花千骨 優酷”、“花千骨小說”以及類型相似的電視劇如“瑯琊榜”、“云中歌”等。
2、當用戶需求滿足度較差時,和query語義重復的推薦就不能盲目打壓。比如很典型的盜版電影需求,如目前網上還沒有免費正版資源的煎餅俠。用戶搜索“煎餅俠免費版”,如果用戶需求滿足度較差(這很可能發生),那么推薦“煎餅俠在線觀看”、“煎餅俠西瓜影音”等就很合適,因為對這類需求,query稍微做一些更改搜索結果就會有很大的不同,滿足用戶需求的可能性就更高。此時就不能對原語義做太多的偏離,如弱需求“煎餅俠票房”、“煎餅俠演員表”等就不要做太多推薦,至少位置要盡可能靠后;同樣類型相似的影視“屌絲男士”、“港囧”等都需要做適當打壓。

右側相關推薦
該模塊獨特的地方有兩個方面:
1、其它2個模塊都是純文本展示形式,該模塊是唯一使用圖文展現形式的模塊。
2、其它2個模塊著重于文本相關,通俗點說就是和原query都有重復的文字;而該模塊更注重領域相關,在文本上基本和原query無重復的地方,起到的更多的是發現探索的作用。
如果說搜索引擎目前還只是做到符合用戶預期,那么未來超出用戶預期的部分最有可能是通過這個模塊來提供。一個典型的場景是某個新人剛進入互聯網行業,某段時間對行業資訊非常感興趣,剛開始它只知道虎嗅網,在搜索引擎中搜索“虎嗅網”的過程中,他發現了右側推薦的一堆相關的提供行業資訊的網站,雷鋒網,36氪,pingwest,知乎,果殼等,這就是典型的超出用戶預期。
做好該模塊的難度較大,因為數據的選擇范圍太廣,但最少需要做到以下幾點:
1、最基本的是要基礎領域相關,這個普通的用戶都可以感知到,技術難度也不大。
2、推薦的粒度要細,不要太粗放。比如“科比”這個query,他的首要標簽是NBA球星,其次才是籃球標簽,所以推薦的時候要優先推薦相關的NBA球星,如果一上來就推薦籃球相關的技術、相關籃球術語等,那么粒度就有些太過于粗放,點擊自然就不會太高。
3、做好基礎質量,尤其是圖片質量。圖片是吸引用戶點擊的最主要因素,所以圖片起碼要做到清晰相關,目前各大搜索引擎做的都不是太好,相對而言百度要好一些。要做好這一點需要重點在數據源上下功夫。
但正如前面所說,做好這個模塊的難度很大,并且人工評判主觀性太強,比較合理的策略是在做好基礎相關(各大引擎目前做的都還不錯)的情況下,不斷調整策略,根據點擊率的變化來評判一個策略的好壞。策略可以是針對所有query,也可以是針對某一類query,如“影視”、“人物”、“小說”等。

當然,最終判定某個模塊是否優秀,或者策略升級是否有效,最終還是要用數據說話。比如點擊率是否提升,從該模塊帶過去的搜索量占總搜索量的比例是否提高等等。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,837評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,196評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,688評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,654評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,456評論 6 406
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,955評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,044評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,195評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,725評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,608評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,802評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,318評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,048評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,422評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,673評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,424評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,762評論 2 372

推薦閱讀更多精彩內容