廣義上搜索引擎的“相關推薦”包含這么幾個模塊:
1、suggest模塊:輸入query(關鍵詞)過程中出現在搜索框下方的智能推薦。
2、相關搜索模塊:就是搜索結果底部的那堆文字鏈模塊。
3、右側相關推薦模塊:出現在搜索結果右上角的圖文推薦模塊。
以上三個模塊所起到的作用各不相同,下面逐個拆解。
suggest模塊
與其它2個模塊不同,suggest是在搜索結果展示之前出現,所以它起到的主要作用是在用戶完成輸入query之前命中用戶的搜索需求,從而減少用戶的輸入成本。
如用戶輸入“4”時,推薦“4399小游戲”;輸入“明朝”時,推薦“明朝那些事”;輸入“校花”時,推薦“校花的貼身高手”等等。
為了命中用戶需求的概率更高,suggest需要重點滿足幾個條件:
1、要相關,符合用戶輸入習慣,這是最基本的。
2、要足夠熱門,同等情況下搜索量越高越好,這里的搜索量指的是較長一段時間內的均值。
3、要足夠多樣化,集中于某個特定的主題,不如分散到多個主題。如搜索“明朝那些事”,全部出在線閱讀、txt下載、有聲閱讀這些下位需求,不如適當穿插“明朝那些事2(3、4)”等。
4、適當關注時效性。推薦的時候需要考慮近期搜索量增長很快的一些query,如搜索“劉曉慶”,前段時間劉曉慶吐槽機場面條貴那個事件就需要推薦。
5、如果技術允許,可以參考用戶的搜索日志做個性化推薦,這或許是目前各搜索引擎提升空間最大的地方,上面4個方面各主要搜索引擎都做的不錯了。有機會可以針對suggest的個性化專門寫一篇文章來分析。
相關搜索模塊
該模塊的典型使用場景是用戶輸入query后在搜索結果中沒有發現自己需要的內容,在拉到搜索結果底部時點擊相關搜索繼續尋找自己需要的內容。
做好該模塊的要素大體上和suggest差不多,相關性、熱門度、多樣性、時效性等都挺重要。但因為相關搜索模塊是在搜索結果顯示后才出現的,所以根據搜索結果對用戶需求的滿足程度不同,出現的相關搜索推薦也有所差異。
1、當用戶需求滿足度較好時,和query語義重復的推薦要做打壓,多推薦一些和query互補或者領域相關的內容。如“花千骨”,主需求是在線觀看該電視劇,當然搜索結果滿足的非常好。那么“花千骨全集”、“花千骨在線觀看”等語義重復的推薦就不要出了。這時適當偏離主需求的推薦就可以推薦,如“花千骨2015”、“花千骨 優酷”、“花千骨小說”以及類型相似的電視劇如“瑯琊榜”、“云中歌”等。
2、當用戶需求滿足度較差時,和query語義重復的推薦就不能盲目打壓。比如很典型的盜版電影需求,如目前網上還沒有免費正版資源的煎餅俠。用戶搜索“煎餅俠免費版”,如果用戶需求滿足度較差(這很可能發生),那么推薦“煎餅俠在線觀看”、“煎餅俠西瓜影音”等就很合適,因為對這類需求,query稍微做一些更改搜索結果就會有很大的不同,滿足用戶需求的可能性就更高。此時就不能對原語義做太多的偏離,如弱需求“煎餅俠票房”、“煎餅俠演員表”等就不要做太多推薦,至少位置要盡可能靠后;同樣類型相似的影視“屌絲男士”、“港囧”等都需要做適當打壓。
右側相關推薦
該模塊獨特的地方有兩個方面:
1、其它2個模塊都是純文本展示形式,該模塊是唯一使用圖文展現形式的模塊。
2、其它2個模塊著重于文本相關,通俗點說就是和原query都有重復的文字;而該模塊更注重領域相關,在文本上基本和原query無重復的地方,起到的更多的是發現探索的作用。
如果說搜索引擎目前還只是做到符合用戶預期,那么未來超出用戶預期的部分最有可能是通過這個模塊來提供。一個典型的場景是某個新人剛進入互聯網行業,某段時間對行業資訊非常感興趣,剛開始它只知道虎嗅網,在搜索引擎中搜索“虎嗅網”的過程中,他發現了右側推薦的一堆相關的提供行業資訊的網站,雷鋒網,36氪,pingwest,知乎,果殼等,這就是典型的超出用戶預期。
做好該模塊的難度較大,因為數據的選擇范圍太廣,但最少需要做到以下幾點:
1、最基本的是要基礎領域相關,這個普通的用戶都可以感知到,技術難度也不大。
2、推薦的粒度要細,不要太粗放。比如“科比”這個query,他的首要標簽是NBA球星,其次才是籃球標簽,所以推薦的時候要優先推薦相關的NBA球星,如果一上來就推薦籃球相關的技術、相關籃球術語等,那么粒度就有些太過于粗放,點擊自然就不會太高。
3、做好基礎質量,尤其是圖片質量。圖片是吸引用戶點擊的最主要因素,所以圖片起碼要做到清晰相關,目前各大搜索引擎做的都不是太好,相對而言百度要好一些。要做好這一點需要重點在數據源上下功夫。
但正如前面所說,做好這個模塊的難度很大,并且人工評判主觀性太強,比較合理的策略是在做好基礎相關(各大引擎目前做的都還不錯)的情況下,不斷調整策略,根據點擊率的變化來評判一個策略的好壞。策略可以是針對所有query,也可以是針對某一類query,如“影視”、“人物”、“小說”等。
當然,最終判定某個模塊是否優秀,或者策略升級是否有效,最終還是要用數據說話。比如點擊率是否提升,從該模塊帶過去的搜索量占總搜索量的比例是否提高等等。