和搜索引擎的對話:SEO的原理和基礎

SEO(Search Engine Optimization)

當網站發布上線以后,我們希望通過適當的優化調整,讓它可以被搜索引擎更好地“理解”,在用戶使用搜索引擎搜索的時候,網站的內容可以更恰當地暴露給用戶。

互聯網搜索引擎

組成部分

  1. 爬取(Crawling)
  2. 建立索引(Indexing)
  3. 返回結果(Serving Results)

PageRank

在 PageRank 以前,排序大多依靠對搜索關鍵字和目標頁的匹配度來進行,這種排序方式弊端非常明顯,尤其對于善于堆砌關鍵字“舞弊”的頁面,很容易就跳到了搜索結果的首頁。但是這樣的頁面對于用戶來說,價值非常小。

PageRank 算法的本質,就是利用網頁之間的關聯關系來確定網頁的影響力權重。而這個關聯關系,就是網頁之間的超鏈接,換言之,如果一個頁面被各種其它頁面引用,特別是被“重要”的網站和頁面引用,這就說明這個頁面的權重更高。

在實際搜索的時候,需要做到兩個因素的平衡:一個是 Reputation,也就是上面說的這個影響力,它并不會因為用戶單次搜索的關鍵字不同而改變;還有一個是 Proximity,也就是接近程度,這是根據用戶搜索的關鍵字的匹配程度來確定返回網頁的。

SEO 相關技術

白帽和黑帽

當我們明確了上述的目的,遵循搜索引擎規則,通過正當和高效的技術途徑來實現 SEO 的效果,這樣的方法叫做白帽(White Hat)法。相應的,如果是通過作弊、欺騙這樣的手段,就叫做黑帽(Black Hat)法。

搜索引擎在評估網站前文所述的影響力的時候,有許許多多不同的“Ranking Signal”,它指的就是會影響返回的網頁排序的“信號”,它們共同決定了一個頁面的影響力, 例子:

  1. 網站的正常運行時間。比方說,如果一個站點,在爬蟲爬取的時候總是遭遇 4xx、5xx 這樣的錯誤,顯然對影響力是一個負面的加權。
  2. 網站的年齡,網頁內容的新鮮程度,好的原創內容總是最好的優化方式。
  3. 網站采用 HTTPS 還是 HTTP,顯然 HTTPS 要更優。
  4. HTML 代碼的質量,是否存在錯誤。
  5. 網頁在站點訪問的深度。

黑帽法:

  • 關鍵字堆砌
  • 鏈接農場(Link Farm)
  • Article Spinning

站內優化和站外優化

站內優化,其實指的就是在自己管理的網站內部做優化工作來實現 SEO。比如我們之前反復提到的關鍵字,

站外優化則和站內優化相反,優化工作是在目標站之外開展的,比如眾所周知的“友情鏈接”,就是一種提供外鏈的站外優化方式。

roberts.txt

“roberts.txt”是網站根目錄下直接能夠訪問到的文本文件,它是一個對于網絡爬蟲的規約,告訴它這個網站下哪些內容你是可以爬取的,哪些內容你是不能爬的。值得注意的是,roberts.txt 不是標準,也不是規范,而是一種“約定俗成”,幾乎所有的搜索引擎都會遵守它。

網站地圖

網站地圖則可以清晰直接地告訴搜索引擎網站內“重要”的頁面都有哪些(無論是否被鏈接指向),它們的更新習慣,包括最近一次是什么時候更新的,更新頻率是多少,以及對于整個網站來說,不同頁面的重要性比重是多少。

對于網站地圖,除了被動等待爬蟲的抓取,搜索引擎服務往往還提供另一種方式來報告網站地圖的變更,那就是允許網站管理員主動去提交變更信息,這種方式和爬蟲來爬取比較起來,類似于我們從第一章就開始講的 pull 和 push 的區別,這種方式對于網站管理員來說更麻煩,但是顯然可以更為及時地讓搜索引擎獲知并收錄最新數據。

統計分析

在進行 SEO 的改動調整之后,我們需要一些方式來跟蹤和評估效果。像 Google Analytics 和百度統計,就提供了這樣的功能。

擴展閱讀

  • 文中介紹了幾個典型的 SEO 黑帽法,作為視野的拓展,你可以閱讀這篇文章了解更多的黑帽法。特別地,你也可以參閱這一詞條了解更多歷史上的 “Google 轟炸”事件。
  • 如果對 Google Analytics 感興趣的話,那么官方有一些很好的學習材料;如果用的是百度統計,那么你也可以瀏覽一下官方的文檔
  • 對于 PageRank 算法,互聯網上其實有很多學習材料,比如維基百科的詞條,再比如科普作家盧昌海的文章——谷歌背后的數學。這個算法的來源,是 The Anatomy of a Large-Scale Hypertextual Web Search Engine 這篇 Sergey Brin 和 Lawrence Page 最早寫的關于 Google 搜索引擎原理的論文,當然,它并非這一講的學習周期內要求的閱讀材料,而僅供感興趣且有余力的你閱讀。
  • 單頁應用(Single Page Application)的搜索引擎優化,專欄第三章已經介紹了 SPA 的優勢,但是 SPA 網站并不是一個擅長將喜怒哀樂表現出來的孩子,他對擅長察言觀色的搜索引擎頗不友好,因此要對 SPA 網站進行有效的 SEO,是需要一些特殊技巧的,推薦閱讀。
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,572評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,071評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,409評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,569評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,360評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,895評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,979評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,123評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,643評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,559評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,742評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,250評論 5 356
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,981評論 3 346
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,363評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,622評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,354評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,707評論 2 370

推薦閱讀更多精彩內容

  • 周圍那么多人都不再看好SEO了,但是不知道怎么的,我就開始走到了SEO這條路上,權當是一個學習筆記吧。把這些bas...
    xyli曉艷閱讀 1,038評論 0 4
  • seo--目的是提高網站的搜索頻率,大點營銷廣告或者別的業務! 心得---思維的想法永遠是大于你的技術--學習技術...
    love2013閱讀 980評論 0 2
  • 這個系列的第六個主題,主要談一些搜索引擎相關的常見技術。 1995年是搜索引擎商業公司發展的重要起點,《淺談推薦系...
    我偏笑_NSNirvana閱讀 6,678評論 3 24
  • 鏈接分析 我們在最開始說過,搜索引擎在查找能夠滿足用戶需求的網頁時,主要會考慮兩方面的因素,一方面是用戶發出的查詢...
    我偏笑_NSNirvana閱讀 3,285評論 1 12
  • 久違的晴天,家長會。 家長大會開好到教室時,離放學已經沒多少時間了。班主任說已經安排了三個家長分享經驗。 放學鈴聲...
    飄雪兒5閱讀 7,538評論 16 22