利用aiohttp制作異步爬蟲

簡介

asyncio可以實現(xiàn)單線程并發(fā)IO操作,是Python中常用的異步處理模塊。關(guān)于asyncio模塊的介紹,筆者會在后續(xù)的文章中加以介紹,本文將會講述一個基于asyncio實現(xiàn)的HTTP框架——aiohttp,它可以幫助我們異步地實現(xiàn)HTTP請求,從而使得我們的程序效率大大提高。

本文將會介紹aiohttp在爬蟲中的一個簡單應(yīng)用。

在原來的項目中,我們是利用Python的爬蟲框架scrapy來爬取當(dāng)當(dāng)網(wǎng)圖書暢銷榜的圖書信息的。在本文中,筆者將會以兩種方式來制作爬蟲,比較同步爬蟲與異步爬蟲(利用aiohttp實現(xiàn))的效率,展示aiohttp在爬蟲方面的優(yōu)勢。

同步爬蟲

首先,我們先來看看用一般的方法實現(xiàn)的爬蟲,即同步方法,完整的Python代碼如下:

image

輸出結(jié)果如下:

image
image

程序運行了23.5秒,爬取了500本書的信息,效率還是可以的。我們前往目錄中查看文件,如下:

image

異步爬蟲

接下來我們看看用aiohttp制作的異步爬蟲的效率,完整的源代碼如下:

image

我們可以看到,這個爬蟲與原先的一般方法的爬蟲的思路和處理方法基本一致,只是在處理HTTP請求時使用了aiohttp模塊以及在解析網(wǎng)頁時函數(shù)變成了協(xié)程(coroutine),再利用aysncio進(jìn)行并發(fā)處理,這樣無疑能夠提升爬蟲的效率。它的運行結(jié)果如下:

image

2.4秒,如此神奇!!!再來看看文件的內(nèi)容:

image

總結(jié)

綜上可以看出,利用同步方法和異步方法制作的爬蟲的效率相差很大,因此,我們在實際制作爬蟲的過程中,也不妨可以考慮異步爬蟲,多多利用異步模塊,如aysncio, aiohttp。另外,aiohttp只支持3.5.3以后的Python版本。

當(dāng)然,本文只是作為一個異步爬蟲的例子,并沒有具體講述異步背后的故事,而異步的思想在我們現(xiàn)實生活和網(wǎng)站制作等方面有著廣泛的應(yīng)用,本文到此結(jié)束,歡迎大家交流~

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,119評論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,382評論 3 415
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,038評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,853評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 71,616評論 6 408
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,112評論 1 323
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,192評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,355評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,869評論 1 334
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 40,727評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,928評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,467評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,165評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,570評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,813評論 1 282
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,585評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 47,892評論 2 372

推薦閱讀更多精彩內(nèi)容

  • ??asyncio可以實現(xiàn)單線程并發(fā)IO操作,是Python中常用的異步處理模塊。關(guān)于asyncio模塊的介紹,筆...
    山陰少年閱讀 1,356評論 0 2
  • 轉(zhuǎn)一篇駒神的關(guān)于異步編程和Asyncio的文章。這是上篇,共三篇。原文地址:http://aju.space/20...
    SeanCheney閱讀 9,817評論 2 99
  • 1 什么是異步編程 通過學(xué)習(xí)相關(guān)概念,我們逐步解釋異步編程是什么。 1.1 阻塞 程序未得到所需計算資源時被掛起的...
    hugoren閱讀 2,668評論 2 10
  • 上篇 中篇 下篇 1 什么是異步編程 1.1 阻塞 程序未得到所需計算資源時被掛起的狀態(tài)。 程序在等待某個操作完成...
    秦時明星閱讀 1,018評論 0 3
  • 劉襄鈺 我喜歡那春天的生機(jī)。春在枝頭,柳條嫩綠,桃花紅艷;春在空中,春風(fēng)送暖,燕子翻飛;春在田間,麥苗返青,...
    青春的節(jié)拍閱讀 222評論 0 0