重構已經完成并發布,在原項目地址,有空之后再寫新版本的說明
之前曾經寫過一個爬取人人貸交易數據的爬蟲,主要用到了urllib2包進行請求,通過re包正則表達式進行提取數據,考慮到需要登陸進行爬取時,urllib2 不如requests 更穩定,同時較為復雜的正則表達式效率較低,準備通過requests包和bs4 進行重構,特開貼記錄重構過程中的問題和思考。
原項目地址:View on Github
TODO
- 重構urllib2 模塊
- 重構re 模塊
- 兼容 Python 2 / 3
重構已經完成并發布,在原項目地址,有空之后再寫新版本的說明
之前曾經寫過一個爬取人人貸交易數據的爬蟲,主要用到了urllib2包進行請求,通過re包正則表達式進行提取數據,考慮到需要登陸進行爬取時,urllib2 不如requests 更穩定,同時較為復雜的正則表達式效率較低,準備通過requests包和bs4 進行重構,特開貼記錄重構過程中的問題和思考。
原項目地址:View on Github