使用Python模擬騰訊第三方認(rèn)證-篇3

前面兩篇演示了模擬騰訊第三方認(rèn)證的過(guò)程,至此已經(jīng)能夠自由登錄學(xué)院網(wǎng)站。下面就要開(kāi)始探索如何寫一個(gè)簡(jiǎn)單的爬蟲(chóng),分析教程頁(yè)面的視頻信息,進(jìn)而可以將自己感興趣的教程進(jìn)行本地或網(wǎng)絡(luò)存儲(chǔ)。

頁(yè)面分析

頁(yè)面分析主要使用F12開(kāi)發(fā)者工具分析頁(yè)面元素信息。

主頁(yè)導(dǎo)航信息

這里從主頁(yè)入手,打開(kāi)學(xué)院的主頁(yè)可以看到左邊的導(dǎo)航信息,如下圖:


導(dǎo)航信息

通過(guò)F12查看元素內(nèi)容,大致如下:

<div class = "lesson-classfy-nav">
  <ul>
    <li>1</li>
    <li>2</li>
    ...
    <li>11</li>
  </ul>
</div>

具體分類分級(jí)就不是重點(diǎn),主要是每一個(gè)li節(jié)點(diǎn)下的課程鏈接:
比如python課程分類:
<a cgid="23" >Python</a>
由此可以繼續(xù)查看python分類所有課程。

分類課程

打開(kāi)python分類課程頁(yè)面,http://www.jikexueyuan.com/course/python, 頁(yè)面如下:

python

可以看到左側(cè)的導(dǎo)航?jīng)]有變化,主要是右側(cè)的課程項(xiàng),分析HTML元素如下:
課程內(nèi)容

在lession-box的div塊內(nèi)可以看到課程《python概述》的地址為:
http://www.jikexueyuan.com/course/2282.html

單個(gè)課程信息

我們繼續(xù)打開(kāi)《python概述》課程地址,


python概述

直到此才瀏覽到真正課程播放視頻的頁(yè)面,之前說(shuō)過(guò),學(xué)院播放使用的video-js實(shí)現(xiàn)的視頻控制,視頻地址可以從source項(xiàng)查詢到,我們看播放器HTML內(nèi)容:


視頻內(nèi)容

這里本來(lái)以為支持HTML5就可以在video塊中看到視頻地址,然而使用開(kāi)發(fā)者工據(jù)查看源碼并沒(méi)有source節(jié)點(diǎn)。不過(guò)之前的工作并沒(méi)有白費(fèi),因?yàn)樯鲜鍪褂玫臑g覽器開(kāi)發(fā)者工具查看的,而通過(guò)查看頁(yè)面源碼HTML文件,是可以看到source地址的。

然后,后面還可以繼續(xù)查看第二節(jié)課程的頁(yè)面。

總結(jié)

至此,整個(gè)視頻頁(yè)面分析流程就結(jié)束了,從主頁(yè)導(dǎo)航到課程分類,然后到單個(gè)課程的單個(gè)章節(jié)。
只關(guān)心單個(gè)章節(jié)的視頻下載,不是最終目的,最好能夠連續(xù)訪問(wèn)并統(tǒng)計(jì)各個(gè)章節(jié)的視頻信息,最終將采集視頻地址與課程信息做成任務(wù)化的下載是真正的目的。

因時(shí)間有限,本篇還是先解釋頁(yè)面原理,下篇開(kāi)始編碼模擬嗅探頁(yè)面信息。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,967評(píng)論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,273評(píng)論 3 415
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事?!?“怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 175,870評(píng)論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 62,742評(píng)論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,527評(píng)論 6 407
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 55,010評(píng)論 1 322
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,108評(píng)論 3 440
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 42,250評(píng)論 0 288
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,769評(píng)論 1 333
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,656評(píng)論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,853評(píng)論 1 369
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,371評(píng)論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,103評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 34,472評(píng)論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 35,717評(píng)論 1 281
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,487評(píng)論 3 390
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,815評(píng)論 2 372

推薦閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢(shì)1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,611評(píng)論 25 708
  • 發(fā)現(xiàn) 關(guān)注 消息 iOS 第三方庫(kù)、插件、知名博客總結(jié) 作者大灰狼的小綿羊哥哥關(guān)注 2017.06.26 09:4...
    肇東周閱讀 12,151評(píng)論 4 61
  • WebSocket-Swift Starscream的使用 WebSocket 是 HTML5 一種新的協(xié)議。它實(shí)...
    香橙柚子閱讀 23,989評(píng)論 8 183
  • 無(wú)心的相遇 在莫名的瞬間 成了定格 韶光漫漫 一縷牽掛 顫微微搖晃在韶華的縫隙 是嬌弱里含著憂愁的吊蘭 盈滿的盛放...
    燕尾無(wú)聲閱讀 279評(píng)論 0 0
  • 近期做事常出錯(cuò)。 在單位填寫加班單子的時(shí)候,一次填寫了20多天的。之前工作日記記錄,但在謄寫時(shí)不免看錯(cuò)行,將張三日...
    關(guān)中人閱讀 148評(píng)論 0 0