? ? ? ? 周末作業是幫助古巴人民把互聯網”夾帶“進古巴,需要在美國把互聯網訪問后按? 網址url=>內容方式? 保存到文件,然后文件被“搬運”到古巴后,能被方便的被反”解“出來訪問。
? ? ? ? 你可能早就看過報道,古巴的互聯網基礎設施非常落后,全國只有 5% 的人能訪問互聯網,而且是速度奇慢的撥號網絡。Google 董事長(現 Alphabet 董事長)施密特曾在今年 3 月訪問古巴,他驚呼,“撥號網絡簡直讓我回到上世紀 90 年代。”
古巴也有速度更快的公共 Wi-Fi,不過,目前全國只有 175 個公共 Wi-Fi 熱點,大部分位于公園和高級酒店里,而且上網費很貴,每小時要 2 古巴比索(約13元人民幣),要知道,古巴的人均月收入只有 20 美元。
古巴公園內上網的人 來自: John Graham-Cumming
在這種情況下,古巴人民使用了古老的智慧:用移動硬盤傳遞數字內容。硬盤里的內容每周更新,被稱為 El Paquete Semanal(西班牙語,意為“每周包裹”,簡稱 El Paquete)。一個和常人無異的大媽,很可能每天早上離家,步行很遠找到一位“信息販子”,把一個個 TB 級的移動硬盤拷滿電影、電視劇、雜志。然后,她把硬盤帶回家,通過口耳相傳,賣給朋友、鄰居……
El Paquete 的價格也合理得多,如果等著看上周五更新的最新內容,你要付 17 美元,當然,你也可以讓別人有償從你這里拷。而只要多忍兩天,你就可以用 2.5 美元買到上周三、四更新的全部內容。
本周末的作業對我來說還是有點難度,最后還是一籌莫展,只好看大大的答案
我的圖
Python大大思路:
在本周的實驗上上會用到這些知識,實現對網站的訪問,而后會利用序列化把網站內容存儲起來。存到哪里呢?用文件操作把序列化的變量存到文件里。
可能你會問,為什么要用序列化呢?反過來想想,文件運輸到古巴后,最終還是要讓人讀取內容吧。
假設古巴人民也像我們一樣,需要一個網頁,一個網頁的讀取,甚至,可以提供一個瀏覽器給他們,那個瀏覽器能按鏈接(比如http://xxxxx? )接來讀取內容。我們提供給他們的文件就作為瀏覽器的數據源,我們的數據結構可能就是按,鏈接=?網頁,這種結構了。整個大文件就是一個python的字典類型進行序列化后,存儲的大文件了。
主要利用本周的內容:
1.序列化啊存儲例子,python的pickle模塊實現了基本的數據序列和反序列化。
2.然后再是做翻墻的程序,在那個程序里,專門去訪問了一種rss類型的網頁。這種網頁就是專門列出網頁列表給專門的rss閱讀軟件看的。就好像互聯網里那種“大嘴巴”,就怕人不知道一樣。比如你關注了某網站的更新,這種更新以前就用rss來表示。提醒軟件就不停的去刷rss,一旦有更新就提醒你呢。為什么我嘮叨那么多呢,其實意思就是,例子里我選取這種特殊例子,就可以得到很多網頁列表來做例子了。
大大思路主要是,先讀取那個rss文件,逐條抽取url,訪問url內容。然后按(url =? 內容)方式存放到字典里。序列化字典到文件。然后再反序列化那文件,就可以按某個url來提取,或是全部按列表提出了。序列化就是那個梗。
由于urllib的效率沒有urllib2好,在遍歷鏈接列表的時候,我使用了urllib2.
感悟:對于本周內容還沒有完全消化,還要花時間好好理解