Abstract
如果你覺得每天去看每個網(wǎng)站麻煩,那么這份教程適合于你!
Introduction
RSS(RDF?Site Summary簡易信息聚合)是一種消息來源格式規(guī)范,用以聚合經(jīng)常發(fā)布更新數(shù)據(jù)的網(wǎng)站,例如博客文章、新聞、音頻或視頻的網(wǎng)摘。可以說是RSS是博客盛行的時候的產(chǎn)物,但直到現(xiàn)在也沒發(fā)展大眾化應(yīng)用,因為RSS不走網(wǎng)站流量= =。但是現(xiàn)在RSS雖然小眾化但仍然有其作用。本文將會教你使用RSS訂閱世界。
不是SSR!!!
Experimental section
工欲善其事,必先利其器。
器:
????RSS閱讀器:
????網(wǎng)頁端:InoReader[1],Feedly[2]等;
????pc端:irreader[3]等;
????移動端:Inoreader[1,4],F(xiàn)eedMe(for Android),Reeder3(for ios)等。
RSS源地址:
????集合類:rsshub[5],F(xiàn)eedX[6]等
????以及你想訂閱的各類網(wǎng)站
其余軟件:
????如鏈接掃描軟件XENU
Results and discussion
從RSS的定義來看,RSS分為兩部分,一部分為RSS閱讀器,一部分為RSS源地址。
RSS閱讀器
????????RSS閱讀器僅為解析RSS格式的數(shù)據(jù),同時支持發(fā)現(xiàn)等操作,換句話說,必須要有訂閱源才可以。RSS訂閱源將在下面介紹。
因為RSS閱讀器比較多此處介紹:
一款網(wǎng)頁端:InoReader(薦);
一款pc端:irreader;
一款移動端:InoReader。
1.InoReader
InoReader是國外的一款產(chǎn)品,國內(nèi)訪問基本不受影響,且又簡體中文語言支持。支持RSS訂閱,訂閱源發(fā)現(xiàn)等操作。新用戶注冊即送一個月(好像是)的專業(yè)版試用。支持跨平臺使用。消息同步,RSS訂閱的導(dǎo)入及導(dǎo)出等操作。免費版即可滿足大部分需求。
訂閱
將訂閱源的源地址放入左上角的框內(nèi),點擊添加訂閱源即可。免費用戶訂閱量沒有限制。
訂閱效果如下:
發(fā)現(xiàn)
在https://www.inoreader.com/discovery下可以進行發(fā)現(xiàn),或者在輸入網(wǎng)址的地方輸入你需要檢索詞
此還有一些統(tǒng)計數(shù)據(jù),偏好設(shè)置等。因為網(wǎng)站是中文不再贅述。
雜談:
更新周期:
????????一般免費用戶的更新周期是夠用的。不需要可以加強,而且只要訂閱這個源的有一個人加強了,所有人都可以加強。
訂閱故障:
????????由于這個所有內(nèi)容都由InoReader的服務(wù)器進行,所以一些校內(nèi)的RSS訂閱可能出現(xiàn)故障,如圖書館的新書通報訂閱,解決此問題就是下一個pc端訂閱器irreader了。同時不支持無rss入口網(wǎng)站的訂閱,解決這些問題就要適用html匹配,或者是其他接口,以及發(fā)現(xiàn)rss接口的操作了,后面將會介紹到。
訂閱優(yōu)點:
????????由于InoReader的服務(wù)器是國外的服務(wù)器,所以可以訂閱一些國外的網(wǎng)站,啦啦啦(逃~)
2.irreader
irreader是一款國產(chǎn)的RSS訂閱軟件,無需注冊,不支持同步,不支持跨平臺。當為什么我還要介紹它呢!因為它有一些別的不具有的優(yōu)點。irreader其實就是程序,在你啟動軟件時才開始從你的訂閱源內(nèi)采集,所以此服務(wù)器相當于你的電腦,可以輕松采集校內(nèi)的IP端才能訂閱的內(nèi)容。
訂閱
同樣需要一個訂閱源地址,添加訂閱,并發(fā)現(xiàn)優(yōu)秀訂閱源。此處發(fā)現(xiàn)的優(yōu)秀訂閱源以中文網(wǎng)站為主。
同時,此閱讀器正在做微信公眾號的訂閱(個人認為不是很好)
雜談
更新周期
????????這款軟件可以自行設(shè)置更新周期,但是由于此軟件沒有后臺服務(wù)器所以它的獲取是由本身電腦的后臺程序進行的。
訂閱
????????這可以說是這個閱讀器的優(yōu)處,支持HTML標簽訂閱,即不需要rss入口即可訂閱。同時支持優(yōu)異的過濾方式,以及微信訂閱。
缺點
????????無法跨平臺,沒有后臺服務(wù)器,不支持同步(開發(fā)人員正在努力)。
????????由于是中文且本身有教程,其余方面不在贅述。
3.InoReader移動端
此移動端為InoReader官方出品,其使用與InoReader本身無異。
雜談
有了這個移動端可以做到在任何地方刷一刷,像刷微博,知乎一樣簡單。其余方面不在贅述
RSS訂閱源?
RSS訂閱源的標志比較像WIFI信號。同時有些網(wǎng)站沒有RSS標志而是直接寫字,可以通過“Ctrl” + “F”直接尋找。
網(wǎng)站上通常寫有RSS或者Feed。
下面將從不同方面獲取RSS訂閱源地址。
期刊文獻
作為一個理工人,不閱讀點英文期刊怎么能行。期刊一般都會提供RSS訂閱的入口,所以不用擔(dān)心。
追蹤某一期刊
以Wiley數(shù)據(jù)庫的ADVANCED MATERIALS期刊為例
進入到AM的期刊網(wǎng)頁[7]即可在藍色的框線內(nèi)發(fā)現(xiàn)RSS標志,點擊之后在Most recent (RSS)上右擊保存鏈接地址,即可獲得一個RSS源地址,添加到上述任何一個閱讀器中即可,完成ADVANCED MATERIALS期刊的追蹤訂閱,在InoReader內(nèi)更新周期為60min。
以ACS nano 為例
在ACS官網(wǎng)最底部有RSS feed一個選項
選擇后即可進入ACS的RSS列表,選擇你需要訂閱的RSS期刊,右擊復(fù)制鏈接地址,即可獲得RSS訂閱源地址。
追蹤某一關(guān)鍵詞
在Wiley數(shù)據(jù)庫內(nèi)追蹤FeS2關(guān)鍵詞為例
在Wiley數(shù)據(jù)庫內(nèi)搜索FeS2即可看見RSS標志,同上述操作相同,即可訂閱。
博客論壇
對于博客論壇的訂閱還是很好使用的,但是有些論壇或者博客沒有公開的RSS入口,所以需要自行尋找一下。后面將會簡單介紹尋找方式。
博客
對于我來說有些優(yōu)質(zhì)博客需要關(guān)注。學(xué)爬蟲,我關(guān)注了
崔慶才的個人博客[8],下面將以此為例來介紹。
很開心,很明顯就能看到RSS訂閱的標志。
可是對于一些,沒有將RSS訂閱外放的該怎么辦呢= =
下來我將介紹如何對付這些博客:
先拉到最底下,看此博客基于什么搭建,如果像靜謐一樣,基于WordPress構(gòu)建。那么WordPress框架會預(yù)留一個RSS訂閱的入口,及在根網(wǎng)頁或某一非html結(jié)尾的網(wǎng)頁后加上"/feed/"即可。
如果,很不幸。該博主壞壞的把這個預(yù)留入口關(guān)閉了。那么,請只能通過HTML標簽,或自制了。往下看。
論壇
我最近在學(xué)Julia編程語言,所以關(guān)注Julia中文社區(qū)論壇有一丟丟的作用,所以后面將從Julia中文社區(qū)論壇和小木蟲為例。
小木蟲[9]
小木蟲的訂閱在每個非討論的網(wǎng)頁最低端即可發(fā)現(xiàn)
Julia中文社區(qū)論壇[10]
而Julia中文社區(qū)論壇就沒這么幸運了,找遍了沒有發(fā)現(xiàn)rss訂閱入口。
那么就要祭出我的第一個必殺技了——域名掃描
這里通過Xenu[11]為域名掃描軟件,
將域名放入Xenu掃描。
掃描一會后(不必等完成)按Ctrl+F搜索rss或者是feed,即可找出rss訂閱地址
從RSS網(wǎng)站訂閱
有一些網(wǎng)站,不支持RSS訂閱。但是,依然難不倒聰明的碼農(nóng)們,從而做出了一些RSS訂閱的網(wǎng)站,方便人們?nèi)ビ嗛営嗛啿坏降木W(wǎng)站,如知乎、微博、bilibili等。這里介紹兩個比較好用的。
rsshub[5]
rsshub是類似于scihub的一個網(wǎng)站,是一個輕量、易于擴展的 RSS 生成器, 可以給任何奇奇怪怪的內(nèi)容生成 RSS 訂閱源。提出了萬物皆可RSS的口號,可見其胃口不小。其支持bilibili、微博、貼吧、簡書、知乎、豆瓣、抖音等主流社交媒體;支持掘金、開源中國、GitHub、Gitlab等編程類;支持斗魚、熊貓、虎牙直播;支持個別大學(xué)信息(此處沒有北航= =)的獲取等等。反正是門類眾多,總有一款適合你。
此處可能需要一些URL的拼接知識,但是極其簡單易懂,再次不在贅述。
比如我訂閱了知乎上的Nature自然科研[12,13]的信息動態(tài),可謂是非常有用。
此處好好讀文檔即可。
FeedX[6]
FeedX是某位程序員維護的網(wǎng)站,它最大的亮點在于全文訂閱。支持經(jīng)濟學(xué)人(The Economist),NASA、CNN等全英文RSS。以及其余的新聞、科技。(可能最大亮點就在于全文訂閱,以及全英文)。訂閱及其簡單,不在贅述。
如果還有什么好的網(wǎng)站,記得告訴我= =
無RSS訂閱攻略
可是總有那么些個壞人不喜歡RSS訂閱,從而沒有RSS訂閱地址該怎么辦呢。
下面告訴你幾個辦法來克服。
通過irreader訂閱
irreader支持標簽訂閱,此處以北航的遠航網(wǎng)[14]為例
打開遠航網(wǎng)進入通告咨詢的頁面,復(fù)制地址。打開irreader
在你想訂閱的旁邊打勾?即可完成訂閱,更多詳情請看irreader的內(nèi)部教程。此處訂閱是通過標簽和標簽的href屬性來完成的
BUT
仍有一些網(wǎng)站就像北航教務(wù)處[15]的網(wǎng)站咨詢是通過Javascript完成的。就不能通過此方法進行了。
Feed43和FeedEx
Feed43[16]是一種生成rss格式數(shù)據(jù)的網(wǎng)站,需要一定的HTML代碼基礎(chǔ),但是照葫蘆畫瓢也不難。
FeedEx[17]是一種將rss格式的數(shù)據(jù)轉(zhuǎn)化為rss全文輸出的網(wǎng)站,提供了rss格式數(shù)據(jù)的全文訂閱。
Full-Text RSS[18]和FeedEx類似,個人更喜歡Full-Text RSS
由于過于復(fù)雜,所以再次不在描述,提供一個教程[19](位于附錄內(nèi))照葫蘆畫瓢吧!!!
終極大殺器
如果上述的方法還是不行的話,只能祭出我的終極大殺器——自己寫代碼!!!(當個碼農(nóng)挺好)
比如我做了幾個公眾號的rss訂閱源地址[22](由于經(jīng)常性有今天,沒明天所以只放一個)基本可以滿足自己的需求。(逃~
而代碼的核心就是獲取信息,以及輸出符合RSS格式的數(shù)據(jù)類型。
獲取數(shù)據(jù)就爬蟲:一份Python3爬蟲教程[20](我實現(xiàn)自引了= =!!)
輸出符合RSS格式:這個就得學(xué)RSS格式以及XML格式了= =,此處不做過多推薦,因為我也沒學(xué)咂懂,不過給個w3school的教程[21]吧。
如果有好的RSS格式的教程,記得私我。
雜談
又到了每次結(jié)尾的雜談環(huán)節(jié)
先來談?wù)勎业挠嗛啞Mㄟ^irreader訂閱了學(xué)校的消息和圖書館新書通報,在第一時間能獲得最新資訊;通過InoReader訂閱了一些期刊、科技等,發(fā)現(xiàn)了更多的小眾化但有用的應(yīng)用。讓實時從不同網(wǎng)站獲取信息成為可能。
再來說說能訂閱什么。就像RssHub所說的”萬物皆可 RSS“,萬物都可訂閱,可以訂閱自己喜歡的微博、知乎、嗶哩嗶哩,可以通過百度訂閱檢索詞,訂閱文獻等等。可以通過知乎、百度去發(fā)現(xiàn)一些優(yōu)異的訂閱源(此處不做推薦)。
說說不能訂閱什么。當然先要遵守法律呀!!!其次就是由于某些軟件的"自閉性"(Wechat),讓訂閱及其困難,但是任何難事都難不倒聰明的程序猿= =
Conclusions
接觸RSS是也就前兩個月,在羅昭鋒的MOOC《文獻管理與信息分析》[23](一門優(yōu)質(zhì)課程)發(fā)現(xiàn),怎么能這么好用!!!就開始學(xué)會訂閱。
總之,RSS看起來比較小眾化,但是卻可以在紛紛的HTML中獲取自己想知道或不知道的事與觀點。同時還略去了網(wǎng)站的廣告。
光說不練假把式,只有你真正的開始訂閱世界后才可能知道她的好用。
References
[1]InoReader官網(wǎng):https://www.inoreader.com/
[2]Feedly官網(wǎng):https://feedly.com/
[3]irreader官網(wǎng):http://irreader.netqon.com/
[4]InoReader安卓版本:鏈接:https://pan.baidu.com/s/1EgzySo5-Kr0U6Ru_hdiCuQ密碼:5kdk
[5]rsshub官方文檔:https://docs.rsshub.app/
[6]FeedX官方網(wǎng)站:https://feedx.net/
[7]ADVANCED MATERIALS官方網(wǎng)頁:https://onlinelibrary.wiley.com/journal/15214095
[8]崔慶才的個人博客:https://cuiqingcai.com/
[9]小木蟲學(xué)術(shù)科研互動平臺:http://muchong.com/bbs/
[10]Julia中文社區(qū)論壇:http://discourse.juliacn.com/
[11]Xenu域名掃描軟件:http://home.snafu.de/tilman/xenulink.html/
[12]Nature自然科研知乎:https://www.zhihu.com/org/naturezi-ran-ke-yan/activities/
[13]Nature自然科研訂閱源地址:https://rsshub.app/zhihu/people/activities/naturezi-ran-ke-yan/
[14]北航遠航網(wǎng):http://yuanhang.buaa.edu.cn/
[15]北航教務(wù)處:http://jiaowu.buaa.edu.cn/
[16]Feed43官網(wǎng):http://feed43.com/
[17]FeedEx官網(wǎng):http://feedex.net/
[18]Full-Text RSS官網(wǎng):http://fivefilters.org/content-only/
[19]Feed43+全文輸出的教程:https://zhuanlan.zhihu.com/p/40496324/
[20]一份Python3爬蟲教程——幻華:https://mp.weixin.qq.com/s/ENjSI_92C8ge9V8yVNx3Xg/
[21]RSS格式w3school:http://www.w3school.com.cn/rss/rss_syntax.asp/
[22]材料人微信公眾號RSS訂閱源地址:https://chemistrywechat.zkhweb.top/rss/icailiaoren.xml/
[23]MOOC《文獻管理與信息分析》——羅昭鋒:https://www.icourse163.org/learn/USTC-9002#/learn/announce/
注釋:
1>所有資源來源于網(wǎng)絡(luò)。
2>所有百度網(wǎng)盤資源有效期7天。
3>更多資源請上網(wǎng)檢索,此處不再推薦資源。
4>未收任何人的廣告費,純粹自己學(xué)習(xí)的。
5>盡量支持正版!
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文案:幻華