電影長(zhǎng)津湖有一句對(duì)白這么說(shuō):我們把該打的仗都打了,我們的后輩就不用打了。
是啊,誰(shuí)不希望下一代能夠生長(zhǎng)在一個(gè)沒(méi)有硝煙的和平盛世?
在簡(jiǎn)書(shū),同樣有一群因?yàn)榫W(wǎng)絡(luò)爬蟲(chóng)侵權(quán)而奮起發(fā)聲維權(quán)的簡(jiǎn)友,而且絕不在少數(shù)。
請(qǐng)認(rèn)真思考這個(gè)問(wèn)題吧。
你難道不希望在一個(gè)沒(méi)有爬蟲(chóng)肆意侵權(quán)的環(huán)境下安心創(chuàng)作嗎?
如果你的答案是肯定的,那么繼續(xù)往下看。
首先,通過(guò)截圖,讓我們回顧2018年的吃驚谷事件:
一場(chǎng)維權(quán)戰(zhàn)爭(zhēng)下來(lái),結(jié)果如何?
據(jù)悉,有不少簡(jiǎn)友憤而舍棄簡(jiǎn)書(shū)而去。
如今嘗試搜索吃驚谷,已經(jīng)一無(wú)所獲……據(jù)傳聞似乎已元?dú)獯髠?/p>
簡(jiǎn)書(shū)從此就不再受到網(wǎng)絡(luò)爬蟲(chóng)的侵權(quán)了嗎?
轉(zhuǎn)眼到了2019年,另一批簡(jiǎn)友又再次為爬蟲(chóng)侵權(quán)奮起而戰(zhàn),這一回的盜賊窩叫美文網(wǎng)。
結(jié)果如何?
據(jù)知,簡(jiǎn)書(shū)管理層確實(shí)出面聲討美文網(wǎng)了。
但是美文網(wǎng)卻根本不鳥(niǎo)簡(jiǎn)書(shū),至今仍然利用爬蟲(chóng)技術(shù)不斷進(jìn)入簡(jiǎn)書(shū)爬文。
這一戰(zhàn)的結(jié)果又讓多少簡(jiǎn)友失望離開(kāi)簡(jiǎn)書(shū)?
簡(jiǎn)書(shū)管理層又在乎了嗎?
2021年末,就在美文網(wǎng)肆無(wú)忌憚繼續(xù)爬取簡(jiǎn)書(shū)文章時(shí),殊不知另一個(gè)盜賊窩臺(tái)部落也許比美文網(wǎng)更早登陸簡(jiǎn)書(shū),所以在曝光之時(shí),簡(jiǎn)書(shū)作者幾乎有一半以上的個(gè)人主頁(yè)早已讓臺(tái)部落所竊取。
于是啊,又一批簡(jiǎn)友奮而聲討兼呼吁簡(jiǎn)書(shū)管理層嚴(yán)正看待層出不窮的爬蟲(chóng)侵權(quán)事件。
這一戰(zhàn)的結(jié)果又會(huì)如何?
難道維權(quán)在簡(jiǎn)書(shū)是每一年都得來(lái)一次的集體吐槽嗎?不對(duì)!我們絕非吐槽,所以這一次必須有一個(gè)結(jié)果!
如果簡(jiǎn)書(shū)管理層無(wú)法解決爬蟲(chóng)長(zhǎng)期侵權(quán)的問(wèn)題,那么,我們也將義無(wú)反顧協(xié)助尋求一個(gè)解決的方法。
要相信世上無(wú)難事,只怕有心人啊!
終于,在搜索了一個(gè)又一個(gè)利用爬蟲(chóng)技術(shù)進(jìn)入簡(jiǎn)書(shū)爬文的盜賊窩后,我發(fā)現(xiàn)了一個(gè)簡(jiǎn)書(shū)管理層早已明白的關(guān)鍵所在!
這是其中一個(gè)爬文網(wǎng)站“攝影圈子”,在其首頁(yè)免責(zé)說(shuō)明第一條文,清楚闡明本站刊載的所有非原創(chuàng)內(nèi)容,包括文字、圖片、音頻、視頻、軟件、程序、以及網(wǎng)頁(yè)版式設(shè)計(jì)等均在網(wǎng)上按照Robots協(xié)議進(jìn)行搜集。
原來(lái)問(wèn)題就出在Robots協(xié)議!
根據(jù)網(wǎng)上資料,Robots協(xié)議也就是爬蟲(chóng)協(xié)議,顧名思義即網(wǎng)站與爬蟲(chóng)之間的協(xié)議,對(duì)允許與不允許被抓取的內(nèi)容作了規(guī)范。
簡(jiǎn)而言之,當(dāng)爬蟲(chóng)來(lái)到某個(gè)網(wǎng)站抓取資料時(shí),首先會(huì)讀取協(xié)議規(guī)則,然后才抓取該網(wǎng)站允許被抓取的內(nèi)容。
當(dāng)然,爬蟲(chóng)也分好壞,壞爬蟲(chóng)自然無(wú)視協(xié)議,但是無(wú)視的同時(shí)自然也承坦了法律風(fēng)險(xiǎn)。
Robots協(xié)議雖然沒(méi)有真正的約束力,可是對(duì)違反此協(xié)議的爬蟲(chóng)網(wǎng)站卻能以此作為付諸法律行動(dòng)的依據(jù)。
若是該網(wǎng)站不存在Robots協(xié)議,意即默許爬蟲(chóng)可任意抓取網(wǎng)站的所有內(nèi)容。
為什么默許?
說(shuō)來(lái)也是現(xiàn)實(shí)啊,當(dāng)一個(gè)網(wǎng)站讓爬蟲(chóng)抓取的頻率愈高,在搜索引擎上也就更容易被發(fā)現(xiàn)。
也許,這也是簡(jiǎn)書(shū)管理層對(duì)爬蟲(chóng)又愛(ài)又恨的原因吧?
這就好比入住酒店,即不想被干擾又想讓服務(wù)員清理客房,那面免打擾的牌子掛還是不掛呢?
然而攝影圈子雖然闡明非原創(chuàng)內(nèi)容,可每一篇爬取的簡(jiǎn)書(shū)文章卻替原作者更名,這又是什么意思?
我對(duì)網(wǎng)絡(luò)上的程序一竅不通,對(duì)于爬蟲(chóng)軟件也是上網(wǎng)搜索所得,貿(mào)然以此作文章難免錯(cuò)漏百出,但是有句話叫拋磚引玉,我更希望因?yàn)殄e(cuò)誤而引出真正的專(zhuān)家發(fā)聲糾正。
而“攝影圈子”既然是以爬蟲(chóng)爬取了簡(jiǎn)書(shū)的文章,但是卻更改了原作者的署名,同時(shí)又以爬取的內(nèi)容獲取利益,這怎么也不能是合理合法吧?
再者,這么多爬蟲(chóng)在簡(jiǎn)書(shū)任意抓取內(nèi)容,是否說(shuō)明簡(jiǎn)書(shū)根本不存在Robots協(xié)議?
又或者……Robots協(xié)議允許爬蟲(chóng)隨意抓取簡(jiǎn)書(shū)用戶(hù)的任何內(nèi)容?
還是說(shuō)簡(jiǎn)書(shū)太佛系,所以壞爬蟲(chóng)都聞風(fēng)而至?
據(jù)說(shuō),這么多爬蟲(chóng)在簡(jiǎn)書(shū)活動(dòng)還會(huì)造成一個(gè)對(duì)你我都深受其苦的“副作用”。
引用網(wǎng)上一篇文章段落所述:
通過(guò)程序進(jìn)行 URL 請(qǐng)求去獲得數(shù)據(jù)的成本是很低的,這就造成大量低質(zhì)量網(wǎng)頁(yè)爬蟲(chóng)在網(wǎng)絡(luò)橫行,對(duì)目標(biāo)網(wǎng)站產(chǎn)生大量的訪問(wèn),導(dǎo)致目標(biāo)網(wǎng)站的服務(wù)器資源大量消耗,輕則影響正常用戶(hù)的訪問(wèn)速度,重則導(dǎo)致網(wǎng)站服務(wù)不可用。
簡(jiǎn)書(shū)經(jīng)常出現(xiàn)類(lèi)似轉(zhuǎn)圈圈、數(shù)據(jù)遺失等問(wèn)題,是否就是爬蟲(chóng)過(guò)度消耗簡(jiǎn)書(shū)資源造成?
這一點(diǎn)相信簡(jiǎn)書(shū)管理層心里有數(shù)吧……
好的爬蟲(chóng)能帶動(dòng)簡(jiǎn)書(shū),可來(lái)者不拒的后果卻極有可能先拖垮了服務(wù)器;更甚的是造成人心向背。
得與失之間,簡(jiǎn)書(shū)究竟該如何衡量?
如果讓平臺(tái)廣為人知的代價(jià)卻是換來(lái)恥辱之名,同時(shí)又流失一批又一批優(yōu)秀作者,值得嗎?
我不懂,我只是根據(jù)網(wǎng)上資料加以猜測(cè)。
其實(shí),簡(jiǎn)書(shū)人才濟(jì)濟(jì),于2017年就有一位簡(jiǎn)友在一篇名為爬蟲(chóng)的“盜亦有道”—Robots 協(xié)議一文中詳細(xì)介紹了什么叫爬蟲(chóng)與爬蟲(chóng)協(xié)議—— 想深入了解的簡(jiǎn)友可以點(diǎn)開(kāi)鏈接 。
維權(quán)確實(shí)艱難,然而簡(jiǎn)書(shū)管理層若是用心理解用戶(hù)心情,至少也該公開(kāi)表態(tài)吧?
比如,我就很想清楚知道,簡(jiǎn)書(shū)與爬蟲(chóng)之間究竟有沒(méi)有爬蟲(chóng)協(xié)議?
你呢?也想知道吧……