分布式之抉擇分布式鎖

引言

為什么寫這篇文章？

目前網(wǎng)上大部分的基于zookeeper，和redis的分布式鎖的文章都不夠全面。要么就是特意避開集群的情況，要么就是考慮不全，讀者看著還是一臉迷茫。坦白說，這種老題材，很難寫出新創(chuàng)意，博主內(nèi)心戰(zhàn)戰(zhàn)兢兢，如履薄冰，文中有什么不嚴(yán)謹(jǐn)之處，歡迎批評(píng)。

博主的這篇文章，不上代碼，只講分析。

(1)在redis方面，有開源redisson的jar包供你使用。

(2)在zookeeper方面，有開源的curator的jar包供你使用

因?yàn)橐呀?jīng)有開源jar包供你使用，沒有必要再去自己封裝一個(gè)，大家出門百度一個(gè)api即可，不需要再羅列一堆實(shí)現(xiàn)代碼。

需要說明的是，Google有一個(gè)名為Chubby的粗粒度分布鎖的服務(wù)，然而，Google Chubby并不是開源的，我們只能通過其論文和其他相關(guān)的文檔中了解具體的細(xì)節(jié)。值得慶幸的是，Yahoo！借鑒Chubby的設(shè)計(jì)思想開發(fā)了zookeeper，并將其開源，因此本文不討論Chubby。至于Tair，是阿里開源的一個(gè)分布式K-V存儲(chǔ)方案。我們?cè)诠ぷ髦谢旧蟫edis使用的比較多，討論Tair所實(shí)現(xiàn)的分布式鎖，不具有代表性。

因此，主要分析的還是redis和zookeeper所實(shí)現(xiàn)的分布式鎖。

文章結(jié)構(gòu)

本文借鑒了兩篇國(guó)外大神的文章，redis的作者antirez的《Is Redlock safe?》以及分布式系統(tǒng)專家Martin的《How to do distributed locking》，再加上自己微薄的見解從而形成這篇文章，文章的目錄結(jié)構(gòu)如下:

(1)為什么使用分布式鎖

(2)單機(jī)情形比較

(3)集群情形比較

(4)鎖的其他特性比較

正文

先上結(jié)論:

zookeeper可靠性比redis強(qiáng)太多，只是效率低了點(diǎn)，如果并發(fā)量不是特別大，追求可靠性，首選zookeeper。為了效率，則首選redis實(shí)現(xiàn)。

為什么使用分布式鎖？

使用分布式鎖的目的，無外乎就是保證同一時(shí)間只有一個(gè)客戶端可以對(duì)共享資源進(jìn)行操作。

但是Martin指出，根據(jù)鎖的用途還可以細(xì)分為以下兩類

(1)允許多個(gè)客戶端操作共享資源

這種情況下，對(duì)共享資源的操作一定是冪等性操作，無論你操作多少次都不會(huì)出現(xiàn)不同結(jié)果。在這里使用鎖，無外乎就是為了避免重復(fù)操作共享資源從而提高效率。

(2)只允許一個(gè)客戶端操作共享資源

這種情況下，對(duì)共享資源的操作一般是非冪等性操作。在這種情況下，如果出現(xiàn)多個(gè)客戶端操作共享資源，就可能意味著數(shù)據(jù)不一致，數(shù)據(jù)丟失。

第一回合，單機(jī)情形比較

(1)redis

先說加鎖，根據(jù)redis官網(wǎng)文檔的描述，使用下面的命令加鎖

SETresource_name my_random_value NX PX30000

my_random_value是由客戶端生成的一個(gè)隨機(jī)字符串，相當(dāng)于是客戶端持有鎖的標(biāo)志

NX表示只有當(dāng)resource_name對(duì)應(yīng)的key值不存在的時(shí)候才能SET成功，相當(dāng)于只有第一個(gè)請(qǐng)求的客戶端才能獲得鎖

PX?30000表示這個(gè)鎖有一個(gè)30秒的自動(dòng)過期時(shí)間。

至于解鎖，為了防止客戶端1獲得的鎖，被客戶端2給釋放,采用下面的Lua腳本來釋放鎖

ifredis.call("get",KEYS[1]) == ARGV[1]thenreturnredis.call("del",KEYS[1])elsereturn0end

在執(zhí)行這段LUA腳本的時(shí)候，KEYS[1]的值為resource_name，ARGV[1]的值為my_random_value。原理就是先獲取鎖對(duì)應(yīng)的value值，保證和客戶端穿進(jìn)去的my_random_value值相等，這樣就能避免自己的鎖被其他人釋放。另外，采取Lua腳本操作保證了原子性.如果不是原子性操作，則有了下述情況出現(xiàn)

分析:這套redis加解鎖機(jī)制看起來很完美，然而有一個(gè)無法避免的硬傷，就是過期時(shí)間如何設(shè)置。如果客戶端在操作共享資源的過程中，因?yàn)殚L(zhǎng)期阻塞的原因，導(dǎo)致鎖過期，那么接下來訪問共享資源就不安全。

可是，有的人會(huì)說

那可以在客戶端操作完共享資源后，判斷鎖是否依然歸該客戶端所有，如果依然歸客戶端所有，則提交資源，釋放鎖。若不歸客戶端所有，則不提交資源啊.

OK,這么做，只能降低多個(gè)客戶端操作共享資源發(fā)生的概率，并不能解決問題。

為了方便讀者理解，博主舉一個(gè)業(yè)務(wù)場(chǎng)景。

業(yè)務(wù)場(chǎng)景:我們有一個(gè)內(nèi)容修改頁(yè)面，為了避免出現(xiàn)多個(gè)客戶端修改同一個(gè)頁(yè)面的請(qǐng)求，采用分布式鎖。只有獲得鎖的客戶端，才能修改頁(yè)面。那么正常修改一次頁(yè)面的流程如下圖所示

注意看，上面的步驟(3)-->步驟(4.1)并不是原子性操作。也就說，你可能出現(xiàn)在步驟(3)的時(shí)候返回的是有效這個(gè)標(biāo)志位，但是在傳輸過程中，因?yàn)檠訒r(shí)等原因，在步驟(4.1)的時(shí)候，鎖已經(jīng)超時(shí)失效了。那么，這個(gè)時(shí)候鎖就會(huì)被另一個(gè)客戶端鎖獲得。就出現(xiàn)了兩個(gè)客戶端共同操作共享資源的情況。

大家可以思考一下，無論你如何采用任何補(bǔ)償手段，你都只能降低多個(gè)客戶端操作共享資源的概率，而無法避免。例如，你在步驟(4.1)的時(shí)候也可能發(fā)生長(zhǎng)時(shí)間GC停頓，然后在停頓的時(shí)候，鎖超時(shí)失效，從而鎖也有可能被其他客戶端獲得。這些大家可以自行思考推敲。

(2)zookeeper

先簡(jiǎn)單說下原理，根據(jù)網(wǎng)上文檔描述，zookeeper的分布式鎖原理是利用了臨時(shí)節(jié)點(diǎn)(EPHEMERAL)的特性。

當(dāng)znode被聲明為EPHEMERAL的后，如果創(chuàng)建znode的那個(gè)客戶端崩潰了，那么相應(yīng)的znode會(huì)被自動(dòng)刪除。這樣就避免了設(shè)置過期時(shí)間的問題。

客戶端嘗試創(chuàng)建一個(gè)znode節(jié)點(diǎn)，比如/lock。那么第一個(gè)客戶端就創(chuàng)建成功了，相當(dāng)于拿到了鎖；而其它的客戶端會(huì)創(chuàng)建失敗（znode已存在），獲取鎖失敗。

分析:這種情況下，雖然避免了設(shè)置了有效時(shí)間問題，然而還是有可能出現(xiàn)多個(gè)客戶端操作共享資源的。

大家應(yīng)該知道，zookeeper如果長(zhǎng)時(shí)間檢測(cè)不到客戶端的心跳的時(shí)候(Session時(shí)間)，就會(huì)認(rèn)為Session過期了，那么這個(gè)Session所創(chuàng)建的所有的ephemeral類型的znode節(jié)點(diǎn)都會(huì)被自動(dòng)刪除。

這種時(shí)候會(huì)有如下情形出現(xiàn)

如上圖所示，客戶端1發(fā)生GC停頓的時(shí)候，zookeeper檢測(cè)不到心跳，也是有可能出現(xiàn)多個(gè)客戶端同時(shí)操作共享資源的情形。當(dāng)然，你可以說，我們可以通過JVM調(diào)優(yōu)，避免GC停頓出現(xiàn)。但是注意了，我們所做的一切，只能盡可能避免多個(gè)客戶端操作共享資源，無法完全消除。

第二回合，集群情形比較

我們?cè)谏a(chǎn)中，一般都是用集群情形，所以第一回合討論的單機(jī)情形。算是給大家熱熱身。

(1)redis

為了redis的高可用，一般都會(huì)給redis的節(jié)點(diǎn)掛一個(gè)slave,然后采用哨兵模式進(jìn)行主備切換。但由于Redis的主從復(fù)制（replication）是異步的，這可能會(huì)出現(xiàn)在數(shù)據(jù)同步過程中，master宕機(jī)，slave來不及同步數(shù)據(jù)就被選為master，從而數(shù)據(jù)丟失。具體流程如下所示:

(1)客戶端1從Master獲取了鎖。

(2)Master宕機(jī)了，存儲(chǔ)鎖的key還沒有來得及同步到Slave上。

(3)Slave升級(jí)為Master。

(4)客戶端2從新的Master獲取到了對(duì)應(yīng)同一個(gè)資源的鎖。

為了應(yīng)對(duì)這個(gè)情形， redis的作者antirez提出了RedLock算法，步驟如下(該流程出自官方文檔)，假設(shè)我們有N個(gè)master節(jié)點(diǎn)(官方文檔里將N設(shè)置成5，其實(shí)大等于3就行)

(1)獲取當(dāng)前時(shí)間（單位是毫秒）。

(2)輪流用相同的key和隨機(jī)值在N個(gè)節(jié)點(diǎn)上請(qǐng)求鎖，在這一步里，客戶端在每個(gè)master上請(qǐng)求鎖時(shí)，會(huì)有一個(gè)和總的鎖釋放時(shí)間相比小的多的超時(shí)時(shí)間。比如如果鎖自動(dòng)釋放時(shí)間是10秒鐘，那每個(gè)節(jié)點(diǎn)鎖請(qǐng)求的超時(shí)時(shí)間可能是5-50毫秒的范圍，這個(gè)可以防止一個(gè)客戶端在某個(gè)宕掉的master節(jié)點(diǎn)上阻塞過長(zhǎng)時(shí)間，如果一個(gè)master節(jié)點(diǎn)不可用了，我們應(yīng)該盡快嘗試下一個(gè)master節(jié)點(diǎn)。

(3)客戶端計(jì)算第二步中獲取鎖所花的時(shí)間，只有當(dāng)客戶端在大多數(shù)master節(jié)點(diǎn)上成功獲取了鎖（在這里是3個(gè)），而且總共消耗的時(shí)間不超過鎖釋放時(shí)間，這個(gè)鎖就認(rèn)為是獲取成功了。

(4)如果鎖獲取成功了，那現(xiàn)在鎖自動(dòng)釋放時(shí)間就是最初的鎖釋放時(shí)間減去之前獲取鎖所消耗的時(shí)間。

(5)如果鎖獲取失敗了，不管是因?yàn)楂@取成功的鎖不超過一半（N/2+1)還是因?yàn)榭傁臅r(shí)間超過了鎖釋放時(shí)間，客戶端都會(huì)到每個(gè)master節(jié)點(diǎn)上釋放鎖，即便是那些他認(rèn)為沒有獲取成功的鎖。

分析:RedLock算法細(xì)想一下還存在下面的問題

節(jié)點(diǎn)崩潰重啟，會(huì)出現(xiàn)多個(gè)客戶端持有鎖

假設(shè)一共有5個(gè)Redis節(jié)點(diǎn)：A, B, C, D, E。設(shè)想發(fā)生了如下的事件序列：

(1)客戶端1成功鎖住了A, B, C，獲取鎖成功（但D和E沒有鎖住）。

(2)節(jié)點(diǎn)C崩潰重啟了，但客戶端1在C上加的鎖沒有持久化下來，丟失了。

(3)節(jié)點(diǎn)C重啟后，客戶端2鎖住了C, D, E，獲取鎖成功。

這樣，客戶端1和客戶端2同時(shí)獲得了鎖（針對(duì)同一資源）。

為了應(yīng)對(duì)節(jié)點(diǎn)重啟引發(fā)的鎖失效問題，redis的作者antirez提出了延遲重啟的概念，即一個(gè)節(jié)點(diǎn)崩潰后，先不立即重啟它，而是等待一段時(shí)間再重啟，等待的時(shí)間大于鎖的有效時(shí)間。采用這種方式，這個(gè)節(jié)點(diǎn)在重啟前所參與的鎖都會(huì)過期，它在重啟后就不會(huì)對(duì)現(xiàn)有的鎖造成影響。這其實(shí)也是通過人為補(bǔ)償措施，降低不一致發(fā)生的概率。

時(shí)間跳躍問題

(1)假設(shè)一共有5個(gè)Redis節(jié)點(diǎn)：A, B, C, D, E。設(shè)想發(fā)生了如下的事件序列：

(2)客戶端1從Redis節(jié)點(diǎn)A, B, C成功獲取了鎖（多數(shù)節(jié)點(diǎn)）。由于網(wǎng)絡(luò)問題，與D和E通信失敗。

(3)節(jié)點(diǎn)C上的時(shí)鐘發(fā)生了向前跳躍，導(dǎo)致它上面維護(hù)的鎖快速過期。

客戶端2從Redis節(jié)點(diǎn)C, D, E成功獲取了同一個(gè)資源的鎖（多數(shù)節(jié)點(diǎn)）。

客戶端1和客戶端2現(xiàn)在都認(rèn)為自己持有了鎖。

為了應(yīng)對(duì)始終跳躍引發(fā)的鎖失效問題，redis的作者antirez提出了應(yīng)該禁止人為修改系統(tǒng)時(shí)間，使用一個(gè)不會(huì)進(jìn)行“跳躍”式調(diào)整系統(tǒng)時(shí)鐘的ntpd程序。這也是通過人為補(bǔ)償措施，降低不一致發(fā)生的概率。

超時(shí)導(dǎo)致鎖失效問題

RedLock算法并沒有解決，操作共享資源超時(shí)，導(dǎo)致鎖失效的問題。回憶一下RedLock算法的過程，如下圖所示

如圖所示，我們將其分為上下兩個(gè)部分。對(duì)于上半部分框圖里的步驟來說，無論因?yàn)槭裁丛虬l(fā)生了延遲，RedLock算法都能處理，客戶端不會(huì)拿到一個(gè)它認(rèn)為有效，實(shí)際卻失效的鎖。然而，對(duì)于下半部分框圖里的步驟來說，如果發(fā)生了延遲導(dǎo)致鎖失效，都有可能使得客戶端2拿到鎖。因此，RedLock算法并沒有解決該問題。

(2)zookeeper

zookeeper在集群部署中，zookeeper節(jié)點(diǎn)數(shù)量一般是奇數(shù)，且一定大等于3。我們先回憶一下，zookeeper的寫數(shù)據(jù)的原理

如圖所示，這張圖懶得畫，直接搬其他文章的了。

那么寫數(shù)據(jù)流程步驟如下

1.在Client向Follwer發(fā)出一個(gè)寫的請(qǐng)求

2.Follwer把請(qǐng)求發(fā)送給Leader

3.Leader接收到以后開始發(fā)起投票并通知Follwer進(jìn)行投票

4.Follwer把投票結(jié)果發(fā)送給Leader，只要半數(shù)以上返回了ACK信息，就認(rèn)為通過

5.Leader將結(jié)果匯總后如果需要寫入，則開始寫入同時(shí)把寫入操作通知給Leader，然后commit;

6.Follwer把請(qǐng)求結(jié)果返回給Client

還有一點(diǎn)，zookeeper采取的是全局串行化操作

OK,現(xiàn)在開始分析

集群同步

client給Follwer寫數(shù)據(jù)，可是Follwer卻宕機(jī)了，會(huì)出現(xiàn)數(shù)據(jù)不一致問題么？不可能，這種時(shí)候，client建立節(jié)點(diǎn)失敗，根本獲取不到鎖。

client給Follwer寫數(shù)據(jù)，F(xiàn)ollwer將請(qǐng)求轉(zhuǎn)發(fā)給Leader,Leader宕機(jī)了，會(huì)出現(xiàn)不一致的問題么？不可能，這種時(shí)候，zookeeper會(huì)選取新的leader,繼續(xù)上面的提到的寫流程。

總之，采用zookeeper作為分布式鎖，你要么就獲取不到鎖，一旦獲取到了，必定節(jié)點(diǎn)的數(shù)據(jù)是一致的，不會(huì)出現(xiàn)redis那種異步同步導(dǎo)致數(shù)據(jù)丟失的問題。

時(shí)間跳躍問題

不依賴全局時(shí)間，怎么會(huì)存在這種問題

超時(shí)導(dǎo)致鎖失效問題

不依賴有效時(shí)間，怎么會(huì)存在這種問題

第三回合，鎖的其他特性比較

(1)redis的讀寫性能比zookeeper強(qiáng)太多，如果在高并發(fā)場(chǎng)景中，使用zookeeper作為分布式鎖，那么會(huì)出現(xiàn)獲取鎖失敗的情況，存在性能瓶頸。

(2)zookeeper可以實(shí)現(xiàn)讀寫鎖，redis不行。

(3)zookeeper的watch機(jī)制,客戶端試圖創(chuàng)建znode的時(shí)候，發(fā)現(xiàn)它已經(jīng)存在了，這時(shí)候創(chuàng)建失敗,那么進(jìn)入一種等待狀態(tài)，當(dāng)znode節(jié)點(diǎn)被刪除的時(shí)候，zookeeper通過watch機(jī)制通知它，這樣它就可以繼續(xù)完成創(chuàng)建操作（獲取鎖）。這可以讓分布式鎖在客戶端用起來就像一個(gè)本地的鎖一樣：加鎖失敗就阻塞住，直到獲取到鎖為止。這套機(jī)制，redis無法實(shí)現(xiàn)

總結(jié)

OK，正文啰嗦了一大堆。其實(shí)只是想表明兩個(gè)觀點(diǎn)，無論是redis還是zookeeper，其實(shí)可靠性都存在一點(diǎn)問題。但是，zookeeper的分布式鎖的可靠性比redis強(qiáng)太多！但是,zookeeper讀寫性能不如redis,存在著性能瓶頸。大家在生產(chǎn)上使用，可自行進(jìn)行評(píng)估使用。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 227,702評(píng)論 6贊 531
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 98,143評(píng)論 3贊 415
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 175,553評(píng)論 0贊 373
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)。經(jīng)常有香客問我，道長(zhǎng)，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,620評(píng)論 1贊 307
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 71,416評(píng)論 6贊 405
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 54,940評(píng)論 1贊 321
城市分裂傳說
那天，我揣著相機(jī)與錄音，去河邊找鬼。笑死，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,024評(píng)論 3贊 440
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 42,170評(píng)論 0贊 287
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 48,709評(píng)論 1贊 333
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 40,597評(píng)論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 42,784評(píng)論 1贊 369
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,291評(píng)論 5贊 357
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 44,029評(píng)論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,407評(píng)論 0贊 25
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,663評(píng)論 1贊 280
情欲美人皮
我被黑心中介騙來泰國(guó)打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個(gè)月前我還...
沈念sama閱讀 51,403評(píng)論 3贊 390
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 47,746評(píng)論 2贊 370

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

分布式之抉擇分布式鎖

分布式之抉擇分布式鎖

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

分布式之抉擇分布式鎖

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频