復制
從服務器對主服務器進行復制,以達到數據庫狀態一致。
Redis2.8以前的復制功能:同步和命令傳播。
同步
從服務器對主服務器的同步操作是通過向主服務器發送SYNC命令來完成的,步驟:
- 從服務器向主服務器發送SYNC命令;
- 收到SYNC命令的主服務器執行BGSAVE命令,在后臺生成一個RDB文件,并使用一個緩沖區記錄從此刻開始的所有寫命令;
- 主服務器將RDB文件發送給從服務器,從服務器接收并載入這個RDB文件,將自己的數據庫狀態更新到主服務器執行BGSAVE時的數據庫狀態;
- 主服務器將記錄在緩沖區的所有寫命令發送給從服務器,從服務器執行這些寫命令,將自己的數據庫狀態更新至主服務器數據庫當前所處的狀態。
命令傳播
在同步后,主服務器會將自己執行的寫命令,也即是造成主從服務器不一致的寫命令,發送給從服務器執行以達到一致狀態。
缺陷:若出現斷線重新連接,從服務器會再次向主服務器發送SYNC請求重新同步一次,而不是執行從斷線到重連這段時間內的寫命令,這樣會導致浪費。
Redis2.8開始,使用PSYNC命令代替SYNC命令來執行復制操作。PSYNC的兩種模式:
- 完整重同步:與SYNC命令一樣,主服務器創建并發送RDB文件,并向從服務器發送保存在緩沖區里的寫命令來進行同步;
- 部分重同步:當從服務器斷線后重新連接主服務器,如果條件允許,主服務器可將斷開期間執行的寫命令發送給從服務器以達到一致狀態。
部分重同步的實現
- 復制偏移量
- 主服務器復制積壓緩沖區
- 服務器運行ID
1、復制偏移量
執行復制的雙方分別維護一個復制偏移量:
- 主服務器每次向從服務器傳播N個字節的數據時,就將自己的復制偏移量的值加上N;
- 從服務器每次收到主服務器傳播來的N個字節的數據時,就將自己的復制偏移量的值加上N。
通過對比主從服務器的偏移量是否相等可以判斷是否處于一致狀態。如果主從服務器不處于一致狀態,那么需要執行完整重同步還是部分重同步取決于復制積壓緩沖區。
2、復制積壓緩沖區
復制積壓緩沖區是由主服務器維護的一個固定長度的先進先出隊列,默認大小為1MB。所謂固定長度的隊列是指當元素個數超過指定隊列長度時,若有新元素入隊尾,則必先從隊首彈出隊首元素。
當主服務器進行命令傳播時,不僅會將寫命令發送給從服務器,還會將寫命令寫入復制積壓緩沖區中。從服務器斷線重連后,會通過PSYNC將自己的復制偏移量offset發送給主服務器,則
- 若offset之后的數據仍然在復制積壓緩沖區中,則主服務器對從服務器執行部分重同步操作;
- 若offset之后的數據已不在復制積壓緩沖區中,則主服務器(先發送+CONTINUE回復,再)對從服務器執行完整重同步操作。
3、服務器運行ID
主從服務器都有自己的運行ID,服務器啟動時自動生成,由40個隨機的十六進制字符組成。從服務器第一次對主服務器進行復制時,主服務器將自己的運行ID發給從服務器,從服務器將它保存起來;從服務器斷線重連后,向主服務器發送該運行ID,若與當前主服務器ID相同,則執行部分重同步,否則執行完整重同步。
PSYNC命令實現原理
復制的實現
步驟:
- 從服務器根據客戶端命令設置主服務器的IP地址和端口;
- 從服務器根據IP地址和端口建立連接主服務器的套接字,再為該套接字關聯一個文件事件處理器用于處理復制工作;
- 從服務器向主服務器發送PING命令,用于
- 檢查套接字讀寫狀態是否正常;
-
檢查主服務器能否正常處理命令請求。
image
-
身份驗證:若從服務器設置了masterauth選項,那么進行身份驗證,否則不驗證;
image 從服務器向主服務器發送自己監聽的端口號,主服務器保存該端口號;
同步;
命令傳播。
心跳檢測
在命令傳播階段,從服務器會每秒一次地向主服務器發送命令:
REPLCONF ACK <replication_offset>
該命令有三個作用:
- 檢測主從服務器的網絡連接狀態;
- 輔助實現min-slaves選項(可防止主服務器在不安全的情況下執行寫命令);
- 檢測命令丟失:若主服務器命令傳播丟失了,則REPLCONF ACK <replication_offset>可讓主服務器發現與從服務器的偏移量不一致,引發部分重同步。