賊全！連夜看完Redis常用的數據類型及對應底層數據結構解析

前言

Redis是一種鍵值(key-Value)數據庫，相對于關系型數據庫，它也被叫作非關系型數據庫。

Redis中，鍵的數據類型是字符串，但是為了豐富數據存儲方式，方便開發者使用，值的數據類型有很多。

一、SDS

1、SDS源碼解讀

sds (Simple Dynamic String)，Simple的意思是簡單，Dynamic即動態，意味著其具有動態增加空間的能力，擴容不需要使用者關心。String是字符串的意思。說白了就是用C語言自己封裝了一個字符串類型，這個項目由Redis作者antirez創建，作為Redis中基本的數據結構之一。

sds有兩個版本，在Redis3.2之前使用的是第一個版本，其數據結構如下所示：

typedef char *sds;      //注意，sds其實不是一個結構體類型，而是被typedef的char*

struct sdshdr {
    unsigned int len;   //buf中已經使用的長度
    unsigned int free;  //buf中未使用的長度
    char buf[];         //柔性數組buf
};
復制代碼

但是在Redis 3.2 版本中，對數據結構做出了修改，針對不同的長度范圍定義了不同的結構，如下，這是目前的結構：

typedef char *sds;      

struct __attribute__ ((__packed__)) sdshdr5 {     // 對應的字符串長度小于 1<<5
    unsigned char flags; 
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr8 {     // 對應的字符串長度小于 1<<8
    uint8_t len; /* used */                       // 目前字符創的長度,使用1個byte
    uint8_t alloc;                                // 已經分配的總長度,使用1個byte
    unsigned char flags;                          // flag用3bit來標明類型，類型后續解釋，其余5bit目前沒有使用。使用1byte。
    char buf[];                                   // 柔性數組，以'\0'結尾
};
struct __attribute__ ((__packed__)) sdshdr16 {    // 對應的字符串長度小于 1<<16
    uint16_t len; /* used，使用2byte */
    uint16_t alloc; /* excluding the header and null terminator,使用2byte */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr32 {    // 對應的字符串長度小于 1<<32
    uint32_t len; /* used,使用4byte */
    uint32_t alloc; /* excluding the header and null terminator,使用4byte */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
struct __attribute__ ((__packed__)) sdshdr64 {    // 對應的字符串長度小于 1<<64
    uint64_t len; /* used */
    uint64_t alloc; /* excluding the header and null terminator */
    unsigned char flags; /* 3 lsb of type, 5 unused bits */
    char buf[];
};
復制代碼

2、SDS的特點

1.二進制安全的數據結構，不會產生數據的丟失

2.內存預分配機制，避免了頻繁的內存分配。當字符串長度小于1M 時，擴容都是加倍現有的空間，如果超過1M，擴容時一次只會多擴1M 的空間。(字符串最大長度為512M)

3.兼容c語言函數庫

二、Redis中幾種數據結構

redisDb默認情況下有16個，每個redisDb內部包含一個dict的數據結構，dict內部包含dictht數組，數組個數為2，主要用于hash擴容使用。dictht內部包含dictEntry的數組，dictEntry其實就是hash表的一個key-value節點，如果沖突通過鏈地址法解決

賊全！連夜看完Redis常用的數據類型及對應底層數據結構解析

1、redisServer

數據結構redisServer是一個redis服務端的抽象，定義在server.h中。 redisServer中的屬性非常多，以下為節選的一部分，簡單介紹下

struct redisServer {
    /* General */
    pid_t pid;                  /* Main process pid. */    
    ......  
    int hz;                     /* serverCron() calls frequency in hertz */
    redisDb *db;
    dict *commands;             /* Command table */
    dict *orig_commands;        /* Command table before command renaming. */
    aeEventLoop *el; 
    ...... 
    char runid[CONFIG_RUN_ID_SIZE+1];  /* ID always different at every exec. */ 
    ...... 
    list *clients;              /* List of active clients */
    list *clients_to_close;     /* Clients to close asynchronously */
    list *clients_pending_write; /* There is to write or install handler. */
    list *clients_pending_read;  /* Client has pending read socket buffers. */
    list *slaves, *monitors;    /* List of slaves and MONITORs */
    client *current_client;     /* Current client executing the command. */
    ......
};
復制代碼

1.hz: redis 定時任務觸發的頻率
2.*db: redisDb數組，默認16個redisDb
3.*commands: redis支持的命令的字典
4.*el: redis事件循環實例
5.runid[CONFIG_RUN_ID_SIZE+1]: 當前redis實例的runid

2、redisDb

redisDb是redis數據庫的抽象，定義在server.h中，比較關鍵的屬性如下：

typedef struct redisDb {
    dict *dict;                 /* 鍵值對字典，保存數據庫中所有的鍵值對 */
    dict *expires;              /* 過期字典，保存著設置過期的鍵和鍵的過期時間*/
    dict *blocking_keys;        /*保存著 所有造成客戶端阻塞的鍵和被阻塞的客戶端 (BLPOP) */
    dict *ready_keys;           /* 保存著 處于阻塞狀態的鍵，value為NULL*/
    dict *watched_keys;         /* 事物模塊，用于保存被WATCH命令所監控的鍵 */
    　　　　// 當內存不足時，Redis會根據LRU算法回收一部分鍵所占的空間，而該eviction_pool是一個長為16數組，保存可能被回收的鍵
    　　　　// eviction_pool中所有鍵按照idle空轉時間，從小到大排序，每次回收空轉時間最長的鍵
    struct evictionPoolEntry *eviction_pool;    /* Eviction pool of keys */
    int id;                     /* 數據庫ID */
    long long avg_ttl;          /* 鍵的平均過期時間 */
} redisDb;
復制代碼

3、dict

dict是redis中的字典，定義在dict.h文件中，其主要的屬性如下：

typedef struct dict {
    dictType *type;
    void *privdata;
    dictht ht[2]; //方便漸進的rehash擴容，dict的hashtable
    long rehashidx; /* rehashing not in progress if rehashidx == -1 */
    unsigned long iterators; /* number of iterators currently running */
} dict;
復制代碼

1.ht[2]: 哈希表數組，為了擴容方便有2個元素，其中一個哈希表正常存儲數據，另一個哈希表為空，空哈希表在rehash時使用
2.rehashidx:rehash索引，當不再進行rehash時，值為-1

4、dictht

dictht是哈希表結構，定義在dict.h文件中，其重要的屬性如下：

typedef struct dictht {
    dictEntry **table;
    unsigned long size;
    unsigned long sizemask;
    unsigned long used;
} dictht;
復制代碼

1.** table:key-value鍵值對節點數組，類似Java中的HashMap底層數組
2.size:哈希表容量大小
3.sizemask:總是等于size-1，用于計算索引值
4.used:哈希表實際存儲的dictEntry數量

5、dictEntry

dictEntry是redis中的key-value鍵值對節點，是實際存儲數據的節點，定義在dict.h文件中，其重要的屬性如下：

typedef struct dictEntry {
    void *key;
    union {
        void *val;
        uint64_t u64;
        int64_t s64;
        double d;
    } v;
    struct dictEntry *next;
} dictEntry;
復制代碼

1.*key:鍵對象，總是一個字符串類型的對象SDS
2.*val:值對象，可能是任意類型的對象。對應常見的5種數據類型：string,hash,list,set,zset
3.*next: 尾指針，指向下一個節點

三、數據類型

1、Redis數據對象結構

Redis數據庫中所有數據都以key-value節點dictEntry存儲，其中key和value都是一個redisObject結構體對象，只不過key總是一個字符串類型的對象(SDS)，value則可能是任意一種數據類型的對象。

redisObject結構體定義在server.h中如下所示：

typedef struct redisObject {
    unsigned type:4;       //占用4bit
    unsigned encoding:4;   //占用4bit
    unsigned lru:LRU_BITS; /*占用24bit LRU time (relative to global lru_clock) or
                            * LFU data (least significant 8 bits frequency
                            * and most significant 16 bits access time). */
    int refcount;          //占用4byte
    void *ptr;             //占用8byte  總空間:4bit+4bit+24bit+4byte+8byte = 16byte
} robj;
復制代碼

可以看到該結構體中重要的屬性如下，不同的對象具有不同的類型type，同一個類型的type會有不同的存儲形式encoding

1.type:該屬性標明了數據對象的類型，比如 String，List等
2.encoding:這個屬性指明了對象底層的存儲結構，比如ZSet類型對象可能的存儲結構有ZIPLIST和SKIPLIST
3.*ptr:指向底層存儲結構的指針

2、Redis數據類型及存儲結構

Redis中數據類型及其存儲結構定義在server.h文件中

/* The actual Redis Object */
#define OBJ_STRING 0    /* String object. */
#define OBJ_LIST 1      /* List object. */
#define OBJ_SET 2       /* Set object. */
#define OBJ_ZSET 3      /* Sorted set object. */
#define OBJ_HASH 4      /* Hash object. */

#define OBJ_MODULE 5    /* Module object. */
#define OBJ_STREAM 6    /* Stream object. */

#define OBJ_ENCODING_RAW 0     /* Raw representation */
#define OBJ_ENCODING_INT 1     /* Encoded as integer */
#define OBJ_ENCODING_HT 2      /* Encoded as hash table */
#define OBJ_ENCODING_ZIPMAP 3  /* Encoded as zipmap */
#define OBJ_ENCODING_LINKEDLIST 4 /* No longer used: old list encoding. */
#define OBJ_ENCODING_ZIPLIST 5 /* Encoded as ziplist */
#define OBJ_ENCODING_INTSET 6  /* Encoded as intset */
#define OBJ_ENCODING_SKIPLIST 7  /* Encoded as skiplist */
#define OBJ_ENCODING_EMBSTR 8  /* Embedded sds string encoding */
#define OBJ_ENCODING_QUICKLIST 9 /* Encoded as linked list of ziplists */
#define OBJ_ENCODING_STREAM 10 /* Encoded as a radix tree of listpacks */
復制代碼

四、Redis中常用數據類型和結構

賊全！連夜看完Redis常用的數據類型及對應底層數據結構解析

1、字符串對象String

OBJ_STRING字符串對象底層數據結構一般為簡單動態字符串（SDS），但其存儲方式可以是OBJ_ENCODING_INT、OBJ_ENCODING_EMBSTR和 OBJ_ENCODING_RAW，不同的存儲方式代表著對象內存結構的不同。

a）OBJ_ENCODING_INT

如果保存的字符串長度小于 20 并且可以解析為整數(值范圍為:-2^63 ~ 2^63-1)，那么這個整數就會直接保存在 redisObject 的 ptr 屬性里

b）OBJ_ENCODING_EMBSTR

長度小于 44 （OBJ_ENCODING_EMBSTR_SIZE_LIMIT）的字符串將以簡單動態字符串（SDS）的形式存儲，但是會使用 malloc 方法一次分配內存，將 redisObject 對象頭和 SDS 對象連續存在一起。因為默認分配空間為64byte，而其中value為string類型采用sdshdr8中len、alloc、flags各占用1byte，buf以'\0'占用1byte，redisObject占用16字節，剩余buff可使用為64-4-16=44byte。

c）OBJ_ENCODING_RAW

字符串將以簡單動態字符串（SDS）的形式存儲，需要兩次 malloc 分配內存，redisObject 對象頭和 SDS 對象在內存地址上一般是不連續的

d）檢測

#string類型查看redis的存儲
SET key value                               //存入字符串鍵值對
STRLEN key                                  //查看key的長度(占用的byte字節)
OBJECT ENCODING key                         //查看key在redis中的存儲類型
SETRANGE key offset value                   //修改key從offset(字符偏移量)字符修改為value，如果原本為embstr修改后也會變成raw。
GETRANGE key start end                      //獲取key的部分值
復制代碼

2、列表對象list

OBJ_LIST列表對象的底層存儲結構有過3種實現，分別是OBJ_ENCODING_LINKEDLIST、 OBJ_ENCODING_ZIPLIST和 OBJ_ENCODING_QUICKLIST，其中OBJ_ENCODING_LINKEDLIST在 3.2版本以后就廢棄了。使用命令：OBJECT ENCODING key查看存儲類型。

a）OBJ_ENCODING_LINKEDLIST

底層采用雙端鏈表實現，每個鏈表節點都保存了一個字符串對象，在每個字符串對象內保存了一個元素。

b）OBJ_ENCODING_ZIPLIST

底層實現類似數組，使用特點屬性保存整個列表的元信息，如整個列表占用的內存大小，列表保存的數據開始的位置，列表保存的數據的個數等，其保存的數據被封裝在zlentry。

[圖片上傳失敗...(image-59ec80-1614238761294)]

1.zlbytes：記錄整個壓縮列表占用的內存字節數。uint_32_t，4byte。
2.zltail：記錄壓縮列表表尾節點距離起始地址有多少字節，通過這個偏移量，程序無需遍歷整個壓縮列表就能確定表尾節點地址。uint_32_t，4byte。
3.zlen：記錄壓縮列表包含的節點數量。uint_16_t，2byte。
4.entryX：壓縮列表的各個節點，節點長度由保存的內容決定。
5.zlend：特殊值(0xFFF)，用于標記壓縮列表末端。uint_8_t，1byte。

prerawlen：表示當前節點的前一個節點長度

len：當前節點的長度

data：當前節點的數據

c）OBJ_ENCODING_QUICKLIST

底層采用雙端鏈表結構，不過每個鏈表節點都保存一個ziplist，數據存儲在ziplist中

賊全！連夜看完Redis常用的數據類型及對應底層數據結構解析

d）redis.conf配置

通過設置每個ziplist的最大容量，quicklist的數據壓縮范圍，提升數據存取效率。

list-max-ziplist-size-2 //單個ziplist節點最大能存儲8kb，超過則進行分裂，將數據存儲在新的ziplist節點中 list-compress-depth 0 //0代表所有節點，都不進行壓縮。1，代表從頭節點往后走一個，尾部節點往前走一個不用壓縮，其他的全部壓縮。

3、集合對象Set

OBJ_SET集合對象的底層存儲結構有兩種，OBJ_ENCODING_HT和OBJ_ENCODING_INTSET

a）OBJ_ENCODING_INTSET

typedef struct intset {
    uint32_t encoding;   //編碼類型
    uint32_t length;       //元素個數
    int8_t contents[];     //元素數據
} intset;

//redis中保存整型的編碼類型有int16_t,int32_t,int64_t
#define INTSET_ENC_INT16(sizeof(int16_t))
#define INTSET_ENC_INT32(sizeof(int32_t))
#define INTSET_ENC_INT64(sizeof(int64_t))
復制代碼

集合保存的所有元素都是整數值將會采用這種存儲結構，但①當集合對象保存的元素數量超過512 (由server.set_max_intset_entries 配置)或者②元素無法用整型表示后會轉化為OBJ_ENCODING_HT

b）OBJ_ENCODING_HT

底層為dict字典，數據作為字典的鍵保存，鍵對應的值都是NULL，與 Java 中的 HashSet 類似

4、有序集合ZSet

OBJ_ZSET 有序集合對象的存儲結構分為 OBJ_ENCODING_SKIPLIST 和 OBJ_ENCODING_ZIPLIST

a）OBJ_ENCODING_ZIPLIST

當 ziplist 作為 zset 的底層存儲結構時，每個集合元素使用兩個緊挨在一起的壓縮列表節點來保存，第一個節點保存元素值，第二個元素保存元素的分值，而且分值小的靠近表頭，大的靠近表尾

有序集合對象使用 ziplist 存儲需要同時滿足以下兩個條件，不滿足任意一條件將使用 skiplist

所有元素長度小于64 (server.zset_max_ziplist_value配置)字節元素個數小于128 (server.zset-max-ziplist-entries配置)

b）OBJ_ENCODING_SKIPLIST

底層實現是跳躍表結合字典。每個跳躍表節點都保存一個集合元素，并按分值從小到大排列，節點的object屬性保存了元素的值，score屬性保存分值；字典的每個鍵值對保存一個集合元素，元素值包裝為字典的鍵，元素分值保存為字典的值。

skiplist同時使用跳躍表和字典實現的原因：

跳躍表優點是有序，但是查詢分值時復雜度為O(logn)；字典查詢分值（zscore命令）復雜度為O(1) ，但是無序，結合兩者可以實現優勢互補集合的元素成員和分值是共享的，跳躍表和字典通過指針指向同一地址，不會浪費內存

賊全！連夜看完Redis常用的數據類型及對應底層數據結構解析

5、哈希對象Hash

OBJ_HASH的存儲結構分為OBJ_ENCODING_ZIPLIST和OBJ_ENCODING_HT(使用命令：OBJECT ENCODING key查看存儲類型)，其實現如下：

a）OBJ_ENCODING_ZIPLIST

在以ziplist結構存儲數據的哈希對象中，key-value鍵值對以緊密相連的方式存入壓縮鏈表，先把key放入表尾，再放入value；鍵值對總是向表尾添加。

哈希對象使用ziplist存儲數據需要同時滿足以下兩個條件，不滿足任意一個都使用dict結構所有鍵值對的鍵和值的字符串長度都小于64 (server.hash_max_ziplist_value 配置)字節鍵值對數量小于512(server.hash-max-ziplist-entries)個

[圖片上傳失敗...(image-5a16cf-1614238761293)]

b）OBJ_ENCODING_HT

底層為dict字典，哈希對象中的每個key-value對都使用一個字典鍵值對dictEntry來保存，字典的鍵和值都是字符串對象。

c）檢測

HMSET key f1 v1 f2 v2 f3 v3                 //在一個哈希表key中存儲多個鍵值對
OBJECT ENCODING key                         //查看key在redis中的存儲類型為ziplist
HGETALL key                                 //查看key對應的所有field和value發現為有序的
HSET key f4 x...x                           //在一個哈希表key中存儲一個長度超過64的value
HSTRLEN key f4                              //查看key中field為f4的長度
OBJECT ENCODING key                         //查看key在redis中的存儲類型為hashtable
HGETALL key                                 //查看key對應的所有field和value發現為無序

復制代碼

最后

[圖片上傳失敗...(image-e45dd2-1614238761292)]

這是有關Redis的學習筆記和資料，希望可以對大家有幫助，喜歡的小伙伴可以幫忙轉發+關注，感謝大家！后期LZ也會不定時更新干貨！

?著作權歸作者所有,轉載或內容合作請聯系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 227,533評論 6贊 531
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,055評論 3贊 414
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 175,365評論 0贊 373
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,561評論 1贊 307
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,346評論 6贊 404
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 54,889評論 1贊 321
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 42,978評論 3贊 439
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,118評論 0贊 286
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,637評論 1贊 333
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,558評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,739評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,246評論 5贊 355
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 43,980評論 3贊 346
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,362評論 0贊 25
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,619評論 1贊 280
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,347評論 3贊 390
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,702評論 2贊 370

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

賊全！連夜看完Redis常用的數據類型及對應底層數據結構解析

賊全！連夜看完Redis常用的數據類型及對應底層數據結構解析

前言

一、SDS

二、Redis中幾種數據結構

三、數據類型

四、Redis中常用數據類型和結構

最后

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

賊全！連夜看完Redis常用的數據類型及對應底層數據結構解析

前言

一、SDS

二、Redis中幾種數據結構

三、數據類型

四、Redis中常用數據類型和結構

最后

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频