iOS底層之cache_t探索

前言

這篇文章主要是分析cache_t流程。通過源碼探索下類的cache_t主要緩存了哪些信息,又是怎么緩存的。
分析環境:arm64 構架,iPhone 真機 編譯環境下。

cache的存儲內容

我們先來看下cache_t的源碼

struct cache_t {
#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_OUTLINED//macOS、模擬器 -- 主要是架構區分
    // explicit_atomic 顯示原子性,目的是為了能夠 保證 增刪改查時 線程的安全性
    //等價于 struct bucket_t * _buckets;
    //_buckets 中放的是 sel imp
    //_buckets的讀取 有提供相應名稱的方法 buckets()
    explicit_atomic<struct bucket_t *> _buckets;
    explicit_atomic<mask_t> _mask;
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16 //64位真機
    explicit_atomic<uintptr_t> _maskAndBuckets;//寫在一起的目的是為了優化
    mask_t _mask_unused;
    
    //以下都是掩碼,即mask -- 類似于isa的掩碼,即位域
    // 掩碼省略....
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4 //非64位 真機
    explicit_atomic<uintptr_t> _maskAndBuckets;
    mask_t _mask_unused;

    //以下都是掩碼,即mask -- 類似于isa的掩碼,即位域
    // 掩碼省略....
#else
#error Unknown cache mask storage type.
#endif
    
#if __LP64__
    uint16_t _flags;
#endif
    uint16_t _occupied;

public: //對外公開可以調用的方法
    static bucket_t *emptyBuckets(); // 清空buckets
    
    struct bucket_t *buckets(); //這個方法的實現很簡單就是_buckets對外的一個獲取函數
    mask_t mask();  //獲取緩存容量_mask
    mask_t occupied(); //獲取已經占用的緩存個數_occupied
    void incrementOccupied(); //增加緩存,_occupied自++
    void setBucketsAndMask(struct bucket_t *newBuckets, mask_t newMask); //這個函數是設置一個新的Buckets
    void initializeToEmpty();
    unsigned capacity();
    bool isConstantEmptyCache();
    bool canBeFreed();
}

我們再來看下bucket_t的源碼實現

struct bucket_t {
private:
#if __arm64__ //真機
    //explicit_atomic 是加了原子性的保護
    explicit_atomic<uintptr_t> _imp;
    explicit_atomic<SEL> _sel;
#else //非真機
    explicit_atomic<SEL> _sel;
    explicit_atomic<uintptr_t> _imp;
#endif
    //方法等其他部分省略
}

通過源碼分析可知,cache中緩存的是sel-imp,也就是方法索引和方法實現。

通過例子分析cache的緩存內容

準備工作,定義一個WJPerson類,然后添加一下方法和屬性

@interface WJPerson : NSObject
{
    NSString *habby;
}

@property (nonatomic, copy) NSString *name;

- (void)sayHello;

- (void)sayHowAreYou;

- (void)sayIamFine;

- (void)sayThanksYou;

- (void)sayAndYou;

+ (void)sayGoodbye;

@end

@implementation WJPerson

- (void)sayHello{
    NSLog(@"%s",__func__);
}

- (void)sayHowAreYou{
    NSLog(@"%s",__func__);
}

- (void)sayIamFine{
    NSLog(@"%s",__func__);
}

- (void)sayThanksYou{
    NSLog(@"%s",__func__);
}

- (void)sayAndYou{
    NSLog(@"%s",__func__);
}

+ (void)sayGoodbye{
    NSLog(@"%s",__func__);
}

@end

然后在main.m中創建一個對象,并調用方法打好斷點,然后運行啟動。

main.m內的實現及斷點位置
lldb調試
哎,不對啊,我們還沒有調用自定義方法呢,這里怎么就有selimp了呢。有的同學會說是init,到底是不是呢,接下來我們驗證一下。
buckets中的第一個方法
可以看到這里確實是init方法。
接下來我們走的第二個斷點,看下接下來的數據。我們再執行下上面的步驟
第二個斷點lldb調試
居然沒有數據了,這是什么情況???剛才不還有一個init方法嗎。是不是不在第一個位置啊,我們再看一下buckets中的其他元素。
buckets其他元素
可以看到確實有的元素是有值的,為什么會這樣呢,但是通過lldb這樣找太麻煩了,有沒有一種更簡單的方式。接下來我們通過更簡單的方式來看一下。

typedef uint32_t mask_t;  // x86_64 & arm64 asm are less efficient with 16-bits

struct wj_bucket_t {
    SEL _sel;
    IMP _imp;
};

struct wj_cache_t {
    struct wj_bucket_t * _buckets;
    mask_t _mask;
    uint16_t _flags;
    uint16_t _occupied;
};

struct wj_class_data_bits_t {
    uintptr_t bits;
};

struct wj_objc_class {
    Class ISA;
    Class superclass;
    struct wj_cache_t cache;             // formerly cache pointer and vtable
    struct wj_class_data_bits_t bits;    // class_rw_t * plus custom rr/alloc flags
};

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        
        
        WJPerson *person = [[WJPerson alloc] init];
        Class personClass = [person class];
        [person sayHello];
//        [person sayHowAreYou];
//        [person sayIamFine];
//        [person sayThanksYou];
//        [person sayAndYou];
        [personClass sayGoodbye];
        
        
        struct wj_objc_class *wj_pClass = (__bridge struct wj_objc_class *)(personClass);
        NSLog(@"%hu - %u",wj_pClass->cache._occupied,wj_pClass->cache._mask);
        for (mask_t i = 0; i<wj_pClass->cache._mask; i++) {
            // 打印獲取的 bucket
            struct wj_bucket_t bucket = wj_pClass->cache._buckets[i];
            NSLog(@"%@ - %p",NSStringFromSelector(bucket._sel),bucket._imp);
        }
        
        NSLog(@"%@", personClass);
        
    }
    return 0;
}

我們把cache_t相關的源碼拷貝過來,加工成我們自己的wj_cache_t,然后通過我們自己的wj_cache_t看一下緩存結果。
首先我們只調用其中一個方法,看下打印結果

打印結果1
然后我們調用兩個的方法,再看下打印結果
打印結果2
最后我們調用一下全部的方法,再看下打印結果
打印結果3
針對上面的打印結果,有以下幾點疑問

  • occupiedmask是什么,又是怎么變化的呢。
  • 為什么會出現有的方法沒有打印的情況呢。
  • 為什么buckets中方法的順序和我們的調用順序不一致呢。

接下來我們分析下cache_t的源碼

cache_t源碼分析

cache_t方法
查看cache_t結構,發現public方法處,有incrementOccupied函數和setBucketsAndMask函數。
進入incrementOccupied發現只是執行了_occupied++

void cache_t::incrementOccupied() 
{
    _occupied++;
}

進入setBucketsAndMask發現每次都是重新設置_buckets_mask,并且把_occupied設置為0

void cache_t::setBucketsAndMask(struct bucket_t *newBuckets, mask_t newMask)
{
    // objc_msgSend uses mask and buckets with no locks.
    // It is safe for objc_msgSend to see new buckets but old mask.
    // (It will get a cache miss but not overrun the buckets' bounds).
    // It is unsafe for objc_msgSend to see old buckets and new mask.
    // Therefore we write new buckets, wait a lot, then write new mask.
    // objc_msgSend reads mask first, then buckets.

#ifdef __arm__
    // ensure other threads see buckets contents before buckets pointer
    mega_barrier();

    _buckets.store(newBuckets, memory_order::memory_order_relaxed);
    
    // ensure other threads see new buckets before new mask
    mega_barrier();
    
    _mask.store(newMask, memory_order::memory_order_relaxed);
    _occupied = 0;
#elif __x86_64__ || i386
    // ensure other threads see buckets contents before buckets pointer
    // 存儲新的buckets
    _buckets.store(newBuckets, memory_order::memory_order_release);
    
    // ensure other threads see new buckets before new mask
    // 存儲新的mask
    _mask.store(newMask, memory_order::memory_order_release);
    // occupied占用z設為0
    _occupied = 0;
#else
#error Don't know how to do setBucketsAndMask on this architecture.
#endif
}

通過這兩個方法的實現,我們發現incrementOccupied是執行計數加一操作,那么我們判斷調用incrementOccupied方法的地方應該就是核心業務處理的過程,所以我們搜索incrementOccupied去看看哪里調用了它。發現只有cache_t::insert使用到了它。那我們再找下cache->insert又在哪里被使用了呢,發現只有一處cache_fill調用了cache->insert,然后我們再往上找,發現找不到調用cache_fill的地方,說明這里又是經過編譯器做了處理,所以我們今天就只討論cache_fill —>insert里的操作。
我們先來看下cache_fill的源碼

void cache_fill(Class cls, SEL sel, IMP imp, id receiver)
{
    runtimeLock.assertLocked(); // runtime鎖  assert斷言
#if !DEBUG_TASK_THREADS 
    // Never cache before +initialize is done
    if (cls->isInitialized()) {
        cache_t *cache = getCache(cls);//獲取當前的cache緩存池
#if CONFIG_USE_CACHE_LOCK
        mutex_locker_t lock(cacheUpdateLock);
#endif
        cache->insert(cls, sel, imp, receiver);//向緩存池中插入信息
    }
#else
    _collecting_in_critical();
#endif
}

然后我們看下cache_t::insert的源碼

void cache_t::insert(Class cls, SEL sel, IMP imp, id receiver)
{
#if CONFIG_USE_CACHE_LOCK
    cacheUpdateLock.assertLocked();
#else
    runtimeLock.assertLocked();
#endif

    ASSERT(sel != 0 && cls->isInitialized());

    // 原occupied計數+1
    mask_t newOccupied = occupied() + 1;

    // 進入查看: return mask() ? mask()+1 : 0;
    // 就是當前mask有值就+1,否則設置初始值0
    unsigned oldCapacity = capacity(), capacity = oldCapacity;
    
    // 當前緩存是否為空
    if (slowpath(isConstantEmptyCache())) {
        
        // Cache is read-only. Replace it.
        // 如果為空,就給空間設置初始值4
        // (進入INIT_CACHE_SIZE查看,可以發現就是1<<2,就是二進制100,十進制為4)
        if (!capacity) capacity = INIT_CACHE_SIZE;
        
        // 創建新空間(第三個入參為false,表示不需要釋放舊空間)
        reallocate(oldCapacity, capacity, /* freeOld */false);
    
    }
    
    // CACHE_END_MARKER 就是 1
    // 如果當前計數+1 < 空間的 3/4。 就不用處理
    // 表示空間夠用。 不需要空間擴容
    else if (fastpath(newOccupied + CACHE_END_MARKER <= capacity / 4 * 3)) {
        // Cache is less than 3/4 full. Use it as-is.
    }
    
    // 如果計數大于3/4, 就需要進行擴容操作
    else {
        // 如果空間存在,就2倍擴容。 如果不存在,就設為初始值4
        capacity = capacity ? capacity * 2 : INIT_CACHE_SIZE;
        
        // 防止超出最大空間值(2^16 - 1)
        if (capacity > MAX_CACHE_SIZE) {
            capacity = MAX_CACHE_SIZE;
        }
        
        // 創建新空間(第三個入參為true,表示需要釋放舊空間)
        reallocate(oldCapacity, capacity, true);
    }

    // 讀取現在的buckets數組
    bucket_t *b = buckets();
    
    // 新的mask值(當前空間最大存儲大小)
    mask_t m = capacity - 1;
    
    // 使用hash計算當前函數的位置(內部就是sel & m, 就是取余操作,保障begin值在m當前可用空間內)
    mask_t begin = cache_hash(sel, m);
    mask_t i = begin;

    do {
        // 如果當前位置為空(空間位置沒被占用)
        if (fastpath(b[i].sel() == 0)) {
            // Occupied計數+1
            incrementOccupied();
            // 將sle和imp與cls關聯起來并寫入內存中
            b[i].set<Atomic, Encoded>(sel, imp, cls);
            return;
        }
        
        // 如果當前位置有值(位置被占用)
        if (b[i].sel() == sel) {
            // The entry was added to the cache by some other thread
            // before we grabbed the cacheUpdateLock.
            // 直接返回
            return;
        }
        // 如果位置有值,再次使用哈希算法找下一個空位置去寫入
        // 需要注意的是,cache_next內部有分支: 
        // 如果是arm64真機環境: 從最大空間位置開始,依次-1往回找空位
        // 如果是arm舊版真機、x86_64電腦、i386模擬器: 從當前位置開始,依次+1往后找空位。不能超過最大空間。
        // 因為當前空間是沒超出mask最大空間的,所以一定有空位置可以放置的。
    } while (fastpath((i = cache_next(i, m)) != begin));

    // 各種錯誤處理
    cache_t::bad_cache(receiver, (SEL)sel, cls);
}

我們再看下reallocate方法的實現,看下他是怎么對內存空間進行操作的

bucket_t *allocateBuckets(mask_t newCapacity)
{
    // 創建1個bucket
    bucket_t *newBuckets = (bucket_t *)
        calloc(cache_t::bytesForCapacity(newCapacity), 1);
    // 將創建的bucket放到當前空間的最尾部,標記數組的結束
    bucket_t *end = cache_t::endMarker(newBuckets, newCapacity);

#if __arm__
    // End marker's sel is 1 and imp points BEFORE the first bucket.
    // This saves an instruction in objc_msgSend.
    end->set<NotAtomic, Raw>((SEL)(uintptr_t)1, (IMP)(newBuckets - 1), nil);
#else
    // 將結束標記為sel為1,imp為這個buckets
    end->set<NotAtomic, Raw>((SEL)(uintptr_t)1, (IMP)newBuckets, nil);
#endif
    
    // 只是打印記錄
    if (PrintCaches) recordNewCache(newCapacity);
    
    // 返回這個bucket
    return newBuckets;
}

我們看下allocateBuckets開辟新空間的操作

bucket_t *allocateBuckets(mask_t newCapacity)
{
    // 創建1個bucket
    bucket_t *newBuckets = (bucket_t *)
        calloc(cache_t::bytesForCapacity(newCapacity), 1);
    // 將創建的bucket放到當前空間的最尾部,標記數組的結束
    bucket_t *end = cache_t::endMarker(newBuckets, newCapacity);

#if __arm__
    // End marker's sel is 1 and imp points BEFORE the first bucket.
    // This saves an instruction in objc_msgSend.
    end->set<NotAtomic, Raw>((SEL)(uintptr_t)1, (IMP)(newBuckets - 1), nil);
#else
    // 將結束標記為sel為1,imp為這個buckets
    end->set<NotAtomic, Raw>((SEL)(uintptr_t)1, (IMP)newBuckets, nil);
#endif
    
    // 只是打印記錄
    if (PrintCaches) recordNewCache(newCapacity);
    
    // 返回這個bucket
    return newBuckets;
}

最后我們看下cache_collect_free是怎么釋放內存空間的

static void cache_collect_free(bucket_t *data, mask_t capacity)
{
#if CONFIG_USE_CACHE_LOCK
    cacheUpdateLock.assertLocked();
#else
    runtimeLock.assertLocked();
#endif

    if (PrintCaches) recordDeadCache(capacity);
    
    // 垃圾房: 開辟空間 (如果首次,就開辟初始空間,如果不是,就空間*2進行拓展)
    _garbage_make_room ();
    // 將當前擴容后的capacity加入垃圾房的尺寸中,便于后續釋放。
    garbage_byte_size += cache_t::bytesForCapacity(capacity);
    // 將當前新數據data存放到 garbage_count 后面 這樣可以釋放前面的,而保留后面的新值
    garbage_refs[garbage_count++] = data;
    // 不記錄之前的緩存 = 【清空之前的緩存】。
    cache_collect(false);
}

最后我們可以總結一個流程圖

cacht_t流程分析圖

經過我們的分析,相信你對前面的疑問已經有了答案。
1.occupiedmask是什么,又是怎么變化的呢。
函數寫入cache緩存時,occupied會加1,mask記錄當前cache最大可存儲空間。
inset緩存的操作,觸發空間使用率超過3/4,空間2倍擴容時,mask記錄新空間的最大可存儲大小,因為舊空間被釋放,之前cache的所有內容都被垃圾房清空了,所以occupied重置為0。從新開始計數
2. 為什么會出現有的方法沒有打印的情況呢。
因為觸發空間擴容時,舊空間被釋放,所以cache中的舊值都被清空。 新值插入新cache空間。
3. 為什么buckets中方法的順序和我們的調用順序不一致呢。
插入操作是使用的hash算法。插入位置是經過取余計算的。且如果插入位置已經有值,就會不停的后移1位,直到找到空位置完成插入位置。

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,663評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,125評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,506評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,614評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,402評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,934評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,021評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,168評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,690評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,596評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,784評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,288評論 5 357
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,027評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,404評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,662評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,398評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,743評論 2 370