Mach-O文件介紹之loadcommand

上一篇博客介紹了mach_header相關(guān)內(nèi)容,Mach-O文件介紹之mach_header。這篇博客主要介紹Mach-O 的加載命令。

Load command

Mach-O文件的主要功能在于加載命令(load command)。加載命令緊跟在文件頭之后,文件頭中的兩個(gè)字段——ncmds和sizeofncmds——用于解析加載命令。

每一條指令都采用“類型——長(zhǎng)度——值”的格式:32位的cmd值(表示類型),32位的cmdsize值(32位二進(jìn)制位4的倍數(shù),64位二進(jìn)制位8的倍數(shù)),以及命令本身(有cmdsize指定的任意長(zhǎng)度)。有一些命令是由內(nèi)核加載器(定義在bsd/kern/mach_loader.c文件中)直接使用的,其他命令是由動(dòng)態(tài)連接器處理的。

內(nèi)核加載器命令

加載過(guò)程在內(nèi)核的部分負(fù)責(zé)新進(jìn)程的基本設(shè)置——分配虛擬內(nèi)存,創(chuàng)建主線程,以及處理任何可能的代碼簽名/加密的工作。然而對(duì)于動(dòng)態(tài)鏈接的可執(zhí)行文件(大部分可執(zhí)行文件都是動(dòng)態(tài)鏈接的)來(lái)說(shuō),真正的庫(kù)加載和符號(hào)解析的工作都是通過(guò)LC_LOAD_DYLINKER命令指定的動(dòng)態(tài)連接器在用戶態(tài)完成的。控制權(quán)會(huì)裝交給連接器,鏈接器進(jìn)而接著處理文件頭中的其他加載命令。
加載命令總共有30多條。下表列出了內(nèi)核加載器使用的命令

image1.jpg

下面詳細(xì)討論這些加載命令。

1、LC_SEGMENT以及進(jìn)程虛擬內(nèi)存設(shè)置

LC_SEGMENT(或LC_SEGMENT_64)命令是最主要的加載命令,這條命令知道內(nèi)核如何設(shè)置新運(yùn)行的進(jìn)程的內(nèi)存空間。這些 segment直接從Mach-O二進(jìn)制文件加載到內(nèi)存中。
每一條LC_SEGMENT命令都提供了段布局的所有必要細(xì)節(jié)信息,如下表:


image2.jpg

Objectice-C中segment加載命令的定義如下:

/*
 * The segment load command indicates that a part of this file is to be
 * mapped into the task's address space.  The size of this segment in memory,
 * vmsize, maybe equal to or larger than the amount to map from this file,
 * filesize.  The file is mapped starting at fileoff to the beginning of
 * the segment in memory, vmaddr.  The rest of the memory of the segment,
 * if any, is allocated zero fill on demand.  The segment's maximum virtual
 * memory protection and initial virtual memory protection are specified
 * by the maxprot and initprot fields.  If the segment has sections then the
 * section structures directly follow the segment command and their size is
 * reflected in cmdsize.
 */
struct segment_command { /* for 32-bit architectures */
uint32_t cmd; /* LC_SEGMENT */
uint32_t cmdsize; /* includes sizeof section structs */
char segname[16]; /* segment name */
uint32_t vmaddr; /* memory address of this segment */
uint32_t vmsize; /* memory size of this segment */
uint32_t fileoff; /* file offset of this segment */
uint32_t filesize; /* amount to map from the file */
vm_prot_t maxprot; /* maximum VM protection */
vm_prot_t initprot; /* initial VM protection */
uint32_t nsects; /* number of sections in segment */
uint32_t flags; /* flags */
};

/*
 * The 64-bit segment load command indicates that a part of this file is to be
 * mapped into a 64-bit task's address space.  If the 64-bit segment has
 * sections then section_64 structures directly follow the 64-bit segment
 * command and their size is reflected in cmdsize.
 */
struct segment_command_64 { /* for 64-bit architectures */
uint32_t cmd; /* LC_SEGMENT_64 */
uint32_t cmdsize; /* includes sizeof section_64 structs */
char segname[16]; /* segment name */
uint64_t vmaddr; /* memory address of this segment */
uint64_t vmsize; /* memory size of this segment */
uint64_t fileoff; /* file offset of this segment */
uint64_t filesize; /* amount to map from the file */
vm_prot_t maxprot; /* maximum VM protection */
vm_prot_t initprot; /* initial VM protection */
uint32_t nsects; /* number of sections in segment */
uint32_t flags; /* flags */
};

對(duì)于每一個(gè)段,將文件中相對(duì)應(yīng)的內(nèi)容加載到內(nèi)存中:從偏移量為fileoff處加載filesize字節(jié)到虛擬內(nèi)存地址vmaddr處的vmsize字節(jié)。每一個(gè)段的頁(yè)面都根據(jù)initprot進(jìn)行初始化,initprot指定了如何通過(guò)讀/寫(xiě)/執(zhí)行位初始化頁(yè)面保護(hù)級(jí)別。段的保護(hù)設(shè)置可以動(dòng)態(tài)改變,但是不能超過(guò)maxprot中指定的值(iOS中,+x 和+w 是互斥的)。
_PAGEZERO段(空指針陷阱)、_TEXT段(程序代碼)、_DATA段(程序數(shù)據(jù))和_LINKEDIT(鏈接器使用的符號(hào)和其他表)段提供了LC_SEGMENT命令。段也可以進(jìn)一步分解為區(qū)(section).
Mach-O可執(zhí)行文件中常見(jiàn)的段和區(qū)

image3.jpg

段也可以設(shè)置一些<mach/loader.h>頭文件中定義的flags。其中一個(gè)flags是SG_PROTECTED_VERSION_1(0x08),表示這個(gè)段是“受保護(hù)的”,即加密的。

2、LC_MAIN

LC_MAIN設(shè)置程序主線程的入口地址和棧大小.
使用 otool -l /bin/ls 查看加載命令,LC_MAIN加載 命令中的entryoff指向的是main還是的入口地址。可以使用
*otool -vt * 反編譯出匯編代碼,查看main函數(shù)的入口。

下面是演示:
a.c文件中的代碼

#include "stdio.h"
int main(int argc, char **argv)
{
    printf("hello world/n");
    return 0;
}

1、使用 gcc -g a.c -o a 進(jìn)行編譯a.c文件。
2、使用 otool -l /bin/ls 查看a的加載命令,其中LC_MAIN加載命令如下:

image4.jpg

entryoff對(duì)應(yīng)的數(shù)字3920,轉(zhuǎn)為16進(jìn)制是 0xf50.
3、再使用 otool -vt a 反編譯出匯編代碼,查看main函數(shù):
image5.jpg

可以看到main函數(shù)的首句匯編代碼的地址正是 0xf50。這個(gè)位置同樣也是__TEXT段中,__text組的起始地址


image6.jpg

動(dòng)態(tài)連接器命令

Mach-O鏡像中有很多“空洞”——即對(duì)外部的庫(kù)和符號(hào)的引用——這些空洞要在程序啟動(dòng)時(shí)填補(bǔ)。這項(xiàng)工作需要由動(dòng)態(tài)鏈接器來(lái)完成。這個(gè)過(guò)程有時(shí)候也被稱為符號(hào)綁定(binding)。

動(dòng)態(tài)鏈接器是在內(nèi)核執(zhí)行LC_DYLINKER加載命令時(shí)啟動(dòng)的,通常是使用/usr/lib/dyld作為動(dòng)態(tài)鏈接器。
由dyld處理的加載命令


image7.jpg

加載命令所對(duì)應(yīng)的結(jié)構(gòu)體在 <mach-o/loader.h> 頭文件中都可以找得到。
例如LC_SYMTAB的結(jié)構(gòu)體如下:

/*
 * The symtab_command contains the offsets and sizes of the link-edit 4.3BSD
 * "stab" style symbol table information as described in the header files
 * <nlist.h> and <stab.h>.
 */
struct symtab_command {
uint32_t cmd; /* LC_SYMTAB */
uint32_t cmdsize; /* sizeof(struct symtab_command) */
uint32_t symoff; /* symbol table offset */
uint32_t nsyms; /* number of symbol table entries */
uint32_t stroff; /* string table offset */
uint32_t strsize; /* string table size in bytes */
};

iOS符號(hào)綁定分為兩種:non-lazylazy綁定符號(hào)。non-lazy符號(hào)位于Mach-O文件__DATA Segment__nl_symbol_ptr sectionlazy符號(hào)位于__DATA Segment__la_symbol_ptr section。對(duì)于non-lazy的符號(hào)綁定時(shí)機(jī)為動(dòng)態(tài)庫(kù)加載(load),lazy符號(hào)的綁定時(shí)機(jī)則與Linux相同即函數(shù)第一次被調(diào)用。
在 iOS 系統(tǒng)中,當(dāng)程序調(diào)用動(dòng)態(tài)庫(kù)的函數(shù)時(shí),它實(shí)際上是執(zhí)行__TEXT 段的 __stubs 節(jié)的代碼。外部函數(shù)的地址放在 __DATA 段的__la_symbol_ptr 中,而__stub 的作用便是找到相應(yīng)的 __la_symbol_ptr,并跳轉(zhuǎn)到它所包含的地址。第一次使用printf時(shí),__la_symbol_ptr中還沒(méi)有記錄printf的真正地址,這時(shí)的地址是指向__TEXT 段的 __stub_helper 節(jié)中的相關(guān)內(nèi)容。__stub_helper 會(huì)調(diào)用 dyld_stub_binder(動(dòng)態(tài)鏈接器的入口) 進(jìn)行符號(hào)綁定,最后會(huì)將 printf 的地址放到 __la_symbol_ptr 處。

這里主要討論下lazy符號(hào)綁定。
測(cè)試代碼 a.c

#include <stdio.h>
int main(int argc, const char * argv[]) {
    // insert code here...
    printf("Hello, World!\n");
    printf("Hello World Again!\n");
    return 0;
}

1、編譯代碼 gcc a.c -o a

2、使用lldb調(diào)試a文件 lldb a,并反編譯出main函數(shù)的匯編代碼


image8.jpg

3、在第一次調(diào)用printf處添加斷點(diǎn) b 0x100000f42 ,然后運(yùn)行代碼


image9.jpg

4、使用MachOView打開(kāi)a文件查看__TEXT段中的__stubs組,可以發(fā)現(xiàn)printf的調(diào)用地址就是_stubs中的樁。


image10.jpg

__stubs會(huì)到__DATA段的__la_symbol_ptr中找到函數(shù)的入口地址。


image11.jpg

在lldb中 si(step in)查看printf的執(zhí)行步驟


image12.jpg

可以發(fā)現(xiàn)printf執(zhí)行的第一條語(yǔ)句就是跳轉(zhuǎn)到0x0000000100000f7c.這與__la_symbol_ptr中printf對(duì)應(yīng)的值是一致的。第一次時(shí),這個(gè)地址并沒(méi)有指向printf函數(shù)入口,而是指向了__TEXT段中的__stub_helper中的地址。


image13.jpg

然后在下一條語(yǔ)句0x100000F81中,會(huì)跳轉(zhuǎn)到__stub_helper的頭部0x100000f6c。順序執(zhí)行到第三條命令就是跳轉(zhuǎn)到dyld_stub_binder進(jìn)行符號(hào)綁定了。

5、在第二個(gè)printf出添加斷點(diǎn)。并繼續(xù)執(zhí)行


image14.jpg

image15.jpg

6、再次si查看第二個(gè)printf的調(diào)用,這里可以看到這里第一條指令的跳轉(zhuǎn)地址已經(jīng)指向的真正的 printf函數(shù)入口。


image16.jpg

本文作者: ctinusdev
原文鏈接: https://ctinusdev.github.io/2017/08/20/Mach-OBasis_Loadcommand/
轉(zhuǎn)載請(qǐng)注明出處!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,967評(píng)論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,273評(píng)論 3 415
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 175,870評(píng)論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 62,742評(píng)論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,527評(píng)論 6 407
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 55,010評(píng)論 1 322
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,108評(píng)論 3 440
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 42,250評(píng)論 0 288
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,769評(píng)論 1 333
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,656評(píng)論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,853評(píng)論 1 369
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,371評(píng)論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,103評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 34,472評(píng)論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 35,717評(píng)論 1 281
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,487評(píng)論 3 390
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,815評(píng)論 2 372

推薦閱讀更多精彩內(nèi)容

  • 13.1 Objective-C消息傳遞(Messaging) 對(duì)于C/C++這類靜態(tài)語(yǔ)言,調(diào)用一個(gè)方法其實(shí)就是跳...
    泰克2008閱讀 2,064評(píng)論 1 6
  • 13. Hook原理介紹 13.1 Objective-C消息傳遞(Messaging) 對(duì)于C/C++這類靜態(tài)語(yǔ)...
    Flonger閱讀 1,428評(píng)論 0 3
  • 之前在項(xiàng)目中使用 fishhook 來(lái)替換系統(tǒng)的 C 函數(shù),其中涉及到很多和 iOS 系統(tǒng)相關(guān)的編譯、鏈接等方面的...
    gbupup閱讀 2,027評(píng)論 0 3
  • 8086匯編 本筆記是筆者觀看小甲魚(yú)老師(魚(yú)C論壇)《零基礎(chǔ)入門學(xué)習(xí)匯編語(yǔ)言》系列視頻的筆記,在此感謝他和像他一樣...
    Gibbs基閱讀 37,294評(píng)論 8 114
  • Mach-O 概述 和 部分命令介紹 我們知道Windows下的文件都是PE文件,同樣在OS X和iOS中可執(zhí)行文...
    青花瓷的平方閱讀 14,964評(píng)論 2 52