Mach-O初探 &編譯與鏈接

Mach-O與連接器的一個作用

Mach-o到底是什么?
Mach-O(Mach Object)是macOS、iOS、iPadOS存儲序和庫的文件格式。對應(yīng)系統(tǒng)通過引用二進(jìn)制接口(application binary interface,所寫為ABI)來運(yùn)行該格式的文件。
Mach-O格式用來替代BSD系統(tǒng)的a.out格式。Mach-O文件格式保存了在編譯過程的連接過重產(chǎn)生的機(jī)器代碼和數(shù)據(jù),從而為靜態(tài)連接和動態(tài)連接的代碼提供了單一文件格式。
Mach-O 是iOS系統(tǒng)不同運(yùn)行時期,可執(zhí)行文件類型的統(tǒng)稱。它是一種用于,可執(zhí)行文件、目標(biāo)代碼、動態(tài)庫、內(nèi)核轉(zhuǎn)儲的文件格式。
Mach -O 的三種類型:Executable 、Dylib 、bundle

  • 思考一個問題當(dāng)我們項(xiàng)目點(diǎn)擊運(yùn)行那一刻發(fā)生了什么系統(tǒng)到底做了什么?
    首先它去加載 ipa包,然后去找到 ipa包里的一個可執(zhí)行文件黑不溜秋的。
截屏2021-01-21 下午9.10.25.png

其可執(zhí)行文件的調(diào)用過程:

  • 1.調(diào)用fork函數(shù),創(chuàng)建一個process
  • 2.調(diào)用execve或其衍生函數(shù),在該進(jìn)程上加載,執(zhí)行我們的Mach-O文件
    當(dāng)我們調(diào)用時execve(程序加載器),內(nèi)核實(shí)際上在執(zhí)行:
  • 1.將文件加載到內(nèi)存
  • 2.開始分析Mach-O中的mach_header,以確認(rèn)它是有效的Mach-O文件

對于上面的我們先不了解過深我們先看它到底是怎樣一種格式我們理解
通過下面命令

objdump --macho --private-headers / 黑不溜秋的地址 

截屏2021-01-21 下午9.26.47.png

可以看到里面他有 mach header 有多個 load command 有多個section ,那他們之間的關(guān)系是怎樣的呢?我們先看下面每個字段的含義。

Mach header :指定文件的目標(biāo)體系結(jié)構(gòu),自我描述信息
  • magic: ,系統(tǒng)加載器通過該字段快速,判斷當(dāng)前文件
  • cputype: 標(biāo)識cpu架構(gòu),比如ARM, X86,i386等等,該字段確保系統(tǒng)可以將合適的二進(jìn)制文件在當(dāng)前架構(gòu)下運(yùn)行。
  • cpusubtype: 具體的cpu類型,區(qū)分不同版本的處理器,如arm64,armv7
  • filetype: 說明該mach-o文件類型(可執(zhí)行文件,庫文件,核心轉(zhuǎn)儲文件,內(nèi)核擴(kuò)展,DYSM文件,動態(tài)庫)。
  • ncmds: loadCommands數(shù)量,每個LoadCommands代表了一種Segment的加載方式 .
  • sizeofcmmds:所有Load commands的總字節(jié)大小
  • flags:標(biāo)識二進(jìn)制文件支持的功能,主要與系統(tǒng)的加載、連接有關(guān)
  • reserved:保留的字段。
Load commands: 在虛擬內(nèi)存中指定文件的邏輯結(jié)構(gòu)和文件的布局。類似書的目錄
  • load commands 跟在mach_header之后。所有命令的總大小由mach_header中sizeofcmmds字段給出。
  • load command必須有前兩個字段 cmd 和 cmdsize. cmd字段以該命令類型的常量填充。每個命令類型都有專門追對它的結(jié)構(gòu)。cmdsize字段是特定加載命令結(jié)構(gòu)的字節(jié)大小加跟隨它的任何一部分,這是加載命令(即節(jié)結(jié)構(gòu)、字符串等)的須是4字節(jié)的倍數(shù),對于64位架構(gòu)必須是8字節(jié)的倍數(shù)(這些永遠(yuǎn)是任何加載命令的最大對齊)。填充的字節(jié)必須為0.
  • 目標(biāo)文件中的所有表也必須遵循這些規(guī)則,以便文件可以進(jìn)行內(nèi)容映射。否則,這些表的指針在某些機(jī)器上無法正常工作或根本無法真長工作。所有padding歸零對象
Raw segment data: 包含在加載命令中定義的段的原始數(shù)據(jù)。主要包含代碼、數(shù)據(jù)、符號表等

因?yàn)閙ach -O里面全部都是二進(jìn)制的,我們就可以理解為 配置文件+二進(jìn)制代碼,比如說 為什么我們程序的啟動都是main?就是因?yàn)閙ach- O指定了它的入口函數(shù) 在dyld解析的時候會根據(jù)這個字段來找到入口函數(shù)
通過下面命令 找到 LC_MAIN

objdump --macho --private-headers / 黑不溜秋的地址 | ag 'LC_MAIN' -A  3
截屏2021-01-21 下午9.40.14.png

總結(jié)

Mach-O圖解1
  • 比如通過黃色區(qū)域 _TEXT load Command 就可以找到其_TEXT代碼具體的執(zhí)行二進(jìn)制的位置。
  • 通過 _DATA Load Command 就可以 找到 _DATA 具體的執(zhí)行位置
  • load Command 就向一本書的目錄. 可以通過目錄 來定位 具體的章節(jié)
Mach-O圖解2

此圖更能形象的描述出 Mach-O 的結(jié)構(gòu),整個 Mach-O 均為二進(jìn)制文件,它就向一本書,Mach header 就像 書的前言 自描述著,load commands 就像書的目錄 Data 就向是目錄 具體的內(nèi)容。

編譯鏈接過程

截屏2021-02-20 下午1.12.58.png

對于上面的描述有些生硬,我來實(shí)操一下


截屏2021-02-20 下午2.12.46.png

看如上代碼只編譯一個mian.m 然后我們通過命令去查看編譯出來的可執(zhí)行文件代碼 段

objdump --macho -d /黑不溜秋的地址。
截屏2021-02-20 下午2.15.23.png
  • 可以看到NSLog變成了一條指令 callq 這個地址
    那在編譯的時候?qū)嶋H干了點(diǎn)什么事情呢?

編譯

  1. 再編譯過程把能變成匯編的盡量變成匯編變成機(jī)器碼
  2. 不能變成匯編的給其進(jìn)行一個歸類。

比如上面的NSLog 可以callq一個地址,向其他的變量就要進(jìn)行歸類 比如說 數(shù)據(jù),那應(yīng)該放在數(shù)據(jù)段,其他的放在其他地方,比如變成目標(biāo)文件的時候像NSlog在其他的mach-O 中,需要鏈接的時候才能確定一些東西那怎么辦?所以就是,將不能變成機(jī)器碼的符號進(jìn)行一個歸類

下面我們看一下當(dāng)前的重定位符號表 我們先將 main.m 用clang編譯器成 中間代碼.o

$ clang -x objective-c \
> -target x86_64-apple-macos10.15 \
> -fobjc-arc \
> -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/MacOSX.platform/Developer/SDKs/MacOSX10.15.sdk \
> -c main.m -o main.o
  • -x objective-c :指定編譯語言
  • -target x86_64-apple-macos10.15 :指定編譯架構(gòu)
  • -fobjc-arc : 指定編譯 是arc
  • -isysroot 比如<Foundation/Foundation.h> 系統(tǒng)sdk在哪
  • 輸出。

編譯出中間代碼.o之后 我們在來看一下 當(dāng)前.o 的重定位符號表

objdump --macho --reloc  .o地址
$ objdump --macho --reloc /Users/lh/Desktop/LHObject/symbol/symbol/main.o 
/Users/lh/Desktop/LHObject/symbol/symbol/main.o:
Relocation information (__TEXT,__text) 4 entries
address  pcrel length extern type    scattered symbolnum/value
00000033 True  long   True   BRANCH  False     _NSLog
00000029 True  long   True   SIGNED  False     _static_init_value
0000001f True  long   True   SIGNED4 False     _static_uninit_value
0000000b True  long   False  SIGNED  False     5 (__DATA,__cfstring)
Relocation information (__DATA,__cfstring) 2 entries
address  pcrel length extern type    scattered symbolnum/value
00000010 False quad   False  UNSIGND False     4 (__TEXT,__cstring)
00000000 False quad   True   UNSIGND False     ___CFConstantStringClassReference
Relocation information (__LD,__compact_unwind) 1 entries
address  pcrel length extern type    scattered symbolnum/value
00000000 False quad   False  UNSIGND False     1 (__TEXT,__text)

對應(yīng)上面的我們看一下都代表什么意思


截屏2021-02-20 下午3.42.35.png
  • 從這里我們就能明白,重定位符號表里 的保存的是當(dāng)前文件你用到的符號,使用了的在這里,沒有使用的不在這里。
總結(jié):

程序編譯過程 就是將.m 變成.o 的過程。里面做了通過詞法分析語法分析展開宏啊清除注釋啊,能變成機(jī)器碼的盡量變成機(jī)器碼。不能變成對符號進(jìn)行歸類,對于當(dāng)前.m文件用到的符號,放在重定向符號表里。

鏈接:

當(dāng)程序被編譯成一個個中間代碼.o, 接下來就需要進(jìn)行一個鏈接過程,處理編譯情況。 把多個目標(biāo)文件合并到一起,之后 也就意味著,重定位符號表,包括 其他符號,就被合并到一張表中,最后生成我們的可執(zhí)行文件 exec

Symbol Table
  • symbol Table:用來保存符號
  • StringTable: 用來保存符號的名稱
  • indrect Symbol Table:間接符號表,保存使用外部符號,更準(zhǔn)確一點(diǎn)就是使用的外部動態(tài)庫的符號,是symbolTable的子集(例如: NSLog)
看到這里在回顧一下上面mach -O
截屏2021-02-20 下午4.39.37.png
  • 一樣通過load Command 來找到 符號表的一個具體的位置。
總結(jié):
  • 鏈接過程就是在處理目標(biāo)文件符號的過程。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,572評論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,071評論 3 414
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,409評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,569評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,360評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 54,895評論 1 321
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,979評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,123評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,643評論 1 333
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,559評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,742評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,250評論 5 356
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 43,981評論 3 346
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,363評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,622評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,354評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,707評論 2 370

推薦閱讀更多精彩內(nèi)容