當你寫完一個helloworld程序,興致勃勃地你通過gcc把它編譯成一個由機器碼(machine code)組成的可執行文件并在命令行輸入./hello時,你看到屏幕上出現一行"Hello, world."看起來很酷,你也許會問這中間發生了什么?
·高級語言->匯編->機器碼
當我們用高級語言,例如C語言,寫了一個程序并用gcc -o hello helloworld.c命令將它編譯成可執行文件時,會發生下面的一系列事情。
1.預處理(Preprocessing)。預處理器(Preprocessor)處理源文件中以#開頭的預處理指令,從相應的系統文件中得到所需的內容并修改源文件。這一步可以用gcc-E helloworld.c-o hello.i實現。產生的是一個.i文件。
2.編譯(Compilig)。簡單來說就是編譯器(Compiler)將第一步得到的文件翻譯成一個以.s(或.asm)結尾的匯編文件。
3.匯編(Assembling)。匯編器(Assembler)將匯編文件翻譯成機器指令文件并打包成可重定位目標文件(Relocatable Object Program),一種以.o結尾的文件。
4.鏈接(Linking)。合并.o文件及其所用到的庫中的目標文件,生成可執行文件hello。
·CPU對機器碼指令的處理
當你成功得到一個可執行文件之后,在命令行輸入./hello,并滿心歡喜地打入回車,此時這個由機器碼組成的文件就被加載到內存中。
程序計數器(Program Counter)記錄當前指令(一條機器碼)的地址,在取完一條指令之后改變自己的值為下一跳要執行的指令的地址,依次取出每一條指令。每一條被取出的指令就放在指令寄存器(Instruction Register)中。
讓我們再仔細看看!
通過取指(Fetch),譯碼(Decode)CPU就可以了解所要執行的機器碼的內容。接下來運用算術邏輯單元(ALU)執行指令中的運算。接下來通過訪存(Memory)讀取/寫入內存,通過寫回(Write Back)寫入寄存器。之后更新PC準備讀取下一條指令。
·地址的抽象
在CPU和主存之間進行數據傳輸時,數據通過兩條線交互:地址線(Address Bus),數據線(Data Bus),還有一條控制線(Control Bus)先不說。其中數據線很容易理解。就是將在相應地址/寄存器上的數據相互傳遞,但是如果我們將目光投向地址線,我們會發現這里用到了一層抽象,地址線上的地址通過一個譯碼器將地址信息翻譯成具體要訪問的的內存單元,這樣看起來就像是每個內存單元有自己的地址一般。
如果我們的地址兩位長度的A0, A1,那么地址00, 01, 10, 11分別就代表D0, D1, D2, D3??雌饋砭秃孟衩總€內存單元有了自己的地址一樣!