當Power on PC時,BIOS的代碼開始執行,然后是Linux初始化的代碼,這其中大約很長一段時間Linux都沒有進程這一概念,但是這不影響CPU執行它的二進制代碼。如果不是多任務以及進程調度的需要,Linux內核可以一直這樣走下去
但是因為多任務的需求,Linux必須能支持任務這一特性,任務即進程,或者更簡單地說由task_struct對象實例所代表的一段代碼的集合,用以完成特定的任務。所以Linux內核初始化過程中必須為進程以及進程調度做準備
追蹤操作系統 內核態 的初始化過程,從 init/main.c 中的 start_kernel() 開始
使用gdb跟蹤調試內核
qemu?-kernel?linux-3.18.6/arch/x86/boot/bzImage -S -s
# 關于-S和-s選項的說明:
# -S freeze CPU at startup (use ’c’ to start execution)
# -s shorthand for -gdb tcp::1234
# 若不想使用1234端口,則可以使用-gdb tcp:xxxx來取代-s選項
另開一個shell窗口
gdb
? (gdb) file linux-3.18.6/vmlinux # 在gdb界面中targe remote之前加載符號表
? (gdb) target remote:1234 # 建立gdb和gdbserver之間的連接,按c讓qemu上的Linux繼續運行
? (gdb) break start_kernel # 斷點的設置可以在target remote之前,也可以在之后
詳細分析從start_kernel到init進程啟動的過程
start_kernel()????? /linux-3.18.6/init/main.c(500行)
start_kernel()是內核的匯編與C語言的交接點,在該函數以前,內核的代碼都是用匯編寫的,完成一些最基本的初始化與環境設置工作,比如內核代碼載入內存并解壓縮(現在的內核一般都經過壓縮),CPU的最基本初始化,為C代碼的運行設置環境(C代碼的運行是有一定環境要求的,比如stack的設置等,具體見 C語言函數調用堆棧框架?)
全局變量init_task,即手工創建的(0號進程的)PCB,0號進程即最終的idle進程
init_task進程在Linux中屬于一個比較特殊的進程,它是內核開發者人為制造出來的,而不是其他進程通過do_fork來完成,init_task進程的內核棧通過靜態方式分配
所有的模塊在初始化的時候都是通過調用 start_kernel() 進行初始化,例如中斷模塊(trap_init)、內存管理模塊(mm_init)、調度模塊(sched_init)等等,研究特定的內核的模塊,都需要了解 main.c 中的 start_kernel(),不管分析內核的哪一部分都會涉及到 start_kernel()
trap_init()????? /linux-3.18.6/arch/x86/kernel/traps.c(792行)
涉及一些中斷,初始化一些中斷向量
set_intr_gate,設置了很多中斷門
set_system_trap_gate,設置系統陷阱門,系統調用
分析中斷的時候也主要是分析系統調用,因為硬件中斷不好模擬,而系統調用也是一種中斷,和中斷的機制是一樣的,它只是用指令的方式來觸發一個中斷
Linux在無進程概念的情況下將一直從初始化部分的代碼執行到start_kernel(),在start_kernel()中Linux將完成整個系統的內核初始化。內核初始化的最后一步就是調用rest_init(),啟動init進程這個所有進程的祖先
rest_init():Linux內核初始化的尾聲
從rest_init開始,Linux開始產生進程,因為init_task是靜態制造出來的,pid=0,它試圖將從最早的匯編代碼一直到start_kernel的執行都納入到init_task進程上下文中。在rest_init函數中,內核將通過下面的代碼產生第一個真正的進程(pid=1):
kernel_thread():創建一個內核線程,實際上就是內核進程,Linux內核是不支持類似Windows NT一樣的線程概念的。Linux本質上只支持進程。這里的kernel_init只是一個函數
kernel_init():會通過調用do_execve來執行根文件系統下的/sbin/init文件(所以此前根文件系統必須已經就緒),do_execve對用戶空間程序/sbin/init的調用發起自int $0x80,這是個從內核空間發起的系統調用
run_init_process():實際上是通過嵌入匯編構建一個類似用戶態代碼一樣的do_execve()調用,其參數就是要執行的可執行文件名,也就是這里的init進程在磁盤上的文件
這里的run_init_process就是通過execve()來運行init程序。這里首先運行“/sbin/init”,如果失敗再運行“/etc/init”,然后是 “/bin/init”,然后是“/bin/sh”(也就是說,init可執行文件可以放在上面代碼中尋找的4個目錄中都可以),如果都失敗,則可以通過在系統啟動時再添加的啟動參數來指定init,比如init=/home/rootfs/init。這里是內核初始化結束并開始用戶態初始化的陰陽界
init進程是Linux系統的第一個用戶態進程,為1號進程,沒有父進程,由Linux內核直接啟動
接下來還創建了一個kthreadd內核線程,來管理系統的資源
此時init_task的任務基本上已經完全結束了,它將淪落為一個idle task,事實上在更早前的sched_init()函數中,通過init_idle(current, smp_processor_id())函數的調用就已經把init_task初始化成了一個idle task,init_idle函數的第一個參數current就是&init_task,在init_idle中將會把init_task加入到cpu的運行隊列中,這樣當運行隊列中沒有別的就緒進程時,init_task(也就是idle task)將會被調用,它的核心是一個while(1)循環,在循環中它將會調用schedule函數以便在運行隊列中有新進程加入時切換到該新進程上
Summary:
內核啟動過程包括start_kernel之前和之后,之前全部是做初始化的匯編指令(硬件平臺相關),之后開始C代碼的操作系統初始化(硬件平臺無關),最后執行第一個用戶態進程init
結合中國傳統文化的角度看,道生一(start_kernel....cpu_idle),一生二(kernel_init和kthreadd),二生三(即前面0、1和2三個進程),三生萬物(1號進程是所有用戶態進程的祖先,2號進程是所有內核線程的祖先)
(完)