日期 | 內核版本 | 架構 | 作者 | GitHub | CSDN |
---|---|---|---|---|---|
2016-05⑵9 | Linux⑷.5 | X86 & arm | gatieme | LinuxDeviceDrivers | Linux進程管理與調度-之-進程的創建 |
Linux下有3個特殊的進程,idle進程(
* idle進程由系統自動創建, 運行在內核態
idle進程其pid=0,其前身是系統創建的第1個進程,也是唯逐一個沒有通過fork或kernel_thread產生的進程。完成加載系統后,演化為進程調度、交換
* init進程由idle通過kernel_thread創建,在內核空間完成初始化后, 加載init程序, 并終究用戶空間
由0進程創建,完成系統的初始化. 是系統中所有其它用戶進程的先人進程
Linux中的所有進程都是有init進程創建并運行的。首先Linux內核啟動,然后在用戶空間中啟動init進程,再啟動其他系統進程。在系統啟動完成完成后,init將變成守護進程監視系統其他進程。
* kthreadd進程由idle通過kernel_thread創建,并始終運行在內核空間, 負責所有內核線程的調度和管理
它的任務就是管理和調度其他內核線程kernel_thread, 會循環履行1個kthread的函數,該函數的作用就是運行kthread_create_list全局鏈表中保護的kthread, 當我們調用kernel_thread創建的內核線程會被加入到此鏈表中,因此所有的內核線程都是直接或間接的以kthreadd為父進程
我們下面就詳解分析1號進程的前世(kernel_init)今生(init進程)
Linux系統中的init進程(pid=1)是除idle進程(pid=0,也就是init_task)以外另外一個比較特殊的進程,它是Linux內核開始建立起進程概念時第1個通過kernel_thread產生的進程,其開始在內核態履行,然后通過1個系統調用,開始履行用戶空間的/sbin/init程序,期間Linux內核也經歷了從內核態到用戶態的特權級轉變,/sbin/init極有可能產生出了shell,然后所有的用戶進程都有該進程派生出來
前面我們了解到了0號進程是系統所有進程的先祖, 它的進程描寫符init_task是內核靜態創建的, 而它在進行初始化的時候, 通過kernel_thread的方式創建了兩個內核線程,分別是kernel_init和kthreadd,其中kernel_init進程號為1
start_kernel在其最后1個函數rest_init的調用中,會通過kernel_thread來生成1個內核進程,后者則會在新進程環境下調 用kernel_init函數,kernel_init1個讓人感興趣的地方在于它會調用run_init_process來履行根文件系統下的 /sbin/init等程序:
0號進程創建1號進程的方式以下
kernel_thread(kernel_init, NULL, CLONE_FS);
我們發現1號進程的履行函數就是kernel_init, 這個函數被定義init/main.c中,以下所示
kernel_init函數將完成裝備驅動程序的初始化,并調用init_post函數啟動用戶空間的init進程。
由0號進程創建1號進程(內核態),1號內核線程負責履行內核的部份初始化工作及進行系統配置,并創建若干個用于高速緩存和虛擬主存管理的內核線程。
隨后,1號進程調用do_execve運行可履行程序init,并演化成用戶態1號進程,即init進程。
init進程是linux內核啟動的第1個用戶級進程。init有許多很重要的任務,比如像啟動getty(用于用戶登錄)、實現運行級別、和處理孤立進程。
它依照配置文件/etc/initab的要求,完成系統啟開工作,創建編號為1號、2號…的若干終端注冊進程getty。
每一個getty進程設置其進程組標識號,并監視配置到系統終真個接口線路。當檢測到來自終真個連接信號時,getty進程將通過函數do_execve()履行注冊程序login,此時用戶便可輸入注冊名和密碼進入登錄進程,如果成功,由login程序再通過函數execv()履行shell,該shell進程接收getty進程的pid,取代原來的getty進程。再由shell直接或間接地產生其他進程。
上述進程可描寫為:0號進程->1號內核進程->1號用戶進程(init進程)->getty進程->shell進程
注意,上述進程描寫中提到:1號內核進程調用履行init函數并演化成1號用戶態進程(init進程),這里前者是init是函數,后者是進程。二者容易混淆,區分以下:
kernel_init函數在內核態運行,是內核代碼
init進程是內核啟動并運行的第1個用戶進程,運行在用戶態下。
1號內核進程調用execve()從文件/etc/inittab中加載可履行程序init并履行,這個進程并沒有使用調用do_fork(),因此兩個進程都是1號進程。
當內核啟動了自己以后(已被裝入內存、已開始運行、已初始化了所有的裝備驅動程序和數據結構等等),通過啟動用戶級程序init來完成引導進程的內核部份。因此,init總是第1個進程(它的進程號總是1)。
當init開始運行,它通過履行1些管理任務來結束引導進程,例如檢查文件系統、清算/tmp、啟動各種服務和為每一個終端和虛擬控制臺啟動getty,在這些地方用戶將登錄系統。
在系統完全起來以后,init為每一個用戶已退出的終端重啟getty(這樣下1個用戶就能夠登錄)。init一樣也搜集孤立的進程:當1個進程啟動了1個子進程并且在子進程之前終止了,這個子進程立刻成為init的子進程。對各種技術方面的緣由來講這是很重要的,知道這些也是有好處的,由于這便于理解進程列表和進程樹圖。init的變種很少。絕大多數Linux發行版本使用sysinit(由Miguel van Smoorenburg著),它是基于System V的init設計。UNIX的BSD版本有1個不同的init。最主要的不同在于運行級別:System V有而BSD沒有(最少是傳統上說)。這類區分其實不是主要的。在此我們僅討論sysvinit。 配置init以啟動getty:/etc/inittab文件
1號進程通過execve履行init程序來進入用戶空間,成為init進程,那末這個init在哪里呢
內核在幾個位置上來查尋init,這幾個位置之前經常使用來放置init,但是init的最適當的位置(在Linux系統上)是/sbin/init。如果內核沒有找到init,它就會試著運行/bin/sh,如果還是失敗了,那末系統的啟動就宣布失敗了。
因此init程序是1個可以又用戶編寫的進程, 如果希望看init程序源碼的朋友,可以參見
init包 | 說明 | 學習鏈接 |
---|---|---|
sysvinit | 初期1些版本使用的初始化進程工具, 目前在逐步淡出linux歷史舞臺, sysvinit 就是 system V 風格的 init 系統,顧名思義,它源于 System V 系列 UNIX。它提供了比 BSD 風格 init 系統更高的靈活性。是已盛行了幾10年的 UNIX init 系統,1直被各類 Linux 發行版所采取。 | 淺析 Linux 初始化 init 系統(1):sysvinit |
upstart | debian, Ubuntu等系統使用的initdaemon | 淺析 Linux 初始化 init 系統(2): UpStart |
systemd | Systemd 是 Linux 系統中最新的初始化系統(init),它主要的設計目標是克服 sysvinit 固有的缺點,提高系統的啟動速度 | 淺析 Linux 初始化 init 系統(3) Systemd |
Ubuntu等使用deb包的系統可以通過dpkg -S查看程序所在的包
CentOS等使用rpm包的系統可以通過rpm -qf查看系統程序所在的包
參見
Linux下查看并下載命令源碼包(根據命令/利用程序逆向獲得并且安裝其所屬源碼包)
static noinline void __init kernel_init_freeable(void)
{
/*
* Wait until kthreadd is all set-up.
*/
wait_for_completion(&kthreadd_done);
/* Now the scheduler is fully set up and can do blocking allocations */
gfp_allowed_mask = __GFP_BITS_MASK;
/*
* init can allocate pages on any node
*/
set_mems_allowed(node_states[N_MEMORY]);
/*
* init can run on any cpu.
*/
set_cpus_allowed_ptr(current, cpu_all_mask);
cad_pid = task_pid(current);
smp_prepare_cpus(setup_max_cpus);
do_pre_smp_initcalls();
lockup_detector_init();
smp_init();
sched_init_smp();
page_alloc_init_late();
do_basic_setup();
/* Open the /dev/console on the rootfs, this should never fail */
if (sys_open((const char __user *) "/dev/console", O_RDWR, 0) < 0)
pr_err("Warning: unable to open an initial console.\n");
(void) sys_dup(0);
(void) sys_dup(0);
/*
* check if there is an early userspace init. If yes, let it do all
* the work
*/
if (!ramdisk_execute_command)
ramdisk_execute_command = "/init";
if (sys_access((const char __user *) ramdisk_execute_command, 0) != 0) {
ramdisk_execute_command = NULL;
prepare_namespace();
}
/*
* Ok, we have completed the initial bootup, and
* we're essentially up and running. Get rid of the
* initmem segments and start the user-mode stuff..
*
* rootfs is available now, try loading the public keys
* and default modules
*/
integrity_load_keys();
load_default_modules();
}
履行流程 | 說明 |
---|---|
wait_for_completion | 實例在kernel/sched/completion.c中, 等待Kernel Thread kthreadd (PID=2)創建終了 |
gfp_allowed_mask | __GFP_BITS_MASK;設置bitmask, 使得init進程可使用PM并且允許I/O阻塞操作 |
set_mems_allowed(node_states[N_MEMORY]); | init進程可以分配物理頁面 |
set_cpus_allowed_ptr | 通過設置cpu_bit_mask, 可以限定task只能在特定的處理器上運行, 而initcurrent進程此時必定是init進程,設置其cpu_all_mask即便得init進程可以在任意的cpu上運行 |
task_pid | 設置到目前運行進程init的pid號給cad_pid(cad_pid是用來接收ctrl-alt-del reboot signal的進程, 如果設置C_A_D=1就表示可以處理來自ctl-alt-del 的動作), 最后會調用 ctrl_alt_del(void)并確認C_A_D是不是為1,確認完成后將履行cad_work=deferred_cad,履行kernel_restart |
smp_prepare_cpus | 體系結構相干的函數,實例在arch/arm/kernel/smp.c中,調用smp_prepare_cpus時,會以全局變量setup_max_cpus為函式參數max_cpus,以表示在編譯核心時,設定支援的最大CPU數量 |
do_pre_smp_initcalls | 實例在init/main.c中, 會透過函式do_one_initcall,履行Symbol中 __initcall_start與__early_initcall_end之間的函數 |
smp_init | 實例在kernel/smp.c中, 函數主要是由Bootstrap處理器,進行Active多核心架構下其它的處理器. 如果產生Online的處理器個數(from num_online_cpus)超過在核心編譯時,所設定的最大處理器個數 setup_max_cpus (from NR_CPUS),就會終止流程.如果該處理器目前屬於Present (也就是存在系統中),但還沒有是Online的狀態,就會呼喚函式cpu_up(in kernel/cpu.c)來啟動該處理器. |
sched_init_smp | 實例在kernel/sched.c中, (1), 呼喚get_online_cpus,如果目前CPU Hotplug Active Write行程是自己,就直接返回.反之就把 cpu_hotplug.refcount加1 (表示多1個Reader) (2),獲得Mutex Lock “sched_domains_mutex” (3),呼喚arch_init_sched_domains,設定scheduler domains與groups,參考Linux Documentation/scheduler/sched-domains.txt文件,1個Scheduling Domain會包括1個或多個CPU Groups,排程的Load-Balance就會根據Domain中的Groups來做調劑. (4),釋放Mutex Lock “sched_domains_mutex” (5),呼喚put_online_cpus,如果目前CPU Hotplug Active Writer行程是自己,就直接返回.反之就把 cpu_hotplug.refcount減1,如果 cpu_hotplug.refcount減到為0,表示沒有其他Reader,此時如果有CPU Hotplug Active Writer行程在等待,就會透過wake_up_process喚醒該行程,以便讓等待中的Writer可以被履行下去.(也能夠參考_cpu_up中對於函式cpu_hotplug_begin的說明). (6)注冊CPU Notifier cpuset_cpu_active/cpuset_cpu_inactive/update_runtime (7),呼喚set_cpus_allowed_ptr,透過這函式可以設定CPU bitmask,限定Task只能在特定的處理器上運作.在這會用參數”non_isolated_cpus”,也就是會把init指定給non-isolated CPU. Linux Kernel可以在啟動時,透過Boot Parameters “isolcpus=“指定CPU編號或是范圍,讓這些處理器不被包括在Linux Kernel SMP balancing/scheduling算法內,可以在啟動后指派給特定的Task運作.而不在 “isolcpus=“ 指定范圍內的處理器就算是non-isolated CPU. (8),呼喚sched_init_granularity,透過函式update_sysctl,讓sysctl_sched_min_granularity=normalized_sysctl_sched_min_granularity,sysctl_sched_latency=normalized_sysctl_sched_latency,sysctl_sched_wakeup_granularity=normalized_sysctl_sched_wakeup_granularit |
do_basic_setup | 實例在init/main.c中, 1,diaousermodehelper_init (in kernel/kmod.c),產生khelper workqueue. 2,調用init_tmpfs (in mm/shmem.c),對VFS注冊Temp FileSystem. 3,呼喚driver_init (in drivers/base/init.c),初始化Linux Kernel Driver System Model. 4,呼喚init_irq_proc(in kernel/irq/proc.c),初始化 “/proc/irq”與其下的File Nodes. 5,呼喚do_ctors (in init/main.c),履行位於Symbol __ctors_start 到 __ctors_end間屬於Section “.ctors” 的Constructor函式. 6,透過函式do_initcalls,履行介於Symbol __early_initcall_end與__initcall_end之間的函式呼喚, |
sys_open | 實例在fs/fcntl.c中,”SYSCALL_DEFINE1(dup, unsigned int, fildes)”,在這會連續履行兩次sys_dup,復制兩個sys_open開啟/dev/console所產生的檔案描寫0 (也就是會多生出兩個1與2),只是都對應到”/dev/console”,我們在System V streams下的Standard Stream1般而言會有以下的對應 0:Standard input (stdin) 1:Standard output (stdout) 2:Standard error (stderr) (為方便大家參考,附上Wiki URL http://en.wikipedia.org/wiki/Standard_streams ) |
ramdisk_execute_command與prepare_namespace | 1,如果ramdisk_execute_command為0,就設定ramdisk_execute_command = “/init” 2,如果sys_access確認檔案ramdisk_execute_command 失敗,就把ramdisk_execute_command 設定為0,然后呼喚prepare_namespace去mount root FileSystem. |
integrity_load_keys | 至此我們初始化工作完成, 文件系統也已準備好了,那末接下來加載 load integrity keys hook |
load_default_modules | 加載基本的模塊 |
static int __ref kernel_init(void *unused)
{
int ret;
kernel_init_freeable();
/* need to finish all async __init code before freeing the memory */
async_synchronize_full();
free_initmem();
mark_rodata_ro();
system_state = SYSTEM_RUNNING;
numa_default_policy();
flush_delayed_fput();
rcu_end_inkernel_boot();
if (ramdisk_execute_command) {
ret = run_init_process(ramdisk_execute_command);
if (!ret)
return 0;
pr_err("Failed to execute %s (error %d)\n",
ramdisk_execute_command, ret);
}
/*
* We try each of these until one succeeds.
*
* The Bourne shell can be used instead of init if we are
* trying to recover a really broken machine.
*/
if (execute_command) {
ret = run_init_process(execute_command);
if (!ret)
return 0;
panic("Requested init %s failed (error %d).",
execute_command, ret);
}
if (!try_to_run_init_process("/sbin/init") ||
!try_to_run_init_process("/etc/init") ||
!try_to_run_init_process("/bin/init") ||
!try_to_run_init_process("/bin/sh"))
return 0;
panic("No working init found. Try passing init= option to kernel. "
"See Linux Documentation/init.txt for guidance.");
}
履行流程 | 說明 |
---|---|
kernel_init_freeable | 調用kernel_init_freeable完成初始化工作,準備文件系統,準備模塊信息 |
async_synchronize_full | 用以同步所有非同步函式呼喚的履行,在這函數中會等待List async_running與async_pending都清空后,才會返回. Asynchronously called functions主要設計用來加速Linux Kernel開機的效力,避免在開機流程中等待硬體反應延遲,影響到開機完成的時間 |
free_initmem | free_initmem(in arch/arm/mm/init.c),釋放Linux Kernel介於__init_begin到 __init_end屬于init Section的函數的所有內存.并會把Page個數加到變量totalram_pages中,作為后續Linux Kernel在配置記憶體時可使用的Pages. (在這也可把TCM范圍(__tcm_start到__tcm_end)釋放加入到總Page中,但TCM比外部記憶體有效力,合適多媒體,中斷,…etc等對效能要求高的履行需求,放到總Page中,成為可供1般目的配置的存儲范圍 |
system_state | 設置運行狀態SYSTEM_RUNNING |
加載init進程,進入用戶空間 | a,如果ramdisk_execute_command不為0,就履行該命令成為init User Process. b,如果execute_command不為0,就履行該命令成為init User Process. c,如果上述都不成立,就依序執行以下指令 run_init_process(“/sbin/init”); run_init_process(“/etc/init”); run_init_process(“/bin/init”); run_init_process(“/bin/sh”); 也就是說會依照順序從/sbin/init, /etc/init, /bin/init 與 /bin/sh依序履行第1個 init User Process. 如果都找不到可以執行的 init Process,就會進入Kernel Panic.以下所示panic(“No init found. Try passing init= option to kernel. ”“See Linux Documentation/init.txt for guidance.”); |