/****************************
* 系統(tǒng)調(diào)用
****************************/
(1)什么是系統(tǒng)調(diào)用
系統(tǒng)調(diào)用是內(nèi)核和應(yīng)用程序間的接口,應(yīng)用程序要訪問(wèn)硬件設(shè)備和其他操作系統(tǒng)資源,必須通過(guò)系統(tǒng)調(diào)用來(lái)完成。
在linux中,系統(tǒng)調(diào)用是用戶空間訪問(wèn)內(nèi)核的唯一手段,除異常和中斷外,他們是內(nèi)核唯一的合法入口。系統(tǒng)調(diào)用的數(shù)量很少,在i386上只有大概300個(gè)左右。
(2)c庫(kù)和系統(tǒng)調(diào)用的關(guān)系
應(yīng)用程序員通過(guò)C庫(kù)中的應(yīng)用程序接口(API)而不是直接通過(guò)系統(tǒng)調(diào)用來(lái)編程。C庫(kù)中的函數(shù)可以不調(diào)用系統(tǒng)調(diào)用,也可以只是簡(jiǎn)單封裝一個(gè)系統(tǒng)調(diào)用,還可以通過(guò)調(diào)用多個(gè)系統(tǒng)調(diào)用來(lái)實(shí)現(xiàn)一個(gè)功能。
應(yīng)用程序-->C庫(kù)-->內(nèi)核的系統(tǒng)調(diào)用
從程序員的角度來(lái)看,系統(tǒng)調(diào)用無(wú)關(guān)緊要,他們只需要跟API打交道就可以了;
從內(nèi)核的角度來(lái)看,內(nèi)核只跟系統(tǒng)調(diào)用打交道,庫(kù)函數(shù)及應(yīng)用程序怎么使用系統(tǒng)調(diào)用不是內(nèi)核所關(guān)心的。
unix的系統(tǒng)調(diào)用抽象出了用于完成某種特定目的的函數(shù),而怎么使用這些函數(shù)則是用戶的事情,內(nèi)核并不關(guān)心。
(3)在內(nèi)核中實(shí)現(xiàn)的系統(tǒng)調(diào)用函數(shù)
在用戶空間中使用系統(tǒng)調(diào)用例子
#include <unistd.h>
getpid();
經(jīng)過(guò)glibc庫(kù)的封裝,最終會(huì)調(diào)用內(nèi)核中kernel/timer.c中的函數(shù)sys_getpid。見該函數(shù)。內(nèi)核中所有的系統(tǒng)調(diào)用函數(shù)都用sys_開頭。
- asmlinkage 通知編譯器,使用局部堆棧來(lái)傳遞參數(shù)
- FASTCALL宏 通知編譯器,使用寄存器來(lái)傳遞參數(shù)
(4)系統(tǒng)調(diào)用號(hào)
因?yàn)橄到y(tǒng)調(diào)用要從用戶空間進(jìn)入內(nèi)核空間,所以不可能通過(guò)簡(jiǎn)單的函數(shù)調(diào)用完成,必須通過(guò)一些處理器支持的特殊機(jī)制(所謂的軟中斷)。
在x86上,這一特殊機(jī)制就是匯編指令int $0x80, 而在arm上,就是匯編指令SWI。
這條指令被封裝到C庫(kù)中的函數(shù)里,當(dāng)程序執(zhí)行到這一條指令后,cpu會(huì)進(jìn)入一個(gè)特殊的異常模式(或軟中斷模式),并將程序指針跳轉(zhuǎn)到特點(diǎn)的位置(如arm為中斷向量表的0x8處)。
內(nèi)核中實(shí)現(xiàn)了很多的系統(tǒng)調(diào)用,這些系統(tǒng)調(diào)用的地址被按順序放在一個(gè)系統(tǒng)調(diào)用表中,這個(gè)表是一個(gè)名為sys_call_table的數(shù)組,共有NR_syscalls個(gè)表項(xiàng)。通過(guò)這個(gè)表,就可以調(diào)用到內(nèi)核定義的所以sys_函數(shù)
調(diào)用匯編指令int $0x80 或SWI 時(shí),要同時(shí)傳遞一個(gè)系統(tǒng)調(diào)用號(hào),這個(gè)系統(tǒng)調(diào)用號(hào)將作為索引,從sys_call_table中選擇對(duì)應(yīng)的系統(tǒng)調(diào)用。
int80將系統(tǒng)調(diào)用號(hào)保存在eax寄存器中,而SWI將其直接集成在指令中(如SWI 0x124)。
(5)系統(tǒng)調(diào)用的實(shí)現(xiàn)機(jī)制
內(nèi)核中處理系統(tǒng)調(diào)用的函數(shù)定義在arch/i386/kernel/entry.s中的system_call,而arm系統(tǒng)在arch/arm/kernel/entry-common.s中的vector_swi。x86系統(tǒng)的系統(tǒng)調(diào)用表定義在arch/i386/kernel/syscall_table.s(或直接定義在entry.s)中,而arm定義在arch/arm/kernel/calls.s中系統(tǒng)調(diào)用號(hào)定義在include/asm/unistd.h中
(6)要實(shí)現(xiàn)系統(tǒng)調(diào)用需注意哪些方面
給linux添加一個(gè)系統(tǒng)調(diào)用不難,但怎么設(shè)計(jì)和實(shí)現(xiàn)一個(gè)系統(tǒng)調(diào)用是難題所在。linux不提倡采用多用途的系統(tǒng)調(diào)用(根據(jù)不同的參數(shù)提供不同的功能)。
系統(tǒng)調(diào)用必須仔細(xì)檢查傳入?yún)?shù)的有效性,尤其是用戶提供的指針,必須確保:
- *指針指向的內(nèi)存區(qū)域?qū)儆谟脩艨臻g,進(jìn)程不能哄騙內(nèi)核去讀內(nèi)核空間的數(shù)據(jù)
- *指針指向的內(nèi)存區(qū)域?qū)儆谶M(jìn)程的地址空間,不能哄騙內(nèi)核去讀其他進(jìn)程的數(shù)據(jù)
- *進(jìn)程不能繞過(guò)內(nèi)存訪問(wèn)權(quán)限。
內(nèi)核在執(zhí)行系統(tǒng)調(diào)用的時(shí)候處于進(jìn)程上下文,可以休眠,也可以被搶占,所以必須保證系統(tǒng)調(diào)用是可重入的。
(7)一個(gè)系統(tǒng)調(diào)用的例子(包括內(nèi)核的修改和用戶空間程序的實(shí)現(xiàn))
實(shí)現(xiàn)一個(gè)系統(tǒng)調(diào)用sys_foo
a.添加系統(tǒng)調(diào)用號(hào)
修改include/asm/unistd.h
,加入:#define __NR_foo 289
并修改:#define NR_syscalls 290
b.在系統(tǒng)調(diào)用表中添加
修改arch/i386/kernel/entry.s或syscall_table.s,加入:
.long sys_foo
c.系統(tǒng)調(diào)用必須編譯到核心的內(nèi)核映像中,可以將系統(tǒng)調(diào)用的定義放置到和其功能聯(lián)系最緊密的代碼中,如kernel/sys.c,加入:
#include <asm/thread_info.h>
/*
* return the size of kernel stack
*/
asmlinkage long sys_foo(void)
{
return THREAD_SIZE;
}
d.在用戶空間進(jìn)行調(diào)用
通常,系統(tǒng)調(diào)用靠c庫(kù)支持,glibc不可能支持我們自己的系統(tǒng)調(diào)用,此時(shí),需要借助linux本身提供的一組宏來(lái)對(duì)系統(tǒng)調(diào)用直接進(jìn)行訪問(wèn)。
man 2 syscall
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接