操作系統(tǒng)之文件描述符FD與Inode

一、文件描述符

1.1 概念

Linux 系統(tǒng)中,把一切都看做是文件,當(dāng)進(jìn)程打開現(xiàn)有文件或創(chuàng)建新文件時,內(nèi)核向進(jìn)程返回一個文件描述符,文件描述符就是內(nèi)核為了高效管理已被打開的文件所創(chuàng)建的索引,用來指向被打開的文件,所有執(zhí)行I/O操作的系統(tǒng)調(diào)用都會通過文件描述符。

1.2 文件描述符與文件、進(jìn)程的關(guān)系

我們可以通過linux的幾個基本的I/O操作函數(shù)來理解什么是文件操作符。

fd = open(pathname, flags, mode)
// 返回了該文件的fd
rlen = read(fd, buf, count)
// IO操作均需要傳入該文件的fd值
wlen = write(fd, buf, count)
status = close(fd)

每當(dāng)進(jìn)程用open()函數(shù)打開一個文件,內(nèi)核便會返回該文件的文件操作符(一個非負(fù)的整形值),此后所有對該文件的操作,都會以返回的fd文件操作符為參數(shù)。

文件描述符可以理解為進(jìn)程文件描述表這個表的索引,或者把文件描述表看做一個數(shù)組的話,文件描述符可以看做是數(shù)組的下標(biāo)。當(dāng)需要進(jìn)行I/O操作的時候,會傳入fd作為參數(shù),先從進(jìn)程文件描述符表查找該fd對應(yīng)的那個條目,取出對應(yīng)的那個已經(jīng)打開的文件的句柄,根據(jù)文件句柄指向,去系統(tǒng)fd表中查找到該文件指向的inode,從而定位到該文件的真正位置,從而進(jìn)行I/O操作。

  • 每個文件描述符會與一個打開的文件相對應(yīng)
  • 不同的文件描述符也可能指向同一個文件
  • 相同的文件可以被不同的進(jìn)程打開,也可以在同一個進(jìn)程被多次打開

1.3文件描述符相關(guān)表

  • 進(jìn)程級的文件描述符表
  • 系統(tǒng)級的文件描述符表
  • 文件系統(tǒng)的i-node表

1.3.1 進(jìn)程級的文件描述符表

linux內(nèi)核會為每一個進(jìn)程創(chuàng)建一個task_truct結(jié)構(gòu)體來維護(hù)進(jìn)程信息,稱之為進(jìn)程描述符,該結(jié)構(gòu)體中指針,指向一個名稱為file_struct的結(jié)構(gòu)體,該結(jié)構(gòu)體即 進(jìn)程級別的文件描述表。

它的每一個條目記錄的是單個文件描述符的相關(guān)信息:

  • 文件描述符控制標(biāo)志,內(nèi)核僅定義了一個,即close-on-exec
  • 所打開的文件句柄的引用

1.3.2 系統(tǒng)級的文件描述符表

內(nèi)核對系統(tǒng)中所有打開的文件維護(hù)了一個描述符表,也被稱之為 【打開文件表】,表格中的每一項被稱之為 【打開文件句柄】,一個【打開文件句柄】 描述了一個打開文件的全部信息。
主要包括:

  • 當(dāng)前文件偏移量(調(diào)用read()和write()時更新,或使用lseek()直接修改)
  • 打開文件時所使用的狀態(tài)標(biāo)識(即,open()的flags參數(shù))
  • 文件訪問模式(如調(diào)用open()時所設(shè)置的只讀模式、只寫模式或讀寫模式)
  • 與信號驅(qū)動相關(guān)的設(shè)置
  • 對該文件i-node對象的引用文件類型(例如:常規(guī)文件、套接字或FIFO)和訪問權(quán)限
  • 一個指針,指向該文件所持有的鎖列表
  • 文件的各種屬性,包括文件大小以及與不同類型操作相關(guān)的時間戳

1.3.3 文件系統(tǒng)的i-node表

每個文件系統(tǒng)會為存儲于其上的所有文件(包括目錄)維護(hù)一個i-node表,單個i-node包含以下信息:

  • 文件類型(file type),可以是常規(guī)文件、目錄、套接字或FIFO
  • 訪問權(quán)限
  • 文件鎖列表(file locks)
  • 文件大小
    ........

i-node存儲在磁盤設(shè)備上,內(nèi)核在內(nèi)存中維護(hù)了一個副本,這里的i-node表為后者。副本除了原有信息,還包括:引用計數(shù)(從打開文件描述體)、所在設(shè)備號以及一些臨時屬性,例如文件鎖。

關(guān)系圖

在進(jìn)程A中,文件描述符1和30都指向了同一個打開的文件句柄(標(biāo)號23)。這可能是通過調(diào)用dup()、dup2()、fcntl()或者對同一個文件多次調(diào)用了open()函數(shù)而形成的。

進(jìn)程A的文件描述符2和進(jìn)程B的文件描述符2都指向了同一個打開的文件句柄(標(biāo)號73)。這種情形可能是在調(diào)用fork()后出現(xiàn)的(即,進(jìn)程A、B是父子進(jìn)程關(guān)系),或者當(dāng)某進(jìn)程通過UNIX域套接字將一個打開的文件描述符傳遞給另一個進(jìn)程時,也會發(fā)生。再者是不同的進(jìn)程獨自去調(diào)用open函數(shù)打開了同一個文件,此時進(jìn)程內(nèi)部的描述符正好分配到與其他進(jìn)程打開該文件的描述符一樣。

此外,進(jìn)程A的描述符0和進(jìn)程B的描述符3分別指向不同的打開文件句柄,但這些句柄均指向i-node表的相同條目(1976),換言之,指向同一個文件。發(fā)生這種情況是因為每個進(jìn)程各自對同一個文件發(fā)起了open()調(diào)用。同一個進(jìn)程兩次打開同一個文件,也會發(fā)生類似情況。

二、i-node

2.1 i-node是什么

理解inode,要從文件儲存說起。

文件儲存在硬盤上,硬盤的最小存儲單位叫做”扇區(qū)”(Sector)。每個扇區(qū)儲存512字節(jié)(相當(dāng)于0.5KB)。

操作系統(tǒng)讀取硬盤的時候,不會一個個扇區(qū)地讀取,這樣效率太低,而是一次性連續(xù)讀取多個扇區(qū),即一次性讀取一個”塊”(block)。這種由多個扇區(qū)組成的”塊”,是文件存取的最小單位?!眽K”的大小,最常見的是4KB,即連續(xù)八個 sector組成一個 block。

文件數(shù)據(jù)都儲存在”塊”中,那么很顯然,我們還必須找到一個地方儲存文件的元信息,比如文件的創(chuàng)建者、文件的創(chuàng)建日期、文件的大小等等。這種儲存文件元信息的區(qū)域就叫做inode,中文譯名為”索引節(jié)點”。每一個文件都有對應(yīng)的inode,里面包含了與該文件有關(guān)的一些信息。

2.2 i-node中有什么

inode包含文件的元信息,具體來說有以下內(nèi)容:

  • 文件的字節(jié)數(shù)
  • 文件擁有者的User ID
  • 文件的Group ID
  • 文件的讀、寫、執(zhí)行權(quán)限
  • 文件的時間戳,共有三個:ctime指inode上一次變動的時間,mtime指文件內(nèi)容上一次變動的時間,atime指文件上一次打開的時間。
  • 鏈接數(shù),即有多少文件名指向這個inode
  • 文件數(shù)據(jù)block的位置

2.3 i-node的大小

inode也會消耗硬盤空間,所以硬盤格式化的時候,操作系統(tǒng)自動將硬盤分成兩個區(qū)域。一個是數(shù)據(jù)區(qū),存放文件數(shù)據(jù);另一個是inode區(qū)(inode table),存放inode所包含的信息。

每個inode節(jié)點的大小,一般是128字節(jié)或256字節(jié)。inode節(jié)點的總數(shù),在格式化時就給定,一般是每1KB或每2KB就設(shè)置一個inode。假定在一塊1GB的硬盤中,每個inode節(jié)點的大小為128字節(jié),每1KB就設(shè)置一個inode,那么inode table的大小就會達(dá)到128MB,占整塊硬盤的12.8%。

查看每個硬盤分區(qū)的inode總數(shù)和已經(jīng)使用的數(shù)量,可以使用df -i命令。

2.4 i-node的號碼

每個inode都有一個號碼,操作系統(tǒng)用inode號碼來識別不同的文件。

這里值得重復(fù)一遍,Unix/Linux系統(tǒng)內(nèi)部不使用文件名,而使用inode號碼來識別文件。對于系統(tǒng)來說,文件名只是inode號碼便于識別的別稱或者綽號。

表面上,用戶通過文件名,打開文件。實際上,系統(tǒng)內(nèi)部這個過程分成三步:首先,系統(tǒng)找到這個文件名對應(yīng)的inode號碼;其次,通過inode號碼,獲取inode信息;最后,根據(jù)inode信息,找到文件數(shù)據(jù)所在的block,讀出數(shù)據(jù)。

使用ls -i命令,可以看到文件名對應(yīng)的inode號碼。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容