一文讓你徹底理解 Java NIO 核心組件

背景知識

同步、異步、阻塞、非阻塞

首先,這幾個概念非常容易搞混淆,但NIO中又有涉及,所以總結一下。

同步:API調(diào)用返回時調(diào)用者就知道操作的結果如何了(實際讀取/寫入了多少字節(jié))。

異步:相對于同步,API調(diào)用返回時調(diào)用者不知道操作的結果,后面才會回調(diào)通知結果。

阻塞:當無數(shù)據(jù)可讀,或者不能寫入所有數(shù)據(jù)時,掛起當前線程等待。

非阻塞:讀取時,可以讀多少數(shù)據(jù)就讀多少然后返回,寫入時,可以寫入多少數(shù)據(jù)就寫入多少然后返回。

對于I/O操作,根據(jù)Oracle官網(wǎng)的文檔,同步異步的劃分標準是“調(diào)用者是否需要等待I/O操作完成”,這個“等待I/O操作完成”的意思不是指一定要讀取到數(shù)據(jù)或者說寫入所有數(shù)據(jù),而是指真正進行I/O操作時,比如數(shù)據(jù)在TCP/IP協(xié)議棧緩沖區(qū)和JVM緩沖區(qū)之間傳輸?shù)倪@段時間,調(diào)用者是否要等待。

所以,我們常用的 read() 和 write() 方法都是同步I/O,同步I/O又分為阻塞和非阻塞兩種模式,如果是非阻塞模式,檢測到無數(shù)據(jù)可讀時,直接就返回了,并沒有真正執(zhí)行I/O操作。

總結就是,Java中實際上只有 同步阻塞I/O、同步非阻塞I/O 與 異步I/O 三種機制,我們下文所說的是前兩種,JDK 1.7才開始引入異步 I/O,那稱之為NIO.2。

傳統(tǒng)IO

我們知道,一個新技術的出現(xiàn)總是伴隨著改進和提升,Java NIO的出現(xiàn)亦如此。

傳統(tǒng) I/O 是阻塞式I/O,主要問題是系統(tǒng)資源的浪費。比如我們?yōu)榱俗x取一個TCP連接的數(shù)據(jù),調(diào)用 InputStream 的 read() 方法,這會使當前線程被掛起,直到有數(shù)據(jù)到達才被喚醒,那該線程在數(shù)據(jù)到達這段時間內(nèi),占用著內(nèi)存資源(存儲線程棧)卻無所作為,也就是俗話說的占著茅坑不拉屎,為了讀取其他連接的數(shù)據(jù),我們不得不啟動另外的線程。在并發(fā)連接數(shù)量不多的時候,這可能沒什么問題,然而當連接數(shù)量達到一定規(guī)模,內(nèi)存資源會被大量線程消耗殆盡。另一方面,線程切換需要更改處理器的狀態(tài),比如程序計數(shù)器、寄存器的值,因此非常頻繁的在大量線程之間切換,同樣是一種資源浪費。

隨著技術的發(fā)展,現(xiàn)代操作系統(tǒng)提供了新的I/O機制,可以避免這種資源浪費。基于此,誕生了Java NIO,NIO的代表性特征就是非阻塞I/O。緊接著我們發(fā)現(xiàn),簡單的使用非阻塞I/O并不能解決問題,因為在非阻塞模式下,read()方法在沒有讀取到數(shù)據(jù)時就會立即返回,不知道數(shù)據(jù)何時到達的我們,只能不停的調(diào)用read()方法進行重試,這顯然太浪費CPU資源了,從下文可以知道,Selector組件正是為解決此問題而生。

Java NIO 核心組件

1.Channel

概念

Java NIO中的所有I/O操作都基于Channel對象,就像流操作都要基于Stream對象一樣,因此很有必要先了解Channel是什么。以下內(nèi)容摘自JDK 1.8的文檔

A channel represents an open connection to an entity such as a hardware device, a file, a network socket, or a program component that is capable of performing one or more distinct I/O operations, for example reading or writing.

從上述內(nèi)容可知,一個Channel(通道)代表和某一實體的連接,這個實體可以是文件、網(wǎng)絡套接字等。也就是說,通道是Java NIO提供的一座橋梁,用于我們的程序和操作系統(tǒng)底層I/O服務進行交互。

通道是一種很基本很抽象的描述,和不同的I/O服務交互,執(zhí)行不同的I/O操作,實現(xiàn)不一樣,因此具體的有FileChannel、SocketChannel等。

通道使用起來跟Stream比較像,可以讀取數(shù)據(jù)到Buffer中,也可以把Buffer中的數(shù)據(jù)寫入通道。


當然,也有區(qū)別,主要體現(xiàn)在如下兩點:

一個通道,既可以讀又可以寫,而一個Stream是單向的(所以分 InputStream 和 OutputStream)

通道有非阻塞I/O模式

實現(xiàn)

Java NIO中最常用的通道實現(xiàn)是如下幾個,可以看出跟傳統(tǒng)的 I/O 操作類是一一對應的。

FileChannel:讀寫文件

DatagramChannel: UDP協(xié)議網(wǎng)絡通信

SocketChannel:TCP協(xié)議網(wǎng)絡通信

ServerSocketChannel:監(jiān)聽TCP連接

2.Buffer

NIO中所使用的緩沖區(qū)不是一個簡單的byte數(shù)組,而是封裝過的Buffer類,通過它提供的API,我們可以靈活的操縱數(shù)據(jù),下面細細道來。

與Java基本類型相對應,NIO提供了多種 Buffer 類型,如ByteBuffer、CharBuffer、IntBuffer等,區(qū)別就是讀寫緩沖區(qū)時的單位長度不一樣(以對應類型的變量為單位進行讀寫)。

Buffer中有3個很重要的變量,它們是理解Buffer工作機制的關鍵,分別是

capacity (總容量)

position (指針當前位置)

limit (讀/寫邊界位置)

Buffer的工作方式跟C語言里的字符數(shù)組非常的像,類比一下,capacity就是數(shù)組的總長度,position就是我們讀/寫字符的下標變量,limit就是結束符的位置。Buffer初始時3個變量的情況如下圖


在對Buffer進行讀/寫的過程中,position會往后移動,而 limit 就是 position 移動的邊界。由此不難想象,在對Buffer進行寫入操作時,limit應當設置為capacity的大小,而對Buffer進行讀取操作時,limit應當設置為數(shù)據(jù)的實際結束位置。(注意:將Buffer數(shù)據(jù)?寫入?通道是Buffer?讀取?操作,從通道?讀取?數(shù)據(jù)到Buffer是Buffer?寫入?操作)

在對Buffer進行讀/寫操作前,我們可以調(diào)用Buffer類提供的一些輔助方法來正確設置 position 和 limit 的值,主要有如下幾個

flip(): 設置 limit 為 position 的值,然后 position 置為0。對Buffer進行讀取操作前調(diào)用。

rewind(): 僅僅將 position 置0。一般是在重新讀取Buffer數(shù)據(jù)前調(diào)用,比如要讀取同一個Buffer的數(shù)據(jù)寫入多個通道時會用到。

clear(): 回到初始狀態(tài),即 limit 等于 capacity,position 置0。重新對Buffer進行寫入操作前調(diào)用。

compact(): 將未讀取完的數(shù)據(jù)(position 與 limit 之間的數(shù)據(jù))移動到緩沖區(qū)開頭,并將 position 設置為這段數(shù)據(jù)末尾的下一個位置。其實就等價于重新向緩沖區(qū)中寫入了這么一段數(shù)據(jù)。

然后,看一個實例,使用 FileChannel 讀寫文本文件,通過這個例子驗證通道可讀可寫的特性以及Buffer的基本用法(注意 FileChannel 不能設置為非阻塞模式)。

FileChannel channel = new RandomAccessFile("test.txt", "rw").getChannel();

? ? channel.position(channel.size());? // 移動文件指針到末尾(追加寫入)

? ? ByteBuffer byteBuffer = ByteBuffer.allocate(20);

? ? // 數(shù)據(jù)寫入Buffer

? ? byteBuffer.put("你好,世界!\n".getBytes(StandardCharsets.UTF_8));

? ? // Buffer -> Channel

? ? byteBuffer.flip();

? ? while (byteBuffer.hasRemaining()) {

? ? ? ? channel.write(byteBuffer);

? ? }

? ? channel.position(0); // 移動文件指針到開頭(從頭讀?。?/p>

? ? CharBuffer charBuffer = CharBuffer.allocate(10);

? ? CharsetDecoder decoder = StandardCharsets.UTF_8.newDecoder();

? ? // 讀出所有數(shù)據(jù)

? ? byteBuffer.clear();

? ? while (channel.read(byteBuffer) != -1 || byteBuffer.position() > 0) {

? ? ? ? byteBuffer.flip();

? ? ? ? // 使用UTF-8解碼器解碼

? ? ? ? charBuffer.clear();

? ? ? ? decoder.decode(byteBuffer, charBuffer, false);

? ? ? ? System.out.print(charBuffer.flip().toString());

? ? ? ? byteBuffer.compact(); // 數(shù)據(jù)可能有剩余

? ? }

? ? channel.close();

這個例子中使用了兩個Buffer,其中 byteBuffer 作為通道讀寫的數(shù)據(jù)緩沖區(qū),charBuffer 用于存儲解碼后的字符。clear() 和 flip() 的用法正如上文所述,需要注意的是最后那個 compact() 方法,即使 charBuffer 的大小完全足以容納 byteBuffer 解碼后的數(shù)據(jù),這個 compact() 也必不可少,這是因為常用中文字符的UTF-8編碼占3個字節(jié),因此有很大概率出現(xiàn)在中間截斷的情況,


當 Decoder 讀取到緩沖區(qū)末尾的 0xe4 時,無法將其映射到一個 Unicode,decode()方法第三個參數(shù) false 的作用就是讓 Decoder 把無法映射的字節(jié)及其后面的數(shù)據(jù)都視作附加數(shù)據(jù),因此 decode() 方法會在此處停止,并且 position 會回退到 0xe4 的位置。如此一來, 緩沖區(qū)中就遺留了“中”字編碼的第一個字節(jié),必須將其 compact 到前面,以正確的和后序數(shù)據(jù)拼接起來。

BTW,例子中的 CharsetDecoder 也是 Java NIO 的一個新特性,所以大家應該發(fā)現(xiàn)了一點哈,NIO的操作是面向緩沖區(qū)的(傳統(tǒng)I/O是面向流的)。

至此,我們了解了 Channel 與 Buffer 的基本用法。接下來要說的是讓一個線程管理多個Channel的重要組件。

3.Selector

Selector 是什么

Selector(選擇器)是一個特殊的組件,用于采集各個通道的狀態(tài)(或者說事件)。我們先將通道注冊到選擇器,并設置好關心的事件,然后就可以通過調(diào)用select()方法,靜靜地等待事件發(fā)生。

通道有如下4個事件可供我們監(jiān)聽:

Accept:有可以接受的連接

Connect:連接成功

Read:有數(shù)據(jù)可讀

Write:可以寫入數(shù)據(jù)了

為什么要用Selector

前文說了,如果用阻塞I/O,需要多線程(浪費內(nèi)存),如果用非阻塞I/O,需要不斷重試(耗費CPU)。Selector的出現(xiàn)解決了這尷尬的問題,非阻塞模式下,通過Selector,我們的線程只為已就緒的通道工作,不用盲目的重試了。比如,當所有通道都沒有數(shù)據(jù)到達時,也就沒有Read事件發(fā)生,我們的線程會在select()方法處被掛起,從而讓出了CPU資源。

使用方法

如下所示,創(chuàng)建一個Selector,并注冊一個Channel。

注意:要將 Channel 注冊到 Selector,首先需要將 Channel 設置為非阻塞模式,否則會拋異常。

Selector selector = Selector.open();

channel.configureBlocking(false);

SelectionKey key = channel.register(selector, SelectionKey.OP_READ);

register()方法的第二個參數(shù)名叫“interest set”,也就是你所關心的事件集合。如果你關心多個事件,用一個“按位或運算符”分隔,比如

SelectionKey.OP_READ | SelectionKey.OP_WRITE

這種寫法一點都不陌生,支持位運算的編程語言里都這么玩,用一個整型變量可以標識多種狀態(tài),它是怎么做到的呢,其實很簡單,舉個例子,首先預定義一些常量,它們的值(二進制)如下


可以發(fā)現(xiàn),它們值為1的位都是錯開的,因此對它們進行按位或運算之后得出的值就沒有二義性,可以反推出是由哪些變量運算而來。怎么判斷呢,沒錯,就是“按位與”運算。比如,現(xiàn)在有一個狀態(tài)集合變量值為 0011,我們只需要判斷 “0011 & OP_READ” 的值是 1 還是 0 就能確定集合是否包含 OP_READ 狀態(tài)。

然后,注意 register() 方法返回了一個SelectionKey的對象,這個對象包含了本次注冊的信息,我們也可以通過它修改注冊信息。從下面完整的例子中可以看到,select()之后,我們也是通過獲取一個 SelectionKey 的集合來獲取到那些狀態(tài)就緒了的通道。

一個完整實例

概念和理論的東西闡述完了(其實寫到這里,我發(fā)現(xiàn)沒寫出多少東西,好尷尬(⊙?⊙)),看一個完整的例子吧。

這個例子使用Java NIO實現(xiàn)了一個單線程的服務端,功能很簡單,監(jiān)聽客戶端連接,當連接建立后,讀取客戶端的消息,并向客戶端響應一條消息。

需要注意的是,我用字符 ‘\0′(一個值為0的字節(jié)) 來標識消息結束。

單線程Server

public class NioServer {

? ? public static void main(String[] args) throws IOException {

? ? ? ? // 創(chuàng)建一個selector

? ? ? ? Selector selector = Selector.open();

? ? ? ? // 初始化TCP連接監(jiān)聽通道

? ? ? ? ServerSocketChannel listenChannel = ServerSocketChannel.open();

? ? ? ? listenChannel.bind(new InetSocketAddress(9999));

? ? ? ? listenChannel.configureBlocking(false);

? ? ? ? // 注冊到selector(監(jiān)聽其ACCEPT事件)

? ? ? ? listenChannel.register(selector, SelectionKey.OP_ACCEPT);

? ? ? ? // 創(chuàng)建一個緩沖區(qū)

? ? ? ? ByteBuffer buffer = ByteBuffer.allocate(100);

? ? ? ? while (true) {

? ? ? ? ? ? selector.select(); //阻塞,直到有監(jiān)聽的事件發(fā)生

? ? ? ? ? ? Iterator<SelectionKey> keyIter = selector.selectedKeys().iterator();

? ? ? ? ? ? // 通過迭代器依次訪問select出來的Channel事件

? ? ? ? ? ? while (keyIter.hasNext()) {

? ? ? ? ? ? ? ? SelectionKey key = keyIter.next();

? ? ? ? ? ? ? ? if (key.isAcceptable()) { // 有連接可以接受

? ? ? ? ? ? ? ? ? ? SocketChannel channel = ((ServerSocketChannel) key.channel()).accept();

? ? ? ? ? ? ? ? ? ? channel.configureBlocking(false);

? ? ? ? ? ? ? ? ? ? channel.register(selector, SelectionKey.OP_READ);

? ? ? ? ? ? ? ? ? ? System.out.println("與【" + channel.getRemoteAddress() + "】建立了連接!");

? ? ? ? ? ? ? ? } else if (key.isReadable()) { // 有數(shù)據(jù)可以讀取

? ? ? ? ? ? ? ? ? ? buffer.clear();

? ? ? ? ? ? ? ? ? ? // 讀取到流末尾說明TCP連接已斷開,

? ? ? ? ? ? ? ? ? ? // 因此需要關閉通道或者取消監(jiān)聽READ事件

? ? ? ? ? ? ? ? ? ? // 否則會無限循環(huán)

? ? ? ? ? ? ? ? ? ? if (((SocketChannel) key.channel()).read(buffer) == -1) {

? ? ? ? ? ? ? ? ? ? ? ? key.channel().close();

? ? ? ? ? ? ? ? ? ? ? ? continue;

? ? ? ? ? ? ? ? ? ? }

? ? ? ? ? ? ? ? ? ? // 按字節(jié)遍歷數(shù)據(jù)

? ? ? ? ? ? ? ? ? ? buffer.flip();

? ? ? ? ? ? ? ? ? ? while (buffer.hasRemaining()) {

? ? ? ? ? ? ? ? ? ? ? ? byte b = buffer.get();

? ? ? ? ? ? ? ? ? ? ? ? if (b == 0) { // 客戶端消息末尾的\0

? ? ? ? ? ? ? ? ? ? ? ? ? ? System.out.println();

? ? ? ? ? ? ? ? ? ? ? ? ? ? // 響應客戶端

? ? ? ? ? ? ? ? ? ? ? ? ? ? buffer.clear();

? ? ? ? ? ? ? ? ? ? ? ? ? ? buffer.put("Hello, Client!\0".getBytes());

? ? ? ? ? ? ? ? ? ? ? ? ? ? buffer.flip();

? ? ? ? ? ? ? ? ? ? ? ? ? ? while (buffer.hasRemaining()) {

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ((SocketChannel) key.channel()).write(buffer);

? ? ? ? ? ? ? ? ? ? ? ? ? ? }

? ? ? ? ? ? ? ? ? ? ? ? } else {

? ? ? ? ? ? ? ? ? ? ? ? ? ? System.out.print((char) b);

? ? ? ? ? ? ? ? ? ? ? ? }

? ? ? ? ? ? ? ? ? ? }

? ? ? ? ? ? ? ? }

? ? ? ? ? ? ? ? // 已經(jīng)處理的事件一定要手動移除

? ? ? ? ? ? ? ? keyIter.remove();

? ? ? ? ? ? }

? ? ? ? }

? ? }

}

Client

這個客戶端純粹測試用,為了看起來不那么費勁,就用傳統(tǒng)的寫法了,代碼很簡短。

要嚴謹一點測試的話,應該并發(fā)運行大量Client,統(tǒng)計服務端的響應時間,而且連接建立后不要立刻發(fā)送數(shù)據(jù),這樣才能發(fā)揮出服務端非阻塞I/O的優(yōu)勢。

public class Client {

? ? public static void main(String[] args) throws Exception {

? ? ? ? Socket socket = new Socket("localhost", 9999);

? ? ? ? InputStream is = socket.getInputStream();

? ? ? ? OutputStream os = socket.getOutputStream();

? ? ? ? // 先向服務端發(fā)送數(shù)據(jù)

? ? ? ? os.write("Hello, Server!\0".getBytes());

? ? ? ? // 讀取服務端發(fā)來的數(shù)據(jù)

? ? ? ? int b;

? ? ? ? while ((b = is.read()) != 0) {

? ? ? ? ? ? System.out.print((char) b);

? ? ? ? }

? ? ? ? System.out.println();

? ? ? ? socket.close();

? ? }

}

NIO vs IO

學習了NIO之后我們都會有這樣一個疑問:到底什么時候該用NIO,什么時候該用傳統(tǒng)的I/O呢?

其實了解他們的特性后,答案還是比較明確的,NIO擅長1個線程管理多條連接,節(jié)約系統(tǒng)資源,但是如果每條連接要傳輸?shù)臄?shù)據(jù)量很大的話,因為是同步I/O,會導致整體的響應速度很慢;而傳統(tǒng)I/O為每一條連接創(chuàng)建一個線程,能充分利用處理器并行處理的能力,但是如果連接數(shù)量太多,內(nèi)存資源會很緊張。

總結就是:連接數(shù)多數(shù)據(jù)量小用NIO,連接數(shù)少用I/O(寫起來也簡單- -)。

Next

經(jīng)過NIO核心組件的學習,了解了非阻塞服務端實現(xiàn)的基本方法。然而,細心的你們肯定也發(fā)現(xiàn)了,上面那個完整的例子,實際上就隱藏了很多問題。比如,例子中只是簡單的將讀取到的每個字節(jié)輸出,實際環(huán)境中肯定是要讀取到完整的消息后才能進行下一步處理,由于NIO的非阻塞特性,一次可能只讀取到消息的一部分,這已經(jīng)很糟糕了,如果同一條連接會連續(xù)發(fā)來多條消息,那不僅要對消息進行拼接,還需要切割,同理,例子中給客戶端響應的時候,用了個while()循環(huán),保證數(shù)據(jù)全部write完成再做其它工作,實際應用中為了性能,肯定不會這么寫。另外,為了充分利用現(xiàn)代處理器多核心并行處理的能力,應該用一個線程組來管理這些連接的事件。 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 歡迎工作一到五年的Java工程師朋友們加入Java群:?891219277

群內(nèi)提供免費的Java架構學習資料(里面有高可用、高并發(fā)、高性能及分布式、Jvm性能調(diào)優(yōu)、Spring源碼,MyBatis,Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多個知識點的架構資料)合理利用自己每一分每一秒的時間來學習提升自己,不要再用"沒有時間“來掩飾自己思想上的懶惰!趁年輕,使勁拼,給未來的自己一個交代!

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容