堆外內(nèi)存
堆外內(nèi)存是相對于堆內(nèi)內(nèi)存的一個概念。堆內(nèi)內(nèi)存是由JVM所管控的Java進(jìn)程內(nèi)存,我們平時在Java中創(chuàng)建的對象都處于堆內(nèi)內(nèi)存中,并且它們遵循JVM的內(nèi)存管理機制,JVM會采用垃圾回收機制統(tǒng)一管理它們的內(nèi)存。那么堆外內(nèi)存就是存在于JVM管控之外的一塊內(nèi)存區(qū)域,因此它是不受JVM的管控。
在講解DirectByteBuffer之前,需要先簡單了解兩個知識點
java引用類型,因為DirectByteBuffer是通過虛引用(Phantom Reference)來實現(xiàn)堆外內(nèi)存的釋放的。
PhantomReference 是所有“弱引用”中最弱的引用類型。不同于軟引用和弱引用,虛引用無法通過 get() 方法來取得目標(biāo)對象的強引用從而使用目標(biāo)對象,觀察源碼可以發(fā)現(xiàn) get() 被重寫為永遠(yuǎn)返回 null。
那虛引用到底有什么作用?其實虛引用主要被用來 跟蹤對象被垃圾回收的狀態(tài),通過查看引用隊列中是否包含對象所對應(yīng)的虛引用來判斷它是否 即將被垃圾回收,從而采取行動。它并不被期待用來取得目標(biāo)對象的引用,而目標(biāo)對象被回收前,它的引用會被放入一個 ReferenceQueue 對象中,從而達(dá)到跟蹤對象垃圾回收的作用。
關(guān)于java引用類型的實現(xiàn)和原理可以閱讀之前的文章Reference 、ReferenceQueue 詳解 和Java 引用類型簡述
關(guān)于linux的內(nèi)核態(tài)和用戶態(tài)

- 內(nèi)核態(tài):控制計算機的硬件資源,并提供上層應(yīng)用程序運行的環(huán)境。比如socket I/0操作或者文件的讀寫操作等
- 用戶態(tài):上層應(yīng)用程序的活動空間,應(yīng)用程序的執(zhí)行必須依托于內(nèi)核提供的資源。
- 系統(tǒng)調(diào)用:為了使上層應(yīng)用能夠訪問到這些資源,內(nèi)核為上層應(yīng)用提供訪問的接口。

因此我們可以得知當(dāng)我們通過JNI調(diào)用的native方法實際上就是從用戶態(tài)切換到了內(nèi)核態(tài)的一種方式。并且通過該系統(tǒng)調(diào)用使用操作系統(tǒng)所提供的功能。
Q:為什么需要用戶進(jìn)程(位于用戶態(tài)中)要通過系統(tǒng)調(diào)用(Java中即使JNI)來調(diào)用內(nèi)核態(tài)中的資源,或者說調(diào)用操作系統(tǒng)的服務(wù)了?
A:intel cpu提供Ring0-Ring3四種級別的運行模式,Ring0級別最高,Ring3最低。Linux使用了Ring3級別運行用戶態(tài),Ring0作為內(nèi)核態(tài)。Ring3狀態(tài)不能訪問Ring0的地址空間,包括代碼和數(shù)據(jù)。因此用戶態(tài)是沒有權(quán)限去操作內(nèi)核態(tài)的資源的,它只能通過系統(tǒng)調(diào)用外完成用戶態(tài)到內(nèi)核態(tài)的切換,然后在完成相關(guān)操作后再有內(nèi)核態(tài)切換回用戶態(tài)。
DirectByteBuffer ———— 直接緩沖
DirectByteBuffer是Java用于實現(xiàn)堆外內(nèi)存的一個重要類,我們可以通過該類實現(xiàn)堆外內(nèi)存的創(chuàng)建、使用和銷毀。

DirectByteBuffer該類本身還是位于Java內(nèi)存模型的堆中。堆內(nèi)內(nèi)存是JVM可以直接管控、操縱。
而DirectByteBuffer中的unsafe.allocateMemory(size);是個一個native方法,這個方法分配的是堆外內(nèi)存,通過C的malloc來進(jìn)行分配的。分配的內(nèi)存是系統(tǒng)本地的內(nèi)存,并不在Java的內(nèi)存中,也不屬于JVM管控范圍,所以在DirectByteBuffer一定會存在某種方式來操縱堆外內(nèi)存。
在DirectByteBuffer的父類Buffer中有個address屬性:
// Used only by direct buffers
// NOTE: hoisted here for speed in JNI GetDirectBufferAddress
long address;
address只會被直接緩存給使用到。之所以將address屬性升級放在Buffer中,是為了在JNI調(diào)用GetDirectBufferAddress時提升它調(diào)用的速率。
address表示分配的堆外內(nèi)存的地址。

unsafe.allocateMemory(size);分配完堆外內(nèi)存后就會返回分配的堆外內(nèi)存基地址,并將這個地址賦值給了address屬性。這樣我們后面通過JNI對這個堆外內(nèi)存操作時都是通過這個address來實現(xiàn)的了。
在前面我們說過,在linux中內(nèi)核態(tài)的權(quán)限是最高的,那么在內(nèi)核態(tài)的場景下,操作系統(tǒng)是可以訪問任何一個內(nèi)存區(qū)域的,所以操作系統(tǒng)是可以訪問到Java堆的這個內(nèi)存區(qū)域的。
Q:那為什么操作系統(tǒng)不直接訪問Java堆內(nèi)的內(nèi)存區(qū)域了?
A:這是因為JNI方法訪問的內(nèi)存區(qū)域是一個已經(jīng)確定了的內(nèi)存區(qū)域地質(zhì),那么該內(nèi)存地址指向的是Java堆內(nèi)內(nèi)存的話,那么如果在操作系統(tǒng)正在訪問這個內(nèi)存地址的時候,Java在這個時候進(jìn)行了GC操作,而GC操作會涉及到數(shù)據(jù)的移動操作[GC經(jīng)常會進(jìn)行先標(biāo)志在壓縮的操作。即,將可回收的空間做標(biāo)志,然后清空標(biāo)志位置的內(nèi)存,然后會進(jìn)行一個壓縮,壓縮就會涉及到對象的移動,移動的目的是為了騰出一塊更加完整、連續(xù)的內(nèi)存空間,以容納更大的新對象],數(shù)據(jù)的移動會使JNI調(diào)用的數(shù)據(jù)錯亂。所以JNI調(diào)用的內(nèi)存是不能進(jìn)行GC操作的。
Q:如上面所說,JNI調(diào)用的內(nèi)存是不能進(jìn)行GC操作的,那該如何解決了?
A:①堆內(nèi)內(nèi)存與堆外內(nèi)存之間數(shù)據(jù)拷貝的方式(并且在將堆內(nèi)內(nèi)存拷貝到堆外內(nèi)存的過程JVM會保證不會進(jìn)行GC操作):比如我們要完成一個從文件中讀數(shù)據(jù)到堆內(nèi)內(nèi)存的操作,即FileChannelImpl.read(HeapByteBuffer)。這里實際上File I/O會將數(shù)據(jù)讀到堆外內(nèi)存中,然后堆外內(nèi)存再講數(shù)據(jù)拷貝到堆內(nèi)內(nèi)存,這樣我們就讀到了文件中的內(nèi)存。

static int read(FileDescriptor var0, ByteBuffer var1, long var2, NativeDispatcher var4) throws IOException {
if (var1.isReadOnly()) {
throw new IllegalArgumentException("Read-only buffer");
} else if (var1 instanceof DirectBuffer) {
return readIntoNativeBuffer(var0, var1, var2, var4);
} else {
// 分配臨時的堆外內(nèi)存
ByteBuffer var5 = Util.getTemporaryDirectBuffer(var1.remaining());
int var7;
try {
// File I/O 操作會將數(shù)據(jù)讀入到堆外內(nèi)存中
int var6 = readIntoNativeBuffer(var0, var5, var2, var4);
var5.flip();
if (var6 > 0) {
// 將堆外內(nèi)存的數(shù)據(jù)拷貝到堆外內(nèi)存中
var1.put(var5);
}
var7 = var6;
} finally {
// 里面會調(diào)用DirectBuffer.cleaner().clean()來釋放臨時的堆外內(nèi)存
Util.offerFirstTemporaryDirectBuffer(var5);
}
return var7;
}
}
而寫操作則反之,我們會將堆內(nèi)內(nèi)存的數(shù)據(jù)線寫到對堆外內(nèi)存中,然后操作系統(tǒng)會將堆外內(nèi)存的數(shù)據(jù)寫入到文件中。
② 直接使用堆外內(nèi)存,如DirectByteBuffer:這種方式是直接在堆外分配一個內(nèi)存(即,native memory)來存儲數(shù)據(jù),程序通過JNI直接將數(shù)據(jù)讀/寫到堆外內(nèi)存中。因為數(shù)據(jù)直接寫入到了堆外內(nèi)存中,所以這種方式就不會再在JVM管控的堆內(nèi)再分配內(nèi)存來存儲數(shù)據(jù)了,也就不存在堆內(nèi)內(nèi)存和堆外內(nèi)存數(shù)據(jù)拷貝的操作了。這樣在進(jìn)行I/O操作時,只需要將這個堆外內(nèi)存地址傳給JNI的I/O的函數(shù)就好了。
DirectByteBuffer堆外內(nèi)存的創(chuàng)建和回收的源碼解讀
堆外內(nèi)存分配
DirectByteBuffer(int cap) { // package-private
super(-1, 0, cap, cap);
boolean pa = VM.isDirectMemoryPageAligned();
int ps = Bits.pageSize();
long size = Math.max(1L, (long)cap + (pa ? ps : 0));
// 保留總分配內(nèi)存(按頁分配)的大小和實際內(nèi)存的大小
Bits.reserveMemory(size, cap);
long base = 0;
try {
// 通過unsafe.allocateMemory分配堆外內(nèi)存,并返回堆外內(nèi)存的基地址
base = unsafe.allocateMemory(size);
} catch (OutOfMemoryError x) {
Bits.unreserveMemory(size, cap);
throw x;
}
unsafe.setMemory(base, size, (byte) 0);
if (pa && (base % ps != 0)) {
// Round up to page boundary
address = base + ps - (base & (ps - 1));
} else {
address = base;
}
// 構(gòu)建Cleaner對象用于跟蹤DirectByteBuffer對象的垃圾回收,以實現(xiàn)當(dāng)DirectByteBuffer被垃圾回收時,堆外內(nèi)存也會被釋放
cleaner = Cleaner.create(this, new Deallocator(base, size, cap));
att = null;
}
Bits.reserveMemory(size, cap) 方法
static void reserveMemory(long size, int cap) {
if (!memoryLimitSet && VM.isBooted()) {
maxMemory = VM.maxDirectMemory();
memoryLimitSet = true;
}
// optimist!
if (tryReserveMemory(size, cap)) {
return;
}
final JavaLangRefAccess jlra = SharedSecrets.getJavaLangRefAccess();
// retry while helping enqueue pending Reference objects
// which includes executing pending Cleaner(s) which includes
// Cleaner(s) that free direct buffer memory
while (jlra.tryHandlePendingReference()) {
if (tryReserveMemory(size, cap)) {
return;
}
}
// trigger VM's Reference processing
System.gc();
// a retry loop with exponential back-off delays
// (this gives VM some time to do it's job)
boolean interrupted = false;
try {
long sleepTime = 1;
int sleeps = 0;
while (true) {
if (tryReserveMemory(size, cap)) {
return;
}
if (sleeps >= MAX_SLEEPS) {
break;
}
if (!jlra.tryHandlePendingReference()) {
try {
Thread.sleep(sleepTime);
sleepTime <<= 1;
sleeps++;
} catch (InterruptedException e) {
interrupted = true;
}
}
}
// no luck
throw new OutOfMemoryError("Direct buffer memory");
} finally {
if (interrupted) {
// don't swallow interrupts
Thread.currentThread().interrupt();
}
}
}
該方法用于在系統(tǒng)中保存總分配內(nèi)存(按頁分配)的大小和實際內(nèi)存的大小。
其中,如果系統(tǒng)中內(nèi)存( 即,堆外內(nèi)存 )不夠的話:
final JavaLangRefAccess jlra = SharedSecrets.getJavaLangRefAccess();
// retry while helping enqueue pending Reference objects
// which includes executing pending Cleaner(s) which includes
// Cleaner(s) that free direct buffer memory
while (jlra.tryHandlePendingReference()) {
if (tryReserveMemory(size, cap)) {
return;
}
}
jlra.tryHandlePendingReference()會觸發(fā)一次非堵塞的Reference#tryHandlePending(false)。該方法會將已經(jīng)被JVM垃圾回收的DirectBuffer對象的堆外內(nèi)存釋放。
因為在Reference的靜態(tài)代碼塊中定義了:
SharedSecrets.setJavaLangRefAccess(new JavaLangRefAccess() {
@Override
public boolean tryHandlePendingReference() {
return tryHandlePending(false);
}
});
如果在進(jìn)行一次堆外內(nèi)存資源回收后,還不夠進(jìn)行本次堆外內(nèi)存分配的話,則
// trigger VM's Reference processing
System.gc();
System.gc()會觸發(fā)一個full gc,當(dāng)然前提是你沒有顯示的設(shè)置-XX:+DisableExplicitGC來禁用顯式GC。并且你需要知道,調(diào)用System.gc()并不能夠保證full gc馬上就能被執(zhí)行。
所以在后面打代碼中,會進(jìn)行最多9次嘗試,看是否有足夠的可用堆外內(nèi)存來分配堆外內(nèi)存。并且每次嘗試之前,都對延遲等待時間,已給JVM足夠的時間去完成full gc操作。如果9次嘗試后依舊沒有足夠的可用堆外內(nèi)存來分配本次堆外內(nèi)存,則拋出OutOfMemoryError("Direct buffer memory”)異常。

注意,這里之所以用使用full gc的很重要的一個原因是:System.gc()會對新生代的老生代都會進(jìn)行內(nèi)存回收,這樣會比較徹底地回收DirectByteBuffer對象以及他們關(guān)聯(lián)的堆外內(nèi)存.
DirectByteBuffer對象本身其實是很小的,但是它后面可能關(guān)聯(lián)了一個非常大的堆外內(nèi)存,因此我們通常稱之為冰山對象.
我們做ygc的時候會將新生代里的不可達(dá)的DirectByteBuffer對象及其堆外內(nèi)存回收了,但是無法對old里的DirectByteBuffer對象及其堆外內(nèi)存進(jìn)行回收,這也是我們通常碰到的最大的問題。( 并且堆外內(nèi)存多用于生命期中等或較長的對象 )
如果有大量的DirectByteBuffer對象移到了old,但是又一直沒有做cms gc或者full gc,而只進(jìn)行ygc,那么我們的物理內(nèi)存可能被慢慢耗光,但是我們還不知道發(fā)生了什么,因為heap明明剩余的內(nèi)存還很多(前提是我們禁用了System.gc – JVM參數(shù)DisableExplicitGC)。
總的來說,Bits.reserveMemory(size, cap)方法在可用堆外內(nèi)存不足以分配給當(dāng)前要創(chuàng)建的堆外內(nèi)存大小時,會實現(xiàn)以下的步驟來嘗試完成本次堆外內(nèi)存的創(chuàng)建:
① 觸發(fā)一次非堵塞的Reference#tryHandlePending(false)。該方法會將已經(jīng)被JVM垃圾回收的DirectBuffer對象的堆外內(nèi)存釋放。
② 如果進(jìn)行一次堆外內(nèi)存資源回收后,還不夠進(jìn)行本次堆外內(nèi)存分配的話,則進(jìn)行 System.gc()。System.gc()會觸發(fā)一個full gc,但你需要知道,調(diào)用System.gc()并不能夠保證full gc馬上就能被執(zhí)行。所以在后面打代碼中,會進(jìn)行最多9次嘗試,看是否有足夠的可用堆外內(nèi)存來分配堆外內(nèi)存。并且每次嘗試之前,都對延遲等待時間,已給JVM足夠的時間去完成full gc操作。
注意,如果你設(shè)置了-XX:+DisableExplicitGC,將會禁用顯示GC,這會使System.gc()調(diào)用無效。
③ 如果9次嘗試后依舊沒有足夠的可用堆外內(nèi)存來分配本次堆外內(nèi)存,則拋出OutOfMemoryError("Direct buffer memory”)異常。
那么可用堆外內(nèi)存到底是多少了?,即默認(rèn)堆外存內(nèi)存有多大:
① 如果我們沒有通過-XX:MaxDirectMemorySize來指定最大的堆外內(nèi)存。則??
② 如果我們沒通過-Dsun.nio.MaxDirectMemorySize指定了這個屬性,且它不等于-1。則??
③ 那么最大堆外內(nèi)存的值來自于directMemory = Runtime.getRuntime().maxMemory(),這是一個native方法
JNIEXPORT jlong JNICALL
Java_java_lang_Runtime_maxMemory(JNIEnv *env, jobject this)
{
return JVM_MaxMemory();
}
JVM_ENTRY_NO_ENV(jlong, JVM_MaxMemory(void))
JVMWrapper("JVM_MaxMemory");
size_t n = Universe::heap()->max_capacity();
return convert_size_t_to_jlong(n);
JVM_END
其中在我們使用CMS GC的情況下也就是我們設(shè)置的-Xmx的值里除去一個survivor的大小就是默認(rèn)的堆外內(nèi)存的大小了。
堆外內(nèi)存回收
Cleaner是PhantomReference的子類,并通過自身的next和prev字段維護(hù)的一個雙向鏈表。PhantomReference的作用在于跟蹤垃圾回收過程,并不會對對象的垃圾回收過程造成任何的影響。
所以cleaner = Cleaner.create(this, new Deallocator(base, size, cap)); 用于對當(dāng)前構(gòu)造的DirectByteBuffer對象的垃圾回收過程進(jìn)行跟蹤。
當(dāng)DirectByteBuffer對象從pending狀態(tài) ——> enqueue狀態(tài)時,會觸發(fā)Cleaner的clean(),而Cleaner的clean()的方法會實現(xiàn)通過unsafe對堆外內(nèi)存的釋放。


??雖然Cleaner不會調(diào)用到Reference.clear(),但Cleaner的clean()方法調(diào)用了remove(this),即將當(dāng)前Cleaner從Cleaner鏈表中移除,這樣當(dāng)clean()執(zhí)行完后,Cleaner就是一個無引用指向的對象了,也就是可被GC回收的對象。
thunk方法:

通過配置參數(shù)的方式來回收堆外內(nèi)存
同時我們可以通過-XX:MaxDirectMemorySize來指定最大的堆外內(nèi)存大小,當(dāng)使用達(dá)到了閾值的時候?qū)⒄{(diào)用System.gc()來做一次full gc,以此來回收掉沒有被使用的堆外內(nèi)存。
堆外內(nèi)存那些事
使用堆外內(nèi)存的原因
- 對垃圾回收停頓的改善
因為full gc 意味著徹底回收,徹底回收時,垃圾收集器會對所有分配的堆內(nèi)內(nèi)存進(jìn)行完整的掃描,這意味著一個重要的事實——這樣一次垃圾收集對Java應(yīng)用造成的影響,跟堆的大小是成正比的。過大的堆會影響Java應(yīng)用的性能。如果使用堆外內(nèi)存的話,堆外內(nèi)存是直接受操作系統(tǒng)管理( 而不是虛擬機 )。這樣做的結(jié)果就是能保持一個較小的堆內(nèi)內(nèi)存,以減少垃圾收集對應(yīng)用的影響。 - 在某些場景下可以提升程序I/O操縱的性能。少去了將數(shù)據(jù)從堆內(nèi)內(nèi)存拷貝到堆外內(nèi)存的步驟。
什么情況下使用堆外內(nèi)存
- 堆外內(nèi)存適用于生命周期中等或較長的對象。( 如果是生命周期較短的對象,在YGC的時候就被回收了,就不存在大內(nèi)存且生命周期較長的對象在FGC對應(yīng)用造成的性能影響 )。
- 直接的文件拷貝操作,或者I/O操作。直接使用堆外內(nèi)存就能少去內(nèi)存從用戶內(nèi)存拷貝到系統(tǒng)內(nèi)存的操作,因為I/O操作是系統(tǒng)內(nèi)核內(nèi)存和設(shè)備間的通信,而不是通過程序直接和外設(shè)通信的。
- 同時,還可以使用 池+堆外內(nèi)存 的組合方式,來對生命周期較短,但涉及到I/O操作的對象進(jìn)行堆外內(nèi)存的再使用。( Netty中就使用了該方式 )
堆外內(nèi)存 VS 內(nèi)存池
- 內(nèi)存池:主要用于兩類對象:①生命周期較短,且結(jié)構(gòu)簡單的對象,在內(nèi)存池中重復(fù)利用這些對象能增加CPU緩存的命中率,從而提高性能;②加載含有大量重復(fù)對象的大片數(shù)據(jù),此時使用內(nèi)存池能減少垃圾回收的時間。
- 堆外內(nèi)存:它和內(nèi)存池一樣,也能縮短垃圾回收時間,但是它適用的對象和內(nèi)存池完全相反。內(nèi)存池往往適用于生命期較短的可變對象,而生命期中等或較長的對象,正是堆外內(nèi)存要解決的。
堆外內(nèi)存的特點
- 對于大內(nèi)存有良好的伸縮性
- 對垃圾回收停頓的改善可以明顯感覺到
- 在進(jìn)程間可以共享,減少虛擬機間的復(fù)制
堆外內(nèi)存的一些問題
- 堆外內(nèi)存回收問題,以及堆外內(nèi)存的泄漏問題。這個在上面的源碼解析已經(jīng)提到了
- 堆外內(nèi)存的數(shù)據(jù)結(jié)構(gòu)問題:堆外內(nèi)存最大的問題就是你的數(shù)據(jù)結(jié)構(gòu)變得不那么直觀,如果數(shù)據(jù)結(jié)構(gòu)比較復(fù)雜,就要對它進(jìn)行串行化(serialization),而串行化本身也會影響性能。另一個問題是由于你可以使用更大的內(nèi)存,你可能開始擔(dān)心虛擬內(nèi)存(即硬盤)的速度對你的影響了。
參考
http://lovestblog.cn/blog/2015/05/12/direct-buffer/
http://www.infoq.com/cn/news/2014/12/external-memory-heap-memory
http://www.itdecent.cn/p/85e931636f27
圣思園《并發(fā)與Netty》課程