分析和理解應(yīng)用的內(nèi)存使用情況是開發(fā)過程中一項不小的挑戰(zhàn)。一個微小的邏輯錯誤可能會導(dǎo)致監(jiān)聽器沒法被釋放回收,最終導(dǎo)致可怕的內(nèi)存溢出問題。甚至有時你已經(jīng)釋放了所有空對象,但是你的應(yīng)用卻多消耗了十倍甚至百倍的內(nèi)存導(dǎo)致效率很低。
幸運的是,Eclipse Memory Analyzer(MAT)能給我提供應(yīng)用的內(nèi)存使用情況的詳細信息幫助我們進行內(nèi)存分析。這款工具不僅能有效的追蹤內(nèi)存泄漏,還能周期性的審查系統(tǒng)的狀態(tài)。在本課程我將列出10條小技巧幫助你更高效的使用MAT。如果你是一名Java開發(fā)者,Eclipse Memory Analyzer Tool是你調(diào)試工具箱里必不可少的。
[ 你還在尋找更多工具嗎? 查看Eclipse Tools頁面. | 使用Yoxos.Create a free profile now讓你更方便的管理你的Eclipse workspace. ]
可以使用Install New Software對話框或者通過EclipseMarketPlace來安裝MAT。你也可以安裝使用Yoxos將其囊括到你自己的Eclipse中。
在本例中,我們使用一個非常簡單的方案,通過分配100,000監(jiān)聽器,并將它們存儲到4個列表中。在未將列表清空回收的情況下讓應(yīng)用休眠。
1.獲取內(nèi)存快照(Heap Dump)
你可以通過下面的幾種方式使用MAT:
1.配置一款應(yīng)用,當其發(fā)生內(nèi)存溢出錯誤的時候?qū)⑵鋬?nèi)存鏡像導(dǎo)出,
2.將MAT連接到一個已存在的Java進程,或者
3.手動獲取heap dump并加載到MAT中。
無論哪種情況,你都需要記住這只是內(nèi)存在某一時間節(jié)點的快照。MAT不能告訴你為什么一個對象會被創(chuàng)建,也不能顯示那些已經(jīng)被回收掉的對象。但是,如果你使用MAT結(jié)合其他的調(diào)試工具和調(diào)試技術(shù),通常會非??斓慕鉀Q內(nèi)存泄漏。
你可以通過添加下面的vm argument,配置你的應(yīng)用當其拋出OutOfMemory錯誤的時候?qū)С鰄eap dump:
-XX:+HeapDumpOnOutOfMemoryError
另外,你也可以使用jstack從正在運行的Java進程中獲取Heap dump.
jmap -dump:file=heap.bin
最后,你還可以使用MAT的Acquire Heap Dump動作選中你本地機器上已經(jīng)存在的Java進程。

當你第一次加載Heap dump的時候,MAT需要花幾分鐘時間來給Heap dump編輯索引。其結(jié)果會保留所以后續(xù)的再次加載會很快。
2.理解Histogram
當你第一次獲取heap dump的時候,MAT會給你展示應(yīng)用的內(nèi)存使用情況的overview。

中間的餅狀圖給你展示的是retained size最大的對象。也就是說,如果我們能釋放一個特殊的java.lang.Thread對象,就能保留11.2Mb的內(nèi)存,超過你當前應(yīng)用使用內(nèi)存的90%。有趣的是,java.lang.Thread并不像是問題的癥結(jié)所在。為了更好的理解到系統(tǒng)當前存在的對象,我們可以使用Histogram。

Histogram可以展示某個特定類的對象個數(shù)和每個對象使用的內(nèi)存。當然char[],String和Object[]都不太會導(dǎo)致內(nèi)存問題。為了更好的組織這個視圖,你可以通過classloader或者package來分組。這會讓你更好的專注在你自己的對象上。

Histogram 也能使用正則表達式來過濾。例如,我們可以只展示那些匹配com.example.mat.*的類。

通過這個視圖我們可以看見在系統(tǒng)中存在100,000個Listener的對象。我們也可以看見每一個對象正在占用的內(nèi)存數(shù)量。這里有兩個數(shù)值,Shallow Heap和Retained Heap。Shallow heap是一個對象消費的內(nèi)存數(shù)量。每個對象的引用需要32(或者64 bits,基于你的CPU架構(gòu))。基本數(shù)據(jù)類型例如整形和長整形需要4或者8 bytes以及其他的。其實更有用的參數(shù)是Retained Heap.
3.理解Retained Heap
Retained Heap顯示的是那些當垃圾回收時候會清理的所有對象的Shallow Heap的總和。舉例說明,如果一個ArrayList包含100,000成員項,每個成員需要16 bytes,當移除這個ArrayList的時候會釋放16x100,000+X(bytes),X是ArrayList的shallow size。(注:這是假設(shè)這些對象只被這個ArrayList引用,沒有其他地方引用)。
Retained heap是Retained set(保留集)里面所有對象大小的求和計算結(jié)果。Retained set of X指的是這樣的對象集合: X 對象被 GC 回收后,所有能被回收的對象集合。
Retained heap有兩種不同的計算方式, 使用quick approximation或者precise retained size.


通過計算Retained Heap我們可以看見com.example.mat.Controller持有了大部分的內(nèi)存,盡管他自身只占用了24 bytes。所以通過找到方法釋放Controller,我們就能毫無疑問的控制好內(nèi)存問題。
4. Dominator Tree(支配樹)
查看Dominator tree是理解Retained heap的關(guān)鍵。Dominator tree是由你系統(tǒng)中的復(fù)雜的Object graph(對象引用圖)生成的樹狀圖。Dominator tree可以讓你分別出最大內(nèi)存圖表。如果所有指向?qū)ο骙的路徑都經(jīng)過對象X,則認為對象X支配對象Y。通過查看本例的Dominator tree,我們開始明白到底是哪些內(nèi)存塊發(fā)生了泄露。

通過查看dominator tree,我們可以輕易的了解到并不是java.lang.Thread導(dǎo)致的問題,反而是Controller和Allocator持有內(nèi)存。Controller保留了全部100,000個Listeners對象。我們可以通過釋放這些對象,或釋放他們所包含的lists來改善內(nèi)存情況。下面列出幾條dominator tree的屬性:
● 對象X的子樹中的所有對象(本例中的com.example.mat.Controller)被稱作對象A的Retained set(保留集)。
●?如果對象X是對象Y的直接支配者(Controller就是Allocator的直接支配者),那么X的直接支配者(本例中的java.lang.Thread)也只配Y對象。
●?支配樹中節(jié)點的父子關(guān)系跟對象引用圖中的不直接對應(yīng)。
通過Histogram你也可以選擇某個類,然后找到所有支配該類的實例的對象。

5. 探索Paths to the GC Roots
有時候有一些你確信已經(jīng)處理了的大的對象集合。通過查找支配者可能會有用,但是通常我們希望能得到這個對象節(jié)點到GC根節(jié)點的路徑。例如,如果我現(xiàn)在釋放了Controller對象,會理所當然的以為已經(jīng)解決內(nèi)存問題,不幸的是這并沒有用。如果現(xiàn)在選中一個Listener的對象,然后查看他到GC根節(jié)點的路徑。我們可以看見Controller類(注:是類,而不是對象)引用到了一個Listener隊列。這是因為這些隊列當中有一個被聲明成靜態(tài)隊列。

你也可以查看到這個對象所有被引用到的地方和這個對象持有的引用。當你想要在對象引用圖中查看某個特定對象的所有引用關(guān)系的時候,這是非常有用的。
6. Inspector
Inspector展示的是當前選中類或?qū)ο蟮脑敿毿畔?。在本例中我們可以看見選中的ArrayList包含100,000元素和一個指向地址為0x7f354ea68的對象數(shù)組的引用。

Inspector和Snapshot linked會給你提供一些選中項的重要統(tǒng)計數(shù)據(jù)。
7. Common Memory Anti-Patterns
MAT使用反模式提供了公用存儲器的詳細報告。.能用其來搞明白哪里的發(fā)生了內(nèi)存泄漏,或通過它找到一些簡單的清理手段來優(yōu)化性能。

Heap Dump Overview展示了Heap Dump的詳細信息和一些常用工具的鏈接(比如Histogram)。信息主要有系統(tǒng)中正在運行的線程、對象的總數(shù)、堆的大小等。

Leak Suspects報告顯示了MAT發(fā)現(xiàn)的可能導(dǎo)致內(nèi)存泄漏的地方,和用于分析這些發(fā)現(xiàn)的工具和圖表的鏈接。

另一個使用到反模式的情況是,當系統(tǒng)有大量的集合,但是每個集合只有少量元素的時候。例如,如果每一個監(jiān)聽器都對應(yīng)一組通知者(需要某些事件來觸發(fā)的列表項),但是這些通知者只是偶爾觸發(fā),我們就應(yīng)該制止這種浪費內(nèi)存的行為。Java Collections工具可以幫你處理這類問題。



通過Collection -> Fill Ratio Report我們可以看見100,000個隊列是空的。如果我們能夠用一種便捷的方式來分配這些內(nèi)存(當我們需要的時候),我們可以節(jié)約大概8Mb內(nèi)存。
我們也可以通過分析集合來查看array fill ratios、collection size statistics和map collision ratios。
8. Java工具
MAT量身定制了許多內(nèi)置的工具用來生成Java運行環(huán)境細節(jié)的相關(guān)報表。For example, thereport will show details about all the treads in the system.例如,Threads and Stack可以展示系統(tǒng)中所有線程的細節(jié)。你可以看見每個棧中當前存在的本地變量

你可以通過特定的模板來檢索所有匹配的字符串:

甚至可以檢索那些包含了浪費內(nèi)存的字符數(shù)組的字符串(這種情況經(jīng)常是因為反復(fù)是用substring方法導(dǎo)致的)。

9. Object Query Language
綜合以上所說,Eclipse Memory Analyzer提供了很多用來追蹤內(nèi)存泄漏和內(nèi)存過量使用的工具。大多數(shù)的內(nèi)存問題可以通過上面的工具定位到,但是Heap Dump包含了更多的信息。Object Query Language? (OQL)讓你可以基于Heap Dump創(chuàng)建你自己的報表。
OQL是一種類似于SQL的語言。只需要將類當成表,對象看做行,字段看做列。例如,想要查詢com.example.mat.Listener的所有對象,只需要寫:
select * from com.example.mat.Listener

表的列可以通過不同的字段來設(shè)置,例如:
SELECT toString(l.message), l.message.count FROM com.example.mat.Listener l

And finally, the WHERE clause can be used to specify particular criteria, such as all the Strings in the system which are not of the format “message:.*”最后WHRER子句可以用來篩選特定的條件,例如可以通過下列語句找出系統(tǒng)中所有不匹配"message:.*"的字符串:
SELECT toString(s), s.count FROM java.lang.String s WHERE (toString(s) NOT LIKE "message.*")

10.導(dǎo)出結(jié)果
MAT是一款用來導(dǎo)出應(yīng)用內(nèi)存狀態(tài)相關(guān)報告的利器。Heap Dump包含了有關(guān)你系統(tǒng)的非常有價值的信息。并且MAT提供了相關(guān)的工具來接入這些數(shù)據(jù)。然而,就像很多開源工具一樣,如果你對于某些失誤不太敏感,或者你運氣不好。使用MAT可以將結(jié)果導(dǎo)出成包括HTML,CSV甚至純文本格式。你可以使用電子表格程序(或者你自己的工具)來繼續(xù)進行分析。

MAT是一款強大的工具,一款Java開發(fā)者應(yīng)該熟知的工具。追蹤內(nèi)存泄漏和其他的一些內(nèi)存問題對開發(fā)者來說是常見的難點,可喜的是有MAT可以迅速的幫你找到與你內(nèi)存問題的源頭所在。
英文原文:10 Tips for using the Eclipse Memory Analyzer ? EclipseSource Blog
參考:Android 內(nèi)存剖析 - 發(fā)現(xiàn)潛在問題 - ImportNew

