Java常量池

jvm虛擬內存分布:

jvm虛擬內存分布

程序計數器是jvm執(zhí)行程序的流水線,存放一些跳轉指令。

本地方法棧是jvm調用操作系統(tǒng)方法所使用的棧。

虛擬機棧是jvm執(zhí)行java代碼所使用的棧。

方法區(qū)存放了一些常量、靜態(tài)變量、類信息等,可以理解成class文件在內存中的存放位置。

虛擬機堆是jvm執(zhí)行java代碼所使用的堆。

常量池

Java中的常量池,實際上分為兩種形態(tài):靜態(tài)常量池運行時常量池。

  • 靜態(tài)常量池

所謂靜態(tài)常量池,即.class文件中的常量池,class文件中的常量池不僅僅包含字符串(數字)字面量,還包含類、方法的信息,占用class文件絕大部分空間。這種常量池主要用于存放兩大類常量:字面量(Literal)和符號引用量*(Symbolic References),字面量相當于Java語言層面常量的概念,如文本字符串,聲明為final的常量值等,符號引用則屬于編譯原理方面的概念,包括了如下三種類型的常量:

類和接口的全限定名
字段名稱和描述符
方法名稱和描述符

  • 運行時常量池

運行時常量池,則是jvm虛擬機在完成類裝載操作后,將class文件中的常量池載入到內存中,并保存在方法區(qū)中,我們常說的常量池,就是指方法區(qū)中的運行時常量池。

運行時常量池相對于CLass文件常量池的另外一個重要特征是具備動態(tài)性,Java語言并不要求常量一定只有編譯期才能產生,也就是并非預置入CLass文件中常量池的內容才能進入方法區(qū)運行時常量池,運行期間也可能將新的常量放入池中,這種特性被開發(fā)人員利用比較多的就是String類的intern()方法。

String的intern()方法會查找在常量池中是否存在一份equal相等的字符串,如果有則返回該字符串的引用,如果沒有則添加自己的字符串進入常量池。

常量池的好處

常量池是為了避免頻繁的創(chuàng)建和銷毀對象而影響系統(tǒng)性能,其實現(xiàn)了對象的共享。
例如字符串常量池,在編譯階段就把所有的字符串文字放到一個常量池中。
(1)節(jié)省內存空間:常量池中所有相同的字符串常量被合并,只占用一個空間。
(2)節(jié)省運行時間:比較字符串時,==比equals()快。對于兩個引用變量,只用==判斷引用是否相等,也就可以判斷實際值是否相等。

栗子

  • 栗子1
String s1 = "Hello";
String s2 = "Hello";
String s3 = "Hel" + "lo";
String s4 = "Hel" + new String("lo");
String s5 = new String("Hello");
String s6 = s5.intern();
String s7 = "H";
String s8 = "ello";
String s9 = s7 + s8;
         
System.out.println(s1 == s2);  // true
System.out.println(s1 == s3);  // true
System.out.println(s1 == s4);  // false
System.out.println(s1 == s9);  // false
System.out.println(s4 == s5);  // false
System.out.println(s1 == s6);  // true

首先說明一點,在java 中,直接使用==操作符,比較的是兩個字符串的引用地址,并不是比較內容,比較內容請用String.equals()。

s1 == s2這個非常好理解,s1、s2在賦值時,均使用的字符串字面量,說白話點,就是直接把字符串寫死,在編譯期間,這種字面量會直接放入class文件的常量池中,從而實現(xiàn)復用,載入運行時常量池后,s1、s2指向的是同一個內存地址,所以相等。

s1 == s3這個地方有個坑,s3雖然是動態(tài)拼接出來的字符串,但是所有參與拼接的部分都是已知的字面量,在編譯期間,這種拼接會被優(yōu)化,編譯器直接幫你拼好,因此String s3 = "Hel" + "lo";在class文件中被優(yōu)化成String s3 = "Hello",所以s1 == s3成立。只有使用引號包含文本的方式創(chuàng)建的String對象之間使用“+”連接產生的新對象才會被加入字符串池中。

s1 == s4當然不相等,s4雖然也是拼接出來的,但new String("lo")這部分不是已知字面量,是一個不可預料的部分,編譯器不會優(yōu)化,必須等到運行時才可以確定結果,結合字符串不變定理,鬼知道s4被分配到哪去了,所以地址肯定不同。對于所有包含new方式新建對象(包括null)的“+”連接表達式,它所產生的新對象都不會被加入字符串池中。
配上一張簡圖理清思路:

java字符串不變

s1 == s9也不相等,道理差不多,雖然s7、s8在賦值的時候使用的字符串字面量,但是拼接成s9的時候,s7、s8作為兩個變量,都是不可預料的,編譯器畢竟是編譯器,不可能當解釋器用,不能在編譯期被確定,所以不做優(yōu)化,只能等到運行時,在堆中創(chuàng)建s7、s8拼接成的新字符串,在堆中地址不確定,不可能與方法區(qū)常量池中的s1地址相同。


jvm常量池,堆,棧內存分布

s4 == s5已經不用解釋了,絕對不相等,二者都在堆中,但地址不同。

s1 == s6這兩個相等完全歸功于intern方法,s5在堆中,內容為Hello ,intern方法會嘗試將Hello字符串添加到常量池中,并返回其在常量池中的地址,因為常量池中已經有了Hello字符串,所以intern方法直接返回地址;而s1在編譯期就已經指向常量池了,因此s1和s6指向同一地址,相等。

  • 栗子2
public static final String A = "ab"; // 常量A
public static final String B = "cd"; // 常量B
public static void main(String[] args) {
     String s = A + B;  // 將兩個常量用+連接對s進行初始化 
     String t = "abcd";   
    if (s == t) {   
         System.out.println("s等于t,它們是同一個對象");   
     } else {   
         System.out.println("s不等于t,它們不是同一個對象");   
     }   
 } 

s等于t,它們是同一個對象

A和B都是常量,值是固定的,因此s的值也是固定的,它在類被編譯時就已經確定了。也就是說:String s=A+B; 等同于:String s="ab"+"cd";

  • 栗子3
public static final String A; // 常量A
public static final String B;    // 常量B
static {   
     A = "ab";   
     B = "cd";   
 }   
 public static void main(String[] args) {   
    // 將兩個常量用+連接對s進行初始化   
     String s = A + B;   
     String t = "abcd";   
    if (s == t) {   
         System.out.println("s等于t,它們是同一個對象");   
     } else {   
         System.out.println("s不等于t,它們不是同一個對象");   
     }   
 } 

s不等于t,它們不是同一個對象

A和B雖然被定義為常量,但是它們都沒有馬上被賦值。在運算出s的值之前,他們何時被賦值,以及被賦予什么樣的值,都是個變數。因此A和B在被賦值之前,性質類似于一個變量。那么s就不能在編譯期被確定,而只能在運行時被創(chuàng)建了。

至此,我們可以得出三個非常重要的結論:

  • 必須要關注編譯期的行為,才能更好的理解常量池。

  • 運行時常量池中的常量,基本來源于各個class文件中的常量池。

  • 程序運行時,除非手動向常量池中添加常量(比如調用intern方法),否則jvm不會自動添加常量到常量池。

以上所講僅涉及字符串常量池,實際上還有整型常量池、浮點型常量池(java中基本類型的包裝類的大部分都實現(xiàn)了常量池技術,即Byte,Short,Integer,Long,Character,Boolean;兩種浮點數類型的包裝類Float,Double并沒有實現(xiàn)常量池技術) 等等,但都大同小異,只不過數值類型的常量池不可以手動添加常量,程序啟動時常量池中的常量就已經確定了,比如整型常量池中的常量范圍:-128~127,(Byte,Short,Integer,Long,Character,Boolean)這5種包裝類默認創(chuàng)建了數值[-128,127]的相應類型的緩存數據,但是超出此范圍仍然會去創(chuàng)建新的對象。

例如在自動裝箱時,把int變成Integer的時候,是有規(guī)則的,當你的int的值在-128-IntegerCache.high(127) 時,返回的不是一個新new出來的Integer對象,而是一個已經緩存在堆 中的Integer對象,(我們可以這樣理解,系統(tǒng)已經把-128到127之 間的Integer緩存到一個Integer數組中去了,如果你要把一個int變成一個Integer對象,首先去緩存中找,找到的話直接返回引用給你就 行了,不必再新new一個),如果不在-128-IntegerCache.high(127) 時會返回一個新new出來的Integer對象。

深入字節(jié)碼

前文提到過,class文件中存在一個靜態(tài)常量池,這個常量池是由編譯器生成的,用來存儲java源文件中的字面量(本文僅僅關注字面量),假設我們有如下java代碼:

public class HelloWorld{
  public static void main(String args[]){
    System.out.println("hello world");
  }
}

為了方便起見,就這么簡單,沒錯!將代碼編譯成class文件后,用winhex打開二進制格式的class文件。如圖:

class文件

class文件的結構

(1)魔數
開頭的4個字節(jié)是class文件魔數,用來標識這是一個class文件,說白話點就是文件頭,確定一個文件是否能被JVM接受,既:CA FE BA BE。

(2)版本號
第5和第6個字節(jié)是次版本號,第7個和第8 個是主版本號。這里的第7和第8位是0034,即:0x0034。0x0034轉為10進制是52。Java的版本是從45開始的然而從1.0 到1.1 是45.0到45.3, 之后就是1.2 對應46, 1.3 對應47 … 1.6 對應50,我這里是1.6.0_24對應的是52,就是0x0034;

(3)常量池的入口
由于常量池中的常量的數量不是固定的,所以常量池的入口需要放置一項u2類型的數據,代表常量池的容量計數值。這里的常量池容量計數值是從1開始的。如圖常量池的容量:0x001d(29)。所以共有29個常量。

(4)常量池
常量池中主要存放兩類常量:字面量和符號引用。字面量比較接近Java語言層面的常量概念。就是我們什么提到的常量。而符號引用則屬于編譯原理的方面的概念。包括以下三類常量:

類和接口的全限定名
字段的名稱和描述符
方法的名稱和描述符

class文件就先介紹到這里。

接下來再說說運行時常量池,由于運行時常量池在方法區(qū)中,我們可以通過jvm參數:-XX:PermSize、-XX:MaxPermSize來設置方法區(qū)大小,從而間接限制常量池大小。

假設jvm啟動參數為:-XX:PermSize=2M -XX:MaxPermSize=2M,然后運行如下代碼:

1 //保持引用,防止自動垃圾回收
List<String> list = new ArrayList<String>();
        
int i = 0;
       
while(true){
  //通過intern方法向常量池中手動添加常量
  list.add(String.valueOf(i++).intern());
}

程序立刻會拋出:Exception in thread "main" java.lang.outOfMemoryError: PermGen space異常。PermGen space正是方法區(qū),足以說明常量池在方法區(qū)中。

在jdk8中,移除了方法區(qū),轉而用Metaspace區(qū)域替代,所以我們需要使用新的jvm參數:-XX:MaxMetaspaceSize=2M,依然運行如上代碼,拋出:java.lang.OutOfMemoryError: Metaspace異常。同理說明運行時常量池是劃分在Metaspace區(qū)域中。具體關于Metaspace區(qū)域的知識,請自行搜索。

原文參考:
深入淺出java常量池
Java常量池理解和經典總結

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 一、概述 常量池:編譯期被確定,*.class文件中的一部分,包含字面量(Literal)和符號引用(Symbol...
    高稷閱讀 2,317評論 0 2
  • 相關概念 常量池的定義常量池(constant pool):指的是在編譯期被確定,并被保存在已編譯的.class文...
    snoweek閱讀 852評論 0 4
  • 一.相關概念 什么是常量用final修飾的成員變量表示常量,值一旦給定就無法改變!final修飾的變量有三種:靜態(tài)...
    夢工廠閱讀 58,618評論 38 275
  • java常量池是一個經久不衰的話題,也是面試官的最愛,題目花樣百出。理論jvm虛擬內存分布: ** 程序計...
    Java紅茶閱讀 364評論 0 4
  • java常量池是一個經久不衰的話題,也是面試官的最愛,題目花樣百出,小菜早就對常量池有所耳聞,這次好好總結一下。 ...
    堤岸小跑閱讀 358評論 0 0

友情鏈接更多精彩內容