深入淺出 JVM 系列(一)初識 JVM

閱讀本文大概需要 5.6 分鐘

前言

在 Java 開發(fā)中,我們經(jīng)常會提到 JVM。我們知道 JVM 是 Java 虛擬機,但是它的運行原理是什么?它的內(nèi)存結(jié)構(gòu)是什么?如何進(jìn)行優(yōu)化?如何去定位問題?面試中遇到 JVM 問題如何回答?

接下來我會開啟 JVM 的章節(jié),為大家一一解答上面的問題?,F(xiàn)在就開啟我們的 JVM 學(xué)習(xí)之路吧!

什么是 JVM?

面試官:什么是 JVM?

小李:JVM(Java Virtual Machine)是 Java 虛擬機,用于運行 Java 編譯后的二進(jìn)制字節(jié)碼,最后生成機器指令。(心里一想,簡簡單單)

面試官:那為什么 Java 研發(fā)體系需要 JVM?你對 JVM 的運行原理了解多少?我們寫的 Java 代碼到底是如何運行起來的?

小李:嗯。。。就是。。。嗯。。。是那個。。。嗯。。。

面試官:面試就到這里了,先回去等通知吧。

小李:好的?。拗卮穑?/p>

img

這里面試官對小李進(jìn)行三連問:

  1. 為什么 Java 研發(fā)體系需要 JVM?

  2. 你對 JVM 的運行原理了解多少?

  3. 我們寫的 Java 代碼到底是如何運行起來的?

這套組合拳看似很厲害,其實就是軍體拳。

img

如果想完美的練這套軍體拳,不,是完美的回答這三個問題,就需要首先要了解 JVM 是什么?它和 Java 是什么關(guān)系?又和 JDK 有什么淵源?那要弄清楚這些問題,就需要從三個維度去思考:

  • JVM 和操作系統(tǒng)的關(guān)系;

  • JVM 、JRE、JDK 的關(guān)系;

  • Java 虛擬機規(guī)范和 Java 語言規(guī)范的關(guān)系。

弄清楚這這幾者的關(guān)系,我們再通過一個簡單代碼示例來看一個 Java 程序到底是如何執(zhí)行的。

JVM 和 操作系統(tǒng)的關(guān)系

我們知道煉制一把牛逼的大寶劍,不僅需要上等的技術(shù),還需要一鼎經(jīng)百煉的劍爐。而工程師就相當(dāng)于鑄劍的劍師,JVM 便是劍爐。

img

JVM 就是我們耳熟能詳?shù)?Java 虛擬機。它能識別 .class 后綴文件,并且能夠解析它的指令,最終調(diào)用操作系統(tǒng)上的函數(shù),完成我們想要的操作。

Java 程序和 C++ 程序有什么不同呢?這里用兩張圖進(jìn)行說明。

img
img

對比兩張圖可以看到 C++ 開發(fā)的程序可以翻譯成操作系統(tǒng)能識別的 .exe 文件。而 Java 程序需要通過 javac 編譯成 .class 文件之后,然后由 JVM 負(fù)責(zé)調(diào)用系統(tǒng)函數(shù)執(zhí)行程序,操作系統(tǒng)并不認(rèn)識 .class 文件。

那讀者就勸小李了,轉(zhuǎn) C++ 開發(fā)吧,這 Java 還搞了一個處于程序和操作系統(tǒng)的虛擬機,不像 C++ 編譯后直接在操作系統(tǒng)上運行,肯定不是啥好玩意。

img

我就知道你們壞的很,知道 JVM 的過人之處,還不告訴小李。那我給小李講講 JVM 的過人之處:

Java 是一門抽象度特別高的語言,提供了自動內(nèi)存管理等一系列的特性。這些特性在操作系統(tǒng)上基本上是無望了,所以就需要 JVM 進(jìn)行一番轉(zhuǎn)換。

經(jīng)過上面的介紹,我們可以做如下的類比:

  • JVM:等同于操作系統(tǒng);

  • Java 字節(jié)碼:等同于匯編語言。

Java 字節(jié)碼還是比較容易讀懂,從側(cè)面上也證明了 Java 語言的抽象程度高。我們可以認(rèn)為 JVM 是一個翻譯器,會持續(xù)不斷的翻譯執(zhí)行 Java 字節(jié)碼,然后調(diào)用真正的操作系統(tǒng)函數(shù),這些操作系統(tǒng)函數(shù)是與平臺息息相關(guān)的。

可以把 JVM 想象一個有道詞典,.class 文件是英文,而輸出的結(jié)果是中文。有道詞典有 windows版本,也有 Linux 版本,內(nèi)部具體的實現(xiàn)肯定不同,但最終都會得到相同的結(jié)果,這樣就好理解一些了)

img

當(dāng)有個 JVM 這個抽象層,就可以實現(xiàn)跨平臺了。JVM 只需要正確執(zhí)行 .class 文件,就可以運行在 Linux、Windos、MacOS 等平臺了。

Java 跨平臺的意義在于一次編譯,處處運行,這里 JVM 功不可沒。比如在 Maven 倉庫下載的 jar 包就可以到處運行,不需要在每個平臺上再編譯一次。

img

我們來概括 JVM 與操作系統(tǒng)之間的關(guān)系

JVM 上承開發(fā)語言,下接操作系統(tǒng),它的中間接口就是字節(jié)碼。

JVM、JRE、JDK 的關(guān)系

通過上面的學(xué)習(xí),我們了解到 JVM 是 Java 程序能夠運行的核心。但是我們要知道,JVM 自己什么也干不了,你需要給它提供原料(.class 文件)。俗話說:巧婦難為無米之炊。JVM 功能雖然強大,但還是需要為它提供 .class 文件。

但是僅靠 JVM 是無法完成一次編譯,到處運行的。它需要一個基本的類庫,比如怎么操作文件、怎么連接網(wǎng)絡(luò)、怎么教你出拳(小李已瘋)等。而 Java 體系會一次性將 JVM 運行所需的類庫都傳遞給它。JVM 標(biāo)準(zhǔn)加上基本類庫就組成了 Java 的運行環(huán)境,就是 JRE (Java Runtime Enviroment)

JVM + 基本類庫 = JRE

那 JDK 又是什么呢?

JDK 全稱 Java Development Kit,Kit 是裝備的意思。所以 JDK 不僅包含 JRE,還有一些小工具,比如 javac、java、jar等。

JRE + javac/java/jar 等指令工具 = JDK

JVM、JRE、JDK 它們?nèi)咧g的關(guān)系,可以用一個包含關(guān)系表示。

  • JDK > JRE > JVM
img

Java 虛擬機規(guī)范和 Java 語言規(guī)范的關(guān)系

從廣義上來講,JVM 是一種規(guī)范,它是最為官方、準(zhǔn)確的文檔;狹義上來講,由于我們使用 Hotspot 更多一些,所以我們在談到這個概念時,會將他們等同起來。

如果再加我們平常使用的 Java 語言,可以得到下面一張圖。

img

左邊是 Java 虛擬機規(guī)范,為字節(jié)碼的解析提供一個環(huán)境。右邊是 Java 語法規(guī)范,比如 switch、for、泛型、lambda 等相關(guān)的程序,最終都會編譯成字節(jié)碼。而字節(jié)碼是鏈接左右兩部分的橋梁。

如果 .class 文件的規(guī)格是不變的,這兩部分是可以獨立進(jìn)行優(yōu)化的。But 沒有如果,現(xiàn)在都已經(jīng)到 Java 13 了,為了支持更多的特性,肯定會增加一些字節(jié)碼指令。

img

此刻優(yōu)秀的小李提出了一個讓人深思的問題:

如果我不學(xué)習(xí) JVM,會影響我寫 Java 代碼么?

理論上,這兩者沒有必然的聯(lián)系。他們之間通過 .class 文件進(jìn)行交互,即使你不了解 JVM,也能夠?qū)懘蠖鄶?shù)的 Java 代碼。就像你是寫 C++ 代碼一樣,并不需要特別深入的了解操作系統(tǒng)的底層是如何實現(xiàn)的。

那我還學(xué)個錘子!瞬間關(guān)了該頁面。

img

客官別走,還有但是沒說呢。

但是,如果你想要寫一些比較精巧、效率比較高的代碼,就需要了解一些執(zhí)行層面的知識了。了解 JVM,主要用在調(diào)優(yōu)以及故障排查上面,你會對運行中的各種資源分配,有一個比較全面的掌控。(是不是內(nèi)心還有點小期待呢?。?/p>

img

Java 代碼到底是如何運行起來的

最后,我們簡單看一下 Java 程序的執(zhí)行過程,了解下它到底是如何運行起來的。

這里的 Java 程序是文本格式的。比如下面這段 HelloXiaoli.java,它遵循的就是 Java 語言規(guī)范。其中,我們調(diào)用的 System.out 等模塊,就是 JRE 提供的類庫。

img

通過 JDK 的工具 javac 進(jìn)行編譯后,就會產(chǎn)生 HelloWorld 的字節(jié)碼。

javac HelloXiaoli.java
img

Java 字節(jié)碼是溝通 JVM 和 Java 程序的橋梁,下面使用 javap 來看一下字節(jié)碼到底長什么樣子。javap基本使用

javap -verbose HelloXiaoli.class
0 getstatic #2 <java/lang/System.out>
3 ldc #3 <Hello Xiaoli>
5 invokevirtual #4 <java/io/PrintStream.println>
8 return

Java 虛擬機采用基于棧的架構(gòu)(為什么基于棧的架構(gòu)詳見:JVM 體系結(jié)構(gòu)與工作方式),其指令由操作碼和操作數(shù)組成。這些字節(jié)碼指令,就叫做 opcode。其中,getstatic、ldc、invokeevirtual、return 等,就是 opcode。

我們繼續(xù)使用 hexdump 看一下字節(jié)碼的二進(jìn)制內(nèi)容hexdump 命令

b2 00 02 12 03 b6 00 04 b1

我們可以看一下它們的對應(yīng)關(guān)系。JVM 字節(jié)碼對照表

0xb2   getstatic       獲取靜態(tài)字段的值
0x12   ldc             常量池中的常量值入棧
0xb6   invokevirtual   運行時方法綁定調(diào)用方法
0xb1   return          void 函數(shù)返回

opcode 是一個字節(jié)的長度(0~255),意味著指令集的操作碼個數(shù)不能超過 256 條。緊跟在 opcode 后面的是被操作數(shù)。比如 b2 00 02,就代表了 getstatic #2 。

JVM 就是靠解析這些 opcode 和 操作數(shù)來完成程序的執(zhí)行的,當(dāng)我們使用 Java 命令運行 .class 文件的時候,實際上就相當(dāng)于啟動了一個 JVM 進(jìn)程。

JVM 會翻譯這些字節(jié)碼,它有兩種執(zhí)行方式:

  • 解釋執(zhí)行,將 opcode + 操作數(shù)翻譯成機器代碼;

  • JIT,即時編譯,它會在一定條件下將字節(jié)碼翻譯成機器碼之后再執(zhí)行。

即時編譯器與解釋器的區(qū)別?

.class 文件會被加載、存放到 metaspace 中,等待被調(diào)用,這里會有一個類加載器的概念。

JVM 的程序運行,都是在棧上完成的,這和其他普通程序的執(zhí)行是類似的,分為堆和棧。比如我們程序運行到了 main 方法,就會給它分配一個棧幀。當(dāng)推出方法體時,會彈出相應(yīng)的棧幀。其實,大多數(shù)字節(jié)碼指令,就是不斷的對棧幀進(jìn)行操作。

而其它大塊數(shù)據(jù),是存放在堆上的。Java 在內(nèi)存劃分上會更為細(xì)致,關(guān)于這些概念,會在后面的章節(jié)中詳細(xì)介紹。

我們看下面的圖,JVM 部分是我們系列需要講解的部分。

img

小結(jié)

上面講了這么多,讓我們再回頭看看面試官提問的三個問題。

  • 為什么 Java 研發(fā)系統(tǒng)需要 JVM?

因為 Java 是一門抽象的語言,并且有自動內(nèi)存管理機制。而操作系統(tǒng)無法去進(jìn)行自動垃圾回收等操作,所以就有了虛擬機。虛擬機可以對字節(jié)碼加載、自動垃圾回收、并發(fā)等。而 JVM 只是一個規(guī)范,定義了 .class 文件的結(jié)構(gòu)、加載機制、數(shù)據(jù)存儲、運行時棧等諸多內(nèi)容,最常用的 JVM 實現(xiàn)就是 Hotspot。

  • 你對 JVM 的運行原理了解多少?

JVM 的生命周期是和 Java 程序的運行一樣,當(dāng)程序運行結(jié)束,JVM 實例也就跟著消失了。具體的運行原理,會在后續(xù)文章中詳細(xì)介紹,請關(guān)注小李哦!

  • 我們寫的 Java 代碼到底是如何運行起來的?

Java 程序通過 javac 編譯成 .class 文件,然后虛擬機將其加載到元數(shù)據(jù)區(qū),執(zhí)行引擎將會通過混合模式執(zhí)行這些字節(jié)碼。執(zhí)行時,會翻譯成操作系統(tǒng)相關(guān)的函數(shù)。

過程如下:Java 文件->編譯器->字節(jié)碼->JVM->機器碼

總結(jié)

本篇文章從三個角度了解了 JVM 在 Java 研發(fā)體系中的位置,并以一個簡單的程序,看了下一個 Java 程序的執(zhí)行過程。

我們說的 JVM,狹義上指的就是 HotSpot。如果沒有特殊說明,我們都以 HotSpot 為準(zhǔn)。

我們知道 Java 之所以跨平臺,就是由于 JVM 的存在。Java 的字節(jié)碼,是溝通 Java 語言與 JVM 的橋梁,同時也是溝通 JVM 與操作系統(tǒng)的橋梁。

JVM 是一個非常小的集合,我們常說的 Java 運行時環(huán)境,也就是 JRE 包含 JVM 和一部分基礎(chǔ)類庫。如果加上我們常用的一些開發(fā)工具,就構(gòu)成了整個 JDK。

Java 虛擬機棧采用基于棧的架構(gòu),有比較豐富的 opcode。這些字節(jié)碼可以解釋執(zhí)行,也可以編譯成機器碼,運行在底層硬件上,可以說 JVM 是一種混合執(zhí)行的策略。

留兩道思考題給大家:

  • 棧上都會有哪些數(shù)據(jù)?

  • 垃圾回收會發(fā)生在什么地方?

思考題我會在后面的章節(jié)為大家一一解答。

參考

http://pc-shop.xiaoe-tech.com/appcCrwMYBx6232/video_details?id=v_5e14662379d00_UAifIZpt

推薦閱讀

JVM 體系結(jié)構(gòu)與工作方式

學(xué)習(xí)反射看這一篇就夠了

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容