背景
最近同事在對(duì)項(xiàng)目Jersey由1.6升級(jí)至2.X,本地測(cè)試一切順利。但是當(dāng)部署到INT環(huán)境后,發(fā)現(xiàn)后臺(tái)異步線程執(zhí)行途中就消失了。其偽代碼如下:
public static void exec() {
LOG.info("begin start");
try {
//do business code
LOG.info("finish business");
} catch (Exception e) {
LOG.error("exception ", e);
throw e;
} finally {
LOG.info("finally");
//do
}
}
現(xiàn)象
在輸出日志中,可以看到:
begin start
沒有finish business的日志輸出,也沒有打印出catch塊中的Exception信息。
查找原因
從日志上無法看出任何有用信息,只能知道線程在執(zhí)行業(yè)務(wù)邏輯時(shí),中斷執(zhí)行跳出。本來準(zhǔn)備用jstack查看一下線程執(zhí)行時(shí)候場(chǎng)景,但是前幾天看到阿里開源了arthas工具,就拿過來牛刀小試一把。
安裝和監(jiān)控
安裝完成后,用trace來跟蹤具體的調(diào)用鏈路(具體請(qǐng)見arthas的官方文檔)。
$ trace com....platform.file.client.FileServiceClient createFileMetadata
Press Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 228 ms.
`---ts=2019-01-11 07:34:48;thread_name=async.impl.MessageReceiverExecutor-19(queue@xxxRunReportQueue)-5;id=b9;is_daemon=false;priority=5;TCCL=sun.misc.Launcher$AppClassLoader@764c12b6
`---[0.769619ms] com....platform.file.client.FileServiceClient:createFileMetadata()
+---[0.383598ms] com....platform.file.client.FileManagementClient:createFileMetadata() [throws Exception]
`---[0.005124ms] throw:java.lang.NoSuchMethodError()
`---[0.005124ms] throw:java.lang.NoSuchMethodError()
可見根本原因是:NoSuchMethodError。但是到底是哪個(gè)Class的方法沒有呢?可惜沒有打印出來。我們繼續(xù)查看調(diào)用鏈上的方法:
$ trace org.glassfish.jersey.client.ClientRequest accept
Press Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:2) cost in 222 ms.
`---ts=2019-01-11 09:42:52;thread_name=async.impl.MessageReceiverExecutor-19(queue@xxReportQueue)-39;id=1dc;is_daemon=false;priority=5;TCCL=sun.misc.Launcher$AppClassLoader@764c12b6
`---[0.29744ms] org.glassfish.jersey.client.ClientRequest:accept()
+---[0.024457ms] org.glassfish.jersey.client.ClientRequest:getHeaders()
+---[0.114488ms] javax.ws.rs.core.MultivaluedMap:addAll() [throws Exception]
`---[8.08E-4ms] throw:java.lang.NoSuchMethodError()
可以看到MultivaluedMap,缺少addAll方法。查看該類在javax.ws.rs.core的Jar包中,且出現(xiàn)了兩個(gè)版本。在INT環(huán)境,加載了低版本的Class導(dǎo)致出現(xiàn)該異常。
使用Jar包檢測(cè)工具
有很多的檢測(cè)工具、腳本,可以檢測(cè)class的重復(fù),多個(gè)版本。這里不再重復(fù)。
讓錯(cuò)誤信息暴露出來
讓LOG記錄這類關(guān)鍵信息,以方便我們定位。
我們看到在Java NoSuchMethodError文檔中標(biāo)明:出現(xiàn)這類錯(cuò)誤,是系統(tǒng)出現(xiàn)了不合理的嚴(yán)重問題,該問題應(yīng)該在編譯的時(shí)候就發(fā)現(xiàn),應(yīng)用中不應(yīng)catch這類錯(cuò)誤,應(yīng)當(dāng)暴露出來。
但是,在這里由于是異步線程,出現(xiàn)該錯(cuò)誤沒有任何的日志打印記錄,無法顯示的暴露問題, 建議 catch (Throwable e), 記錄日志,然后將異常拋出。如下:
public static void exec() {
try {
//do business
} catch (Throwable e) {
LOG.error("exception ", e);
throw e;
} finally {
}
}
結(jié)論
項(xiàng)目需要保持各種JAR包版本的干凈,用工具來進(jìn)行檢測(cè)。且在代碼中,我們要盡可能的將這種異常記錄出來,以方便定位。