為什么阿里巴巴RPC接口不允許使用枚舉類型?

最近,我們的線上環(huán)境出現(xiàn)了一個(gè)問題,線上代碼在執(zhí)行過程中拋出了一個(gè)IllegalArgumentException,分析堆棧后,發(fā)現(xiàn)最根本的的異常是以下內(nèi)容:

java.lang.IllegalArgumentException: No enum constant com.a.b.f.m.a.c.AType.P_M

大概就是以上的內(nèi)容,看起來還是很簡單的,提示的錯(cuò)誤信息就是在AType這個(gè)枚舉類中沒有找到P_M這個(gè)枚舉項(xiàng)。

于是經(jīng)過排查,我們發(fā)現(xiàn),在線上開始有這個(gè)異常之前,該應(yīng)用依賴的一個(gè)下游系統(tǒng)有發(fā)布,而發(fā)布過程中是一個(gè)API包發(fā)生了變化,主要變化內(nèi)容是在一個(gè)RPC接口的Response返回值類中的一個(gè)枚舉參數(shù)AType中增加了P_M這個(gè)枚舉項(xiàng)。

但是下游系統(tǒng)發(fā)布時(shí),并未通知到我們負(fù)責(zé)的這個(gè)系統(tǒng)進(jìn)行升級(jí),所以就報(bào)錯(cuò)了。

我們來分析下為什么會(huì)發(fā)生這樣的情況。

問題重現(xiàn)

首先,下游系統(tǒng)A提供了一個(gè)二方庫的某一個(gè)接口的返回值中有一個(gè)參數(shù)類型是枚舉類型。

一方庫指的是本項(xiàng)目中的依賴

二方庫指的是公司內(nèi)部其他項(xiàng)目提供的依賴

三方庫指的是其他組織、公司等來自第三方的依賴

public interface AFacadeService {    public AResponse doSth(ARequest aRequest);}public Class AResponse{    private Boolean success;    private AType aType;}public enum AType{    P_T,    A_B}

然后B系統(tǒng)依賴了這個(gè)二方庫,并且會(huì)通過RPC遠(yuǎn)程調(diào)用的方式調(diào)用AFacadeService的doSth方法。

public class BService {    @Autowired    AFacadeService aFacadeService;    public void doSth(){        ARequest aRequest = new ARequest();        AResponse aResponse = aFacadeService.doSth(aRequest);        AType aType = aResponse.getAType();    }}

這時(shí)候,如果A和B系統(tǒng)依賴的都是同一個(gè)二方庫的話,兩者使用到的枚舉AType會(huì)是同一個(gè)類,里面的枚舉項(xiàng)也都是一致的,這種情況不會(huì)有什么問題。

但是,如果有一天,這個(gè)二方庫做了升級(jí),在AType這個(gè)枚舉類中增加了一個(gè)新的枚舉項(xiàng)P_M,這時(shí)候只有系統(tǒng)A做了升級(jí),但是系統(tǒng)B并沒有做升級(jí)。

那么A系統(tǒng)依賴的的AType就是這樣的:

public enum AType{    P_T,    A_B,    P_M}

而B系統(tǒng)依賴的AType則是這樣的:

public enum AType{    P_T,    A_B}

這種情況下,在B系統(tǒng)通過RPC調(diào)用A系統(tǒng)的時(shí)候,如果A系統(tǒng)返回的AResponse中的aType的類型為新增的P_M時(shí)候,B系統(tǒng)就會(huì)無法解析。一般在這種時(shí)候,RPC框架就會(huì)發(fā)生反序列化異常。導(dǎo)致程序被中斷。

原理分析

這個(gè)問題的現(xiàn)象我們分析清楚了,那么再來看下原理是怎樣的,為什么出現(xiàn)這樣的異常呢。

其實(shí)這個(gè)原理也不難,這類RPC框架大多數(shù)會(huì)采用JSON的格式進(jìn)行數(shù)據(jù)傳輸,也就是客戶端會(huì)將返回值序列化成JSON字符串,而服務(wù)端會(huì)再將JSON字符串反序列化成一個(gè)Java對(duì)象。

而JSON在反序列化的過程中,對(duì)于一個(gè)枚舉類型,會(huì)嘗試調(diào)用對(duì)應(yīng)的枚舉類的valueOf方法來獲取到對(duì)應(yīng)的枚舉。

而我們查看枚舉類的valueOf方法的實(shí)現(xiàn)時(shí),就可以發(fā)現(xiàn),如果從枚舉類中找不到對(duì)應(yīng)的枚舉項(xiàng)的時(shí)候,就會(huì)拋出IllegalArgumentException

public static <T extends Enum<T>> T valueOf(Class<T> enumType, String name) {    T result = enumType.enumConstantDirectory().get(name);    if (result != null)        return result;    if (name == null)        throw new NullPointerException("Name is null");    throw new IllegalArgumentException(        "No enum constant " + enumType.getCanonicalName() + "." + name);}

關(guān)于這個(gè)問題,其實(shí)在《阿里巴巴Java開發(fā)手冊(cè)》中也有類似的約定:

這里面規(guī)定"對(duì)于二方庫的參數(shù)可以使用枚舉,但是返回值不允許使用枚舉"。這背后的思考就是本文上面提到的內(nèi)容。

擴(kuò)展思考

為什么參數(shù)中可以有枚舉?

不知道大家有沒有想過這個(gè)問題,其實(shí)這個(gè)就和二方庫的職責(zé)有點(diǎn)關(guān)系了。

一般情況下,A系統(tǒng)想要提供一個(gè)遠(yuǎn)程接口給別人調(diào)用的時(shí)候,就會(huì)定義一個(gè)二方庫,告訴其調(diào)用方如何構(gòu)造參數(shù),調(diào)用哪個(gè)接口。

而這個(gè)二方庫的調(diào)用方會(huì)根據(jù)其中定義的內(nèi)容來進(jìn)行調(diào)用。而參數(shù)的構(gòu)造過程是由B系統(tǒng)完成的,如果B系統(tǒng)使用到的是一個(gè)舊的二方庫,使用到的枚舉自然是已有的一些,新增的就不會(huì)被用到,所以這樣也不會(huì)出現(xiàn)問題。

比如前面的例子,B系統(tǒng)在調(diào)用A系統(tǒng)的時(shí)候,構(gòu)造參數(shù)的時(shí)候使用到AType的時(shí)候就只有P_T和A_B兩個(gè)選項(xiàng),雖然A系統(tǒng)已經(jīng)支持P_M了,但是B系統(tǒng)并沒有使用到。

如果B系統(tǒng)想要使用P_M,那么就需要對(duì)該二方庫進(jìn)行升級(jí)。

但是,返回值就不一樣了,返回值并不受客戶端控制,服務(wù)端返回什么內(nèi)容是根據(jù)他自己依賴的二方庫決定的。

但是,其實(shí)相比較于手冊(cè)中的規(guī)定,我更加傾向于,在RPC的接口中入?yún)⒑统鰠⒍疾灰褂妹杜e。

一般,我們要使用枚舉都是有幾個(gè)考慮:

  • 1、枚舉嚴(yán)格控制下游系統(tǒng)的傳入內(nèi)容,避免非法字符。
  • 2、方便下游系統(tǒng)知道都可以傳哪些值,不容易出錯(cuò)。

不可否認(rèn),使用枚舉確實(shí)有一些好處,但是我不建議使用主要有以下原因:

  • 1、如果二方庫升級(jí),并且刪除了一個(gè)枚舉中的部分枚舉項(xiàng),那么入?yún)⒅惺褂妹杜e也會(huì)出現(xiàn)問題,調(diào)用方將無法識(shí)別該枚舉項(xiàng)。
  • 2、有的時(shí)候,上下游系統(tǒng)有多個(gè),如C系統(tǒng)通過B系統(tǒng)間接調(diào)用A系統(tǒng),A系統(tǒng)的參數(shù)是由C系統(tǒng)傳過來的,B系統(tǒng)只是做了一個(gè)參數(shù)的轉(zhuǎn)換與組裝。這種情況下,一旦A系統(tǒng)的二方庫升級(jí),那么B和C都要同時(shí)升級(jí),任何一個(gè)不升級(jí)都將無法兼容。

我其實(shí)建議大家在接口中使用字符串代替枚舉,相比較于枚舉這種強(qiáng)類型,字符串算是一種弱類型。

如果使用字符串代替RPC接口中的枚舉,那么就可以避免上面我們提到的兩個(gè)問題,上游系統(tǒng)只需要傳遞字符串就行了,而具體的值的合法性,只需要在A系統(tǒng)內(nèi)自己進(jìn)行校驗(yàn)就可以了。

為了方便調(diào)用者使用,可以使用javadoc的@see注解表明這個(gè)字符串字段的取值從那個(gè)枚舉中獲取。

public Class AResponse{    private Boolean success;    /**    *  @see AType     */    private String aType;}

對(duì)于像阿里這種比較龐大的互聯(lián)網(wǎng)公司,隨便提供出去的一個(gè)接口,可能有上百個(gè)調(diào)用方,而接口升級(jí)也是常態(tài),我們根本做不到每次二方庫升級(jí)之后要求所有調(diào)用者跟著一起升級(jí),這是完全不現(xiàn)實(shí)的,并且對(duì)于有些調(diào)用者來說,他用不到新特性,完全沒必要做升級(jí)。

還有一種看起來比較特殊,但是實(shí)際上比較常見的情況,就是有的時(shí)候一個(gè)接口的聲明在A包中,而一些枚舉常量定義在B包中,比較常見的就是阿里的交易相關(guān)的信息,訂單分很多層次,每次引入一個(gè)包的同時(shí)都需要引入幾十個(gè)包。

對(duì)于調(diào)用者來說,我肯定是不希望我的系統(tǒng)引入太多的依賴的,一方面依賴多了會(huì)導(dǎo)致應(yīng)用的編譯過程很慢,并且很容易出現(xiàn)依賴沖突問題。

所以,在調(diào)用下游接口的時(shí)候,如果參數(shù)中字段的類型是枚舉的話,那我沒辦法,必須得依賴他的二方庫。但是如果不是枚舉,只是一個(gè)字符串,那我就可以選擇不依賴。

所以,我們?cè)诙x接口的時(shí)候,會(huì)盡量避免使用枚舉這種強(qiáng)類型。規(guī)范中規(guī)定在返回值中不允許使用,而我自己要求更高,就是即使在接口的入?yún)⒅形乙埠苌偈褂谩?/p>

最后,我只是不建議在對(duì)外提供的接口的出入?yún)⒅惺褂妹杜e,并不是說徹底不要用枚舉,我之前很多文章也提到過,枚舉有很多好處,我在代碼中也經(jīng)常使用。所以,切不可因噎廢食。

當(dāng)然,文中的觀點(diǎn)僅代表我個(gè)人,具體是是不是適用其他人,其他場(chǎng)景或者其他公司的實(shí)踐,需要讀者們自行分辨下,建議大家在使用的時(shí)候可以多思考一下。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容