學習分布式系統(tǒng)限流、降級、熔斷框架就要看這篇文章

為什么需要Hystrix

在大中型分布式系統(tǒng)中,通常系統(tǒng)很多依賴,如下圖:

image

在高并發(fā)訪問下,這些依賴的穩(wěn)定性與否對系統(tǒng)的影響非常大,但是依賴有很多不可控問題:如網(wǎng)絡連接緩慢,資源繁忙,暫時不可用,服務脫機等,如下圖:

image

當依賴阻塞時,大多數(shù)服務器的線程池就出現(xiàn)阻塞,影響整個線上服務的穩(wěn)定性,如下圖:

image

在復雜的分布式架構的應用程序有很多的依賴,都會不可避免地在某些時候失敗。高并發(fā)的依賴失敗時如果沒有隔離措施,當前應用服務就有被拖垮的風險。

Hystrix如何解決依賴隔離

  • Hystrix使用命令模式HystrixCommand(Command)包裝依賴調(diào)用邏輯,每個命令在單獨線程中/信號授權下執(zhí)行。

  • 可配置依賴調(diào)用超時時間,超時時間一般設為比99.5%平均時間略高即可。當調(diào)用超時時,直接返回或執(zhí)行fallback邏輯。

  • 為每個依賴提供一個小的線程池或信號,如果線程池已滿調(diào)用將被立即拒絕,默認不采用排隊。加速失敗判定時間。

  • 依賴調(diào)用結果分:成功、失敗/拋出異常、超時、線程拒絕、短路。 請求失敗(異常,拒絕,超時,短路)時執(zhí)行fallback(降級)邏輯。

  • 提供熔斷器組件,可以自動運行或手動調(diào)用,停止當前依賴一段時間(10秒),熔斷器默認錯誤率閾值為50%,超過將自動運行。

  • 提供近實時依賴的統(tǒng)計和監(jiān)控。

Hystrix依賴的隔離架構,如下圖:

image

如何使用Hystrix

使用maven引入Hystrix依賴

<hystrix.version>1.3.16</hystrix.version>  
<hystrix-metrics-event-stream.version>1.1.2</hystrix-metrics-event-stream.version>   

<dependency>  
     <groupId>com.netflix.hystrix</groupId>  
     <artifactId>hystrix-core</artifactId>  
     <version>${hystrix.version}</version>  
 </dependency>  
     <dependency>  
     <groupId>com.netflix.hystrix</groupId>  
     <artifactId>hystrix-metrics-event-stream</artifactId>  
     <version>${hystrix-metrics-event-stream.version}</version>  
 </dependency>  

使用命令模式封裝依賴邏輯

 public class HelloWorldCommand extends HystrixCommand<String> {  
    private final String name;  
    public HelloWorldCommand(String name) {  
        //最少配置:指定命令組名(CommandGroup)  
        super(HystrixCommandGroupKey.Factory.asKey("ExampleGroup"));  
        this.name = name;  
    }  
    @Override  
    protected String run() {  
        // 依賴邏輯封裝在run()方法中  
        return "Hello " + name +" thread:" + Thread.currentThread().getName();  
    }  
    //調(diào)用實例  
    public static void main(String[] args) throws Exception{  
        //每個Command對象只能調(diào)用一次,不可以重復調(diào)用,  
        //重復調(diào)用對應異常信息
        HelloWorldCommand helloWorldCommand = new HelloWorldCommand("sync-hystrix");  
        //使用execute()同步調(diào)用代碼,效果等同于:helloWorldCommand.queue().get();   
        String result = helloWorldCommand.execute();  
        System.out.println("result=" + result);  

        helloWorldCommand = new HelloWorldCommand("async-hystrix");  
        //異步調(diào)用,可自由控制獲取結果時機,  
        Future<String> future = helloWorldCommand.queue();  
        //get操作不能超過command定義的超時時間,默認:1秒  
        result = future.get(100, TimeUnit.MILLISECONDS);  
        System.out.println("result=" + result);  
        System.out.println("mainThread=" + Thread.currentThread().getName());  
    }       
}  

使用Fallback() 提供降級策略

image
//重載HystrixCommand的getFallback方法實現(xiàn)邏輯  
public class HelloWorldCommand extends HystrixCommand<String> {  
    private final String name;  
    public HelloWorldCommand(String name) {  
        super(Setter.withGroupKey(HystrixCommandGroupKey.Factory.asKey("HelloWorldGroup"))
            .andCommandPropertiesDefaults(HystrixCommandProperties.Setter()
                            .withExecutionIsolationThreadTimeoutInMilliseconds(500)));  
        this.name = name;  
    }  
    @Override  
    protected String getFallback() {  
        return "exeucute Falled";  
    }  
    @Override  
    protected String run() throws Exception {  
        //sleep 1 秒,調(diào)用會超時  
        TimeUnit.MILLISECONDS.sleep(1000);  
        return "Hello " + name +" thread:" + Thread.currentThread().getName();  
    }  
    public static void main(String[] args) throws Exception{  
        HelloWorldCommand command = new HelloWorldCommand("test-Fallback");  
        String result = command.execute();  
    }  
}  

NOTE: 除了HystrixBadRequestException異常之外,所有從run()方法拋出的異常都算作失敗,并觸發(fā)降級getFallback()和斷路器邏輯。

HystrixBadRequestException用在非法參數(shù)或非系統(tǒng)故障異常等不應觸發(fā)回退邏輯的場景。

依賴命名:CommandKey

public HelloWorldCommand(String name) {  
        super(Setter.withGroupKey(HystrixCommandGroupKey.Factory.asKey("ExampleGroup"))  
                /* HystrixCommandKey工廠定義依賴名稱 */  
                .andCommandKey(HystrixCommandKey.Factory.asKey("HelloWorld")));  
        this.name = name;  
}

NOTE: 每個CommandKey代表一個依賴抽象,相同的依賴要使用相同的CommandKey名稱。依賴隔離的根本就是對相同CommandKey的依賴做隔離。

依賴分組:CommandGroup

命令分組用于對依賴操作分組,便于統(tǒng)計,匯總等。

//使用HystrixCommandGroupKey工廠定義  
public HelloWorldCommand(String name) {  
    Setter.withGroupKey(HystrixCommandGroupKey.Factory.asKey("HelloWorldGroup"))  
}

NOTE: CommandGroup是每個命令最少配置的必選參數(shù),在不指定ThreadPoolKey的情況下,字面值用于對不同依賴的線程池/信號區(qū)分。

線程池/信號:ThreadPoolKey

public HelloWorldCommand(String name) {  
        super(Setter.withGroupKey(HystrixCommandGroupKey.Factory.asKey("ExampleGroup"))  
                .andCommandKey(HystrixCommandKey.Factory.asKey("HelloWorld"))  
                /* 使用HystrixThreadPoolKey工廠定義線程池名稱*/  
                .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("HelloWorldPool")));  
        this.name = name;  
}

NOTE: 當對同一業(yè)務依賴做隔離時使用CommandGroup做區(qū)分,但是對同一依賴的不同遠程調(diào)用如(一個是redis 一個是http),可以使用HystrixThreadPoolKey做隔離區(qū)分。

最然在業(yè)務上都是相同的組,但是需要在資源上做隔離時,可以使用HystrixThreadPoolKey區(qū)分。

信號量隔離:SEMAPHORE

隔離本地代碼或可快速返回遠程調(diào)用(如memcached,redis)可以直接使用信號量隔離,降低線程隔離開銷。

public class HelloWorldCommand extends HystrixCommand<String> {  
    private final String name;  
    public HelloWorldCommand(String name) {  
        super(Setter.withGroupKey(HystrixCommandGroupKey.Factory.asKey("HelloWorldGroup"))  
                /* 配置信號量隔離方式,默認采用線程池隔離 */  
                .andCommandPropertiesDefaults(HystrixCommandProperties.Setter()
                                    .withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.SEMAPHORE)));  
        this.name = name;  
    }  
    @Override  
    protected String run() throws Exception {  
        return "HystrixThread:" + Thread.currentThread().getName();  
    }  
    public static void main(String[] args) throws Exception{  
        HelloWorldCommand command = new HelloWorldCommand("semaphore");  
        String result = command.execute();  
        System.out.println(result);  
        System.out.println("MainThread:" + Thread.currentThread().getName());  
    }  
}  

Hystrix關鍵組件分析

Hystrix流程結構解析

image

流程說明:

1,每次調(diào)用創(chuàng)建一個新的HystrixCommand,把依賴調(diào)用封裝在run()方法中

2,執(zhí)行execute()/queue做同步或異步調(diào)用

3,判斷熔斷器(circuit-breaker)是否打開,如果打開跳到步驟8,進行降級策略,否則繼續(xù)后續(xù)步驟

4,判斷線程池/隊列/信號量是否跑滿,如果跑滿進入降級步驟8,否則繼續(xù)后續(xù)步驟

5,調(diào)用HystrixCommand的run方法,運行依賴邏輯

a 依賴邏輯調(diào)用超時,進入步驟8

6,判斷邏輯是否調(diào)用成功

a 返回成功調(diào)用結果

b 調(diào)用出錯,進入步驟8

7,計算熔斷器狀態(tài),所有的運行狀態(tài)上報給熔斷器,用于統(tǒng)計從而判斷熔斷器狀態(tài)

8,getFallback()降級邏輯

以下四種情況將觸發(fā)getFallback調(diào)用:

  • run()方法拋出非HystrixBadRequestException異常
  • run()方法調(diào)用超時
  • 熔斷器開啟攔截調(diào)用
  • 線程池/隊列/信號量是否跑滿

沒有實現(xiàn)getFallback的Command將直接拋出異常

fallback降級邏輯調(diào)用成功直接返回

降級邏輯調(diào)用失敗拋出異常

9,返回執(zhí)行成功結果

熔斷器:Circuit Breaker

Circuit Breaker 流程架構和統(tǒng)計

image

每個熔斷器默認維護10個bucket,每秒一個bucket,每個blucket記錄成功、失敗、超時、拒絕的狀態(tài),默認錯誤超過50%且10秒內(nèi)超過20個請求進行中斷攔截.。

隔離(Isolation)分析

Hystrix隔離方式采用線程/信號的方式,通過隔離限制依賴的并發(fā)量和阻塞擴散。

(1) 線程隔離

把執(zhí)行依賴代碼的線程與請求線程分離,請求線程可以自由控制離開的時間(異步過程)。

通過線程池大小可以控制并發(fā)量,當線程池飽和時可以提前拒絕服務,防止依賴問題擴散。

線上建議線程池不要設置過大,否則大量堵塞線程有可能會拖慢服務器。

image

線程池的使用示意圖如下圖所示,當n個請求線程并發(fā)對某個接口請求調(diào)用時,會先從hystrix管理的線程池里面獲得一個線程,然后將參數(shù)傳遞給這個線程去執(zhí)行真正調(diào)用。線程池的大小有限,默認是10個線程,可以使用maxConcurrentRequests參數(shù)配置,如果并發(fā)請求數(shù)多于線程池線程個數(shù),就有線程需要進入隊列排隊,但排隊隊列也有上限,默認是 5,如果排隊隊列也滿,則必定有請求線程會走fallback流程。

線程池模式可以支持異步調(diào)用,支持超時調(diào)用,支持直接熔斷,存在線程切換,開銷大。

image

(2) 線程隔離的優(yōu)缺點

線程隔離的優(yōu)點:

  • 使用線程可以完全隔離第三方代碼,請求線程可以快速放回。

  • 當一個失敗的依賴再次變成可用時,線程池將清理,并立即恢復可用,而不是一個長時間的恢復。

  • 可以完全模擬異步調(diào)用,方便異步編程。

線程隔離的缺點:

  • 線程池的主要缺點是它增加了cpu,因為每個命令的執(zhí)行涉及到排隊(默認使用SynchronousQueue避免排隊),調(diào)度和上下文切換。

  • 對使用ThreadLocal等依賴線程狀態(tài)的代碼增加復雜性,需要手動傳遞和清理線程狀態(tài)。

NOTE: Netflix公司內(nèi)部認為線程隔離開銷足夠小,不會造成重大的成本或性能的影響。

Netflix內(nèi)部API每天100億的HystrixCommand依賴請求使用線程隔,每個應用大約40多個線程池,每個線程池大約5-20個線程。

(3) 信號隔離

信號隔離也可以用于限制并發(fā)訪問,防止阻塞擴散, 與線程隔離最大不同在于執(zhí)行依賴代碼的線程依然是請求線程(該線程需要通過信號申請)。

如果客戶端是可信的且可以快速返回,可以使用信號隔離替換線程隔離,降低開銷。

線程隔離與信號隔離區(qū)別如下圖:

image

信號量的使用示意圖如下圖所示,當n個并發(fā)請求去調(diào)用一個目標服務接口時,都要獲取一個信號量才能真正去調(diào)用目標服務接口,但信號量有限,默認是10個,可以使用maxConcurrentRequests參數(shù)配置,如果并發(fā)請求數(shù)多于信號量個數(shù),就有線程需要進入隊列排隊,但排隊隊列也有上限,默認是 5,如果排隊隊列也滿,則必定有請求線程會走fallback流程,從而達到限流和防止雪崩的目的。

image

信號量模式從始至終都只有請求線程自身,是同步調(diào)用模式,不支持超時調(diào)用,不支持直接熔斷,由于沒有線程的切換,開銷非常小。

(4) 總結

當請求的服務網(wǎng)絡開銷比較大的時候,或者是請求比較耗時的時候,我們最好是使用線程隔離策略,這樣的話,可以保證大量的容器(tomcat)線程可用,不會由于服務原因,一直處于阻塞或等待狀態(tài),快速失敗返回。而當我們請求緩存這些服務的時候,我們可以使用信號量隔離策略,因為這類服務的返回通常會非常的快,不會占用容器線程太長時間,而且也減少了線程切換的一些開銷,提高了緩存服務的效率。

  • 線程池:適合絕大多數(shù)的場景,99%的。對依賴服務的網(wǎng)絡請求的調(diào)用和訪問,timeout這種問題

  • 信號量:適合你的訪問不是對外部依賴的訪問,而是對內(nèi)部的一些比較復雜的業(yè)務邏輯的訪問,但是像這種訪問,系統(tǒng)內(nèi)部的代碼,其實不涉及任何的網(wǎng)絡請求,那么只要做信號量的普通限流就可以了,因為不需要去捕獲timeout類似的問題,算法+數(shù)據(jù)結構的效率不是太高,并發(fā)量突然太高,因為這里稍微耗時一些,導致很多線程卡在這里的話,不太好,所以進行一個基本的資源隔離和訪問,避免內(nèi)部復雜的低效率的代碼,導致大量的線程被hang住

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容