面試官:來,年輕人!請手擼5種常見限流算法!

  1. 瞬時流量過高,服務被壓垮?
  2. 惡意用戶高頻光顧,導致服務器宕機?
  3. 消息消費過快,導致數(shù)據(jù)庫壓力過大,性能下降甚至崩潰?
    ......

在高并發(fā)系統(tǒng)中,出于系統(tǒng)保護角度考慮,通常會對流量進行限流;不但在工作中要頻繁使用,而且也是面試中的高頻考點。

今天我們將圖文并茂地對常見的限流算法分別進行介紹,通過各個算法的特點,給出限流算法選型的一些建議,并給出Java語言實現(xiàn)的代碼示例。

01 固定窗口

固定窗口又稱固定窗口(又稱計數(shù)器算法,F(xiàn)ixed Window)限流算法,是最簡單的限流算法,通過在單位時間內(nèi)維護的計數(shù)器來控制該時間單位內(nèi)的最大訪問量。

假設限制每分鐘請求量不超過60,設置一個計數(shù)器,當請求到達時如果計數(shù)器到達閾值,則拒絕請求,否則計數(shù)器加1;每分鐘重置計數(shù)器為0。代碼實現(xiàn)如下:

public class CounterRateLimiter extends MyRateLimiter {
    /**
     * 每秒限制請求數(shù)
     */
    private final long permitsPerSecond;
    /**
     * 上一個窗口的開始時間
     */
    public long timestamp = System.currentTimeMillis();
    /**
     * 計數(shù)器
     */
    private int counter;

    public CounterRateLimiter(long permitsPerSecond) {
        this.permitsPerSecond = permitsPerSecond;
    }

    @Override
    public synchronized boolean tryAcquire() {
        long now = System.currentTimeMillis();
        // 窗口內(nèi)請求數(shù)量小于閾值,更新計數(shù)放行,否則拒絕請求
        if (now - timestamp < 1000) {
            if (counter < permitsPerSecond) {
                counter++;
                return true;
            } else {
                return false;
            }
        }
        // 時間窗口過期,重置計數(shù)器和時間戳
        counter = 0;
        timestamp = now;
        return true;
    }
}

固定窗口最大的優(yōu)點在于易于實現(xiàn);并且內(nèi)存占用小,我們只需要存儲時間窗口中的計數(shù)即可;它能夠確保處理更多的最新請求,不會因為舊請求的堆積導致新請求被餓死。當然也面臨著臨界問題,當兩個窗口交界處,瞬時流量可能為2n。

02 滑動窗口

為了防止瞬時流量,可以把固定窗口近一步劃分成多個格子,每次向后移動一小格,而不是固定窗口大小,這就是滑動窗口(Sliding Window)。

比如每分鐘可以分為6個10秒中的單元格,每個格子中分別維護一個計數(shù)器,窗口每次向前滑動一個單元格。每當請求到達時,只要窗口中所有單元格的計數(shù)總和不超過閾值都可以放行。TCP協(xié)議中數(shù)據(jù)包的傳輸,同樣也是采用滑動窗口來進行流量控制。

實現(xiàn)如下:

public class SlidingWindowRateLimiter extends MyRateLimiter {
    /**
     * 每分鐘限制請求數(shù)
     */
    private final long permitsPerMinute;
    /**
     * 計數(shù)器, k-為當前窗口的開始時間值秒,value為當前窗口的計數(shù)
     */
    private final TreeMap<Long, Integer> counters;

    public SlidingWindowRateLimiter(long permitsPerMinute) {
        this.permitsPerMinute = permitsPerMinute;
        this.counters = new TreeMap<>();
    }

    @Override
    public synchronized boolean tryAcquire() {
        // 獲取當前時間的所在的子窗口值; 10s一個窗口
        long currentWindowTime = LocalDateTime.now().toEpochSecond(ZoneOffset.UTC) / 10 * 10;
        // 獲取當前窗口的請求總量
        int currentWindowCount = getCurrentWindowCount(currentWindowTime);
        if (currentWindowCount >= permitsPerMinute) {
            return false;
        }
        // 計數(shù)器 + 1
        counters.merge(currentWindowTime, 1, Integer::sum);
        return true;
    }
    /**
     * 獲取當前窗口中的所有請求數(shù)(并刪除所有無效的子窗口計數(shù)器)
     *
     * @param currentWindowTime 當前子窗口時間
     * @return 當前窗口中的計數(shù)
     */
    private int getCurrentWindowCount(long currentWindowTime) {
        // 計算出窗口的開始位置時間
        long startTime = currentWindowTime - 50;
        int result = 0;

        // 遍歷當前存儲的計數(shù)器,刪除無效的子窗口計數(shù)器,并累加當前窗口中的所有計數(shù)器之和
        Iterator<Map.Entry<Long, Integer>> iterator = counters.entrySet().iterator();
        while (iterator.hasNext()) {
            Map.Entry<Long, Integer> entry = iterator.next();
            if (entry.getKey() < startTime) {
                iterator.remove();
            } else {
                result += entry.getValue();
            }
        }
        return result;
    }
}

滑動窗口解決了計數(shù)器中的瞬時流量高峰問題,其實計數(shù)器算法也是滑動窗口的一種,只不過窗口沒有進行更細粒度單元的劃分。對比計數(shù)器可見,當窗口劃分的粒度越細,則流量控制更加精準和嚴格。

不過當窗口中流量到達閾值時,流量會瞬間切斷,在實際應用中我們要的限流效果往往不是把流量一下子掐斷,而是讓流量平滑地進入系統(tǒng)當中。

03 漏桶算法

如何更加平滑的限流?不妨看看漏桶算法(Leaky Bucket),請求就像水一樣以任意速度注入漏桶,而桶會按照固定的速率將水漏掉;當注入速度持續(xù)大于漏出的速度時,漏桶會變滿,此時新進入的請求將會被丟棄。限流整形是漏桶算法的兩個核心能力。

實現(xiàn)如下:

public class LeakyBucketRateLimiter extends MyRateLimiter {
    // 桶的容量
    private final int capacity;
    // 漏出速率
    private final int permitsPerSecond;
    // 剩余水量
    private long leftWater;
    // 上次注入時間
    private long timeStamp = System.currentTimeMillis();

    public LeakyBucketRateLimiter(int permitsPerSecond, int capacity) {
        this.capacity = capacity;
        this.permitsPerSecond = permitsPerSecond;
    }

    @Override
    public synchronized boolean tryAcquire() {
        //1. 計算剩余水量
        long now = System.currentTimeMillis();
        long timeGap = (now - timeStamp) / 1000;
        leftWater = Math.max(0, leftWater - timeGap * permitsPerSecond);
        timeStamp = now;
        
        // 如果未滿,則放行;否則限流
        if (leftWater < capacity) {
            leftWater += 1;
            return true;
        }
        return false;
    }
}

這并不是一個完整的漏桶算法的實現(xiàn),以上代碼中只是對流量是否會被拋棄進行校驗,即tryAcquire返回true表示漏桶未滿,否則表示漏桶已滿丟棄請求。

想要以恒定的速率漏出流量,通常還應配合一個FIFO隊列來實現(xiàn),當tryAcquire返回true時,將請求入隊,然后再以固定頻率從隊列中取出請求進行處理。示例代碼如下:

@Test
public void testLeakyBucketRateLimiter() throws InterruptedException {
    ScheduledExecutorService scheduledExecutorService = Executors.newSingleThreadScheduledExecutor();
    ExecutorService singleThread = Executors.newSingleThreadExecutor();

    LeakyBucketRateLimiter rateLimiter = new LeakyBucketRateLimiter(20, 20);
    // 存儲流量的隊列
    Queue<Integer> queue = new LinkedList<>();
    // 模擬請求  不確定速率注水
    singleThread.execute(() -> {
        int count = 0;
        while (true) {
            count++;
            boolean flag = rateLimiter.tryAcquire();
            if (flag) {
                queue.offer(count);
                System.out.println(count + "--------流量被放行--------");
            } else {
                System.out.println(count + "流量被限制");
            }
            try {
                Thread.sleep((long) (Math.random() * 1000));
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    });
  
    // 模擬處理請求 固定速率漏水
    scheduledExecutorService.scheduleAtFixedRate(() -> {
        if (!queue.isEmpty()) {
            System.out.println(queue.poll() + "被處理");
        }
    }, 0, 100, TimeUnit.MILLISECONDS);

    // 保證主線程不會退出
    while (true) {
        Thread.sleep(10000);
    }
}

漏桶算法存在目的主要是用來平滑突發(fā)的流量,提供一種機制來確保網(wǎng)絡中的突發(fā)流量被整合成平滑穩(wěn)定的額流量。

不過由于漏桶對流量的控制過于嚴格,在有些場景下不能充分使用系統(tǒng)資源,因為漏桶的漏出速率是固定的,即使在某一時刻下游能夠處理更大的流量,漏桶也不允許突發(fā)流量通過。

04 令牌桶

如何在夠限制流量速率的前提下,又能夠允許突發(fā)流量呢?令牌桶算法了解一下!令牌桶算法是以恒定速率向令牌桶發(fā)送令牌,請求到達時,嘗試從令牌桶中拿令牌,只有拿到令牌才能夠放行,否則將會被拒絕。

<img src="https://source.mycookies.cn/0233143ca414e9057a682fb8f45b5772.jpg" style="zoom:80%;" />

令牌桶具有以下特點:

  1. 以恒定的速率發(fā)放令牌,假設限流速率為v/s,則表示每1/v秒發(fā)放一個令牌

  2. 假設令牌桶容量是b,如果令牌桶已滿,則新的令牌會被丟棄

  3. 請求能夠通過限流器的前提是令牌桶中有令牌

令牌桶算法中值得關注的參數(shù)有兩個,即限流速率v/s,和令牌桶容量b;速率a表示限流器一般情況下的限流速率,而b則是burst的簡寫,表示限流器允許的最大突發(fā)流量。

比如b=10,當令牌桶滿的時候有10個可用令牌,此時允許10個請求同時通過限流器(允許流量一定程度的突發(fā)),這10個請求瞬間消耗完令牌后,后續(xù)的流量只能按照速率r通過限流器。

實現(xiàn)如下:

public class TokenBucketRateLimiter extends MyRateLimiter {
    /**
     * 令牌桶的容量「限流器允許的最大突發(fā)流量」
     */
    private final long capacity;
    /**
     * 令牌發(fā)放速率
     */
    private final long generatedPerSeconds;
    /**
     * 最后一個令牌發(fā)放的時間
     */
    long lastTokenTime = System.currentTimeMillis();
    /**
     * 當前令牌數(shù)量
     */
    private long currentTokens;

    public TokenBucketRateLimiter(long generatedPerSeconds, int capacity) {
        this.generatedPerSeconds = generatedPerSeconds;
        this.capacity = capacity;
    }

    /**
     * 嘗試獲取令牌
     *
     * @return true表示獲取到令牌,放行;否則為限流
     */
    @Override
    public synchronized boolean tryAcquire() {
          /**
           * 計算令牌當前數(shù)量
           * 請求時間在最后令牌是產(chǎn)生時間相差大于等于額1s(為啥時1s?因為生成令牌的最小時間單位時s),則
           * 1. 重新計算令牌桶中的令牌數(shù)
           * 2. 將最后一個令牌發(fā)放時間重置為當前時間
           */
        long now = System.currentTimeMillis();
        if (now - lastTokenTime >= 1000) {
            long newPermits = (now - lastTokenTime) / 1000 * generatedPerSeconds;
            currentTokens = Math.min(currentTokens + newPermits, capacity);
            lastTokenTime = now;
        }
        if (currentTokens > 0) {
            currentTokens--;
            return true;
        }
        return false;
    }
}

需要主意的是,非常容易被想到的實現(xiàn)是生產(chǎn)者消費者模式;用一個生產(chǎn)者線程定時向阻塞隊列中添加令牌,而試圖通過限流器的線程則作為消費者線程,只有從阻塞隊列中獲取到令牌,才允許通過限流器。

由于線程調度的不確定性,在高并發(fā)場景時,定時器誤差非常大,同時定時器本身會創(chuàng)建調度線程,也會對系統(tǒng)的性能產(chǎn)生影響。

05 滑動日志

滑動日志是一個比較“冷門”,但是確實好用的限流算法。滑動日志限速算法需要記錄請求的時間戳,通常使用有序集合來存儲,我們可以在單個有序集合中跟蹤用戶在一個時間段內(nèi)所有的請求。

假設我們要限制給定T時間內(nèi)的請求不超過N,我們只需要存儲最近T時間之內(nèi)的請求日志,每當請求到來時判斷最近T時間內(nèi)的請求總數(shù)是否超過閾值。

實現(xiàn)如下:

public class SlidingLogRateLimiter extends MyRateLimiter {
    /**
     * 每分鐘限制請求數(shù)
     */
    private static final long PERMITS_PER_MINUTE = 60;
    /**
     * 請求日志計數(shù)器, k-為請求的時間(秒),value當前時間的請求數(shù)量
     */
    private final TreeMap<Long, Integer> requestLogCountMap = new TreeMap<>();

    @Override
    public synchronized boolean tryAcquire() {
        // 最小時間粒度為s
        long currentTimestamp = LocalDateTime.now().toEpochSecond(ZoneOffset.UTC);
        // 獲取當前窗口的請求總數(shù)
        int currentWindowCount = getCurrentWindowCount(currentTimestamp);
        if (currentWindowCount >= PERMITS_PER_MINUTE) {
            return false;
        }
        // 請求成功,將當前請求日志加入到日志中
        requestLogCountMap.merge(currentTimestamp, 1, Integer::sum);
        return true;
    }

    /**
     * 統(tǒng)計當前時間窗口內(nèi)的請求數(shù)
     *
     * @param currentTime 當前時間
     * @return -
     */
    private int getCurrentWindowCount(long currentTime) {
        // 計算出窗口的開始位置時間
        long startTime = currentTime - 59;
        // 遍歷當前存儲的計數(shù)器,刪除無效的子窗口計數(shù)器,并累加當前窗口中的所有計數(shù)器之和
        return requestLogCountMap.entrySet()
                .stream()
                .filter(entry -> entry.getKey() >= startTime)
                .mapToInt(Map.Entry::getValue)
                .sum();
    }
}

滑動日志能夠避免突發(fā)流量,實現(xiàn)較為精準的限流;同樣更加靈活,能夠支持更加復雜的限流策略,如多級限流,每分鐘不超過100次,每小時不超過300次,每天不超過1000次,我們只需要保存最近24小時所有的請求日志即可實現(xiàn)。

靈活并不是沒有代價的,帶來的缺點就是占用存儲空間要高于其他限流算法。

06 分布式限流

以上幾種限流算法的實現(xiàn)都僅適合單機限流。雖然給每臺機器平均分配限流配額可以達到限流的目的,但是由于機器性能,流量分布不均以及計算數(shù)量動態(tài)變化等問題,單機限流在分布式場景中的效果總是差強人意。

分布式限流最簡單的實現(xiàn)就是利用中心化存儲,即將單機限流存儲在本地的數(shù)據(jù)存儲到同一個存儲空間中,如常見的Redis等。

當然也可以從上層流量入口進行限流,Nginx代理服務就提供了限流模塊,同樣能夠實現(xiàn)高性能,精準的限流,其底層是漏桶算法。

07 總結

  1. 固定窗口算法實現(xiàn)簡單,性能高,但是會有臨界突發(fā)流量問題,瞬時流量最大可以達到閾值的2倍。

  2. 為了解決臨界突發(fā)流量,可以將窗口劃分為多個更細粒度的單元,每次窗口向右移動一個單元,于是便有了滑動窗口算法。

    滑動窗口當流量到達閾值時會瞬間掐斷流量,所以導致流量不夠平滑。

  3. 想要達到限流的目的,又不會掐斷流量,使得流量更加平滑?可以考慮漏桶算法!需要注意的是,漏桶算法通常配置一個FIFO的隊列使用以達到允許限流的作用。

    由于速率固定,即使在某個時刻下游處理能力過剩,也不能得到很好的利用,這是漏桶算法的一個短板。

  4. 限流和瞬時流量其實并不矛盾,在大多數(shù)場景中,短時間突發(fā)流量系統(tǒng)是完全可以接受的。令牌桶算法就是不二之選了,令牌桶以固定的速率v產(chǎn)生令牌放入一個固定容量為n的桶中,當請求到達時嘗試從桶中獲取令牌。

    當桶滿時,允許最大瞬時流量為n;當桶中沒有剩余流量時則限流速率最低,為令牌生成的速率v。

  5. 如何實現(xiàn)更加靈活的多級限流呢?滑動日志限流算法了解一下!這里的日志則是請求的時間戳,通過計算制定時間段內(nèi)請求總數(shù)來實現(xiàn)靈活的限流。

    當然,由于需要存儲時間戳信息,其占用的存儲空間要比其他限流算法要大得多。

不管黑貓白貓,能抓到老鼠的就是好貓。限流算法并沒有絕對的好劣之分,如何選擇合適的限流算法呢?不妨從性能,是否允許超出閾值,落地成本流量平滑度,是否允許突發(fā)流量以及系統(tǒng)資源大小限制多方面考慮。

當然,市面上也有比較成熟的限流工具和框架。如Google出品的Guava中基于令牌桶實現(xiàn)的限流組件,拿來即用;以及alibaba開源的面向分布式服務架構的流量控制框架Sentinel更會讓你愛不釋手,它是基于滑動窗口實現(xiàn)的。

看后點贊,養(yǎng)成習慣!本次分享就到這里,我們下期見!

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容