手寫LRU緩存淘汰算法

背景

在我們這個日益追求高效的世界，我們對任何事情的等待都顯得十分的浮躁，網(wǎng)頁頁面刷新不出來，好煩，電腦打開運行程序慢，又是好煩！那怎么辦，技術(shù)的產(chǎn)生不就是我們所服務么，今天我們就聊一聊緩存這個技術(shù)，并使用我們熟知的數(shù)據(jù)結(jié)構(gòu)--用鏈表實現(xiàn)LRU緩存淘汰算法。

在學習如何使用鏈表實現(xiàn)LRU緩存淘汰算法前，我們先提出幾個問題，大家好好思考下，問題如下：

什么是緩存，緩存的作用？
緩存的淘汰策略有哪些？
如何使用鏈表實現(xiàn)LRU緩存淘汰算法，有什么特點，如何優(yōu)化？

好了，我們帶著上面的問題來學進行下面的學習。

1、什么是緩存，緩存的作用是什么?

緩存可以簡單的理解為保存數(shù)據(jù)的一個副本，以便于后續(xù)能夠快速的進行訪問。以計算機的使用場景為例，當cpu要訪問內(nèi)存中的一條數(shù)據(jù)時，它會先在緩存里查找，如果能夠找到則直接使用，如果沒找到，則需要去內(nèi)存里查找；

同樣的，在數(shù)據(jù)庫的訪問場景中，當項目系統(tǒng)需要查詢數(shù)據(jù)庫中的某條數(shù)據(jù)時，可以先讓請求查詢緩存，如果命中，就直接返回緩存的結(jié)果，如果沒有命中，就查詢數(shù)據(jù)庫，并將查詢結(jié)果放入緩存，下次請求時查詢緩存命中，直接返回結(jié)果，就不用再次查詢數(shù)據(jù)庫。

通過以上兩個例子，我們發(fā)現(xiàn)無論在哪種場景下，都存在這樣一個順序：先緩存，后內(nèi)存；先緩存，后數(shù)據(jù)庫。但是緩存的存在也占用了一部分內(nèi)存空間，所以緩存是典型的以空間換時間，犧牲數(shù)據(jù)的實時性，卻滿足計算機運行的高效性。

仔細想一下，我們?nèi)粘ｉ_發(fā)中遇到緩存的例子還挺多的。

操作系統(tǒng)的緩存

減少與磁盤的交互

數(shù)據(jù)庫緩存

減少對數(shù)據(jù)庫的查詢

Web服務器緩存

減少對應用服務器的請求

客戶瀏覽器的緩存

減少對網(wǎng)站的訪問

2、緩存有哪些淘汰策略?

緩存的本質(zhì)是以空間換時間，那么緩存的容量大小肯定是有限的，當緩存被占滿時，緩存中的那些數(shù)據(jù)應該被清理出去，那些數(shù)據(jù)應該被保留呢？這就需要緩存的淘汰策略來決定。

事實上，常用的緩存的淘汰策略有三種：先進先出算法(First in First out FIFO)；淘汰一定時期內(nèi)被訪問次數(shù)最少的頁面(Least Frequently Used LFU)；淘汰最長時間未被使用的頁面(Least Recently Used LRU)

這些算法在不同層次的緩存上執(zhí)行時具有不同的效率，需要結(jié)合具體的場景來選擇。

2.1 FIFO算法

FIFO算法即先進先出算法，常采用隊列實現(xiàn)。在緩存中，它的設計原則是：如果一個數(shù)據(jù)最先進入緩存中，則應該最早淘汰掉。

image-20210227115124480

新訪問的數(shù)據(jù)插入FIFO隊列的尾部，隊列中數(shù)據(jù)由隊到隊頭按順序順序移動
隊列滿時，刪除隊頭的數(shù)據(jù)

2.2 LRU算法

LRU算法是根據(jù)對數(shù)據(jù)的歷史訪問次數(shù)來進行淘汰數(shù)據(jù)的，通常使用鏈表來實現(xiàn)。在緩存中，它的設計原則是：如果數(shù)據(jù)最近被訪問過，那么將來它被訪問的幾率也很高。

image-20210227120433527

新加入的數(shù)據(jù)插入到鏈表的頭部
每當緩存命中時(即緩存數(shù)據(jù)被訪問)，則將數(shù)據(jù)移到鏈表頭部
當來鏈表已滿的時候，將鏈表尾部的數(shù)據(jù)丟棄

2.3 LFU算法

LFU算法是根據(jù)數(shù)據(jù)的歷史訪問頻率來淘汰數(shù)據(jù)，因此，LFU算法中的每個數(shù)據(jù)塊都有一個引用計數(shù)，所有數(shù)據(jù)塊按照引用計數(shù)排序，具有相同引用計數(shù)的數(shù)據(jù)塊則按照時間排序。在緩存中，它的設計原則是：如果數(shù)據(jù)被訪問多次，那么將來它的訪問頻率也會更高。

image-20210227121952816

新加入數(shù)據(jù)插入到隊列尾部（引用計數(shù)為1；
隊列中的數(shù)據(jù)被訪問后，引用計數(shù)增加，隊列重新排序；
當需要淘汰數(shù)據(jù)時，將已經(jīng)排序的列表最后的數(shù)據(jù)塊刪除。

3、如何使用鏈表實現(xiàn)緩存淘汰，有什么特點，如何優(yōu)化？

在上面的文章中我們理解了緩存的概念及淘汰策略，其中LRU算法是筆試/面試中考察比較頻繁的，我秋招的時候，很多公司都讓我手寫了這個算法，為了避免大家采坑，下面，我們就手寫一個LRU緩存淘汰算法。

我們都知道鏈表的形式不止一種，我們應該選擇哪一種呢？

思考三分鐘........

好了，公布答案！

事實上，鏈表按照不同的連接結(jié)構(gòu)可以劃分為單鏈表、循環(huán)鏈表和雙向鏈表。

單鏈表

每個節(jié)點只包含一個指針，即后繼指針。

單鏈表有兩個特殊的節(jié)點，即首節(jié)點和尾節(jié)點，用首節(jié)點地址表示整條鏈表，尾節(jié)點的后繼指針指向空地址null。

性能特點：插入和刪除節(jié)點的時間復雜度為O(1)，查找的時間復雜度為O(n)。

循環(huán)鏈表

除了尾節(jié)點的后繼指針指向首節(jié)點的地址外均與單鏈表一致。

適用于存儲有循環(huán)特點的數(shù)據(jù)，比如約瑟夫問題。

雙向鏈表

節(jié)點除了存儲數(shù)據(jù)外，還有兩個指針分別指向前一個節(jié)點地址（前驅(qū)指針prev）和下一個節(jié)點地址（后繼指針next）

首節(jié)點的前驅(qū)指針prev和尾節(jié)點的后繼指針均指向空地址。

雙向鏈表相較于單鏈表的一大優(yōu)勢在于：找到前驅(qū)節(jié)點的時間復雜度為O(1)，而單鏈表只能從頭節(jié)點慢慢往下找，所以仍然是O(n).而且，對于插入和刪除也是有優(yōu)化的。

我們可能會有問題：單鏈表的插入刪除不是O(1)嗎？

是的，但是一般情況下，我們想要進行插入刪除操作，很多時候還是得先進行查找，再插入或者刪除，可見其實是先O(n),再O(1)。

不熟悉鏈表解題的同學可以先看看我的上一篇算法解析文章刷了LeetCode鏈表專題，我發(fā)現(xiàn)了一個秘密。

因為我們需要刪除操作，刪除一個節(jié)點不僅要得到該節(jié)點本身的指針，也需要操作其它前驅(qū)節(jié)點的指針，而雙向鏈表能夠直接找到前驅(qū)，保證了操作時間復雜度為O(1)，因此使用雙向鏈表作為實現(xiàn)LRU緩存淘汰算法的結(jié)構(gòu)會更高效。

算法思路

維護一個雙向鏈表，保存所有緩存的值，并且最老的值放在鏈表最后面。

當訪問的值在鏈表中時：將找到鏈表中值將其刪除，并重新在鏈表頭添加該值（保證鏈表中數(shù)值的順序是從新到舊）
當訪問的值不在鏈表中時：當鏈表已滿：刪除鏈表最后一個值，將要添加的值放在鏈表頭當鏈表未滿：直接在鏈表頭添加

3.1 LRU緩存淘汰算法

極客時間王爭的《數(shù)據(jù)結(jié)構(gòu)與算法之美》給出了一個使用有序單鏈表實現(xiàn)LRU緩存淘汰算法，代碼如下：

public class LRUBaseLinkedList<T> {

    /**
     * 默認鏈表容量
     */
    private final static Integer DEFAULT_CAPACITY = 10;

    /**
     * 頭結(jié)點
     */
    private SNode<T> headNode;

    /**
     * 鏈表長度
     */
    private Integer length;

    /**
     * 鏈表容量
     */
    private Integer capacity;

    public LRUBaseLinkedList() {
        this.headNode = new SNode<>();
        this.capacity = DEFAULT_CAPACITY;
        this.length = 0;
    }

    public LRUBaseLinkedList(Integer capacity) {
        this.headNode = new SNode<>();
        this.capacity = capacity;
        this.length = 0;
    }

    public void add(T data) {
        SNode preNode = findPreNode(data);

        // 鏈表中存在，刪除原數(shù)據(jù)，再插入到鏈表的頭部
        if (preNode != null) {
            deleteElemOptim(preNode);
            intsertElemAtBegin(data);
        } else {
            if (length >= this.capacity) {
                //刪除尾結(jié)點
                deleteElemAtEnd();
            }
            intsertElemAtBegin(data);
        }
    }

    /**
     * 刪除preNode結(jié)點下一個元素
     *
     * @param preNode
     */
    private void deleteElemOptim(SNode preNode) {
        SNode temp = preNode.getNext();
        preNode.setNext(temp.getNext());
        temp = null;
        length--;
    }

    /**
     * 鏈表頭部插入節(jié)點
     *
     * @param data
     */
    private void intsertElemAtBegin(T data) {
        SNode next = headNode.getNext();
        headNode.setNext(new SNode(data, next));
        length++;
    }

    /**
     * 獲取查找到元素的前一個結(jié)點
     *
     * @param data
     * @return
     */
    private SNode findPreNode(T data) {
        SNode node = headNode;
        while (node.getNext() != null) {
            if (data.equals(node.getNext().getElement())) {
                return node;
            }
            node = node.getNext();
        }
        return null;
    }

    /**
     * 刪除尾結(jié)點
     */
    private void deleteElemAtEnd() {
        SNode ptr = headNode;
        // 空鏈表直接返回
        if (ptr.getNext() == null) {
            return;
        }

        // 倒數(shù)第二個結(jié)點
        while (ptr.getNext().getNext() != null) {
            ptr = ptr.getNext();
        }

        SNode tmp = ptr.getNext();
        ptr.setNext(null);
        tmp = null;
        length--;
    }

    private void printAll() {
        SNode node = headNode.getNext();
        while (node != null) {
            System.out.print(node.getElement() + ",");
            node = node.getNext();
        }
        System.out.println();
    }

    public class SNode<T> {

        private T element;

        private SNode next;

        public SNode(T element) {
            this.element = element;
        }

        public SNode(T element, SNode next) {
            this.element = element;
            this.next = next;
        }

        public SNode() {
            this.next = null;
        }

        public T getElement() {
            return element;
        }

        public void setElement(T element) {
            this.element = element;
        }

        public SNode getNext() {
            return next;
        }

        public void setNext(SNode next) {
            this.next = next;
        }
    }

    public static void main(String[] args) {
        LRUBaseLinkedList list = new LRUBaseLinkedList();
        Scanner sc = new Scanner(System.in);
        while (true) {
            list.add(sc.nextInt());
            list.printAll();
        }
    }
}

這段代碼不管緩存有沒有滿，都需要遍歷一遍鏈表，所以這種基于鏈表的實現(xiàn)思路，緩存訪問的時間復雜度為 O(n)。

3.2使用哈希表優(yōu)化LRU

事實上，這個思路還可以繼續(xù)優(yōu)化，我們可以把單鏈表換成雙向鏈表，并引入散列表。

雙向鏈表支持查找前驅(qū)，保證操作的時間復雜度為O(1)
引入散列表記錄每個數(shù)據(jù)的位置，將緩存訪問的時間復雜度降到O(1)

哈希表查找較快，但是數(shù)據(jù)無固定的順序；鏈表倒是有順序之分。插入、刪除較快，但是查找較慢。將它們結(jié)合，就可以形成一種新的數(shù)據(jù)結(jié)構(gòu)--哈希鏈表(LinkedHashMap)

image-20210227203448255

力扣上146題-LRU緩存機制剛好可以拿來練手，題圖如下：

題目：

運用你所掌握的數(shù)據(jù)結(jié)構(gòu)，設計和實現(xiàn)一個 LRU (最近最少使用) 緩存機制。

實現(xiàn) LRUCache 類：

LRUCache(int capacity) 以正整數(shù)作為容量 capacity 初始化 LRU 緩存
int get(int key) 如果關鍵字 key 存在于緩存中，則返回關鍵字的值，否則返回 -1 。
void put(int key, int value) 如果關鍵字已經(jīng)存在，則變更其數(shù)據(jù)值；如果關鍵字不存在，則插入該組「關鍵字-值」。當緩存容量達到上限時，它應該在寫入新數(shù)據(jù)之前刪除最久未使用的數(shù)據(jù)值，從而為新的數(shù)據(jù)值留出空間。

思路：

我們的思路就是哈希表+雙向鏈表

哈希表用于滿足題目時間復雜度O(1)的要求，雙向鏈表用于存儲順序
哈希表鍵值類型：<Integer, ListNode>，哈希表的鍵用于存儲輸入的key，哈希表的值用于存儲雙向鏈表的節(jié)點
雙向鏈表的節(jié)點中除了value外還需要包含key，因為在刪除最久未使用的數(shù)據(jù)時，需要通過鏈表來定位hashmap中應當刪除的鍵值對
一些操作：雙向鏈表中，在后面的節(jié)點表示被最近訪問

新加入的節(jié)點放在鏈表末尾，addNodeToLast(node)

若容量達到上限，去除最久未使用的數(shù)據(jù)，removeNode(head.next)

若數(shù)據(jù)新被訪問過，比如被get了或被put了新值，把該節(jié)點挪到鏈表末尾，moveNodeToLast(node)

為了操作的方便，在雙向鏈表頭和尾分別定義一個head和tail節(jié)點。

代碼

class LRUCache {
    private int capacity;
    private HashMap<Integer, ListNode> hashmap; 
    private ListNode head;
    private ListNode tail;

    private class ListNode{
        int key;
        int val;
        ListNode prev;
        ListNode next;
        public ListNode(){  
        }
        public ListNode(int key, int val){
            this.key = key;
            this.val = val;
        }
    }

    public LRUCache(int capacity) {
        this.capacity = capacity;
        hashmap = new HashMap<>();
        head = new ListNode();
        tail = new ListNode();
        head.next = tail;
        tail.prev = head;
    }

    private void removeNode(ListNode node){
        node.prev.next = node.next;
        node.next.prev = node.prev;
    }

    private void addNodeToLast(ListNode node){
        node.prev = tail.prev;
        node.prev.next = node;
        node.next = tail;
        tail.prev= node;
    }

    private void moveNodeToLast(ListNode node){
        removeNode(node);
        addNodeToLast(node);
    }
    
    public int get(int key) {   
        if(hashmap.containsKey(key)){
            ListNode node = hashmap.get(key);
            moveNodeToLast(node);
            return node.val;
        }else{
            return -1;
        }
    }
    
    public void put(int key, int value) {
        if(hashmap.containsKey(key)){
            ListNode node = hashmap.get(key);
            node.val = value;
            moveNodeToLast(node);
            return;
        }
        if(hashmap.size() == capacity){
            hashmap.remove(head.next.key);
            removeNode(head.next);
        }

        ListNode node = new ListNode(key, value);
        hashmap.put(key, node);
        addNodeToLast(node);
    }
}

巨人的肩膀

[1]數(shù)據(jù)結(jié)構(gòu)與算法之美-王爭

[2]力扣-LRU緩存機制(146題)

[3]https://blog.csdn.net/yangpl_tale/article/details/44998423

[4]https://leetcode-cn.com/problems/lru-cache/solution/146-lru-huan-cun-ji-zhi-ha-xi-biao-shuan-l3um/

本文由博客群發(fā)一文多發(fā)等運營工具平臺 OpenWrite 發(fā)布

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

手寫LRU緩存淘汰算法