18 張圖,一文了解 8 種常見的數(shù)據(jù)結(jié)構(gòu)

前幾天和敖丙交流,他說我們寫作的人都是在不停地燃燒自己,所以需要不停地補充燃料。對于他的觀點,我不能再茍同了——所以我開始狂補計算機方面的基礎(chǔ)知識,這其中就包括我相對薄弱的數(shù)據(jù)結(jié)構(gòu)。

百度百科對數(shù)據(jù)結(jié)構(gòu)的定義是:相互之間存在一種或多種特定關(guān)系的數(shù)據(jù)元素的集合。定義很抽象,需要大聲地朗讀幾遍,才有點感覺。怎么讓這種感覺來得更強烈,更親切一些呢?我來列舉一下常見的 8 種數(shù)據(jù)結(jié)構(gòu),數(shù)組、鏈表、棧、隊列、樹、堆、圖、哈希表。

這 8 種數(shù)據(jù)結(jié)構(gòu)有什么區(qū)別呢?

①、數(shù)組

優(yōu)點:

  • 按照索引查詢元素的速度很快;
  • 按照索引遍歷數(shù)組也很方便。

缺點:

  • 數(shù)組的大小在創(chuàng)建后就確定了,無法擴容;
  • 數(shù)組只能存儲一種類型的數(shù)據(jù);
  • 添加、刪除元素的操作很耗時間,因為要移動其他元素。

②、鏈表

《算法(第 4 版)》一書中是這樣定義鏈表的:

鏈表是一種遞歸的數(shù)據(jù)結(jié)構(gòu),它或者為空(null),或者是指向一個結(jié)點(node)的引用,該節(jié)點還有一個元素和一個指向另一條鏈表的引用。

Java 的 LinkedList 類可以很形象地通過代碼的形式來表示一個鏈表的結(jié)構(gòu):

public class LinkedList<E> {
    transient Node<E> first;
    transient Node<E> last;

    private static class Node<E> {
        E item;
        Node<E> next;
        Node<E> prev;

        Node(Node<E> prev, E element, Node<E> next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
    }
}

這是一種雙向鏈表,當(dāng)前元素 item 既有 prev 又有 next,不過 first 的 prev 為 null,last 的 next 為 null。如果是單向鏈表的話,就只有 next,沒有 prev。

單向鏈表的缺點是只能從頭到尾依次遍歷,而雙向鏈表可進可退,既能找到下一個,也能找到上一個——每個節(jié)點上都需要多分配一個存儲空間。

鏈表中的數(shù)據(jù)按照“鏈式”的結(jié)構(gòu)存儲,因此可以達到內(nèi)存上非連續(xù)的效果,數(shù)組必須是一塊連續(xù)的內(nèi)存。

由于不必按照順序的方式存儲,鏈表在插入、刪除的時候可以達到 O(1) 的時間復(fù)雜度(只需要重新指向引用即可,不需要像數(shù)組那樣移動其他元素)。除此之外,鏈表還克服了數(shù)組必須預(yù)先知道數(shù)據(jù)大小的缺點,從而可以實現(xiàn)靈活的內(nèi)存動態(tài)管理。

優(yōu)點:

  • 不需要初始化容量;
  • 可以添加任意元素;
  • 插入和刪除的時候只需要更新引用。

缺點:

  • 含有大量的引用,占用的內(nèi)存空間大;
  • 查找元素需要遍歷整個鏈表,耗時。

③、棧

棧就好像水桶一樣,底部是密封的,頂部是開口,水可以進可以出。用過水桶的小伙伴應(yīng)該明白這樣一個道理:先進去的水在桶的底部,后進去的水在桶的頂部;后進去的水先被倒出來,先進去的水后被倒出來。

同理,棧按照“后進先出”、“先進后出”的原則來存儲數(shù)據(jù),先插入的數(shù)據(jù)被壓入棧底,后插入的數(shù)據(jù)在棧頂,讀出數(shù)據(jù)的時候,從棧頂開始依次讀出。

④、隊列

隊列就好像一段水管一樣,兩端都是開口的,水從一端進去,然后從另外一端出來。先進去的水先出來,后進去的水后出來。

和水管有些不同的是,隊列會對兩端進行定義,一端叫隊頭,另外一端就叫隊尾。隊頭只允許刪除操作(出隊),隊尾只允許插入操作(入隊)。

注意,棧是先進后出,隊列是先進先出——兩者雖然都是線性表,但原則是不同的,結(jié)構(gòu)不一樣嘛。

⑤、樹

樹是一種典型的非線性結(jié)構(gòu),它是由 n(n>0)個有限節(jié)點組成的一個具有層次關(guān)系的集合。

之所以叫“樹”,是因為這種數(shù)據(jù)結(jié)構(gòu)看起來就像是一個倒掛的樹,只不過根在上,葉在下。樹形數(shù)據(jù)結(jié)構(gòu)有以下這些特點:

  • 每個節(jié)點都只有有限個子節(jié)點或無子節(jié)點;
  • 沒有父節(jié)點的節(jié)點稱為根節(jié)點;
  • 每一個非根節(jié)點有且只有一個父節(jié)點;
  • 除了根節(jié)點外,每個子節(jié)點可以分為多個不相交的子樹。

下圖展示了樹的一些術(shù)語:

根節(jié)點是第 0 層,它的子節(jié)點是第 1 層,子節(jié)點的子節(jié)點為第 2 層,以此類推。

  • 深度:對于任意節(jié)點 n,n 的深度為從根到 n 的唯一路徑長,根的深度為 0。
  • 高度:對于任意節(jié)點 n,n 的高度為從 n 到一片樹葉的最長路徑長,所有樹葉的高度為 0。

樹的種類有很多種,常見的有:

  • 無序樹:樹中任意節(jié)點的子節(jié)點之間沒有順序關(guān)系。那怎么來理解無序樹呢,到底長什么樣子?

假如有三個節(jié)點,一個是父節(jié)點,兩個是同級的子節(jié)點,那么就有三種情況:

假如有三個節(jié)點,一個是父節(jié)點,兩個是不同級的子節(jié)點,那么就有六種情況:

三個節(jié)點組成的無序樹,合起來就是九種情況。

  • 二叉樹:每個節(jié)點最多含有兩個子樹。二叉樹按照不同的表現(xiàn)形式又可以分為多種。

完全二叉樹:對于一顆二叉樹,假設(shè)其深度為 d(d > 1)。除了第 d 層,其它各層的節(jié)點數(shù)目均已達最大值,且第 d 層所有節(jié)點從左向右連續(xù)地緊密排列,這樣的二叉樹被稱為完全二叉樹。

拿上圖來說,d 為 3,除了第 3 層,第 1 層、第 2 層 都達到了最大值(2 個子節(jié)點),并且第 3 層的所有節(jié)點從左向右聯(lián)系地緊密排列(H、I、J、K、L),符合完全二叉樹的要求。

滿二叉樹:一顆每一層的節(jié)點數(shù)都達到了最大值的二叉樹。有兩種表現(xiàn)形式,第一種,像下圖這樣(每一層都是滿的),滿足每一層的節(jié)點數(shù)都達到了最大值 2。

第二種,像下圖這樣(每一層雖然不滿),但每一層的節(jié)點數(shù)仍然達到了最大值 2。

二叉查找樹:英文名叫 Binary Search Tree,即 BST,需要滿足以下條件:

  • 任意節(jié)點的左子樹不空,左子樹上所有節(jié)點的值均小于它的根節(jié)點的值;
  • 任意節(jié)點的右子樹不空,右子樹上所有節(jié)點的值均大于它的根節(jié)點的值;
  • 任意節(jié)點的左、右子樹也分別為二叉查找樹。

基于二叉查找樹的特點,它相比較于其他數(shù)據(jù)結(jié)構(gòu)的優(yōu)勢就在于查找、插入的時間復(fù)雜度較低,為 O(logn)。假如我們要從上圖中查找 5 個元素,先從根節(jié)點 7 開始找,5 必定在 7 的左側(cè),找到 4,那 5 必定在 4 的右側(cè),找到 6,那 5 必定在 6 的左側(cè),找到了。

理想情況下,通過 BST 查找節(jié)點,所需要檢查的節(jié)點數(shù)可以減半。

平衡二叉樹:當(dāng)且僅當(dāng)任何節(jié)點的兩棵子樹的高度差不大于 1 的二叉樹。由前蘇聯(lián)的數(shù)學(xué)家 Adelse-Velskil 和 Landis 在 1962 年提出的高度平衡的二叉樹,根據(jù)科學(xué)家的英文名也稱為 AVL 樹。

平衡二叉樹本質(zhì)上也是一顆二叉查找樹,不過為了限制左右子樹的高度差,避免出現(xiàn)傾斜樹等偏向于線性結(jié)構(gòu)演化的情況,所以對二叉搜索樹中每個節(jié)點的左右子樹作了限制,左右子樹的高度差稱之為平衡因子,樹中每個節(jié)點的平衡因子絕對值不大于 1。

平衡二叉樹的難點在于,當(dāng)刪除或者增加節(jié)點的情況下,如何通過左旋或者右旋的方式來保持左右平衡。

Java 中最常見的平衡二叉樹就是紅黑樹,節(jié)點是紅色或者黑色,通過顏色的約束來維持著二叉樹的平衡:

1)每個節(jié)點都只能是紅色或者黑色

2)根節(jié)點是黑色

3)每個葉節(jié)點(NIL 節(jié)點,空節(jié)點)是黑色的。

4)如果一個節(jié)點是紅色的,則它兩個子節(jié)點都是黑色的。也就是說在一條路徑上不能出現(xiàn)相鄰的兩個紅色節(jié)點。

5)從任一節(jié)點到其每個葉子的所有路徑都包含相同數(shù)目的黑色節(jié)點。

  • B 樹:一種對讀寫操作進行優(yōu)化的自平衡的二叉查找樹,能夠保持數(shù)據(jù)有序,擁有多于兩個的子樹。數(shù)據(jù)庫的索引技術(shù)里就用到了 B 樹。

⑥、堆

堆可以被看做是一棵樹的數(shù)組對象,具有以下特點:

  • 堆中某個節(jié)點的值總是不大于或不小于其父節(jié)點的值;
  • 堆總是一棵完全二叉樹。

將根節(jié)點最大的堆叫做最大堆或大根堆,根節(jié)點最小的堆叫做最小堆或小根堆。

⑦、圖

圖是一種復(fù)雜的非線性結(jié)構(gòu),由頂點的有窮非空集合和頂點之間邊的集合組成,通常表示為:G(V,E),其中,G 表示一個圖,V 是圖 G 中頂點的集合,E 是圖 G 中邊的集合。

上圖共有 V0,V1,V2,V3 這 4 個頂點,4 個頂點之間共有 5 條邊。

在線性結(jié)構(gòu)中,數(shù)據(jù)元素之間滿足唯一的線性關(guān)系,每個數(shù)據(jù)元素(除第一個和最后一個外)均有唯一的“前驅(qū)”和“后繼”;

在樹形結(jié)構(gòu)中,數(shù)據(jù)元素之間有著明顯的層次關(guān)系,并且每個數(shù)據(jù)元素只與上一層中的一個元素(父節(jié)點)及下一層的多個元素(子節(jié)點)相關(guān);

而在圖形結(jié)構(gòu)中,節(jié)點之間的關(guān)系是任意的,圖中任意兩個數(shù)據(jù)元素之間都有可能相關(guān)。

⑧、哈希表

哈希表(Hash Table),也叫散列表,是一種可以通過關(guān)鍵碼值(key-value)直接訪問的數(shù)據(jù)結(jié)構(gòu),它最大的特點就是可以快速實現(xiàn)查找、插入和刪除。

數(shù)組的最大特點就是查找容易,插入和刪除困難;而鏈表正好相反,查找困難,而插入和刪除容易。哈希表很完美地結(jié)合了兩者的優(yōu)點, Java 的 HashMap 在此基礎(chǔ)上還加入了樹的優(yōu)點。

哈希函數(shù)在哈希表中起著?常關(guān)鍵的作?,它可以把任意長度的輸入變換成固定長度的輸出,該輸出就是哈希值。哈希函數(shù)使得一個數(shù)據(jù)序列的訪問過程變得更加迅速有效,通過哈希函數(shù),數(shù)據(jù)元素能夠被很快的進行定位。

若關(guān)鍵字為 k,則其值存放在 hash(k) 的存儲位置上。由此,不需要遍歷就可以直接取得 k 對應(yīng)的值。

對于任意兩個不同的數(shù)據(jù)塊,其哈希值相同的可能性極小,也就是說,對于一個給定的數(shù)據(jù)塊,找到和它哈希值相同的數(shù)據(jù)塊極為困難。再者,對于一個數(shù)據(jù)塊,哪怕只改動它的一個比特位,其哈希值的改動也會非常的大——這正是 Hash 存在的價值!

盡管可能性極小,但仍然會發(fā)生,如果哈希沖突了,Java 的 HashMap 會在數(shù)組的同一個位置上增加鏈表,如果鏈表的長度大于 8,將會轉(zhuǎn)化成紅黑樹進行處理——這就是所謂的拉鏈法(數(shù)組+鏈表)。

說句實在話,照這個進度惡補下去,我感覺要禿的節(jié)奏,不過,如果能夠變得更強,值了——對,值了。還有一些小伙伴要我推薦一些算法和數(shù)據(jù)結(jié)構(gòu)方面的書籍,我在 GitHub 上搜羅了一些比較受歡迎的,點擊鏈接就可以下載,希望我的用心可以幫助到你。

鏈接:https://pan.baidu.com/s/1rB-CCjjpKPidOio7Ov_0YA 密碼:g5pl

我是沉默王二,一枚沉默但有趣的程序員,關(guān)注即可提升學(xué)習(xí)效率。喜歡這篇文章的小伙伴,請不要忘記四聯(lián)啊,點贊、收藏、轉(zhuǎn)發(fā)、留言,你最美你最帥!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容