數(shù)據(jù)結(jié)構(gòu)

? 數(shù)據(jù)結(jié)構(gòu)

數(shù)據(jù)結(jié)構(gòu)是計算機存儲和組織數(shù)據(jù)的的方式

1. 數(shù)組

在Java中,數(shù)組是用來存放同一種數(shù)據(jù)類型的集合,注意只能存放同一種數(shù)據(jù)類型。

數(shù)組的局限性分析:

 ?、佟⒉迦肼?,對于無序數(shù)組,上面我們實現(xiàn)的數(shù)組就是無序的,即元素沒有按照從大到小或者某個特定的順序排列,只是按照插入的順序排列。無序數(shù)組增加一個元素很簡單,只需要在數(shù)組末尾添加元素即可,但是有序數(shù)組卻不一定了,它需要在指定的位置插入。

  ②、查找快,當然如果根據(jù)下標來查找是很快的。但是通常我們都是根據(jù)元素值來查找,給定一個元素值,對于無序數(shù)組,我們需要從數(shù)組第一個元素開始遍歷,知道找到那個元素。有序數(shù)組通過特定的算法查找的速度會比無需數(shù)組快,后面我們會講各種排序算法。

 ?、?、刪除慢,根據(jù)元素值刪除,我們要先找到該元素所處的位置,然后將元素后面的值整體向前面移動一個位置。也需要比較多的時間。

 ?、?、數(shù)組一旦創(chuàng)建后,大小就固定了,不能動態(tài)擴展數(shù)組的元素個數(shù)。如果初始化你給一個很大的數(shù)組大小,那會白白浪費內(nèi)存空間,如果給小了,后面數(shù)據(jù)個數(shù)增加了又添加不進去了。

很顯然,數(shù)組雖然查找快,但是插入和刪除都比較慢,所以我們不會用數(shù)組來存儲所有的數(shù)據(jù),那有沒有什么數(shù)據(jù)結(jié)構(gòu)插入、查找、刪除都很快,而且還能動態(tài)擴展存儲個數(shù)大小

一維數(shù)組

如何定義數(shù)組

數(shù)據(jù)類型[] 數(shù)組名=new 數(shù)據(jù)類型[數(shù)組長度];

? 數(shù)組類型 數(shù)組名[]=new 數(shù)組類型[數(shù)組長度];

二維數(shù)組

定義

數(shù)組類型 [][] 數(shù)組名;

數(shù)組類型 數(shù)組 [][];

數(shù)組是可以再內(nèi)存中連續(xù)存儲多個元素的結(jié)構(gòu)。數(shù)組中的所有元素必須屬于相同的數(shù)據(jù)類型。

數(shù)組中的元素通過數(shù)組下標進行訪問,數(shù)組下標從0開始。

二維數(shù)組實際上是一個一維數(shù)組,它的每個元素又是一個一維數(shù)組。

使用Array類提供的方法可以方便地對數(shù)組中的元素進行排序、查詢等操作。

JDK1.5之后提供了增強for循環(huán),可以用來實現(xiàn)對數(shù)組和集合中數(shù)據(jù)的訪問。

1. 棧

又稱為堆?;蚨询B,棧作為一種數(shù)據(jù)結(jié)構(gòu),是一種只能在一端進行插入和刪除操作的特殊線性表。它按照先進后出的原則存儲數(shù)據(jù),先進入的數(shù)據(jù)被壓入棧底,最后的數(shù)據(jù)在棧頂,需要讀數(shù)據(jù)的時候從棧頂開始彈出數(shù)據(jù)(最后一個數(shù)據(jù)被第一個讀出來)。棧具有記憶作用,對棧的插入與刪除操作中,不需要改變棧底指針。

棧是允許在同一端進行插入和刪除操作的特殊線性表。允許進行插入和刪除操作的一端稱為棧頂(top),另一端為棧底(bottom);棧底固定,而棧頂浮動;棧中元素個數(shù)為零時稱為空棧。插入一般稱為進棧(PUSH),刪除則稱為退棧(POP)。

  由于堆疊數(shù)據(jù)結(jié)構(gòu)只允許在一端進行操作,因而按照后進先出(LIFO, Last In First Out)的原理運作。棧也稱為后進先出表。

這里以羽毛球筒為例,羽毛球筒就是一個棧,剛開始羽毛球筒是空的,也就是空棧,然后我們一個一個放入羽毛球,也就是一個一個push進棧,當我們需要使用羽毛球的時候,從筒里面拿,也就是pop出棧,但是第一個拿到的羽毛球是我們最后放進去的。

產(chǎn)生的問題:

  ①、上面棧的實現(xiàn)初始化容量之后,后面是不能進行擴容的(雖然棧不是用來存儲大量數(shù)據(jù)的),如果說后期數(shù)據(jù)量超過初始容量之后怎么辦?(自動擴容)

 ?、?、我們是用數(shù)組實現(xiàn)棧,在定義數(shù)組類型的時候,也就規(guī)定了存儲在棧中的數(shù)據(jù)類型,那么同一個棧能不能存儲不同類型的數(shù)據(jù)呢?(聲明為Object)

③、棧需要初始化容量,而且數(shù)組實現(xiàn)的棧元素都是連續(xù)存儲的,那么能不能不初始化容量呢?(改為由鏈表實現(xiàn))

1. 隊列

隊列(queue)是一種特殊的線性表,特殊之處在于它只允許在表的前端(front)進行刪除操作,而在表的后端(rear)進行插入操作,和棧一樣,隊列是一種操作受限制的線性表。進行插入操作的端稱為隊尾,進行刪除操作的端稱為隊頭。隊列中沒有元素時,稱為空隊列。

隊列的數(shù)據(jù)元素又稱為隊列元素。在隊列中插入一個隊列元素稱為入隊,從隊列中刪除一個隊列元素稱為出隊。因為隊列只允許在一端插入,在另一端刪除,所以只有最早進入隊列的元素才能最先從隊列中刪除,故隊列又稱為先進先出(FIFO—first in first out)線性表。

 隊列分為:

 ?、?、單向隊列(Queue):只能在一端插入數(shù)據(jù),另一端刪除數(shù)據(jù)。

 ?、?、雙向隊列(Deque):每一端都可以進行插入數(shù)據(jù)和刪除數(shù)據(jù)操作。

單向隊列實現(xiàn)

?、?、與棧不同的是,隊列中的數(shù)據(jù)不總是從數(shù)組的0下標開始的,移除一些隊頭front的數(shù)據(jù)后,隊頭指針會指向一個較高的下標位置,如下圖:

 ?、凇⑽覀冊僭O(shè)計時,隊列中新增一個數(shù)據(jù)時,隊尾的指針rear 會向上移動,也就是向下標大的方向。移除數(shù)據(jù)項時,隊頭指針 front 也會向下移動。那么這樣設(shè)計好像和現(xiàn)實情況相反,比如排隊買電影票,隊頭的買完票就離開了,然后隊伍整體向前移動。在計算機中也可以在隊列中刪除一個數(shù)之后,隊列整體向前移動,但是這樣做效率很差。我們選擇的做法是移動隊頭和隊尾的指針。

  ③、如果向第②步這樣移動指針,相信隊尾指針很快就移動到數(shù)據(jù)的最末端了,這時候可能移除過數(shù)據(jù),那么隊頭會有空著的位置,然后新來了一個數(shù)據(jù)項,由于隊尾不能再向上移動了,那該怎么辦呢?如下圖:

  為了避免隊列不滿卻不能插入新的數(shù)據(jù),我們可以讓隊尾指針繞回到數(shù)組開始的位置,這也稱為“循環(huán)隊列”。

雙向隊列

雙端隊列就是一個兩端都是結(jié)尾或者開頭的隊列,?隊列的每一端都可以進行插入數(shù)據(jù)項和移除數(shù)據(jù)項

優(yōu)先級隊列(priority queue)

是比棧和隊列更專用的數(shù)據(jù)結(jié)構(gòu),在優(yōu)先級隊列中,數(shù)據(jù)項按照關(guān)鍵字進行排序,關(guān)鍵字最小(或者最大)的數(shù)據(jù)項往往在隊列的最前面,而數(shù)據(jù)項在插入的時候都會插入到合適的位置以確保隊列的有序。

  優(yōu)先級隊列 是0個或多個元素的集合,每個元素都有一個優(yōu)先權(quán),對優(yōu)先級隊列執(zhí)行的操作有:

 ?。?)查找

  (2)插入一個新元素

 ?。?)刪除

  一般情況下,查找操作用來搜索優(yōu)先權(quán)最大的元素,刪除操作用來刪除該元素 。對于優(yōu)先權(quán)相同的元素,可按先進先出次序處理或按任意優(yōu)先權(quán)進行。

  這里我們用數(shù)組實現(xiàn)優(yōu)先級隊列,這種方法插入比較慢,但是它比較簡單,適用于數(shù)據(jù)量比較小并且不是特別注重插入速度的情況。

  后面我們會講解堆,用堆的數(shù)據(jù)結(jié)構(gòu)來實現(xiàn)優(yōu)先級隊列,可以相當快的插入數(shù)據(jù)。

數(shù)組實現(xiàn)優(yōu)先級隊列,聲明為int類型的數(shù)組,關(guān)鍵字是數(shù)組里面的元素,在插入的時候按照從大到小的順序排列,也就是越小的元素優(yōu)先級越高。

 通過前面講的棧以及本篇講的隊列這兩種數(shù)據(jù)結(jié)構(gòu),我們稍微總結(jié)一下:

 ?、?、棧、隊列(單向隊列)、優(yōu)先級隊列通常是用來簡化某些程序操作的數(shù)據(jù)結(jié)構(gòu),而不是主要作為存儲數(shù)據(jù)的。

 ?、凇⒃谶@些數(shù)據(jù)結(jié)構(gòu)中,只有一個數(shù)據(jù)項可以被訪問。

 ?、?、棧允許在棧頂壓入(插入)數(shù)據(jù),在棧頂彈出(移除)數(shù)據(jù),但是只能訪問最后一個插入的數(shù)據(jù)項,也就是棧頂元素。

  ④、隊列(單向隊列)只能在隊尾插入數(shù)據(jù),對頭刪除數(shù)據(jù),并且只能訪問對頭的數(shù)據(jù)。而且隊列還可以實現(xiàn)循環(huán)隊列,它基于數(shù)組,數(shù)組下標可以從數(shù)組末端繞回到數(shù)組的開始位置。

 ?、?、優(yōu)先級隊列是有序的插入數(shù)據(jù),并且只能訪問當前元素中優(yōu)先級別最大(或最?。┑脑亍?/p>

 ?、蕖⑦@些數(shù)據(jù)結(jié)構(gòu)都能由數(shù)組實現(xiàn),但是可以用別的機制(后面講的鏈表、堆等數(shù)據(jù)結(jié)構(gòu))實現(xiàn)。

1. 鏈表

是一種常見的基礎(chǔ)數(shù)據(jù)結(jié)構(gòu),是一種線性表,但是并不會按線性的順序存儲數(shù)據(jù),而是在每一個(或兩個)節(jié)點里存到下一個(或上一個)節(jié)點的指針(Pointer)。

使用鏈表結(jié)構(gòu)可以克服數(shù)組鏈表需要預(yù)先知道數(shù)據(jù)大小的缺點,鏈表結(jié)構(gòu)可以充分利用計算機內(nèi)存空間,實現(xiàn)靈活的內(nèi)存動態(tài)管理。但是鏈表失去了數(shù)組隨機讀取的優(yōu)點,同時鏈表由于增加了結(jié)點的指針域,空間開銷比較大。

單鏈表是鏈表中結(jié)構(gòu)最簡單的。一個單鏈表的節(jié)點(Node)分為兩個部分,第一個部分(data)保存或者顯示關(guān)于節(jié)點的信息,另一個部分存儲下一個節(jié)點的地址。最后一個節(jié)點存儲地址的部分指向空值。

單向鏈表

只可向一個方向遍歷,一般查找一個節(jié)點的時候需要從第一個節(jié)點開始每次訪問下一個節(jié)點,一直訪問到需要的位置。而插入一個節(jié)點,對于單向鏈表,我們只提供在鏈表頭插入,只需要將當前插入的節(jié)點設(shè)置為頭節(jié)點,next指向原頭節(jié)點即可。刪除一個節(jié)點,我們將該節(jié)點的上一個節(jié)點的next指向該節(jié)點的下一個節(jié)點。

雙端鏈表

1. 二叉樹

樹的每個節(jié)點最多只能有兩個子節(jié)點

查找某個節(jié)點,我們必須從根節(jié)點開始遍歷。

 ?、?、查找值比當前節(jié)點值大,則搜索右子樹;

  ②、查找值等于當前節(jié)點值,停止搜索(終止條件);

 ?、?、查找值小于當前節(jié)點值,則搜索左子樹;

  要插入節(jié)點,必須先找到插入的位置。與查找操作相似,由于二叉搜索樹的特殊性,待插入的節(jié)點也需要從根節(jié)點開始進行比較,小于根節(jié)點則與根節(jié)點左子樹比較,反之則與右子樹比較,直到左子樹為空或右子樹為空,則插入到相應(yīng)為空的位置,在比較的過程中要注意保存父節(jié)點的信息 及 待插入的位置是父節(jié)點的左子樹還是右子樹,才能插入到正確的位置。

刪除節(jié)點是二叉搜索樹中最復(fù)雜的操作,刪除的節(jié)點有三種情況,前兩種比較簡單,但是第三種卻很復(fù)雜。

  1、該節(jié)點是葉節(jié)點(沒有子節(jié)點)

  2、該節(jié)點有一個子節(jié)點

  3、該節(jié)點有兩個子節(jié)點

  下面我們分別對這三種情況進行講解。

  ①、刪除沒有子節(jié)點的節(jié)點

  要刪除葉節(jié)點,只需要改變該節(jié)點的父節(jié)點引用該節(jié)點的值,即將其引用改為 null 即可。要刪除的節(jié)點依然存在,但是它已經(jīng)不是樹的一部分了,由于Java語言的垃圾回收機制,我們不需要非得把節(jié)點本身刪掉,一旦Java意識到程序不在與該節(jié)點有關(guān)聯(lián),就會自動把它清理出存儲器。

刪除節(jié)點,我們要先找到該節(jié)點,并記錄該節(jié)點的父節(jié)點。在檢查該節(jié)點是否有子節(jié)點。如果沒有子節(jié)點,接著檢查其是否是根節(jié)點,如果是根節(jié)點,只需要將其設(shè)置為null即可。如果不是根節(jié)點,是葉節(jié)點,那么斷開父節(jié)點和其的關(guān)系即可。

 ?、?、刪除有一個子節(jié)點的節(jié)點

  刪除有一個子節(jié)點的節(jié)點,我們只需要將其父節(jié)點原本指向該節(jié)點的引用,改為指向該節(jié)點的子節(jié)點即可。

?、?、刪除有兩個子節(jié)點的節(jié)點


  當刪除的節(jié)點存在兩個子節(jié)點,那么刪除之后,兩個子節(jié)點的位置我們就沒辦法處理了。既然處理不了,我們就想到一種辦法,用另一個節(jié)點來代替被刪除的節(jié)點,那么用哪一個節(jié)點來代替呢?

  我們知道二叉搜索樹中的節(jié)點是按照關(guān)鍵字來進行排列的,某個節(jié)點的關(guān)鍵字次高節(jié)點是它的中序遍歷后繼節(jié)點。用后繼節(jié)點來代替刪除的節(jié)點,顯然該二叉搜索樹還是有序的。(這里用后繼節(jié)點代替,如果該后繼節(jié)點自己也有子節(jié)點,我們后面討論。)

  那么如何找到刪除節(jié)點的中序后繼節(jié)點呢?其實我們稍微分析,這實際上就是要找比刪除節(jié)點關(guān)鍵值大的節(jié)點集合中最小的一個節(jié)點,只有這樣代替刪除節(jié)點后才能滿足二叉搜索樹的特性。

  后繼節(jié)點也就是:比刪除節(jié)點大的最小節(jié)點。

6.紅黑樹

  有如下兩個特征:

 ?、?、節(jié)點都有顏色;

 ?、?、在插入和刪除的過程中,要遵循保持這些顏色的不同排列規(guī)則。

  第一個很好理解,在紅-黑樹中,每個節(jié)點的顏色或者是黑色或者是紅色的。當然也可以是任意別的兩種顏色,這里的顏色用于標記,我們可以在節(jié)點類Node中增加一個boolean型變量isRed,以此來表示顏色的信息。

  第二點,在插入或者刪除一個節(jié)點時,必須要遵守的規(guī)則稱為紅-黑規(guī)則:

  1.每個節(jié)點不是紅色就是黑色的;

  2.根節(jié)點總是黑色的;

  3.如果節(jié)點是紅色的,則它的子節(jié)點必須是黑色的(反之不一定),(也就是從每個葉子到根的所有路徑上不能有兩個連續(xù)的紅色節(jié)點);

  4.從根節(jié)點到葉節(jié)點或空子節(jié)點的每條路徑,必須包含相同數(shù)目的黑色節(jié)點(即相同的黑色高度)。

  從根節(jié)點到葉節(jié)點的路徑上的黑色節(jié)點的數(shù)目稱為黑色高度,規(guī)則 4 另一種表示就是從根到葉節(jié)點路徑上的黑色高度必須相同。

注意:新插入的節(jié)點顏色總是紅色的,這是因為插入一個紅色節(jié)點比插入一個黑色節(jié)點違背紅-黑規(guī)則的可能性更小,原因是插入黑色節(jié)點總會改變黑色高度(違背規(guī)則4),但是插入紅色節(jié)點只有一半的機會會違背規(guī)則3(因為父節(jié)點是黑色的沒事,父節(jié)點是紅色的就違背規(guī)則3)。另外違背規(guī)則3比違背規(guī)則4要更容易修正。

紅黑樹和二叉樹的區(qū)別 :

紅黑樹和之前所講的AVL樹類似,都是在進行插入和刪除操作時通過特定操作保持二叉查找樹的平衡,從而獲得較高的查找性能。自從紅黑樹出來后,AVL樹就被放到了博物館里,據(jù)說是紅黑樹有更好的效率,更高的統(tǒng)計性能。 紅黑樹和AVL樹的區(qū)別在于它使用顏色來標識結(jié)點的高度,它所追求的是局部平衡而不是AVL樹中的非常嚴格的平衡。AVL樹的復(fù)雜比起紅黑樹來說簡直是小巫見大巫。紅黑樹是真正的變態(tài)級數(shù)據(jù)結(jié)構(gòu)。

(AVL樹,平衡二叉樹)

7.哈希表

Hash表也稱散列表,也有直接譯作哈希表,Hash表是一種根據(jù)關(guān)鍵字值(key - value)而直接進行訪問的數(shù)據(jù)結(jié)構(gòu)。它基于數(shù)組,通過把關(guān)鍵字映射到數(shù)組的某個下標來加快查找速度,但是又和數(shù)組、鏈表、樹等數(shù)據(jù)結(jié)構(gòu)不同,在這些數(shù)據(jù)結(jié)構(gòu)中查找某個關(guān)鍵字,通常要遍歷整個數(shù)據(jù)結(jié)構(gòu)

哈希表(Hash table,也叫散列表),是根據(jù)關(guān)鍵碼值(Key value)而直接進行訪問的數(shù)據(jù)結(jié)構(gòu)。也就是說,它通過把關(guān)鍵碼值映射到表中一個位置來訪問記錄,以加快查找的速度。這個映射函數(shù)叫做散列函數(shù),存放記錄的數(shù)組叫做散列表。

?而當使用哈希表進行查詢的時候,就是再次使用哈希函數(shù)將key轉(zhuǎn)換為對應(yīng)的數(shù)組下標,并定位到該空間獲取value,如此一來,就可以充分利用到數(shù)組的定位性能進行數(shù)據(jù)定位

優(yōu)缺點

優(yōu)點:不論哈希表中有多少數(shù)據(jù),查找、插入、刪除(有時包括刪除)只需要接近常量的時間即0(1)的時間級。實際上,這只需要幾條機器指令。

哈希表運算得非常快,在計算機程序中,如果需要在一秒種內(nèi)查找上千條記錄通常使用哈希表(例如拼寫檢查器)哈希表的速度明顯比樹快,樹的操作通常需要O(N)的時間級。哈希表不僅速度快,編程實現(xiàn)也相對容易。

如果不需要有序遍歷數(shù)據(jù),并且可以提前預(yù)測數(shù)據(jù)量的大小。那么哈希表在速度和易用性方面是無與倫比的。

缺點:它是基于數(shù)組的,數(shù)組創(chuàng)建后難于擴展,某些哈希表被基本填滿時,性能下降得非常嚴重,所以程序員必須要清楚表中將要存儲多少數(shù)據(jù)(或者準備好定期地把數(shù)據(jù)轉(zhuǎn)移到更大的哈希表中,這是個費時的過程)。

(有個不錯的例子,點擊)

8. 堆

堆是一顆完全二叉樹,在這棵樹中,所有父節(jié)點都滿足大于等于其子節(jié)點的堆叫大根堆,所有父節(jié)點都滿足小于等于其子節(jié)點的堆叫小根堆。堆雖然是一顆樹,但是通常存放在一個數(shù)組中,父節(jié)點和孩子節(jié)點的父子關(guān)系通過數(shù)組下標來確定。

堆是弱序的,所以想要遍歷堆是很困難的,基本上,堆是不支持遍歷的。

  對于查找,由于堆的特性,在查找的過程中,沒有足夠的信息來決定選擇通過節(jié)點的兩個子節(jié)點中的哪一個來選擇走向下一層,所以也很難在堆中查找到某個關(guān)鍵字。

因此,堆這種組織似乎非常接近無序,不過,對于快速的移除最大(或最小)節(jié)點,也就是根節(jié)點,以及能快速插入新的節(jié)點,這兩個操作就足夠了。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 愛情對于男人來說是發(fā)情了才愛,對與女人來說是愛了才發(fā)情。---馮侖 對于女人來說從情感出發(fā)要求一心一意,一對一,加...
    科學(xué)健身傳播者閱讀 2,938評論 0 3
  • 06是盼望吧 前情提要:趙君臨接到了靜好,并把靜好請到了別墅。對于君墨來說,顏靜好真是特別的存在,在她面前,他可以...
    守素閱讀 557評論 6 2
  • 前言 國內(nèi)的相關(guān)資料太少了,不管是學(xué)習(xí)還是處理問題方法,為了讓還在 flask官方有關(guān)于部署文檔,官方提供幾種方法...
    aimaile閱讀 961評論 0 1

友情鏈接更多精彩內(nèi)容