數(shù)據(jù)結(jié)構(gòu)學習-三大查找八大排序

三大查找方法

順序查找,二分法查找(折半查找),分塊查找

順序查找的基本思想:

從表的一端開始,順序掃描表,依次將掃描到的結(jié)點關(guān)鍵字和給定值(假定為a)相比較,若當前結(jié)點關(guān)鍵字與a相等,則查找成功;若掃描結(jié)束后,仍未找到關(guān)鍵字等于a的結(jié)點,則查找失敗。

說白了就是,從頭到尾,一個一個地比,找著相同的就成功,找不到就失敗。很明顯的缺點就是查找效率低。

適用于線性表的順序存儲結(jié)構(gòu)和鏈式存儲結(jié)構(gòu)。

image.png
計算平均查找長度。

例如上表,查找1,需要1次,查找2需要2次,依次往下推,可知查找16需要16次,

可以看出,我們只要將這些查找次數(shù)求和(我們初中學的,上底加下底乘以高除以2),然后除以結(jié)點數(shù),即為平均查找長度。

設n=節(jié)點數(shù)

平均查找長度 =(n+1)/2

二分法查找(折半查找)的基本思想:

前提:

(1)確定該區(qū)間的中點位置:mid =(low+high)/2

min代表區(qū)間中間的結(jié)點的位置,low代表區(qū)間最左結(jié)點位置,high代表區(qū)間最右結(jié)點位置

(2)將待查a值與結(jié)點mid的關(guān)鍵字(下面用R[mid].key)比較,若相等,則查找成功,否則確定新的查找區(qū)間:

如果R[mid].key>a,則由表的有序性可知,R[mid].key右側(cè)的值都大于a,所以等于a的關(guān)鍵字如果存在,必然在R[mid].key左邊的表中。這時high=mid-1

如果R[mid].key<a,則等于a的關(guān)鍵字如果存在,必然在R[mid].key右邊的表中。這時low=mid

如果R[mid].key=a,則查找成功。

(3)下一次查找針對新的查找區(qū)間,重復步驟(1)和(2)

(4)在查找過程中,low逐步增加,high逐步減少,如果high<low,則查找失敗。

 /**
     * @param $x
     * @param $a
     * @param $lower
     * @param $high
     * @return bool|int
     *
     * 二分查找,需要數(shù)組是一個有序數(shù)組
     * 遞歸實現(xiàn)
     */
    private function binRecursive($x, &$a, $lower = 0, $high = 11)
    {
        //$lower開始位置 $high結(jié)束位置
        //采用二分法查找
        $c = count($a);
        if ($high > $c) {
            return false;
        }
        if ($lower <= $high) {
            $middle = intval(($lower + $high) / 2);
            if ($a[$middle] == $x) {
                return $middle;
            } elseif ($a[$middle] < $x) {//在后半段里查
                return $this->binSearchRecursive($x, $a, $middle + 1, $high);
            } else {//在前半段里查
                return $this->binSearchRecursive($x, $a, $lower, $middle - 1);
            }
        } else {
            return false;
        }
    }
image.png

平均查找長度=Log2(n+1)-1

注:雖然二分法查找的效率高,但是要將表按關(guān)鍵字排序。而排序本身是一種很費時的運算,所以二分法比較適用于順序存儲結(jié)構(gòu)。為保持表的有序性,在順序結(jié)構(gòu)中插入和刪除都必須移動大量的結(jié)點。因此,二分查找特別適用于那種一經(jīng)建立就很少改動而又經(jīng)常需要查找的線性表。

分塊查找的基本思想:

二分查找表使分塊有序的線性表和索引表(抽取各塊中的最大關(guān)鍵字及其起始位置構(gòu)成索引表)組成,由于表是分塊有序的,所以索引表是一個遞增有序表,因此采用順序或二分查找索引表,以確定待查結(jié)點在哪一塊,由于塊內(nèi)無序,只能用順序查找。

image.png
設表共n個結(jié)點,分b塊,s=n/b

(分塊查找索引表)平均查找長度=Log2(n/s+1)+s/2

(順序查找索引表)平均查找長度=(S2+2S+n)/(2S)

注:分塊查找的優(yōu)點是在表中插入或刪除一個記錄時,只要找到該記錄所屬塊,就在該塊中進行插入或刪除運算(因塊內(nèi)無序,所以不需要大量移動記錄)。它主要代價是增加一個輔助數(shù)組的存儲控件和將初始表分塊排序的運算。

它的性能介于順序查找和二分查找之間。

八大排序

數(shù)據(jù)結(jié)構(gòu)常見的八大排序算法,他們之間關(guān)系如下:

img

排序算法.png

他們的性能比較:

img

性能比較.png

下面,利用Python分別將他們進行實現(xiàn)。

直接插入排序


  • 算法思想:
img

直接插入排序.gif

直接插入排序的核心思想就是:將數(shù)組中的所有元素依次跟前面已經(jīng)排好的元素相比較,如果選擇的元素比已排序的元素小,則交換,直到全部元素都比較過。
因此,從上面的描述中我們可以發(fā)現(xiàn),直接插入排序可以用兩個循環(huán)完成:

  1. 第一層循環(huán):遍歷待比較的所有數(shù)組元素
  2. 第二層循環(huán):將本輪選擇的元素(selected)與已經(jīng)排好序的元素(ordered)相比較。
    如果:selected > ordered,那么將二者交換
  • 代碼實現(xiàn)
#直接插入排序
def insert_sort(L):
    #遍歷數(shù)組中的所有元素,其中0號索引元素默認已排序,因此從1開始
    for x in range(1,len(L)):
    #將該元素與已排序好的前序數(shù)組依次比較,如果該元素小,則交換
    #range(x-1,-1,-1):從x-1倒序循環(huán)到0
        for i in range(x-1,-1,-1):
    #判斷:如果符合條件則交換
            if L[i] > L[i+1]:
                temp = L[i+1]
                L[i+1] = L[i]
                L[i] = temp

希爾排序


  • 算法思想:
img

希爾排序.png

希爾排序的算法思想:將待排序數(shù)組按照步長gap進行分組,然后將每組的元素利用直接插入排序的方法進行排序;每次將gap折半減小,循環(huán)上述操作;當gap=1時,利用直接插入,完成排序。
同樣的:從上面的描述中我們可以發(fā)現(xiàn):希爾排序的總體實現(xiàn)應該由三個循環(huán)完成:

  1. 第一層循環(huán):將gap依次折半,對序列進行分組,直到gap=1
  2. 第二、三層循環(huán):也即直接插入排序所需要的兩次循環(huán)。具體描述見上。
  • 代碼實現(xiàn):
#希爾排序
def insert_shell(L):
    #初始化gap值,此處利用序列長度的一般為其賦值
    gap = (int)(len(L)/2)
    #第一層循環(huán):依次改變gap值對列表進行分組
    while (gap >= 1):
    #下面:利用直接插入排序的思想對分組數(shù)據(jù)進行排序
    #range(gap,len(L)):從gap開始
        for x in range(gap,len(L)):
    #range(x-gap,-1,-gap):從x-gap開始與選定元素開始倒序比較,每個比較元素之間間隔gap
            for i in range(x-gap,-1,-gap):
    #如果該組當中兩個元素滿足交換條件,則進行交換
                if L[i] > L[i+gap]:
                    temp = L[i+gap]
                    L[i+gap] = L[i]
                    L[i] =temp
    #while循環(huán)條件折半
        gap = (int)(gap/2)

簡單選擇排序


  • 算法思想
img

簡單選擇排序.gif

簡單選擇排序的基本思想:比較+交換。

  1. 從待排序序列中,找到關(guān)鍵字最小的元素;
  2. 如果最小元素不是待排序序列的第一個元素,將其和第一個元素互換;
  3. 從余下的 N - 1 個元素中,找出關(guān)鍵字最小的元素,重復(1)、(2)步,直到排序結(jié)束。
    因此我們可以發(fā)現(xiàn),簡單選擇排序也是通過兩層循環(huán)實現(xiàn)。
    第一層循環(huán):依次遍歷序列當中的每一個元素
    第二層循環(huán):將遍歷得到的當前元素依次與余下的元素進行比較,符合最小元素的條件,則交換。
  • 代碼實現(xiàn)
# 簡單選擇排序
def select_sort(L):
#依次遍歷序列中的每一個元素
    for x in range(0,len(L)):
#將當前位置的元素定義此輪循環(huán)當中的最小值
        minimum = L[x]
#將該元素與剩下的元素依次比較尋找最小元素
        for i in range(x+1,len(L)):
            if L[i] < minimum:
                temp = L[i];
                L[i] = minimum;
                minimum = temp
#將比較后得到的真正的最小值賦值給當前位置
        L[x] = minimum

堆排序


  • 堆的概念
    堆:本質(zhì)是一種數(shù)組對象。特別重要的一點性質(zhì):<b>任意的葉子節(jié)點小于(或大于)它所有的父節(jié)點</b>。對此,又分為大頂堆和小頂堆,大頂堆要求節(jié)點的元素都要大于其孩子,小頂堆要求節(jié)點元素都小于其左右孩子,兩者對左右孩子的大小關(guān)系不做任何要求。
    利用堆排序,就是基于大頂堆或者小頂堆的一種排序方法。下面,我們通過大頂堆來實現(xiàn)。

  • 基本思想:
    堆排序可以按照以下步驟來完成:

    1. 首先將序列構(gòu)建稱為大頂堆;
      (這樣滿足了大頂堆那條性質(zhì):位于根節(jié)點的元素一定是當前序列的最大值)
 ![img](https://upload-images.jianshu.io/upload_images/1156494-596eee6397817ca2.png)

 構(gòu)建大頂堆.png
  1. 取出當前大頂堆的根節(jié)點,將其與序列末尾元素進行交換;
    (此時:序列末尾的元素為已排序的最大值;由于交換了元素,當前位于根節(jié)點的堆并不一定滿足大頂堆的性質(zhì))

  2. 對交換后的n-1個序列元素進行調(diào)整,使其滿足大頂堆的性質(zhì);

 ![img](https://upload-images.jianshu.io/upload_images/1156494-7e5c63ce1ed48ebf.png)

 Paste_Image.png
  1. 重復2.3步驟,直至堆中只有1個元素為止
  • 代碼實現(xiàn):
#-------------------------堆排序--------------------------------
#**********獲取左右葉子節(jié)點**********
def LEFT(i):
    return 2*i + 1
def RIGHT(i):
    return 2*i + 2
#********** 調(diào)整大頂堆 **********
#L:待調(diào)整序列 length: 序列長度 i:需要調(diào)整的結(jié)點
def adjust_max_heap(L,length,i):
#定義一個int值保存當前序列最大值的下標
    largest = i
#執(zhí)行循環(huán)操作:兩個任務:1 尋找最大值的下標;2.最大值與父節(jié)點交換
    while (1):
#獲得序列左右葉子節(jié)點的下標
        left,right = LEFT(i),RIGHT(i)
#當左葉子節(jié)點的下標小于序列長度 并且 左葉子節(jié)點的值大于父節(jié)點時,將左葉子節(jié)點的下標賦值給largest
        if (left < length) and (L[left] > L[i]):
            largest = left
            print('左葉子節(jié)點')
        else:
            largest = i
#當右葉子節(jié)點的下標小于序列長度 并且 右葉子節(jié)點的值大于父節(jié)點時,將右葉子節(jié)點的下標值賦值給largest
        if (right < length) and (L[right] > L[largest]):
            largest = right
            print('右葉子節(jié)點')
#如果largest不等于i 說明當前的父節(jié)點不是最大值,需要交換值
        if (largest != i):
            temp = L[i]
            L[i] = L[largest]
            L[largest] = temp
            i = largest
            print(largest)
            continue
        else:
            break
#********** 建立大頂堆 **********
def build_max_heap(L):
    length = len(L)
    for x in range((int)((length-1)/2),-1,-1):
        adjust_max_heap(L,length,x)
#********** 堆排序 **********
def heap_sort(L):
#先建立大頂堆,保證最大值位于根節(jié)點;并且父節(jié)點的值大于葉子結(jié)點
    build_max_heap(L)
#i:當前堆中序列的長度.初始化為序列的長度
    i = len(L)
#執(zhí)行循環(huán):1. 每次取出堆頂元素置于序列的最后(len-1,len-2,len-3...)
#         2. 調(diào)整堆,使其繼續(xù)滿足大頂堆的性質(zhì),注意實時修改堆中序列的長度
    while (i > 0):
        temp = L[i-1]
        L[i-1] = L[0]
        L[0] = temp
#堆中序列長度減1
        i = i-1
#調(diào)整大頂堆
        adjust_max_heap(L,i,0)

冒泡排序


  • 基本思想
img

冒泡排序.gif

冒泡排序思路比較簡單:

  1. 將序列當中的左右元素,依次比較,保證右邊的元素始終大于左邊的元素;
    ( 第一輪結(jié)束后,序列最后一個元素一定是當前序列的最大值;)
  2. 對序列當中剩下的n-1個元素再次執(zhí)行步驟1。
  3. 對于長度為n的序列,一共需要執(zhí)行n-1輪比較
    (利用while循環(huán)可以減少執(zhí)行次數(shù))

*代碼實現(xiàn)

#冒泡排序
def bubble_sort(L):
    length = len(L)
#序列長度為length,需要執(zhí)行l(wèi)ength-1輪交換
    for x in range(1,length):
#對于每一輪交換,都將序列當中的左右元素進行比較
#每輪交換當中,由于序列最后的元素一定是最大的,因此每輪循環(huán)到序列未排序的位置即可
        for i in range(0,length-x):
            if L[i] > L[i+1]:
                temp = L[i]
                L[i] = L[i+1]
                L[i+1] = temp

快速排序


  • 算法思想:
img

快速排序.gif

快速排序的基本思想:挖坑填數(shù)+分治法

  1. 從序列當中選擇一個基準數(shù)(pivot)
    在這里我們選擇序列當中第一個數(shù)最為基準數(shù)
  2. 將序列當中的所有數(shù)依次遍歷,比基準數(shù)大的位于其右側(cè),比基準數(shù)小的位于其左側(cè)
  3. 重復步驟1.2,直到所有子集當中只有一個元素為止。
    用偽代碼描述如下:
    1.i =L; j = R; 將基準數(shù)挖出形成第一個坑a[i]。
    2.j--由后向前找比它小的數(shù),找到后挖出此數(shù)填前一個坑a[i]中。
    3.i++由前向后找比它大的數(shù),找到后也挖出此數(shù)填到前一個坑a[j]中。
    4.再重復執(zhí)行2,3二步,直到i==j,將基準數(shù)填入a[i]中
  • 代碼實現(xiàn):
#快速排序
#L:待排序的序列;start排序的開始index,end序列末尾的index
#對于長度為length的序列:start = 0;end = length-1
def quick_sort(L,start,end):
    if start < end:
        i , j , pivot = start , end , L[start]
        while i < j:
#從右開始向左尋找第一個小于pivot的值
            while (i < j) and (L[j] >= pivot):
                j = j-1
#將小于pivot的值移到左邊
            if (i < j):
                L[i] = L[j]
                i = i+1 
#從左開始向右尋找第一個大于pivot的值
            while (i < j) and (L[i] < pivot):
                i = i+1
#將大于pivot的值移到右邊
            if (i < j):
                L[j] = L[i]
                j = j-1
#循環(huán)結(jié)束后,說明 i=j,此時左邊的值全都小于pivot,右邊的值全都大于pivot
#pivot的位置移動正確,那么此時只需對左右兩側(cè)的序列調(diào)用此函數(shù)進一步排序即可
#遞歸調(diào)用函數(shù):依次對左側(cè)序列:從0 ~ i-1//右側(cè)序列:從i+1 ~ end
        L[i] = pivot
#左側(cè)序列繼續(xù)排序
        quick_sort(L,start,i-1)
#右側(cè)序列繼續(xù)排序
        quick_sort(L,i+1,end)

歸并排序


  • 算法思想:
img

歸并排序.gif

  1. 歸并排序是建立在歸并操作上的一種有效的排序算法,該算法是采用分治法的一個典型的應用。它的基本操作是:將已有的子序列合并,達到完全有序的序列;即先使每個子序列有序,再使子序列段間有序。
  2. 歸并排序其實要做兩件事:
  • 分解----將序列每次折半拆分
  • 合并----將劃分后的序列段兩兩排序合并
    因此,歸并排序?qū)嶋H上就是兩個操作,拆分+合并
  1. 如何合并?
    L[first...mid]為第一段,L[mid+1...last]為第二段,并且兩端已經(jīng)有序,現(xiàn)在我們要將兩端合成達到L[first...last]并且也有序。
  • 首先依次從第一段與第二段中取出元素比較,將較小的元素賦值給temp[]
  • 重復執(zhí)行上一步,當某一段賦值結(jié)束,則將另一段剩下的元素賦值給temp[]
  • 此時將temp[]中的元素復制給L[],則得到的L[first...last]有序
  1. 如何分解?
    在這里,我們采用遞歸的方法,首先將待排序列分成A,B兩組;然后重復對A、B序列
    分組;直到分組后組內(nèi)只有一個元素,此時我們認為組內(nèi)所有元素有序,則分組結(jié)束。
  • 代碼實現(xiàn)
# 歸并排序
#這是合并的函數(shù)
# 將序列L[first...mid]與序列L[mid+1...last]進行合并
def mergearray(L,first,mid,last,temp):
#對i,j,k分別進行賦值
    i,j,k = first,mid+1,0
#當左右兩邊都有數(shù)時進行比較,取較小的數(shù)
    while (i <= mid) and (j <= last):
        if L[i] <= L[j]:
            temp[k] = L[i]
            i = i+1
            k = k+1
        else:
            temp[k] = L[j]
            j = j+1
            k = k+1
#如果左邊序列還有數(shù)
    while (i <= mid):
        temp[k] = L[i]
        i = i+1
        k = k+1
#如果右邊序列還有數(shù)
    while (j <= last):
        temp[k] = L[j]
        j = j+1
        k = k+1
#將temp當中該段有序元素賦值給L待排序列使之部分有序
    for x in range(0,k):
        L[first+x] = temp[x]
# 這是分組的函數(shù)
def merge_sort(L,first,last,temp):
    if first < last:
        mid = (int)((first + last) / 2)
#使左邊序列有序
        merge_sort(L,first,mid,temp)
#使右邊序列有序
        merge_sort(L,mid+1,last,temp)
#將兩個有序序列合并
        mergearray(L,first,mid,last,temp)
# 歸并排序的函數(shù)
def merge_sort_array(L):
#聲明一個長度為len(L)的空列表
    temp = len(L)*[None]
#調(diào)用歸并排序
    merge_sort(L,0,len(L)-1,temp)

基數(shù)排序


  • 算法思想
img

基數(shù)排序.gif

  1. 基數(shù)排序:通過序列中各個元素的值,對排序的N個元素進行若干趟的“分配”與“收集”來實現(xiàn)排序。
    分配:我們將L[i]中的元素取出,首先確定其個位上的數(shù)字,根據(jù)該數(shù)字分配到與之序號相同的桶中
    收集:當序列中所有的元素都分配到對應的桶中,再按照順序依次將桶中的元素收集形成新的一個待排序列L[ ]
    對新形成的序列L[]重復執(zhí)行分配和收集元素中的十位、百位...直到分配完該序列中的最高位,則排序結(jié)束
  2. 根據(jù)上述“基數(shù)排序”的展示,我們可以清楚的看到整個實現(xiàn)的過程
  • 代碼實現(xiàn)
#************************基數(shù)排序****************************
#確定排序的次數(shù)
#排序的順序跟序列中最大數(shù)的位數(shù)相關(guān)
def radix_sort_nums(L):
    maxNum = L[0]
#尋找序列中的最大數(shù)
    for x in L:
        if maxNum < x:
            maxNum = x
#確定序列中的最大元素的位數(shù)
    times = 0
    while (maxNum > 0):
        maxNum = (int)(maxNum/10)
        times = times+1
    return times
#找到num從低到高第pos位的數(shù)據(jù)
def get_num_pos(num,pos):
    return ((int)(num/(10**(pos-1))))%10
#基數(shù)排序
def radix_sort(L):
    count = 10*[None]       #存放各個桶的數(shù)據(jù)統(tǒng)計個數(shù)
    bucket = len(L)*[None]  #暫時存放排序結(jié)果
#從低位到高位依次執(zhí)行循環(huán)
    for pos in range(1,radix_sort_nums(L)+1):
        #置空各個桶的數(shù)據(jù)統(tǒng)計
        for x in range(0,10):
            count[x] = 0
        #統(tǒng)計當前該位(個位,十位,百位....)的元素數(shù)目
        for x in range(0,len(L)):
            #統(tǒng)計各個桶將要裝進去的元素個數(shù)
            j = get_num_pos(int(L[x]),pos)
            count[j] = count[j]+1
        #count[i]表示第i個桶的右邊界索引
        for x in range(1,10):
            count[x] = count[x] + count[x-1]
        #將數(shù)據(jù)依次裝入桶中
        for x in range(len(L)-1,-1,-1):
            #求出元素第K位的數(shù)字
            j = get_num_pos(L[x],pos)
            #放入對應的桶中,count[j]-1是第j個桶的右邊界索引
            bucket[count[j]-1] = L[x]
            #對應桶的裝入數(shù)據(jù)索引-1
            count[j] = count[j]-1
        # 將已分配好的桶中數(shù)據(jù)再倒出來,此時已是對應當前位數(shù)有序的表
        for x in range(0,len(L)):
            L[x] = bucket[x]

后記


寫完之后運行了一下時間比較:

  • 1w個數(shù)據(jù)時:
直接插入排序:11.615608
希爾排序:13.012008
簡單選擇排序:3.645136000000001
堆排序:0.09587900000000005
冒泡排序:6.687218999999999
#****************************************************
快速排序:9.999999974752427e-07 
#快速排序有誤:實際上并未執(zhí)行
#RecursionError: maximum recursion depth exceeded in comparison
#****************************************************
歸并排序:0.05638299999999674
基數(shù)排序:0.08150400000000246
  • 10w個數(shù)據(jù)時:
直接插入排序:1233.581131
希爾排序:1409.8012320000003
簡單選擇排序:466.66974500000015
堆排序:1.2036720000000969
冒泡排序:751.274449
#****************************************************
快速排序:1.0000003385357559e-06
#快速排序有誤:實際上并未執(zhí)行
#RecursionError: maximum recursion depth exceeded in comparison
#****************************************************
歸并排序:0.8262230000000272
基數(shù)排序:1.1162899999999354

從運行結(jié)果上來看,堆排序、歸并排序、基數(shù)排序真的快。
對于快速排序迭代深度超過的問題,可以將考慮將快排通過非遞歸的方式進行實現(xiàn)。

參考:
簡書用戶 【LeeLom】的文章 《數(shù)據(jù)結(jié)構(gòu)常見的八大排序算法(詳細整理)》

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

  • 一些概念 數(shù)據(jù)結(jié)構(gòu)就是研究數(shù)據(jù)的邏輯結(jié)構(gòu)和物理結(jié)構(gòu)以及它們之間相互關(guān)系,并對這種結(jié)構(gòu)定義相應的運算,而且確保經(jīng)過這...
    Winterfell_Z閱讀 6,616評論 0 13
  • 1)這本書為什么值得看: Python語言描述,如果學的Python用這本書學數(shù)據(jù)結(jié)構(gòu)更合適 2016年出版,內(nèi)容...
    孫懷闊閱讀 12,946評論 0 15
  • 概述 排序有內(nèi)部排序和外部排序,內(nèi)部排序是數(shù)據(jù)記錄在內(nèi)存中進行排序,而外部排序是因排序的數(shù)據(jù)很大,一次不能容納全部...
    蟻前閱讀 5,308評論 0 52
  • 1.插入排序—直接插入排序(Straight Insertion Sort) 基本思想: 將一個記錄插入到已排序好...
    依依玖玥閱讀 1,357評論 0 2
  • 感恩親密關(guān)系,我擁有: 1、感謝你,我親愛的老公。是你的愛與寬容轉(zhuǎn)變了我的脾性,使我看清自己的火爆脾氣就像熱鍋里的...
    小泥蛋兒閱讀 192評論 0 1

友情鏈接更多精彩內(nèi)容