Python3 實(shí)現(xiàn)十大經(jīng)典排序算法
算法分類
算法分類
算法比較
算法比較
術(shù)語說明
- 穩(wěn)定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面;
- 不穩(wěn)定:如果a原本在b的前面,而a=b,排序之后a可能會(huì)出現(xiàn)在b的后面;
- 內(nèi)排序:所有排序操作都在內(nèi)存中完成;
- 外排序:由于數(shù)據(jù)太大,因此把數(shù)據(jù)放在磁盤中,而排序通過磁盤和內(nèi)存的數(shù)據(jù)傳輸才能進(jìn)行;
- 時(shí)間復(fù)雜度: 一個(gè)算法執(zhí)行所耗費(fèi)的時(shí)間。
- 空間復(fù)雜度:運(yùn)行完一個(gè)程序所需內(nèi)存的大小。
1.選擇排序(Selection Sort)
-
選擇排序(Selection Sort):
- 選擇排序(Selection-sort)是一種簡單直觀的排序算法。它的工作原理:首先在未排序序列中找到最?。ù螅┰兀娣诺脚判蛐蛄械钠鹗嘉恢?,然后,再從剩余未排序元素中繼續(xù)尋找最小(大)元素,然后放到已排序序列的末尾。以此類推,直到所有元素均排序完畢。
-
算法描述:
- n個(gè)記錄的直接選擇排序可經(jīng)過n-1趟直接選擇排序得到有序結(jié)果。具體算法描述如下:
- 1.初始狀態(tài):無序區(qū)為R[1..n],有序區(qū)為空;
- 2.第i趟排序(i=1,2,3…n-1)開始時(shí),當(dāng)前有序區(qū)和無序區(qū)分別為R[1..i-1]和R(i..n)。該趟排序從當(dāng)前無序區(qū)中-選出關(guān)鍵字最小的記錄 R[k],將它與無序區(qū)的第1個(gè)記錄R交換,使R[1..i]和R[i+1..n)分別變?yōu)橛涗泜€(gè)數(shù)增加1個(gè)的新有序區(qū)和記錄個(gè)數(shù)減少1個(gè)的新無序區(qū);
- 3.n-1趟結(jié)束,數(shù)組有序化了。
- n個(gè)記錄的直接選擇排序可經(jīng)過n-1趟直接選擇排序得到有序結(jié)果。具體算法描述如下:
-
算法演示
選擇排序 算法實(shí)現(xiàn)
def select_sort(data):
"""
:param data: list
:return: sorted data
"""
length = len(data)
if length < 2:
return data
for i in range(length - 1):
# 最小值的索引
minIndex = i
for j in range(i + 1, length):
# 找到最小值的索引
if (data[j] < data[minIndex]):
minIndex = j
# 將最小的值放在i處
data[i], data[minIndex] = data[minIndex], data[i]
# print(data)
return data
2.冒泡排序(Bubble Sort)
- 冒泡排序(Bubble Sort):
- 冒泡排序是一種簡單的排序算法。它重復(fù)地走訪過要排序的數(shù)列,一次比較兩個(gè)元素,如果它們的順序錯(cuò)誤就把它們交換過來。走訪數(shù)列的工作是重復(fù)地進(jìn)行直到?jīng)]有再需要交換,也就是說該數(shù)列已經(jīng)排序完成。這個(gè)算法的名字由來是因?yàn)樵叫〉脑貢?huì)經(jīng)由交換慢慢“浮”到數(shù)列的頂端。
- 算法描述:
- 1.比較相鄰的元素。如果第一個(gè)比第二個(gè)大,就交換它們兩個(gè);
- 2.對(duì)每一對(duì)相鄰元素作同樣的工作,從開始第一對(duì)到結(jié)尾的最后一對(duì),這樣在最后的元素應(yīng)該會(huì)是最大的數(shù);
- 3.針對(duì)所有的元素重復(fù)以上的步驟,除了最后一個(gè);
- 4.重復(fù)步驟1~3,直到排序完成。
-
算法演示
冒泡排序
- 算法實(shí)現(xiàn)
def bubble_sort(data):
"""
:param data: list
:return: sorted data
"""
length = len(data)
if length < 2:
return data
for i in range(length - 1):
for j in range(length - 1 - i):
if (data[j + 1] < data[j]):
data[j], data[j + 1] = data[j + 1], data[j]
# print(data)
return data
3.插入排序(Insertion Sort)
- 插入排序(Insertion Sort):
- 插入排序(Insertion-Sort)的算法描述是一種簡單直觀的排序算法。它的工作原理是通過構(gòu)建有序序列,對(duì)于未排序數(shù)據(jù),在已排序序列中從后向前掃描,找到相應(yīng)位置并插入。插入排序在實(shí)現(xiàn)上,通常采用in-place排序(即只需用到O(1)的額外空間的排序),因而在從后向前掃描過程中,需要反復(fù)把已排序元素逐步向后挪位,為最新元素提供插入空間。
- 算法描述:
- 一般來說,插入排序都采用in-place在數(shù)組上實(shí)現(xiàn)。具體算法描述如下:
- 1.從第一個(gè)元素開始,該元素可以認(rèn)為已經(jīng)被排序;
- 2.取出下一個(gè)元素,在已經(jīng)排序的元素序列中從后向前掃描;
- 3.如果該元素(已排序)大于新元素,將該元素移到下一位置;
- 4.重復(fù)步驟3,直到找到已排序的元素小于或者等于新元素的位置;
- 5.將新元素插入到該位置后;
- 6.重復(fù)步驟2~5。
- 一般來說,插入排序都采用in-place在數(shù)組上實(shí)現(xiàn)。具體算法描述如下:
-
算法演示
插入排序
- 算法實(shí)現(xiàn)
def insert_sort(data):
"""
:param data:list
:return: sorted data
"""
length = len(data)
if length < 2:
return data
for i in range(0, length - 1):
preIndex = i
current = data[i + 1]
while preIndex >= 0 and current < data[preIndex]:
# 增加空間
data[preIndex + 1] = data[preIndex]
preIndex -= 1
data[preIndex + 1] = current
# print(data)
return data
4.希爾排序(Shell Sort)
- 希爾排序(Shell Sort):
- 希爾排序是希爾(Donald Shell)于1959年提出的一種排序算法。希爾排序也是一種插入排序,它是簡單插入排序經(jīng)過改進(jìn)之后的一個(gè)更高效的版本,也稱為縮小增量排序,同時(shí)該算法是沖破O(n2)的第一批算法之一。它與插入排序的不同之處在于,它會(huì)優(yōu)先比較距離較遠(yuǎn)的元素。希爾排序又叫縮小增量排序。希爾排序是把記錄按下表的一定增量分組,對(duì)每組使用直接插入排序算法排序;隨著增量逐漸減少,每組包含的關(guān)鍵詞越來越多,當(dāng)增量減至1時(shí),整個(gè)文件恰被分成一組,算法便終止。
- 算法描述:
- 我們來看下希爾排序的基本步驟,在此我們選擇增量gap=length/2,縮小增量繼續(xù)以gap = gap/2的方式,這種增量選擇我們可以用一個(gè)序列來表示,{n/2,(n/2)/2...1},稱為增量序列。希爾排序的增量序列的選擇與證明是個(gè)數(shù)學(xué)難題,我們選擇的這個(gè)增量序列是比較常用的,也是希爾建議的增量,稱為希爾增量,但其實(shí)這個(gè)增量序列不是最優(yōu)的。此處我們做示例使用希爾增量。先將整個(gè)待排序的記錄序列分割成為若干子序列分別進(jìn)行直接插入排序,具體算法描述:選擇一個(gè)增量序列t1,t2,…,tk,其中ti>tj,tk=1;按增量序列個(gè)數(shù)k,對(duì)序列進(jìn)行k 趟排序;每趟排序,根據(jù)對(duì)應(yīng)的增量ti,將待排序列分割成若干長度為m 的子序列,分別對(duì)各子表進(jìn)行直接插入排序。僅增量因子為1 時(shí),整個(gè)序列作為一個(gè)表來處理,表長度即為整個(gè)序列的長度。
-
算法演示
希爾排序
- 算法實(shí)現(xiàn)
def shell_sort(data):
"""
:param data: list
:return: sorted data
"""
length = len(data)
if length < 2:
return data
step = length // 2
while step > 0:
for i in range(step, length):
while i >= step and data[i - step] > data[i]:
data[i - step], data[i] = data[i], data[i - step]
i -= step
# print(data)
step = step // 2
return data
5.歸并排序(Merge Sort)
-
歸并排序(Merge Sort):
- 歸并排序是建立在歸并操作上的一種有效的排序算法。該算法是采用分治法(Divide and Conquer)的一個(gè)非常典型的應(yīng)用。將已有序的子序列合并,得到完全有序的序列;即先使每個(gè)子序列有序,再使子序列段間有序。若將兩個(gè)有序表合并成一個(gè)有序表,稱為2-路歸并。
-
算法描述:
- 1.把長度為n的輸入序列分成兩個(gè)長度為n/2的子序列;
- 2.對(duì)這兩個(gè)子序列分別采用歸并排序;
- 3.將兩個(gè)排序好的子序列合并成一個(gè)最終的排序序列。
-
算法演示
歸并排序
- 算法實(shí)現(xiàn)
def merge_sort(data):
"""
:param data: list
:return: sorted data
"""
length = len(data)
if length < 2:
return data
mid = length // 2
# 分別對(duì)兩個(gè)子列表并歸排序
merge_left = merge_sort(data[:mid])
merge_right = merge_sort(data[mid:])
def merge(data_left, data_right):
# print(data_left, data_right)
"""
合并(將兩個(gè)有序的列表合并成一個(gè)有序的列表)
:param data_left: data[:mid]
:param data_right:data[mid:]
:return: sorted data
"""
left, right = 0, 0
len_left = len(data_left)
len_right = len(data_right)
sorted_data = []
while left < len_left and right < len_right:
if data_left[left] < data_right[right]:
sorted_data.append(data_left[left])
left += 1
else:
sorted_data.append(data_right[right])
right += 1
sorted_data += data_left[left:]
sorted_data += data_right[right:]
return sorted_data
# 合并(將兩個(gè)有序的列表合并成一個(gè)有序的列表)
return merge(merge_left, merge_right)
6.快速排序(Quick Sort)
-
快速排序(Quick Sort):
- 快速排序的基本思想:通過一趟排序?qū)⒋庞涗浄指舫瑟?dú)立的兩部分,其中一部分記錄的關(guān)鍵字均比另一部分的關(guān)鍵字小,則可分別對(duì)這兩部分記錄繼續(xù)進(jìn)行排序,以達(dá)到整個(gè)序列有序。
-
算法描述:
- 快速排序使用分治法來把一個(gè)串(list)分為兩個(gè)子串(sub-lists)。具體算法描述如下:
- 1.從數(shù)列中挑出一個(gè)元素,稱為 “基準(zhǔn)”(pivot);
- 2.重新排序數(shù)列,所有元素比基準(zhǔn)值小的擺放在基準(zhǔn)前面,所有元素比基準(zhǔn)值大的擺在基準(zhǔn)的后面(相同的數(shù)可以到任一 邊)。在這個(gè)分區(qū)退出之后,該基準(zhǔn)就處于數(shù)列的中間位置。這個(gè)稱為分區(qū)(partition)操作;
- 3.遞歸地(recursive)把小于基準(zhǔn)值元素的子數(shù)列和大于基準(zhǔn)值元素的子數(shù)列排序。
- 快速排序使用分治法來把一個(gè)串(list)分為兩個(gè)子串(sub-lists)。具體算法描述如下:
-
算法演示
快速排序
- 算法實(shí)現(xiàn)
def quick_sort(data):
"""
:param data:list
:return:sorted data
"""
length = len(data)
if length < 2:
return data
# 隨機(jī)基準(zhǔn)
import random
index = random.randint(0, length - 1)
left = [l for l in data[index + 1:] + data[0:index] if l <= data[index]]
right = [r for r in data[index + 1:] + data[0:index] if r > data[index]]
# 有序數(shù)據(jù) = 基準(zhǔn)左側(cè) + 基準(zhǔn) + 基準(zhǔn)右側(cè)
return quick_sort(left) + [data[index]] + quick_sort(right)
快速排序,一行代碼實(shí)現(xiàn)(為了方便查閱,用了換行)
one_quick_sort = (lambda array: array if len(array) <= 1 else
one_quick_sort([item for item in array[1:] if item <= array[0]]) + # 小于基準(zhǔn)
[array[0]] + # 等于基準(zhǔn)
one_quick_sort([item for item in array[1:] if item > array[0]])) # 大于基準(zhǔn)
7.堆排序(Heap Sort)
-
堆排序(Heap Sort):
- 堆排序(Heapsort)是指利用堆這種數(shù)據(jù)結(jié)構(gòu)所設(shè)計(jì)的一種排序算法。堆積是一個(gè)近似完全二叉樹的結(jié)構(gòu),并同時(shí)滿足堆積的性質(zhì):即子結(jié)點(diǎn)的鍵值或索引總是小于(或者大于)它的父節(jié)點(diǎn)。
-
算法描述:
- 1.將初始待排序關(guān)鍵字序列(R1,R2….Rn)構(gòu)建成大頂堆,此堆為初始的無序區(qū);
- 2.將堆頂元素R1與最后一個(gè)元素Rn交換,此時(shí)得到新的無序區(qū)(R1,R2,……Rn-1)和新的有序區(qū)(Rn),且滿足R[1,2…n-1]<=Rn;
- 3.由于交換后新的堆頂R1可能違反堆的性質(zhì),因此需要對(duì)當(dāng)前無序區(qū)(R1,R2,……Rn-1)調(diào)整為新堆,然后再次將R1與無序區(qū)最后一個(gè)元素交換,得到新的無序區(qū)(R1,R2….Rn-2)和新的有序區(qū)(Rn-1,Rn)。不斷重復(fù)此過程直到有序區(qū)的元素個(gè)數(shù)為n-1,則整個(gè)
排序過程完成。
-
算法演示
堆排序
- 算法實(shí)現(xiàn)
def heap_sort(data):
"""
:param data:list
:return:sorted data
"""
length = len(data)
if length < 2:
return data
def adjustHeap(i):
"""調(diào)整使之成為最大堆"""
maxIndex = i
if i * 2 < length and data[i * 2] > data[maxIndex]:
maxIndex = i * 2
if i * 2 + 1 < length and data[i * 2 + 1] > data[maxIndex]:
maxIndex = i * 2 + 1
if maxIndex != i:
data[maxIndex], data[i] = data[i], data[maxIndex]
adjustHeap(maxIndex)
def buildMaxHeap():
"""建立最大堆"""
# 從最后一個(gè)非葉子節(jié)點(diǎn)開始向上構(gòu)造最大堆
i = (length - 1) // 2
while i >= 0:
adjustHeap(i)
i -= 1
# 構(gòu)建一個(gè)最大堆
buildMaxHeap()
# 循環(huán)將堆首位(最大值)與末位交換,然后再重新調(diào)整最大堆
while length > 0:
data[0], data[length - 1] = data[length - 1], data[0]
length -= 1
adjustHeap(0)
# print(data)
return data
8.計(jì)數(shù)排序(Counting Sort)
-
計(jì)數(shù)排序(Counting Sort):
- 計(jì)數(shù)排序的核心在于將輸入的數(shù)據(jù)值轉(zhuǎn)化為鍵存儲(chǔ)在額外開辟的數(shù)組空間中。 作為一種線性時(shí)間復(fù)雜度的排序,計(jì)數(shù)排序要求輸入的數(shù)據(jù)必須是有確定范圍的整數(shù)。計(jì)數(shù)排(Counting sort)是一種穩(wěn)定的排序算法。計(jì)數(shù)排序使用一個(gè)額外的數(shù)組C,其中第i個(gè)元素是待排序數(shù)組A中值等于i的元素的個(gè)數(shù)。然后根據(jù)數(shù)組C來將A中的元素排到正確的位置。它只能對(duì)整數(shù)進(jìn)行排序。
-
算法描述:
- 1.找出待排序的數(shù)組中最大和最小的元素;
- 2.統(tǒng)計(jì)數(shù)組中每個(gè)值為i的元素出現(xiàn)的次數(shù),存入數(shù)組C的第i項(xiàng);(i必須為正整數(shù))
- 3.對(duì)所有的計(jì)數(shù)累加(從C中的第一個(gè)元素開始,每一項(xiàng)和前一項(xiàng)相加);
- 4.反向填充目標(biāo)數(shù)組:將每個(gè)元素i放在新數(shù)組的第C(i)項(xiàng),每放一個(gè)元素就將C(i)減去1。
-
算法演示
計(jì)數(shù)排序
- 算法實(shí)現(xiàn)
def count_sort(data):
"""
:param data:list
:return:sorted data
"""
length = len(data)
if length < 2:
return data
# 數(shù)組C,None表示當(dāng)前位置沒有記錄數(shù)據(jù)信息
C = [None] * (max(data) - min(data) + 1)
# 將計(jì)數(shù)信息存入C數(shù)組中
for i in range(length):
C[data[i] - min(data)] += 1
# print(C)
# 從C數(shù)組中按序取出數(shù)值并返回
sorted_data = []
for index, value in enumerate(C):
# 判斷當(dāng)前位置是否記錄有信息
if value is not None:
sorted_data += [index + min(data)] * value
return sorted_data
9.桶排序(Bucket Sort)
-
桶排序(Bucket Sort):
- 桶排序是計(jì)數(shù)排序的升級(jí)版。它利用了函數(shù)的映射關(guān)系,高效與否的關(guān)鍵就在于這個(gè)映射函數(shù)的確定。
- 桶排序 (Bucket sort)的工作的原理:假設(shè)輸入數(shù)據(jù)服從均勻分布,將數(shù)據(jù)分到有限數(shù)量的桶里,每個(gè)桶再分別排序(有可能再
使用別的排序算法或是以遞歸方式繼續(xù)使用桶排序進(jìn)行排序。
-
算法描述:
- 1.人為設(shè)置一個(gè)BucketSize,作為每個(gè)桶所能放置多少個(gè)不同數(shù)值(例如當(dāng)BucketSize==5時(shí),該桶可以存放{1,2,3,4,5}這幾
種數(shù)字,但是容量不限,即可以存放100個(gè)3); - 2.遍歷輸入數(shù)據(jù),并且把數(shù)據(jù)一個(gè)一個(gè)放到對(duì)應(yīng)的桶里去;
- 3.對(duì)每個(gè)不是空的桶進(jìn)行排序,可以使用其它排序方法,也可以遞歸使用桶排序;
- 4.從不是空的桶里把排好序的數(shù)據(jù)拼接起來。
- 1.人為設(shè)置一個(gè)BucketSize,作為每個(gè)桶所能放置多少個(gè)不同數(shù)值(例如當(dāng)BucketSize==5時(shí),該桶可以存放{1,2,3,4,5}這幾
-
算法演示
桶排序
- 算法實(shí)現(xiàn)
def bucket_sort(data, num=10):
"""
:param data:list
:param num:bucket num
:return:sorted data
"""
length = len(data)
if length < 2:
return data
min_value = min(data)
max_value = max(data)
import re
pattern = r'^[1-9]+[0-9]*$'
# 桶的數(shù)量,如果不匹配默認(rèn)取10
num = num if num > 1 and re.match(pattern, str(num)) else 10
# 桶的空間
space = int((max_value - min_value) / num) + 1
# 初始化桶空間,注意:[[]] * num生成list的坑,兩者append方法結(jié)果不同
buckets = [[] for _ in range(num)]
# 將數(shù)據(jù)放到對(duì)應(yīng)的桶里面,難點(diǎn):數(shù)據(jù)與桶的映射關(guān)系
for i in range(length):
# 數(shù)據(jù)與桶的映射關(guān)系
index = int((data[i] - min_value) / space)
# print(data[i], index)
buckets[index].append(data[i])
# print(buckets)
# 桶內(nèi)數(shù)據(jù)排序
# for n in buckets:
# print(n)
# n.sort()
# 按序取出桶內(nèi)的數(shù)據(jù),組成有序序列
sorted_data = []
for n in buckets:
n.sort()
sorted_data += n
return sorted_data
10.基數(shù)排序(Radix Sort)
-
基數(shù)排序(Radix Sort):
- 基數(shù)排序也是非比較的排序算法,對(duì)每一位進(jìn)行排序,從最低位開始排序,復(fù)雜度為O(kn),為數(shù)組長度,k為數(shù)組中的數(shù)的最大的位數(shù);基數(shù)排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次類推,直到最高位。有時(shí)候有些屬性是有優(yōu)先級(jí)順序的,先按低優(yōu)先級(jí)排序,再按高優(yōu)先級(jí)排序。最后的次序就是高優(yōu)先級(jí)高的在前,高優(yōu)先級(jí)相同的低優(yōu)先級(jí)高的在 前?;鶖?shù)排序基于分別排序,分別收集,所以是穩(wěn)定的。
-
算法描述:
- 1.取得數(shù)組中的最大數(shù),并取得位數(shù);
- 2.arr為原始數(shù)組,從最低位開始取每個(gè)位組成radix數(shù)組;
- 3.對(duì)radix進(jìn)行計(jì)數(shù)排序(利用計(jì)數(shù)排序適用于小范圍數(shù)的特點(diǎn));
-
基數(shù)排序有兩種方法:
- 1.MSD 從高位開始進(jìn)行排序
- 2.LSD 從低位開始進(jìn)行排序
-
基數(shù)排序 vs 計(jì)數(shù)排序 vs 桶排序
- 這三種排序算法都利用了桶的概念,但對(duì)桶的使用方法上有明顯差異:
- 基數(shù)排序:根據(jù)鍵值的每位數(shù)字來分配桶
- 計(jì)數(shù)排序:每個(gè)桶只存儲(chǔ)單一鍵值
- 桶排序:每個(gè)桶存儲(chǔ)一定范圍的數(shù)值
- 這三種排序算法都利用了桶的概念,但對(duì)桶的使用方法上有明顯差異:
-
算法演示
基數(shù)排序
- 算法實(shí)現(xiàn)
def radix_sort(data):
"""
:param data:list
:return:sorted data
"""
length = len(data)
if length < 2:
return data
# 最大位數(shù)
max_value = max(data)
max_digit = str(max_value).__len__()
# 將數(shù)據(jù)按照個(gè)位、十位、百位。。。上的數(shù)字放到對(duì)應(yīng)編號(hào)的桶里
for i in range(max_digit):
# 初始化桶,因?yàn)槊總€(gè)位置數(shù)范圍0-9,故初始化10個(gè)桶
buckets = [[] for _ in range(10)]
for d in data:
index = int(d / (10 ** i) % 10)
buckets[index].append(d)
# 從桶中按序取出數(shù)據(jù)放回原數(shù)組
data = [d for b in buckets for d in b]
print(data)
return data
后話
其實(shí)Python有自帶的排序函數(shù),這里自己實(shí)現(xiàn)十大經(jīng)典排序,一方面提高Python語言熟練度,另一方面鍛煉自己的思維。
# 一句話搞定的事兒,何必呢。。??滓壹海耗阒馈盎亍庇卸嗌俜N寫法嗎。。。
print(sorted(data))
本文動(dòng)圖來自網(wǎng)絡(luò),感謝網(wǎng)友們的分享。









