上期文章排序算法——(2)Python實現(xiàn)十大常用排序算法
為大家介紹了十大常用排序算法的前五種(冒泡、選擇、插入、希爾、歸并),因為快速排序的重要性,所以今天將單獨為大家介紹一下快速排序!
一、算法介紹
排序算法(Sorting algorithm)是計算機科學(xué)最古老、最基本的課題之一。要想成為合格的程序員,就必須理解和掌握各種排序算法。其中"快速排序"(Quicksort)使用得最廣泛,速度也較快。它是圖靈獎得主C. A. R. Hoare(托尼·霍爾)于1960時提出來的。

二、算法原理
快排的實現(xiàn)方式多種多樣,豬哥給大家寫一種容易理解的:分治+迭代,只需要三步:
- 在數(shù)列之中,選擇一個元素作為"基準(zhǔn)"(pivot),或者叫比較值。
- 數(shù)列中所有元素都和這個基準(zhǔn)值進行比較,如果比基準(zhǔn)值小就移到基準(zhǔn)值的左邊,如果比基準(zhǔn)值大就移到基準(zhǔn)值的右邊
- 以基準(zhǔn)值左右兩邊的子列作為新數(shù)列,不斷重復(fù)第一步和第二步,直到所有子集只剩下一個元素為止。
舉個例子,假設(shè)我現(xiàn)在有一個數(shù)列需要使用快排來排序:{3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48},我們來看看使用快排的詳細(xì)步驟:
- 選取中間的
26作為基準(zhǔn)值(基準(zhǔn)值可以隨便選) - 數(shù)列從第一個元素
3開始和基準(zhǔn)值26進行比較,小于基準(zhǔn)值,那么將它放入左邊的分區(qū)中,第二個元素44比基準(zhǔn)值26大,把它放入右邊的分區(qū)中,依次類推就得到下圖中的第二列。 - 然后依次對左右兩個分區(qū)進行再分區(qū),得到下圖中的第三列,依次往下,直到最后只有一個元素
- 分解完成再一層一層返回,返回規(guī)則是:左邊分區(qū)+基準(zhǔn)值+右邊分區(qū)

三、代碼實現(xiàn)
quick_sort = lambda array: array if len(array) <= 1 else quick_sort([item for item in array[1:] if item <= array[0]]) + [array[0]] + quick_sort([item for item in array[1:] if item > array[0]])
是不是很簡潔很秀,如果再有面試官讓你手寫一個快排,你就把這行寫上去吧,面試官見了都要喊你秀兒,哈哈。
在你感嘆python吊炸天的同時,你因該考慮到代碼的可讀性問題,lambda函數(shù)設(shè)計是為了代碼的簡潔性,但是濫用的話會導(dǎo)致可讀性變得極差,而且現(xiàn)在pep8代碼規(guī)范中也不建議使用lambda函數(shù)了,建議使用關(guān)鍵字def去定義一個函數(shù),所以下面豬哥給大家寫一段符合pythonic風(fēng)格的快排代碼
def quick_sort(arr):
"""快速排序"""
if len(arr) < 2:
return arr
# 選取基準(zhǔn),隨便選哪個都可以,選中間的便于理解
mid = arr[len(arr) // 2]
# 定義基準(zhǔn)值左右兩個數(shù)列
left, right = [], []
# 從原始數(shù)組中移除基準(zhǔn)值
arr.remove(mid)
for item in arr:
# 大于基準(zhǔn)值放右邊
if item >= mid:
right.append(item)
else:
# 小于基準(zhǔn)值放左邊
left.append(item)
# 使用迭代進行比較
return quick_sort(left) + [mid] + quick_sort(right)
四、算法分析
- 穩(wěn)定性:快排是一種不穩(wěn)定排序,比如基準(zhǔn)值的前后都存在與基準(zhǔn)值相同的元素,那么相同值就會被放在一邊,這樣就打亂了之前的相對順序
- 比較性:因為排序時元素之間需要比較,所以是比較排序
- 時間復(fù)雜度:快排的時間復(fù)雜度為O(nlogn)
- 空間復(fù)雜度:排序時需要另外申請空間,并且隨著數(shù)列規(guī)模增大而增大,其復(fù)雜度為:O(nlogn)
- 歸并排序與快排 :歸并排序與快排兩種排序思想都是分而治之,但是它們分解和合并的策略不一樣:歸并是從中間直接將數(shù)列分成兩個,而快排是比較后將小的放左邊大的放右邊,所以在合并的時候歸并排序還是需要將兩個數(shù)列重新再次排序,而快排則是直接合并不再需要排序,所以快排比歸并排序更高效一些,可以從示意圖中比較二者之間的區(qū)別。
歸并排序.png
五、快排優(yōu)化
快速排序有一個缺點就是對于小規(guī)模的數(shù)據(jù)集性能不是很好。可能有人認(rèn)為可以忽略這個缺點不計,因為大多數(shù)排序都只要考慮大規(guī)模的適應(yīng)性就行了。但是快速排序算法使用了分治技術(shù),最終來說大的數(shù)據(jù)集都要分為小的數(shù)據(jù)集來進行處理,所以快排分解到最后幾層性能不是很好,所以我們就可以使用揚長避短的策略去優(yōu)化快排:
- 先使用快排對數(shù)據(jù)集進行排序,此時的數(shù)據(jù)集已經(jīng)達到了基本有序的狀態(tài)
- 然后當(dāng)分區(qū)的規(guī)模達到一定小時,便停止快速排序算法,而是改用插入排序,因為我們之前講過插入排序在對基本有序的數(shù)據(jù)集排序有著接近線性的復(fù)雜度,性能比較好。
這一改進被證明比持續(xù)使用快速排序算法要有效的多。
六、模擬面試
- 面試官:你了解快排嗎?
- 你:略知一二
- 面試官:那你講講快排的算法思想吧
- 你:快排基本思想是:從數(shù)據(jù)集中選取一個基準(zhǔn),然后讓數(shù)據(jù)集的每個元素和基準(zhǔn)值比較,小于基準(zhǔn)值的元素放入左邊分區(qū)大于基準(zhǔn)值的元素放入右邊分區(qū),最后以左右兩邊分區(qū)為新的數(shù)據(jù)集進行遞歸分區(qū),直到只剩一個元素。
- 面試官:快排有什么優(yōu)點,有什么缺點?
- 你:分治思想的排序在處理大數(shù)據(jù)集量時效果比較好,小數(shù)據(jù)集性能差些。
- 面試官:那該如何優(yōu)化?
- 你:對大規(guī)模數(shù)據(jù)集進行快排,當(dāng)分區(qū)的規(guī)模達到一定小時改用插入排序,插入排序在小數(shù)據(jù)規(guī)模時排序性能較好。
- 面試官:那你能手寫一個快排嗎?
- 你:
quick_sort = lambda array: array if len(array) <= 1 else quick_sort([item for item in array[1:] if item <= array[0]]) + [array[0]] + quick_sort([item for item in array[1:] if item > array[0]])
七、總結(jié)
快排是面試與考試中最高頻的一種排序算法(沒有之一),請大家務(wù)必理解與掌握,歡迎大家在評論區(qū)留言,同時也希望大家轉(zhuǎn)發(fā)分享讓更多的人愛上python這門語言。
