Python一行代碼實現(xiàn)快速排序

上期文章排序算法——(2)Python實現(xiàn)十大常用排序算法
為大家介紹了十大常用排序算法的前五種(冒泡、選擇、插入、希爾、歸并),因為快速排序的重要性,所以今天將單獨為大家介紹一下快速排序!

一、算法介紹

排序算法(Sorting algorithm)是計算機科學(xué)最古老、最基本的課題之一。要想成為合格的程序員,就必須理解和掌握各種排序算法。其中"快速排序"(Quicksort)使用得最廣泛,速度也較快。它是圖靈獎得主C. A. R. Hoare(托尼·霍爾)于1960時提出來的。


托尼·霍爾

二、算法原理

快排的實現(xiàn)方式多種多樣,豬哥給大家寫一種容易理解的:分治+迭代,只需要三步:

  1. 在數(shù)列之中,選擇一個元素作為"基準(zhǔn)"(pivot),或者叫比較值。
  2. 數(shù)列中所有元素都和這個基準(zhǔn)值進行比較,如果比基準(zhǔn)值小就移到基準(zhǔn)值的左邊,如果比基準(zhǔn)值大就移到基準(zhǔn)值的右邊
  3. 以基準(zhǔn)值左右兩邊的子列作為新數(shù)列,不斷重復(fù)第一步和第二步,直到所有子集只剩下一個元素為止。

舉個例子,假設(shè)我現(xiàn)在有一個數(shù)列需要使用快排來排序:{3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48},我們來看看使用快排的詳細(xì)步驟:

  1. 選取中間的26作為基準(zhǔn)值(基準(zhǔn)值可以隨便選)
  2. 數(shù)列從第一個元素3開始和基準(zhǔn)值26進行比較,小于基準(zhǔn)值,那么將它放入左邊的分區(qū)中,第二個元素44比基準(zhǔn)值26大,把它放入右邊的分區(qū)中,依次類推就得到下圖中的第二列。
  3. 然后依次對左右兩個分區(qū)進行再分區(qū),得到下圖中的第三列,依次往下,直到最后只有一個元素
  4. 分解完成再一層一層返回,返回規(guī)則是:左邊分區(qū)+基準(zhǔn)值+右邊分區(qū)
快速排序.png

三、代碼實現(xiàn)

quick_sort = lambda array: array if len(array) <= 1 else quick_sort([item for item in array[1:] if item <= array[0]]) + [array[0]] + quick_sort([item for item in array[1:] if item > array[0]])

是不是很簡潔很秀,如果再有面試官讓你手寫一個快排,你就把這行寫上去吧,面試官見了都要喊你秀兒,哈哈。

在你感嘆python吊炸天的同時,你因該考慮到代碼的可讀性問題,lambda函數(shù)設(shè)計是為了代碼的簡潔性,但是濫用的話會導(dǎo)致可讀性變得極差,而且現(xiàn)在pep8代碼規(guī)范中也不建議使用lambda函數(shù)了,建議使用關(guān)鍵字def去定義一個函數(shù),所以下面豬哥給大家寫一段符合pythonic風(fēng)格的快排代碼

def quick_sort(arr):
    """快速排序"""
    if len(arr) < 2:
        return arr
    # 選取基準(zhǔn),隨便選哪個都可以,選中間的便于理解
    mid = arr[len(arr) // 2]
    # 定義基準(zhǔn)值左右兩個數(shù)列
    left, right = [], []
    # 從原始數(shù)組中移除基準(zhǔn)值
    arr.remove(mid)
    for item in arr:
        # 大于基準(zhǔn)值放右邊
        if item >= mid:
            right.append(item)
        else:
            # 小于基準(zhǔn)值放左邊
            left.append(item)
    # 使用迭代進行比較
    return quick_sort(left) + [mid] + quick_sort(right)

四、算法分析

  1. 穩(wěn)定性:快排是一種不穩(wěn)定排序,比如基準(zhǔn)值的前后都存在與基準(zhǔn)值相同的元素,那么相同值就會被放在一邊,這樣就打亂了之前的相對順序
  2. 比較性:因為排序時元素之間需要比較,所以是比較排序
  3. 時間復(fù)雜度:快排的時間復(fù)雜度為O(nlogn)
  4. 空間復(fù)雜度:排序時需要另外申請空間,并且隨著數(shù)列規(guī)模增大而增大,其復(fù)雜度為:O(nlogn)
  5. 歸并排序與快排 :歸并排序與快排兩種排序思想都是分而治之,但是它們分解和合并的策略不一樣:歸并是從中間直接將數(shù)列分成兩個,而快排是比較后將小的放左邊大的放右邊,所以在合并的時候歸并排序還是需要將兩個數(shù)列重新再次排序,而快排則是直接合并不再需要排序,所以快排比歸并排序更高效一些,可以從示意圖中比較二者之間的區(qū)別。
    歸并排序.png

五、快排優(yōu)化

快速排序有一個缺點就是對于小規(guī)模的數(shù)據(jù)集性能不是很好。可能有人認(rèn)為可以忽略這個缺點不計,因為大多數(shù)排序都只要考慮大規(guī)模的適應(yīng)性就行了。但是快速排序算法使用了分治技術(shù),最終來說大的數(shù)據(jù)集都要分為小的數(shù)據(jù)集來進行處理,所以快排分解到最后幾層性能不是很好,所以我們就可以使用揚長避短的策略去優(yōu)化快排:

  1. 先使用快排對數(shù)據(jù)集進行排序,此時的數(shù)據(jù)集已經(jīng)達到了基本有序的狀態(tài)
  2. 然后當(dāng)分區(qū)的規(guī)模達到一定小時,便停止快速排序算法,而是改用插入排序,因為我們之前講過插入排序在對基本有序的數(shù)據(jù)集排序有著接近線性的復(fù)雜度,性能比較好。

這一改進被證明比持續(xù)使用快速排序算法要有效的多。

六、模擬面試

  • 面試官:你了解快排嗎?
  • 你:略知一二
  • 面試官:那你講講快排的算法思想吧
  • 你:快排基本思想是:從數(shù)據(jù)集中選取一個基準(zhǔn),然后讓數(shù)據(jù)集的每個元素和基準(zhǔn)值比較,小于基準(zhǔn)值的元素放入左邊分區(qū)大于基準(zhǔn)值的元素放入右邊分區(qū),最后以左右兩邊分區(qū)為新的數(shù)據(jù)集進行遞歸分區(qū),直到只剩一個元素。
  • 面試官:快排有什么優(yōu)點,有什么缺點?
  • 你:分治思想的排序在處理大數(shù)據(jù)集量時效果比較好,小數(shù)據(jù)集性能差些。
  • 面試官:那該如何優(yōu)化?
  • 你:對大規(guī)模數(shù)據(jù)集進行快排,當(dāng)分區(qū)的規(guī)模達到一定小時改用插入排序,插入排序在小數(shù)據(jù)規(guī)模時排序性能較好。
  • 面試官:那你能手寫一個快排嗎?
  • 你:
quick_sort = lambda array: array if len(array) <= 1 else quick_sort([item for item in array[1:] if item <= array[0]]) + [array[0]] + quick_sort([item for item in array[1:] if item > array[0]])

七、總結(jié)

快排是面試與考試中最高頻的一種排序算法(沒有之一),請大家務(wù)必理解與掌握,歡迎大家在評論區(qū)留言,同時也希望大家轉(zhuǎn)發(fā)分享讓更多的人愛上python這門語言。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容