程序兵法:插入排序算法 Java 源版

《程序兵法: Java 源碼的插入排序算法 (二)》

文章工程:

一、前言

上一講《程序兵法:Java String 源碼的排序算法(一)》講了什么是選擇問題,什么是比較能力。

選擇問題,是假設一組 N 個數,要確定其中第 K 個最大值者。算法是為求解一個問題。

那什么是算法?
算法是某種集合,是簡單指令的集合,是被指定的簡單指令集合。確定該算法重要的指標:

  • 第一是否能解決問題;
  • 第二算法運行時間,即解決問題出結果需要多少時間;
  • 還有所需的空間資源,比如內存等。

很多時候,寫一個工作程序并不夠。因為遇到大數據下,運行時間就是一個重要的問題。

算法性能用大 O 標記法表示。大 O 標記法是標記相對增長率,精度是粗糙的。比如 2N 和 3N + 2 ,都是 O(N)。也就是常說的線性增長,還有常說的指數增長等

典型的增長率

典型的提供性能做法是分治法,即分支 divide and conquer 策略:

  1. 將問題分成兩個大致相等的子問題,遞歸地對它們求解,這是分的部分;
  2. 治階段將兩個子問題的解修補到一起,并可能再做些少量的附加工作,最后得到整個問題的解。

二、排序

排序問題,是古老,但一直流行的問題。從 ACM 接觸到現(xiàn)在工作,每次涉及算法,或品讀 JDK 源碼中一些算法,經常會有排序的算法出現(xiàn)。

排序算法是為了將一組數組(或序列)重新排列,排列后數據符合從大到?。ɑ驈男〉酱螅┑拇涡颉_@樣數據從無序到有序,會有什么好處?

  • 應用層面:解決問題。
    • 最簡單的是可以找到最大值或者最小值
    • 解決"一起性"問題,即相同標志元素連在一起
    • 匹配在兩個或者更多個文件中的項目
    • 通過鍵碼值查找信息
  • 系統(tǒng)層面:減少系統(tǒng)的熵值,增加系統(tǒng)的有序度
    (Donald Knuth 的經典之作《計算機程序設計藝術》(The Art of Computer Programming)的第三卷)

通過維基百科查閱資料得到:
在主內存中完成的排序叫做,內部排序。那需要在磁盤等其他存儲完成的排序,叫做外部排序 external sorting。資料地址:https://en.wikipedia.org/wiki/External_sorting

上一篇《程序兵法:Java String 源碼的排序算法(一)》,講到了 java.lang.Comparable 接口。那么接口是一個抽象類型,是抽象方法(compareTo)的集合,用 interface 來聲明。因此被排序的對象屬于 Comparable 類型,即實現(xiàn) Comparable 接口,然后調用對象實現(xiàn)的 compareTo 方法進行比較后排序。

在這些條件下的排序,叫作基于比較的排序(comparison-based sorting)

三、插入排序

白話文:熊大(一)、熊二、熊三... 按照身高從低到高排隊(排序)。這時候熊 N 加入隊伍,它從隊伍尾巴開始比較。如果它比前面的熊身高低,則與被比較的交換位置,依次從尾巴到頭部進行比較 & 交換位置。最終換到了應該熊 N 所在的位置。這就是插入排序的原理。

插入排序(insertion sort)

  • 最簡單的排序之一。ps: 冒泡排序看看就好,不推薦學習
  • 由 N - 1 次排序過程組成。
    • 如果被排序的這樣一個元素,就不需要排序。即 N =1 (1 - 1 = 0)
    • 每一次排序保證,從第一個位置到當前位置的元素為已排序狀態(tài)。
  • 如圖:每個元素往前進行比較,并終止于自己所在的位置
/**
 * 插入排序案例
 * <p>
 * Created by 泥瓦匠@bysocket.com on 19/5/15.
 */
public class InsertionSortingDemo {
    
    /**
     * 插入排序
     *
     * @param arr 能比較的對象數組
     * @param <T> 已排序的對象數組
     */
    public static <T extends Comparable> void insertionSort(T[] arr) {
        int j;
        
        // 從數組第二個元素開始,向前比較
        for (int p = 1; p < arr.length; p++) {
            T tmp = arr[p];
            // 循環(huán),向前依次比較
            // 如果比前面元素小,交換位置
            for (j = p; (j > 0) && (tmp.compareTo(arr[j - 1]) < 0); j--) {
                arr[j] = arr[j - 1];
            }
            // 如果比前面元素大或者相等,那么這就是元素的位置,交換
            arr[j] = tmp;
        }
    }
    
    public static void main(String[] args) {
        Integer[] intArr = new Integer[] {2, 3, 1, 4, 3};
        
        System.out.println(Arrays.toString(intArr));
        insertionSort(intArr);
        System.out.println(Arrays.toString(intArr));
    }
}

代碼解析如下:

  • 從數組的第二個元素,向前開始比較。比第一個元素小,則交換位置
  • 如果第二個元素比較完畢,那就第三個,第四個... 以此類推
  • 比較到最后一個元素時,完成排序

時間復雜度是 O(N^2),最好情景的是排序已經排好的,那就是 O(N),因為滿足不了循環(huán)的判斷條件;最極端的是反序的數組,那就是 O(N^2)。所以該算法的時間復雜度為 O(N^2)

運行 main 方法,結果如下:

[2, 3, 1, 4, 3]
[1, 2, 3, 3, 4]

再考慮考慮優(yōu)化,會怎么優(yōu)化呢?
插入排序優(yōu)化版 不是往前比較 。往前的一半比較,二分比較會更好。具體代碼,可以自行試試

四、Array.sort 源碼中的插入排序

上面用自己實現(xiàn)的插入算法進行排序,其實 JDK 提供了 Array.sort 方法,方便排序。案例代碼如下:

/**
 * Arrays.sort 排序案例
 * <p>
 * Created by 泥瓦匠@bysocket.com on 19/5/28.
 */
public class ArraysSortDemo {
    
    public static void main(String[] args) {
    
        Integer[] intArr = new Integer[] {2, 3, 1, 4, 3};
    
        System.out.println(Arrays.toString(intArr));
        Arrays.sort(intArr);
        System.out.println(Arrays.toString(intArr));
    }
}

運行 main 方法,結果如下:

[2, 3, 1, 4, 3]
[1, 2, 3, 3, 4]

那 Arrays.sort 是如何實現(xiàn)的呢?JDK 1.2 的時候有了 Arrays ,JDK 1.8 時優(yōu)化了一版 sort 算法。大致如下:

  • 如果元素數量小于 47,使用插入排序
  • 如果元素數量小于 286,使用快速排序
  • Timsort 算法整合了歸并排序和插入排序

源碼中我們看到了 mergeSort 里面整合了插入排序算法,跟上面實現(xiàn)的異曲同工。這邊就不一行一行解釋了。

五、小結

算法是解決問題的。所以不一定一個算法解決一個問題,可能多個算法一起解決一個問題。達到問題的最優(yōu)解。插入排序,這樣就這么簡單

資料:

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容