什么是md5算法

簡(jiǎn)介

MD5消息摘要算法(MD5 Message-Digest Algorithm),是一種被廣泛使用的密碼散列函數(shù),可以產(chǎn)生出一個(gè)128位(16字節(jié))的散列值(hash value),用于確保信息傳輸完整一致。

MD5算法經(jīng)常用以進(jìn)行文件、應(yīng)用到軟件下載站、論壇數(shù)據(jù)庫、系統(tǒng)文件安全校驗(yàn)等。MD5的典型應(yīng)用是對(duì)一段信息(Message)產(chǎn)生信息摘要(Message-Digest),以防止被篡改。大致結(jié)構(gòu)如下:

MD5 (“內(nèi)容”) = 38b8c2c1093dd0fec383a9d9ac940515(32位)

md5特點(diǎn)

1.長(zhǎng)度固定:

不管多長(zhǎng)的字符串,加密后長(zhǎng)度都是一樣長(zhǎng)

作用:方便平時(shí)信息的統(tǒng)計(jì)和管理

2.易計(jì)算:

字符串和文件加密的過程是容易的.

作用: 開發(fā)者很容易理解和做出加密工具

3.細(xì)微性

一個(gè)文件,不管多大,小到幾k,大到幾G,你只要改變里面某個(gè)字符,那么都會(huì)導(dǎo)致MD5值改變.

作用:很多軟件和應(yīng)用在網(wǎng)站提供下載資源,其中包含了對(duì)文件的MD5碼,用戶下載后只需要用工具測(cè)一下下載好的文件,通過對(duì)比就知道該文件是否有過更改變動(dòng).

4.不可逆性

你明明知道密文和加密方式,你卻無法反向計(jì)算出原密碼.

作用:基于這個(gè)特點(diǎn),很多安全的加密方式都是用到.大大提高了數(shù)據(jù)的安全性。

md5撞庫破解

這是概率極低的破解方法,原理就是:

  • 建立一個(gè)大型的數(shù)據(jù)庫,把日常的各個(gè)語句,通過MD5加密成為密文,不斷的積累大量的句子,放在一個(gè)龐大的數(shù)據(jù)庫里.

  • 當(dāng)一個(gè)人拿到了別人的密文,想去查詢真實(shí)的密碼,就需要那這個(gè)密文去到提供這個(gè)數(shù)據(jù)庫的公司網(wǎng)站去查詢.

這就是撞庫的概念.

md5算法過程

MD5算法的過程分為四步:處理原文,設(shè)置初始值,循環(huán)加工,拼接結(jié)果。

第一步:處理原文

首先,我們計(jì)算出原文長(zhǎng)度(bit)對(duì)512求余的結(jié)果,如果不等于448,就需要填充原文使得原文對(duì)512求余的結(jié)果等于448。填充的方法是第一位填充1,其余位填充0。填充完后,信息的長(zhǎng)度就是512*N+448。

之后,用剩余的位置(512-448=64位)記錄原文的真正長(zhǎng)度,把長(zhǎng)度的二進(jìn)制值補(bǔ)在最后。這樣處理后的信息長(zhǎng)度就是512*(N+1)。

第二步:設(shè)置初始值

MD5的哈希結(jié)果長(zhǎng)度為128位,按每32位分成一組共4組。這4組結(jié)果是由4個(gè)初始值A(chǔ)、B、C、D經(jīng)過不斷演變得到。MD5的官方實(shí)現(xiàn)中,A、B、C、D的初始值如下(16進(jìn)制):

A=0x01234567
B=0x89ABCDEF
C=0xFEDCBA98
D=0x76543210

第三步:循環(huán)加工

這一步是最復(fù)雜的一步,我們看看下面這張圖,此圖代表了單次A,B,C,D值演變的流程。

演變流程

圖中,A,B,C,D就是哈希值的四個(gè)分組。每一次循環(huán)都會(huì)讓舊的ABCD產(chǎn)生新的ABCD。一共進(jìn)行多少次循環(huán)呢?由處理后的原文長(zhǎng)度決定。

假設(shè)處理后的原文長(zhǎng)度是M,主循環(huán)次數(shù) = M / 512,每個(gè)主循環(huán)中包含 512 / 32 * 4 = 64 次 子循環(huán)。

上面這張圖所表達(dá)的就是單次子循環(huán)的流程。

下面對(duì)圖中其他元素一一解釋:

1.綠色F
圖中的綠色F,代表非線性函數(shù)。官方MD5所用到的函數(shù)有四種:

F(X, Y, Z) =(X&Y) | ((~X) & Z)
G(X, Y, Z) =(X&Z) | (Y & (~Z))
H(X, Y, Z) =X^Y^Z
I(X, Y, Z)=Y^(X|(~Z))

在主循環(huán)下面64次子循環(huán)中,F(xiàn)、G、H、I 交替使用,第一個(gè)16次使用F,第二個(gè)16次使用G,第三個(gè)16次使用H,第四個(gè)16次使用I。

2.紅色“田”字
很簡(jiǎn)單,紅色的田字代表相加的意思。

3.Mi
Mi是第一步處理后的原文。在第一步中,處理后原文的長(zhǎng)度是512的整數(shù)倍。把原文的每512位再分成16等份,命名為M0M15,每一等份長(zhǎng)度32。在64次子循環(huán)中,每16次循環(huán),都會(huì)交替用到M1M16之一。

4.Ki
一個(gè)常量,在64次子循環(huán)中,每一次用到的常量都是不同的。

5.黃色的<<

第一輪:
    FF(a,b,c,d,M0,7,0xd76aa478)     s[0]=7,   K[0] = 0xd76aa478
   FF(a,b,c,d,M1,12,0xe8c7b756)   s[1]=12,  K[1] = 0xe8c7b756
   FF(a,b,c,d,M2,17,0x242070db)
   FF(a,b,c,d,M3,22,0xc1bdceee)
   FF(a,b,c,d,M4,7,0xf57c0faf)
  FF(a,b,c,d,M5,12,0x4787c62a)
  FF(a,b,c,d,M6,17,0xa8304613)
  FF(a,b,c,d,M7,22,0xfd469501)
  FF(a,b,c,d,M8,7,0x698098d8)
  FF(a,b,c,d,M9,12,0x8b44f7af)
  FF(a,b,c,d,M10,17,0xffff5bb1)
  FF(a,b,c,d,M11,22,0x895cd7be)
  FF(a,b,c,d,M12,7,0x6b901122)
  FF(a,b,c,d,M13,12,0xfd987193)
  FF(a,b,c,d,M14,17, 0xa679438e)
  FF(a,b,c,d,M15,22,0x49b40821)
第二輪:
  GG(a,b,c,d,M1,5,0xf61e2562)
  GG(a,b,c,d,M6,9,0xc040b340)
  GG(a,b,c,d,M11,14,0x265e5a51)
  GG(a,b,c,d,M0,20,0xe9b6c7aa)
  GG(a,b,c,d,M5,5,0xd62f105d)
  GG(a,b,c,d,M10,9,0x02441453)
  GG(a,b,c,d,M15,14,0xd8a1e681)
  GG(a,b,c,d,M4,20,0xe7d3fbc8)
  GG(a,b,c,d,M9,5,0x21e1cde6)
  GG(a,b,c,d,M14,9,0xc33707d6)
  GG(a,b,c,d,M3,14,0xf4d50d87)
  GG(a,b,c,d,M8,20,0x455a14ed)
  GG(a,b,c,d,M13,5,0xa9e3e905)
  GG(a,b,c,d,M2,9,0xfcefa3f8)
  GG(a,b,c,d,M7,14,0x676f02d9)
  GG(a,b,c,d,M12,20,0x8d2a4c8a)
第三輪:
  HH(a,b,c,d,M5,4,0xfffa3942)
  HH(a,b,c,d,M8,11,0x8771f681)
  HH(a,b,c,d,M11,16,0x6d9d6122)
  HH(a,b,c,d,M14,23,0xfde5380c)
  HH(a,b,c,d,M1,4,0xa4beea44)
  HH(a,b,c,d,M4,11,0x4bdecfa9)
  HH(a,b,c,d,M7,16,0xf6bb4b60)
  HH(a,b,c,d,M10,23,0xbebfbc70)
  HH(a,b,c,d,M13,4,0x289b7ec6)
  HH(a,b,c,d,M0,11,0xeaa127fa)
  HH(a,b,c,d,M3,16,0xd4ef3085)
  HH(a,b,c,d,M6,23,0x04881d05)
  HH(a,b,c,d,M9,4,0xd9d4d039)
  HH(a,b,c,d,M12,11,0xe6db99e5)
  HH(a,b,c,d,M15,16,0x1fa27cf8)
  HH(a,b,c,d,M2,23,0xc4ac5665)
第四輪:
 ?、颍╝,b,c,d,M0,6,0xf4292244)
 ?、颍╝,b,c,d,M7,10,0x432aff97)
 ?、颍╝,b,c,d,M14,15,0xab9423a7)
 ?、颍╝,b,c,d,M5,21,0xfc93a039)
  Ⅱ(a,b,c,d,M12,6,0x655b59c3)
 ?、颍╝,b,c,d,M3,10,0x8f0ccc92)
 ?、颍╝,b,c,d,M10,15,0xffeff47d)
 ?、颍╝,b,c,d,M1,21,0x85845dd1)
 ?、颍╝,b,c,d,M8,6,0x6fa87e4f)
 ?、颍╝,b,c,d,M15,10,0xfe2ce6e0)
 ?、颍╝,b,c,d,M6,15,0xa3014314)
 ?、颍╝,b,c,d,M13,21,0x4e0811a1)
 ?、颍╝,b,c,d,M4,6,0xf7537e82)
 ?、颍╝,b,c,d,M11,10,0xbd3af235)
 ?、颍╝,b,c,d,M2,15,0x2ad7d2bb)
  Ⅱ(a,b,c,d,M9,21,0xeb86d391)

第四步:拼接結(jié)果

這一步就很簡(jiǎn)單了,把循環(huán)加工最終產(chǎn)生的A,B,C,D四個(gè)值拼接在一起,轉(zhuǎn)換成字符串即可。

md5算法的Java實(shí)現(xiàn)

public class MD5{
    //四個(gè)鏈接變量
    private final int A=0x67452301;
    private final int B=0xefcdab89;
    private final int C=0x98badcfe;
    private final int D=0x10325476;
    
    //ABCD的臨時(shí)變量
    private int Atemp,Btemp,Ctemp,Dtemp;
     
    //常量ti    公式:floor(abs(sin(i+1))×(2pow32)
    private final int K[]={
        0xd76aa478,0xe8c7b756,0x242070db,0xc1bdceee,
        0xf57c0faf,0x4787c62a,0xa8304613,0xfd469501,0x698098d8,
        0x8b44f7af,0xffff5bb1,0x895cd7be,0x6b901122,0xfd987193,
        0xa679438e,0x49b40821,0xf61e2562,0xc040b340,0x265e5a51,
        0xe9b6c7aa,0xd62f105d,0x02441453,0xd8a1e681,0xe7d3fbc8,
        0x21e1cde6,0xc33707d6,0xf4d50d87,0x455a14ed,0xa9e3e905,
        0xfcefa3f8,0x676f02d9,0x8d2a4c8a,0xfffa3942,0x8771f681,
        0x6d9d6122,0xfde5380c,0xa4beea44,0x4bdecfa9,0xf6bb4b60,
        0xbebfbc70,0x289b7ec6,0xeaa127fa,0xd4ef3085,0x04881d05,
        0xd9d4d039,0xe6db99e5,0x1fa27cf8,0xc4ac5665,0xf4292244,
        0x432aff97,0xab9423a7,0xfc93a039,0x655b59c3,0x8f0ccc92,
        0xffeff47d,0x85845dd1,0x6fa87e4f,0xfe2ce6e0,0xa3014314,
        0x4e0811a1,0xf7537e82,0xbd3af235,0x2ad7d2bb,0xeb86d391};
        
    //向左位移數(shù),計(jì)算方法未知
    private final int s[]={7,12,17,22,7,12,17,22,7,12,17,22,7,
        12,17,22,5,9,14,20,5,9,14,20,5,9,14,20,5,9,14,20,
        4,11,16,23,4,11,16,23,4,11,16,23,4,11,16,23,6,10,
        15,21,6,10,15,21,6,10,15,21,6,10,15,21};
     
    //初始化函數(shù)
    private void init(){
        Atemp=A;
        Btemp=B;
        Ctemp=C;
        Dtemp=D;
    }
    //移動(dòng)一定位數(shù)
    private int shift(int a,int s){
        return(a<<s)|(a>>>(32-s));//右移的時(shí)候,高位一定要補(bǔ)零,而不是補(bǔ)充符號(hào)位
    }
    
    //主循環(huán)
    private void MainLoop(int M[]){
        int F,g;
        int a=Atemp;
        int b=Btemp;
        int c=Ctemp;
        int d=Dtemp;
        for(int i = 0; i < 64; i ++){
            if(i<16){
                F=(b&c)|((~b)&d);
                g=i;
            }else if(i<32){
                F=(d&b)|((~d)&c);
                g=(5*i+1)%16;
            }else if(i<48){
                F=b^c^d;
                g=(3*i+5)%16;
            }else{
                F=c^(b|(~d));
                g=(7*i)%16;
            }
            int tmp=d;
            d=c;
            c=b;
            b=b+shift(a+F+K[i]+M[g],s[i]);
            a=tmp;
        }
        Atemp=a+Atemp;
        Btemp=b+Btemp;
        Ctemp=c+Ctemp;
        Dtemp=d+Dtemp;
    }
    
    /*
    *填充函數(shù)
    *處理后應(yīng)滿足bits≡448(mod512),字節(jié)就是bytes≡56(mode64)
    *填充方式為先加一個(gè)0,其它位補(bǔ)零
    *最后加上64位的原來長(zhǎng)度
    */
    private int[] add(String str){
        int num=((str.length()+8)/64)+1;//以512位,64個(gè)字節(jié)為一組
        int strByte[]=new int[num*16];//64/4=16,所以有16個(gè)整數(shù)
        for(int i=0;i<num*16;i++){//全部初始化0
            strByte[i]=0;
        }
        int    i;
        for(i=0;i<str.length();i++){
            strByte[i>>2]|=str.charAt(i)<<((i%4)*8);//一個(gè)整數(shù)存儲(chǔ)四個(gè)字節(jié),小端序
        }
        strByte[i>>2]|=0x80<<((i%4)*8);//尾部添加1
        //添加原長(zhǎng)度,長(zhǎng)度指位的長(zhǎng)度,所以要乘8,然后是小端序,所以放在倒數(shù)第二個(gè),這里長(zhǎng)度只用了32位
        strByte[num*16-2]=str.length()*8;
            return strByte;
    }
    
    //調(diào)用函數(shù)
    public String getMD5(String source){
        init();
        int strByte[]=add(source);
        for(int i=0;i<strByte.length/16;i++){
        int num[]=new int[16];
        for(int j=0;j<16;j++){
            num[j]=strByte[i*16+j];
        }
        MainLoop(num);
        }
        return changeHex(Atemp)+changeHex(Btemp)+changeHex(Ctemp)+changeHex(Dtemp);
     
    }
    //整數(shù)變成16進(jìn)制字符串
 
    private String changeHex(int a){
        String str="";
        for(int i=0;i<4;i++){
            str+=String.format("%2s", Integer.toHexString(((a>>i*8)%(1<<8))&0xff)).replace(' ', '0');
 
        }
        return str;
    }
    
    //單例
    private static MD5 instance;
    public static MD5 getInstance(){
        if(instance==null){
            instance=new MD5();
        }
        return instance;
    }
     
    private MD5(){};
    
    public static void main(String[] args){
        String str=MD5.getInstance().getMD5("123");
        System.out.println(str);
    }
}

md5算法的應(yīng)用

對(duì)信息產(chǎn)生摘要

MD5的典型應(yīng)用是對(duì)一段信息(Message)產(chǎn)生信息摘要(Message-Digest),以防止被篡改。比如,在UNIX下有很多軟件在下載的時(shí)候都有一個(gè)文件名相同,文件擴(kuò)展名為.md5的文件,在這個(gè)文件中通常只有一行文本,大致結(jié)構(gòu)如:

MD5 (tanajiya.tar.gz) = 0ca175b9c0f726a831d895e269332461

這就是tanajiya.tar.gz文件的數(shù)字簽名。MD5將整個(gè)文件當(dāng)作一個(gè)大文本信息,通過其不可逆的字符串變換算法,產(chǎn)生了這個(gè)唯一的MD5信息摘要。為了讓讀者朋友對(duì)MD5的應(yīng)用有個(gè)直觀的認(rèn)識(shí),筆者以一個(gè)比方和一個(gè)實(shí)例來簡(jiǎn)要描述一下其工作過程:

大家都知道,地球上任何人都有自己獨(dú)一無二的指紋,這常常成為公安機(jī)關(guān)鑒別罪犯身份最值得信賴的方法;與之類似,MD5就可以為任何文件(不管其大小、格式、數(shù)量)產(chǎn)生一個(gè)同樣獨(dú)一無二的“數(shù)字指紋”,如果任何人對(duì)文件做了任何改動(dòng),其MD5值也就是對(duì)應(yīng)的“數(shù)字指紋”都會(huì)發(fā)生變化。

我們常常在某些軟件下載站點(diǎn)的某軟件信息中看到其MD5值,它的作用就在于我們可以在下載該軟件后,對(duì)下載回來的文件用專門的軟件(如Windows MD5 Check等)做一次MD5校驗(yàn),以確保我們獲得的文件與該站點(diǎn)提供的文件為同一文件。利用MD5算法來進(jìn)行文件校驗(yàn)的方案被大量應(yīng)用到軟件下載站、論壇數(shù)據(jù)庫、系統(tǒng)文件安全等方面。

對(duì)字節(jié)串產(chǎn)生指紋

MD5的典型應(yīng)用是對(duì)一段Message(字節(jié)串)產(chǎn)生fingerprint(指紋),以防止被“篡改”。舉個(gè)例子,你將一段話寫在一個(gè)叫 readme.txt文件中,并對(duì)這個(gè)readme.txt產(chǎn)生一個(gè)MD5的值并記錄在案,然后你可以傳播這個(gè)文件給別人,別人如果修改了文件中的任何內(nèi)容,你對(duì)這個(gè)文件重新計(jì)算MD5時(shí)就會(huì)發(fā)現(xiàn)(兩個(gè)MD5值不相同)。如果再有一個(gè)第三方的認(rèn)證機(jī)構(gòu),用MD5還可以防止文件作者的“抵賴”,這就是所謂的數(shù)字簽名應(yīng)用。

登錄認(rèn)證

MD5還廣泛用于操作系統(tǒng)的登陸認(rèn)證上,如Unix、各類BSD系統(tǒng)登錄密碼、數(shù)字簽名等諸多方。如在UNIX系統(tǒng)中用戶的密碼是以MD5(或其它類似的算法)經(jīng)Hash運(yùn)算后存儲(chǔ)在文件系統(tǒng)中。當(dāng)用戶登錄的時(shí)候,系統(tǒng)把用戶輸入的密碼進(jìn)行MD5 Hash運(yùn)算,然后再去和保存在文件系統(tǒng)中的MD5值進(jìn)行比較,進(jìn)而確定輸入的密碼是否正確。通過這樣的步驟,系統(tǒng)在并不知道用戶密碼的明碼的情況下就可以確定用戶登錄系統(tǒng)的合法性。這可以避免用戶的密碼被具有系統(tǒng)管理員權(quán)限的用戶知道。MD5將任意長(zhǎng)度的“字節(jié)串”映射為一個(gè)128bit的大整數(shù),并且是通過該128bit反推原始字符串是困難的,換句話說就是,即使你看到源程序和算法描述,也無法將一個(gè)MD5的值變換回原始的字符串,從數(shù)學(xué)原理上說,是因?yàn)樵嫉淖址袩o窮多個(gè),這有點(diǎn)象不存在反函數(shù)的數(shù)學(xué)函數(shù)。所以,要遇到了md5密碼的問題,比較好的辦法是:你可以用這個(gè)系統(tǒng)中的md5()函數(shù)重新設(shè)一個(gè)密碼,如admin,把生成的一串密碼的Hash值覆蓋原來的Hash值就行了。

正是因?yàn)檫@個(gè)原因,現(xiàn)在被黑客使用最多的一種破譯密碼的方法就是一種被稱為"跑字典"的方法。有兩種方法得到字典,一種是日常搜集的用做密碼的字符串表,另一種是用排列組合方法生成的,先用MD5程序計(jì)算出這些字典項(xiàng)的MD5值,然后再用目標(biāo)的MD5值在這個(gè)字典中檢索。我們假設(shè)密碼的最大長(zhǎng)度為8位字節(jié)(8 Bytes),同時(shí)密碼只能是字母和數(shù)字,共26+26+10=62個(gè)字符,排列組合出的字典的項(xiàng)數(shù)則是P(62,1)+P(62,2)….+P(62,8),那也已經(jīng)是一個(gè)很天文的數(shù)字了,存儲(chǔ)這個(gè)字典就需要TB級(jí)的磁盤陣列,而且這種方法還有一個(gè)前提,就是能獲得目標(biāo)賬戶的密碼MD5值的情況下才可以。這種加密技術(shù)被廣泛的應(yīng)用于UNIX系統(tǒng)中,這也是為什么UNIX系統(tǒng)比一般操作系統(tǒng)更為堅(jiān)固一個(gè)重要原因。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容