簡(jiǎn)介
MD5消息摘要算法(MD5 Message-Digest Algorithm),是一種被廣泛使用的密碼散列函數(shù),可以產(chǎn)生出一個(gè)128位(16字節(jié))的散列值(hash value),用于確保信息傳輸完整一致。
MD5算法經(jīng)常用以進(jìn)行文件、應(yīng)用到軟件下載站、論壇數(shù)據(jù)庫、系統(tǒng)文件安全校驗(yàn)等。MD5的典型應(yīng)用是對(duì)一段信息(Message)產(chǎn)生信息摘要(Message-Digest),以防止被篡改。大致結(jié)構(gòu)如下:
MD5 (“內(nèi)容”) = 38b8c2c1093dd0fec383a9d9ac940515(32位)
md5特點(diǎn)
1.長(zhǎng)度固定:
不管多長(zhǎng)的字符串,加密后長(zhǎng)度都是一樣長(zhǎng)
作用:方便平時(shí)信息的統(tǒng)計(jì)和管理
2.易計(jì)算:
字符串和文件加密的過程是容易的.
作用: 開發(fā)者很容易理解和做出加密工具
3.細(xì)微性
一個(gè)文件,不管多大,小到幾k,大到幾G,你只要改變里面某個(gè)字符,那么都會(huì)導(dǎo)致MD5值改變.
作用:很多軟件和應(yīng)用在網(wǎng)站提供下載資源,其中包含了對(duì)文件的MD5碼,用戶下載后只需要用工具測(cè)一下下載好的文件,通過對(duì)比就知道該文件是否有過更改變動(dòng).
4.不可逆性
你明明知道密文和加密方式,你卻無法反向計(jì)算出原密碼.
作用:基于這個(gè)特點(diǎn),很多安全的加密方式都是用到.大大提高了數(shù)據(jù)的安全性。
md5撞庫破解
這是概率極低的破解方法,原理就是:
建立一個(gè)大型的數(shù)據(jù)庫,把日常的各個(gè)語句,通過MD5加密成為密文,不斷的積累大量的句子,放在一個(gè)龐大的數(shù)據(jù)庫里.
當(dāng)一個(gè)人拿到了別人的密文,想去查詢真實(shí)的密碼,就需要那這個(gè)密文去到提供這個(gè)數(shù)據(jù)庫的公司網(wǎng)站去查詢.
這就是撞庫的概念.
md5算法過程
MD5算法的過程分為四步:處理原文,設(shè)置初始值,循環(huán)加工,拼接結(jié)果。
第一步:處理原文
首先,我們計(jì)算出原文長(zhǎng)度(bit)對(duì)512求余的結(jié)果,如果不等于448,就需要填充原文使得原文對(duì)512求余的結(jié)果等于448。填充的方法是第一位填充1,其余位填充0。填充完后,信息的長(zhǎng)度就是512*N+448。
之后,用剩余的位置(512-448=64位)記錄原文的真正長(zhǎng)度,把長(zhǎng)度的二進(jìn)制值補(bǔ)在最后。這樣處理后的信息長(zhǎng)度就是512*(N+1)。
第二步:設(shè)置初始值
MD5的哈希結(jié)果長(zhǎng)度為128位,按每32位分成一組共4組。這4組結(jié)果是由4個(gè)初始值A(chǔ)、B、C、D經(jīng)過不斷演變得到。MD5的官方實(shí)現(xiàn)中,A、B、C、D的初始值如下(16進(jìn)制):
A=0x01234567
B=0x89ABCDEF
C=0xFEDCBA98
D=0x76543210
第三步:循環(huán)加工
這一步是最復(fù)雜的一步,我們看看下面這張圖,此圖代表了單次A,B,C,D值演變的流程。
圖中,A,B,C,D就是哈希值的四個(gè)分組。每一次循環(huán)都會(huì)讓舊的ABCD產(chǎn)生新的ABCD。一共進(jìn)行多少次循環(huán)呢?由處理后的原文長(zhǎng)度決定。
假設(shè)處理后的原文長(zhǎng)度是M,主循環(huán)次數(shù) = M / 512,每個(gè)主循環(huán)中包含 512 / 32 * 4 = 64 次 子循環(huán)。
上面這張圖所表達(dá)的就是單次子循環(huán)的流程。
下面對(duì)圖中其他元素一一解釋:
1.綠色F
圖中的綠色F,代表非線性函數(shù)。官方MD5所用到的函數(shù)有四種:
F(X, Y, Z) =(X&Y) | ((~X) & Z)
G(X, Y, Z) =(X&Z) | (Y & (~Z))
H(X, Y, Z) =X^Y^Z
I(X, Y, Z)=Y^(X|(~Z))
在主循環(huán)下面64次子循環(huán)中,F(xiàn)、G、H、I 交替使用,第一個(gè)16次使用F,第二個(gè)16次使用G,第三個(gè)16次使用H,第四個(gè)16次使用I。
2.紅色“田”字
很簡(jiǎn)單,紅色的田字代表相加的意思。
3.Mi
Mi是第一步處理后的原文。在第一步中,處理后原文的長(zhǎng)度是512的整數(shù)倍。把原文的每512位再分成16等份,命名為M0M15,每一等份長(zhǎng)度32。在64次子循環(huán)中,每16次循環(huán),都會(huì)交替用到M1M16之一。
4.Ki
一個(gè)常量,在64次子循環(huán)中,每一次用到的常量都是不同的。
5.黃色的<<
第一輪:
FF(a,b,c,d,M0,7,0xd76aa478) s[0]=7, K[0] = 0xd76aa478
FF(a,b,c,d,M1,12,0xe8c7b756) s[1]=12, K[1] = 0xe8c7b756
FF(a,b,c,d,M2,17,0x242070db)
FF(a,b,c,d,M3,22,0xc1bdceee)
FF(a,b,c,d,M4,7,0xf57c0faf)
FF(a,b,c,d,M5,12,0x4787c62a)
FF(a,b,c,d,M6,17,0xa8304613)
FF(a,b,c,d,M7,22,0xfd469501)
FF(a,b,c,d,M8,7,0x698098d8)
FF(a,b,c,d,M9,12,0x8b44f7af)
FF(a,b,c,d,M10,17,0xffff5bb1)
FF(a,b,c,d,M11,22,0x895cd7be)
FF(a,b,c,d,M12,7,0x6b901122)
FF(a,b,c,d,M13,12,0xfd987193)
FF(a,b,c,d,M14,17, 0xa679438e)
FF(a,b,c,d,M15,22,0x49b40821)
第二輪:
GG(a,b,c,d,M1,5,0xf61e2562)
GG(a,b,c,d,M6,9,0xc040b340)
GG(a,b,c,d,M11,14,0x265e5a51)
GG(a,b,c,d,M0,20,0xe9b6c7aa)
GG(a,b,c,d,M5,5,0xd62f105d)
GG(a,b,c,d,M10,9,0x02441453)
GG(a,b,c,d,M15,14,0xd8a1e681)
GG(a,b,c,d,M4,20,0xe7d3fbc8)
GG(a,b,c,d,M9,5,0x21e1cde6)
GG(a,b,c,d,M14,9,0xc33707d6)
GG(a,b,c,d,M3,14,0xf4d50d87)
GG(a,b,c,d,M8,20,0x455a14ed)
GG(a,b,c,d,M13,5,0xa9e3e905)
GG(a,b,c,d,M2,9,0xfcefa3f8)
GG(a,b,c,d,M7,14,0x676f02d9)
GG(a,b,c,d,M12,20,0x8d2a4c8a)
第三輪:
HH(a,b,c,d,M5,4,0xfffa3942)
HH(a,b,c,d,M8,11,0x8771f681)
HH(a,b,c,d,M11,16,0x6d9d6122)
HH(a,b,c,d,M14,23,0xfde5380c)
HH(a,b,c,d,M1,4,0xa4beea44)
HH(a,b,c,d,M4,11,0x4bdecfa9)
HH(a,b,c,d,M7,16,0xf6bb4b60)
HH(a,b,c,d,M10,23,0xbebfbc70)
HH(a,b,c,d,M13,4,0x289b7ec6)
HH(a,b,c,d,M0,11,0xeaa127fa)
HH(a,b,c,d,M3,16,0xd4ef3085)
HH(a,b,c,d,M6,23,0x04881d05)
HH(a,b,c,d,M9,4,0xd9d4d039)
HH(a,b,c,d,M12,11,0xe6db99e5)
HH(a,b,c,d,M15,16,0x1fa27cf8)
HH(a,b,c,d,M2,23,0xc4ac5665)
第四輪:
?、颍╝,b,c,d,M0,6,0xf4292244)
?、颍╝,b,c,d,M7,10,0x432aff97)
?、颍╝,b,c,d,M14,15,0xab9423a7)
?、颍╝,b,c,d,M5,21,0xfc93a039)
Ⅱ(a,b,c,d,M12,6,0x655b59c3)
?、颍╝,b,c,d,M3,10,0x8f0ccc92)
?、颍╝,b,c,d,M10,15,0xffeff47d)
?、颍╝,b,c,d,M1,21,0x85845dd1)
?、颍╝,b,c,d,M8,6,0x6fa87e4f)
?、颍╝,b,c,d,M15,10,0xfe2ce6e0)
?、颍╝,b,c,d,M6,15,0xa3014314)
?、颍╝,b,c,d,M13,21,0x4e0811a1)
?、颍╝,b,c,d,M4,6,0xf7537e82)
?、颍╝,b,c,d,M11,10,0xbd3af235)
?、颍╝,b,c,d,M2,15,0x2ad7d2bb)
Ⅱ(a,b,c,d,M9,21,0xeb86d391)
第四步:拼接結(jié)果
這一步就很簡(jiǎn)單了,把循環(huán)加工最終產(chǎn)生的A,B,C,D四個(gè)值拼接在一起,轉(zhuǎn)換成字符串即可。
md5算法的Java實(shí)現(xiàn)
public class MD5{
//四個(gè)鏈接變量
private final int A=0x67452301;
private final int B=0xefcdab89;
private final int C=0x98badcfe;
private final int D=0x10325476;
//ABCD的臨時(shí)變量
private int Atemp,Btemp,Ctemp,Dtemp;
//常量ti 公式:floor(abs(sin(i+1))×(2pow32)
private final int K[]={
0xd76aa478,0xe8c7b756,0x242070db,0xc1bdceee,
0xf57c0faf,0x4787c62a,0xa8304613,0xfd469501,0x698098d8,
0x8b44f7af,0xffff5bb1,0x895cd7be,0x6b901122,0xfd987193,
0xa679438e,0x49b40821,0xf61e2562,0xc040b340,0x265e5a51,
0xe9b6c7aa,0xd62f105d,0x02441453,0xd8a1e681,0xe7d3fbc8,
0x21e1cde6,0xc33707d6,0xf4d50d87,0x455a14ed,0xa9e3e905,
0xfcefa3f8,0x676f02d9,0x8d2a4c8a,0xfffa3942,0x8771f681,
0x6d9d6122,0xfde5380c,0xa4beea44,0x4bdecfa9,0xf6bb4b60,
0xbebfbc70,0x289b7ec6,0xeaa127fa,0xd4ef3085,0x04881d05,
0xd9d4d039,0xe6db99e5,0x1fa27cf8,0xc4ac5665,0xf4292244,
0x432aff97,0xab9423a7,0xfc93a039,0x655b59c3,0x8f0ccc92,
0xffeff47d,0x85845dd1,0x6fa87e4f,0xfe2ce6e0,0xa3014314,
0x4e0811a1,0xf7537e82,0xbd3af235,0x2ad7d2bb,0xeb86d391};
//向左位移數(shù),計(jì)算方法未知
private final int s[]={7,12,17,22,7,12,17,22,7,12,17,22,7,
12,17,22,5,9,14,20,5,9,14,20,5,9,14,20,5,9,14,20,
4,11,16,23,4,11,16,23,4,11,16,23,4,11,16,23,6,10,
15,21,6,10,15,21,6,10,15,21,6,10,15,21};
//初始化函數(shù)
private void init(){
Atemp=A;
Btemp=B;
Ctemp=C;
Dtemp=D;
}
//移動(dòng)一定位數(shù)
private int shift(int a,int s){
return(a<<s)|(a>>>(32-s));//右移的時(shí)候,高位一定要補(bǔ)零,而不是補(bǔ)充符號(hào)位
}
//主循環(huán)
private void MainLoop(int M[]){
int F,g;
int a=Atemp;
int b=Btemp;
int c=Ctemp;
int d=Dtemp;
for(int i = 0; i < 64; i ++){
if(i<16){
F=(b&c)|((~b)&d);
g=i;
}else if(i<32){
F=(d&b)|((~d)&c);
g=(5*i+1)%16;
}else if(i<48){
F=b^c^d;
g=(3*i+5)%16;
}else{
F=c^(b|(~d));
g=(7*i)%16;
}
int tmp=d;
d=c;
c=b;
b=b+shift(a+F+K[i]+M[g],s[i]);
a=tmp;
}
Atemp=a+Atemp;
Btemp=b+Btemp;
Ctemp=c+Ctemp;
Dtemp=d+Dtemp;
}
/*
*填充函數(shù)
*處理后應(yīng)滿足bits≡448(mod512),字節(jié)就是bytes≡56(mode64)
*填充方式為先加一個(gè)0,其它位補(bǔ)零
*最后加上64位的原來長(zhǎng)度
*/
private int[] add(String str){
int num=((str.length()+8)/64)+1;//以512位,64個(gè)字節(jié)為一組
int strByte[]=new int[num*16];//64/4=16,所以有16個(gè)整數(shù)
for(int i=0;i<num*16;i++){//全部初始化0
strByte[i]=0;
}
int i;
for(i=0;i<str.length();i++){
strByte[i>>2]|=str.charAt(i)<<((i%4)*8);//一個(gè)整數(shù)存儲(chǔ)四個(gè)字節(jié),小端序
}
strByte[i>>2]|=0x80<<((i%4)*8);//尾部添加1
//添加原長(zhǎng)度,長(zhǎng)度指位的長(zhǎng)度,所以要乘8,然后是小端序,所以放在倒數(shù)第二個(gè),這里長(zhǎng)度只用了32位
strByte[num*16-2]=str.length()*8;
return strByte;
}
//調(diào)用函數(shù)
public String getMD5(String source){
init();
int strByte[]=add(source);
for(int i=0;i<strByte.length/16;i++){
int num[]=new int[16];
for(int j=0;j<16;j++){
num[j]=strByte[i*16+j];
}
MainLoop(num);
}
return changeHex(Atemp)+changeHex(Btemp)+changeHex(Ctemp)+changeHex(Dtemp);
}
//整數(shù)變成16進(jìn)制字符串
private String changeHex(int a){
String str="";
for(int i=0;i<4;i++){
str+=String.format("%2s", Integer.toHexString(((a>>i*8)%(1<<8))&0xff)).replace(' ', '0');
}
return str;
}
//單例
private static MD5 instance;
public static MD5 getInstance(){
if(instance==null){
instance=new MD5();
}
return instance;
}
private MD5(){};
public static void main(String[] args){
String str=MD5.getInstance().getMD5("123");
System.out.println(str);
}
}
md5算法的應(yīng)用
對(duì)信息產(chǎn)生摘要
MD5的典型應(yīng)用是對(duì)一段信息(Message)產(chǎn)生信息摘要(Message-Digest),以防止被篡改。比如,在UNIX下有很多軟件在下載的時(shí)候都有一個(gè)文件名相同,文件擴(kuò)展名為.md5的文件,在這個(gè)文件中通常只有一行文本,大致結(jié)構(gòu)如:
MD5 (tanajiya.tar.gz) = 0ca175b9c0f726a831d895e269332461
這就是tanajiya.tar.gz文件的數(shù)字簽名。MD5將整個(gè)文件當(dāng)作一個(gè)大文本信息,通過其不可逆的字符串變換算法,產(chǎn)生了這個(gè)唯一的MD5信息摘要。為了讓讀者朋友對(duì)MD5的應(yīng)用有個(gè)直觀的認(rèn)識(shí),筆者以一個(gè)比方和一個(gè)實(shí)例來簡(jiǎn)要描述一下其工作過程:
大家都知道,地球上任何人都有自己獨(dú)一無二的指紋,這常常成為公安機(jī)關(guān)鑒別罪犯身份最值得信賴的方法;與之類似,MD5就可以為任何文件(不管其大小、格式、數(shù)量)產(chǎn)生一個(gè)同樣獨(dú)一無二的“數(shù)字指紋”,如果任何人對(duì)文件做了任何改動(dòng),其MD5值也就是對(duì)應(yīng)的“數(shù)字指紋”都會(huì)發(fā)生變化。
我們常常在某些軟件下載站點(diǎn)的某軟件信息中看到其MD5值,它的作用就在于我們可以在下載該軟件后,對(duì)下載回來的文件用專門的軟件(如Windows MD5 Check等)做一次MD5校驗(yàn),以確保我們獲得的文件與該站點(diǎn)提供的文件為同一文件。利用MD5算法來進(jìn)行文件校驗(yàn)的方案被大量應(yīng)用到軟件下載站、論壇數(shù)據(jù)庫、系統(tǒng)文件安全等方面。
對(duì)字節(jié)串產(chǎn)生指紋
MD5的典型應(yīng)用是對(duì)一段Message(字節(jié)串)產(chǎn)生fingerprint(指紋),以防止被“篡改”。舉個(gè)例子,你將一段話寫在一個(gè)叫 readme.txt文件中,并對(duì)這個(gè)readme.txt產(chǎn)生一個(gè)MD5的值并記錄在案,然后你可以傳播這個(gè)文件給別人,別人如果修改了文件中的任何內(nèi)容,你對(duì)這個(gè)文件重新計(jì)算MD5時(shí)就會(huì)發(fā)現(xiàn)(兩個(gè)MD5值不相同)。如果再有一個(gè)第三方的認(rèn)證機(jī)構(gòu),用MD5還可以防止文件作者的“抵賴”,這就是所謂的數(shù)字簽名應(yīng)用。
登錄認(rèn)證
MD5還廣泛用于操作系統(tǒng)的登陸認(rèn)證上,如Unix、各類BSD系統(tǒng)登錄密碼、數(shù)字簽名等諸多方。如在UNIX系統(tǒng)中用戶的密碼是以MD5(或其它類似的算法)經(jīng)Hash運(yùn)算后存儲(chǔ)在文件系統(tǒng)中。當(dāng)用戶登錄的時(shí)候,系統(tǒng)把用戶輸入的密碼進(jìn)行MD5 Hash運(yùn)算,然后再去和保存在文件系統(tǒng)中的MD5值進(jìn)行比較,進(jìn)而確定輸入的密碼是否正確。通過這樣的步驟,系統(tǒng)在并不知道用戶密碼的明碼的情況下就可以確定用戶登錄系統(tǒng)的合法性。這可以避免用戶的密碼被具有系統(tǒng)管理員權(quán)限的用戶知道。MD5將任意長(zhǎng)度的“字節(jié)串”映射為一個(gè)128bit的大整數(shù),并且是通過該128bit反推原始字符串是困難的,換句話說就是,即使你看到源程序和算法描述,也無法將一個(gè)MD5的值變換回原始的字符串,從數(shù)學(xué)原理上說,是因?yàn)樵嫉淖址袩o窮多個(gè),這有點(diǎn)象不存在反函數(shù)的數(shù)學(xué)函數(shù)。所以,要遇到了md5密碼的問題,比較好的辦法是:你可以用這個(gè)系統(tǒng)中的md5()函數(shù)重新設(shè)一個(gè)密碼,如admin,把生成的一串密碼的Hash值覆蓋原來的Hash值就行了。
正是因?yàn)檫@個(gè)原因,現(xiàn)在被黑客使用最多的一種破譯密碼的方法就是一種被稱為"跑字典"的方法。有兩種方法得到字典,一種是日常搜集的用做密碼的字符串表,另一種是用排列組合方法生成的,先用MD5程序計(jì)算出這些字典項(xiàng)的MD5值,然后再用目標(biāo)的MD5值在這個(gè)字典中檢索。我們假設(shè)密碼的最大長(zhǎng)度為8位字節(jié)(8 Bytes),同時(shí)密碼只能是字母和數(shù)字,共26+26+10=62個(gè)字符,排列組合出的字典的項(xiàng)數(shù)則是P(62,1)+P(62,2)….+P(62,8),那也已經(jīng)是一個(gè)很天文的數(shù)字了,存儲(chǔ)這個(gè)字典就需要TB級(jí)的磁盤陣列,而且這種方法還有一個(gè)前提,就是能獲得目標(biāo)賬戶的密碼MD5值的情況下才可以。這種加密技術(shù)被廣泛的應(yīng)用于UNIX系統(tǒng)中,這也是為什么UNIX系統(tǒng)比一般操作系統(tǒng)更為堅(jiān)固一個(gè)重要原因。