在開發(fā)過程中,避免不了要涉及到數(shù)據(jù)加密,比如用戶賬號(hào)密碼的加密,用戶敏感數(shù)據(jù)的加密,涉及到的加密算法種類繁多,作為拿來主義的開發(fā)者時(shí)間精力有限,能夠清楚其中主流的加密算法和用途,就已經(jīng)足夠了。

主要的數(shù)據(jù)加密算法主要有:md5、sha、aes、des、rsa、base64等等。
先來看看我們的老熟人:md5算法,
MD5算法是哈希算法的一種,雖然不能算真正意義上的加密算法,但幾乎在任何一個(gè)系統(tǒng)中,都少不了他的身影。MD5算法全稱叫 Message Digest Algorithm 5(信息摘要算法5),是數(shù)字摘要算法的一種實(shí)現(xiàn),摘要長(zhǎng)度為128位。由于它哈希算法的典型特征,注定了他無法從密文準(zhǔn)確還原出明文,因此MD5算法不能算真正的加密算法,但在很多地方也籠統(tǒng)地叫它是加密算法。由于其具備了足夠的復(fù)雜性和不可逆性,因此主要用于確保信息傳輸完整性和一致性。他還有早期的“不太爭(zhēng)氣”的幾代MD2、MD3、MD4(早期的幾代就是由于復(fù)雜度不夠被破解了)。正是由于MD5算法有如此特性,在業(yè)界應(yīng)用非常廣泛,主流的編程語言都自帶有MD5的實(shí)現(xiàn)。

最常見的,很多系統(tǒng)中的用戶密碼都采用了MD5加密算法進(jìn)行加密。但是樹大必然招風(fēng),就像windows系統(tǒng)應(yīng)用廣泛了,安全性就收到了挑戰(zhàn),MD5也不例外。度娘一下就會(huì)發(fā)現(xiàn),有諸多網(wǎng)站提供MD5破解,有的甚至需要收費(fèi)提供破解服務(wù)。
不過不用擔(dān)心,目前能破解MD5并還原出原始數(shù)據(jù)的成功率很低(當(dāng)然像123456這種弱智的原文,就不要提了,其他的破解可以自行度娘試試)。這就需要提到現(xiàn)行MD5算法的主要破解思路,其實(shí)核心只有一個(gè),那就是暴力碰撞(其他還有兩種 字典法、彩虹表法都是暴力碰撞法的改良,原理一樣),說白了就是用已知的字符進(jìn)行各種變態(tài)組合,生成眾多的密文與原文的對(duì)應(yīng)庫,然后反向根據(jù)密文,找到對(duì)應(yīng)的明文。
比如,你的明文數(shù)據(jù)是 abcd1234(當(dāng)然實(shí)際不應(yīng)該這么簡(jiǎn)單,這里只是舉例),加密出來的密文是e19d5cd5af0378da05f63f891c7467af,那么不安好心的人就會(huì)用密文e19d5cd5af0378da05f63f891c7467af去提供這種破解的工具或者服務(wù)那里,查詢這個(gè)密文有沒有對(duì)應(yīng)明文,如果有,就代表破解成功了,然后他就拿這個(gè)“破解”得到的明文去登錄你的賬號(hào),結(jié)果可想而知。

成功進(jìn)入了你的領(lǐng)地,但這個(gè)成功,是不完美的。因?yàn)閙d5的不可逆性,大多數(shù)賬號(hào)登錄過程,只能拿用戶輸入的原文加密成MD5密文后去跟數(shù)據(jù)庫里的密文比較,相同則認(rèn)定密碼正確。
但這也有漏網(wǎng)之魚,因?yàn)榧词蛊平獬鰜淼慕Y(jié)果不是上面說到的abcd1234而是xxxxx,也有可能用xxxx成功登錄系統(tǒng)。
因?yàn)镸D5雖然不可逆,但不是唯一性。 這里所謂的破解,并非把摘要還原成原文。為什么呢?因?yàn)楣潭?28位的摘要(也就是加密后的密文)是有窮的,而原文數(shù)量是無窮的,每一個(gè)摘要都可以由若干個(gè)原文通過Hash得到。換句人話說,就是不同的原文可能加密后得到相同的密文。那么拿密文猜測(cè)原文就會(huì)得到多個(gè)結(jié)果,單純比較密文,就會(huì)被認(rèn)為是一致的。而反過來,也是同理。拿到不一定對(duì)的還原出來的明文去做其他操作,也不一定能成功。

總結(jié)一下,MD5加密算法之所以破解成功的概率很低,主要由于以下幾點(diǎn):
1)依賴暴力碰撞的破解思路,意味著需要盡可能多的組合所有字符,形成海量的配對(duì)庫,用于通過密文反向查詢明文,但字符種類千千萬萬,所有都進(jìn)行組合,可能性都超過地球的細(xì)胞總數(shù)了,估計(jì)現(xiàn)在所有硬盤加在一起的空間都存不下,成本之高,可想而知。
2)目前能破解的都屬于已經(jīng)被組合猜測(cè)過的,一般也都是長(zhǎng)度較短的或者比較有規(guī)律的組合。只要長(zhǎng)度越長(zhǎng)越?jīng)]有規(guī)律,不同類型字符組合越多,破解概率越低,幾乎不會(huì)成功。
3)就算密文對(duì)了,原始明文也不一定對(duì),當(dāng)然這是最后一道防線,聽天由命了。
另外,MD5的用途,目前主流的無非兩種,一種是用于類似用戶密碼等不需要還原的敏感數(shù)據(jù)的加密,一種是用于確保信息傳輸完整性和一致性。其實(shí),第二種用途才是他誕生的初衷。
這里簡(jiǎn)單提一下第二種用途。很多支付接口、數(shù)據(jù)交互接口,都采用基于MD5來確保數(shù)據(jù)的完整性和一致性,也就是在網(wǎng)絡(luò)傳輸過程中沒有被篡改。如何保證數(shù)據(jù)不被篡改,僅僅依靠MD5做不到,還需要聯(lián)手其他加密算法,具體請(qǐng)后續(xù)再談。
本文由弈碼當(dāng)先 root1024 獨(dú)家發(fā)布!