利用 Python 破解 ZIP 或 RAR 文件密碼

我們經(jīng)常會(huì)從網(wǎng)絡(luò)上下載一些帶密碼的壓縮包,想要獲取里面的內(nèi)容,往往就要給提供商支付一些費(fèi)用。想要白嫖其中的內(nèi)容,常見的做法是百度搜索一些壓縮包密碼破解軟件,但后果相信體驗(yàn)過的人都知道。本文將會(huì)利用 Python 破解壓縮包的密碼,這里以 ZIP/RAR 為例。

!

破解原理

其實(shí)原理很簡(jiǎn)單,一句話概括就是「大力出奇跡」,Python 有兩個(gè)壓縮文件庫:zipfile和?rarfile,這兩個(gè)庫提供的解壓縮方法?extractall()?可以指定密碼,這樣的話首先生成一個(gè)密碼字典(手動(dòng)或用程序),然后依次嘗試其中的密碼,如果能夠正常解壓縮則表示密碼正確。

實(shí)驗(yàn)環(huán)境

本文采取的虛擬環(huán)境為 Pipenv,有關(guān) Pipenv 的詳細(xì)介紹可以參考我的這篇文章 ??《Python 管理哪家強(qiáng)?

zipfile:Python 標(biāo)準(zhǔn)庫,使用時(shí)直接導(dǎo)入即可


rarfile:Python 第三方庫,使用時(shí)需要安裝,API 文檔(https://rarfile.readthedocs.io/en/latest/api.html)


利用 Pipenv 安裝 rarfile

pipenv install rarfile

最后,再將一個(gè)帶有密碼的壓縮包放入實(shí)驗(yàn)環(huán)境中即可。

編碼

知道原理后,編碼就會(huì)非常簡(jiǎn)單了

準(zhǔn)備密碼本

「密碼本」其實(shí)就是一個(gè)包含了所有可能密碼的文件,用戶可以手動(dòng)錄入,也可以用程序錄入。文末還會(huì)有一個(gè)介紹。

讀取壓縮文件

# 根據(jù)文件擴(kuò)展名,使用不同的庫

if?filename.endswith('.zip'):

fp?=?zipfile.ZipFile(filename)

elif?filename.endswith('.rar'):

fp?=?rarfile.RarFile(filename)

嘗試解壓

先嘗試不用密碼解壓縮,如果成功則表示壓縮文件沒有密碼

fp.extractall(desPath)

fp.close()

print('No password')

return

暴力破解

try:

# 讀取密碼本文件

fpPwd?=?open('pwd.txt')

except:

print('No dict file pwd.txt in current directory.')

return

for?pwd?in?fpPwd:

pwd?=?pwd.rstrip()

try:

fp.extractall(path=desPath,?pwd=pwd.encode())

print('Success! ====>'+pwd)

fp.close()

break

except:

pass

fpPwd.close()

程序入口

if?__name__?==?'__main__':

filename?=?sys.argv[1]

if?os.path.isfile(filename)?and?filename.endswith(('.zip',?'.rar')):

decryptRarZipFile(filename)

else:

print('Must be Rar or Zip file')

使用

如果想要使用上述代碼,我們只需在命令行執(zhí)行?python main.py<filename>即可。例如?python main.py test.zip

運(yùn)行結(jié)果:

$ python main.py test.zip

Success!?====>323126

擴(kuò)展

密碼本如何獲取?

看到這里,細(xì)心的小伙伴一定會(huì)發(fā)現(xiàn),最核心的其實(shí)不是代碼,而是「密碼本」。理論上只要密碼本中的密碼足夠多,就一定能獲取到壓縮包的密碼,這也就是俗稱的「撞庫」

這時(shí)問題又來了,如何搜集到足夠多的密碼?我在搜索資料的時(shí)候發(fā)現(xiàn)已經(jīng)有人整理好了,我 fork 了一份到了自己的倉庫,有興趣的可以點(diǎn)擊 ??爆破字典(https://github.com/YueYongDev/Blasting_dictionary)

如何加速破解過程?

解決了密碼本的問題,深入思考的小伙伴的一定又會(huì)有新的疑問,密碼本既然如此龐大,那如何加速破解的過程呢?這里給出兩個(gè)思路

多線程(進(jìn)程)破解

密碼本如果很多且密碼數(shù)量龐大時(shí),我們可以采用多線程(進(jìn)程)的方式讀取密碼,一個(gè)進(jìn)程讀一個(gè)密碼本,一個(gè)線程分段讀密碼。當(dāng)然,如果是在 python 中,建議不要采用多線程,因?yàn)?python 中的線程就是雞肋,有興趣的可以閱讀相關(guān)資料。

利用 GPU 加速

我們以上的代碼都是運(yùn)行在 CPU 上的,即使開啟多線程(進(jìn)程)也只是利用到 CPU 的資源,但如果想要加速破解過程,我們其實(shí)還可以利用閑置的 GPU 資源。

在介紹為什么可以利用 GPU 加速前,我們需要明確一個(gè)觀點(diǎn),兩者都為了完成計(jì)算任務(wù)而設(shè)計(jì)。

那為什么會(huì)想到使用 GPU 加速呢?這是就要說到兩者的不同了:CPU 雖然有多核,但總數(shù)沒有超過兩位數(shù),并且每個(gè)核的運(yùn)算能力極其強(qiáng)大。而 GPU 的核數(shù)遠(yuǎn)超 CPU,但每個(gè)核的運(yùn)算能力與 CPU 的核相比就相差甚遠(yuǎn)了。

我們可以簡(jiǎn)單的舉個(gè)例子,解一道題,CPU 就是博士生,GPU 就是小學(xué)生,CPU 負(fù)責(zé)理解題目并且整理出解題的步驟以及解法,而 GPU 負(fù)責(zé)其中很簡(jiǎn)單但是數(shù)量又很大的簡(jiǎn)單運(yùn)算就行了。

因此理論上在破解密碼的過程中,我們完全可以使用 GPU 來加速這一過程。

事實(shí)上,這樣的工具也已經(jīng)出現(xiàn)了,Hashcat?便是最出名的一個(gè),它號(hào)稱是世界上最快的密碼恢復(fù)工具,可以基于 CPU/GPU 工作。有興趣的可以訪問他的官網(wǎng)https://hashcat.net/hashcat/進(jìn)行了解。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容