《攻殼機動隊》描述了大量機器技術深入發(fā)展的時代的犯罪形態(tài),而早在《2010太空漫游》,新如《異形:契約》中也都有大量對“不友好”的人工智能的描述。當然這些都是對發(fā)展人工智能的風險的揣測,但其實在初期人工智能作為一種工具。雖然工具“本無善惡”,但當強大的人工智能為惡人掌握的時候,其“惡能”也更為強大!
今年9月,浙江紹興警方宣布破獲全國首例利用人工智能技術竊取公民個人信息的案件,截獲了 10 億余組公民個人信息。
關于上述案件的詳細介紹老土轉(zhuǎn)載如下文。
AI 開始進入我們的生活,棲息在智能音箱或者手機里的它們,是能夠給你放音樂、陪聊天的助手,而在互聯(lián)網(wǎng)的灰色地帶里,它們也正成為犯罪分子的幫兇。
今年 9 月,浙江紹興警方公布,破獲全國首例利用人工智能技術竊取公民個人信息的案件,截獲了 10 億余組公民個人信息。
被警方查封的平臺叫做「快啊」,曾經(jīng)是市場上最大的打碼平臺。他們在破解、竊取、販賣和盜用個人信息實施詐騙有著完整的鏈條,其中人工智能技術運用在識別驗證碼這個環(huán)節(jié)。
為什么 AI 會先學習識別驗證碼?
一般而言,黑產(chǎn)最初盜取的賬號密碼信息往往是「粗糙」的。但由于人們的同一個郵箱,通常也是多個網(wǎng)站的登陸賬號,同樣的密碼往往也在多個網(wǎng)站使用。因此黑產(chǎn)會通過利用已有的賬號密碼信息,去批量嘗試這些賬號密碼能否在更多不同的平臺上登陸。(所以真的不要在多個網(wǎng)站使用同樣的密碼)
這個過程被稱為「撞庫」,而撞庫的過程中最主要的障礙就是各個網(wǎng)站設置的驗證碼。
總是擔心被盜號?淡定,搜索微信公眾號愛范兒(微信號:ifanr), 后臺回復「安全」,獲取密碼管理利器清單和防盜號指南。
黑產(chǎn)使用的 AI,就是用來應對這些驗證碼的。為什么 AI 會先學習識別驗證碼呢?我們先來解釋一下驗證碼是什么。

當我們登陸網(wǎng)站、提交信息時,總能遇上驗證步驟,尤其是在 12306 上買票時,對那些圖片驗證碼真的是咬牙切齒。但事實上,驗證碼是各個網(wǎng)站用來對抗網(wǎng)絡黑產(chǎn)惡意登陸等行為而設置的安全策略。
驗證碼的全名是「全自動區(qū)分計算機和人類的圖靈測試」,由卡內(nèi)基梅隆大學的路易斯 · 馮 · 安(Luis von Ahn)提出。圖靈測試,顧名思義,驗證碼的目的,是為了識別網(wǎng)絡請求的發(fā)起方是人類,亦或是機器。因此早期的驗證碼就是網(wǎng)站提出一些問題,這些問題不能被機器破解回答,又得能夠被人類輕易答對。
網(wǎng)絡黑產(chǎn)在撞庫時,他們就會將所遇到的海量驗證碼「打碼」任務,交給「打碼平臺」去完成。

根據(jù)騰訊守護者計劃安全團隊的介紹,網(wǎng)絡黑產(chǎn)撞庫時,與打碼平臺是這樣合作的:
首先黑產(chǎn)把已竊取的帳號密碼信息導入到撞庫軟件,撞庫軟件模擬登錄協(xié)議,向互聯(lián)網(wǎng)公司的服務器發(fā)送登錄請求。服務器檢測到登錄異常時,會通過驗證碼來進行攔截;
撞庫軟件將收到的驗證碼圖片發(fā)送給「打碼平臺」,請求將圖片轉(zhuǎn)化為字符。打碼平臺后臺破解驗證碼,將字符結(jié)果返回給撞庫軟件,完成撞庫流程,得到更多的用戶信息。
隨后這些信息可能被販賣、用于詐騙犯罪等。
早期的打碼平臺,是通過眾包讓分布在各地電腦前的打碼小工來完成的。后來進化到了「人工 + OCR 降維識別圖片」。隨著互聯(lián)網(wǎng)公司對驗證碼識別難度的升級,「人工 + OCR 降維識別圖片」的識別率在降低,因此像「快啊」這樣的打碼平臺就開始運用 AI 技術訓練機器,提高識別驗證碼的精度和效率。
隨著安全防護與破解入侵兩方面的抗衡日益升級,驗證碼的難度在增加,形式也在多樣化。從簡單的字母數(shù)字、算術題,到扭曲的字符、模糊的圖片,這些被歸類為知識性驗證碼;如今新一代的驗證碼已經(jīng)開始向無知識型進化,例如 Google 的 reCAPTCHA,某些網(wǎng)站需要拖動滑條的驗證步驟。

機器學習的發(fā)展,讓字母、數(shù)字組成的知識性驗證碼被識別和破解的風險日漸增大,但這種驗證碼,依然是主流。據(jù)警方公布,這次抓捕的團伙所使用和訓練的 AI,已經(jīng)能夠識別出 98% 以上的驗證碼。
上文中案件相關的內(nèi)容摘自下面的帖子。
全國首例 AI 技術犯罪案背后,你的個人信息被最先盯上(http://www.ifanr.com/923886?utm_source=rss&utm_medium=rss&utm_campaign=)