2024-12-30

【安當(dāng)產(chǎn)品應(yīng)用案例100集】009-安當(dāng)KTM在企業(yè)數(shù)據(jù)脫敏中的應(yīng)用


安當(dāng)?shù)钠髽I(yè)客戶在進(jìn)行業(yè)務(wù)系統(tǒng)數(shù)據(jù)安全合規(guī)改造時(shí),涉及到一個(gè)普遍的問題就是對(duì)于存量敏感數(shù)據(jù)的處理。改造方案一般針對(duì)新產(chǎn)生的數(shù)據(jù)會(huì)在業(yè)務(wù)流程中增加脫敏環(huán)節(jié),而對(duì)于存量數(shù)據(jù),業(yè)務(wù)流程中增加脫敏功能就變成了“一次性”的開發(fā)工作。這種情況下,在業(yè)務(wù)系統(tǒng)改造方案上線前,使用輔助工具對(duì)于業(yè)務(wù)系統(tǒng)中的存量數(shù)據(jù)進(jìn)行“靜態(tài)脫敏”,就不失為一種更經(jīng)濟(jì)的處理方案。安當(dāng)KTM(Key Tokenization Module)就是基于企業(yè)客戶這個(gè)脫敏需求而開發(fā)的一個(gè)獨(dú)立的數(shù)據(jù)脫敏組件。


以下案例,我們會(huì)簡單介紹一下數(shù)據(jù)脫敏的一些方法和安當(dāng)企業(yè)客戶的實(shí)際使用場景。


一、什么是數(shù)據(jù)脫敏

數(shù)據(jù)脫敏(Data Masking)是一種關(guān)鍵的數(shù)據(jù)保護(hù)技術(shù),旨在防止敏感信息和隱私數(shù)據(jù)的未授權(quán)訪問或泄露。通過策略性地修改或替換原始數(shù)據(jù)中的敏感部分,數(shù)據(jù)脫敏能夠生成一個(gè)在結(jié)構(gòu)和格式上與原數(shù)據(jù)相似,但不包含實(shí)際敏感信息的數(shù)據(jù)副本。這種數(shù)據(jù)副本適用于開發(fā)、測試、分析和培訓(xùn)等非生產(chǎn)環(huán)境,確保了數(shù)據(jù)的安全使用。


數(shù)據(jù)脫敏技術(shù)的核心目標(biāo)是解決在非可信環(huán)境中使用敏感數(shù)據(jù)的挑戰(zhàn)。通過編輯和處理,它確保敏感數(shù)據(jù)即使在被訪問的情況下,也無法被識(shí)別或解析出其原始的敏感含義。這樣,無論是人還是機(jī)器,都無法從脫敏后的數(shù)據(jù)中獲取到敏感信息。


數(shù)據(jù)脫敏的主要目的是保護(hù)隱私,確保個(gè)人信息如身份證號(hào)、電話號(hào)碼、銀行賬號(hào)等不被非法獲取和利用。同時(shí),它也保證了數(shù)據(jù)在共享和使用過程中的安全性。數(shù)據(jù)脫敏技術(shù)廣泛應(yīng)用于政府、企業(yè)、金融、醫(yī)療等多個(gè)領(lǐng)域,在數(shù)據(jù)采集、傳輸、存儲(chǔ)、處理和共享的過程中發(fā)揮著重要作用。


數(shù)據(jù)脫敏的方法多種多樣,包括但不限于以下幾種:


1、替換:以虛構(gòu)的數(shù)據(jù)代替真值。例如,建立一個(gè)較大的虛擬值數(shù)據(jù)表,對(duì)每一真實(shí)值記錄產(chǎn)生隨機(jī)種子,對(duì)原始數(shù)據(jù)內(nèi)容進(jìn)行哈希映射替換。

2、無效化:以NULL或特定符號(hào)(如*****)代替真值或真值的一部分,如遮蓋信用卡號(hào)的后12位。

3、置亂:對(duì)敏感數(shù)據(jù)列的值進(jìn)行重新隨機(jī)分布,混淆原有值和其他字段的聯(lián)系。這種方法不影響原有數(shù)據(jù)的統(tǒng)計(jì)特性,如最大/最小/方差等均與原數(shù)據(jù)無異。

4、均值化:針對(duì)數(shù)值型數(shù)據(jù),首先計(jì)算它們的均值,然后使脫敏后的值在均值附近隨機(jī)分布,從而保持?jǐn)?shù)據(jù)的總和不變。通常用于產(chǎn)品成本表、工資表等場合。

5、反推斷:查找可能由某些字段推斷出另一敏感字段的映射,并對(duì)這些字段進(jìn)行脫敏,如從出生日期可推斷出身份證號(hào)、性別、地區(qū)的場景。

6、偏移:通過隨機(jī)移位改變數(shù)字?jǐn)?shù)據(jù)。

7、FPE(Format Preserving Encryption):即保留格式加密,是一種特殊的可逆脫敏方法。通過加密密鑰和算法對(duì)原始數(shù)據(jù)進(jìn)行加密,密文格式與原始數(shù)據(jù)在邏輯規(guī)則上一致,如都為日期、卡號(hào)、結(jié)構(gòu)化值等。通過解密密鑰可以恢復(fù)原始數(shù)據(jù)。

數(shù)據(jù)脫敏技術(shù)的數(shù)據(jù)處理過程通常包括以下幾個(gè)步驟:


1、元數(shù)據(jù)識(shí)別:識(shí)別數(shù)據(jù)中的敏感信息和元數(shù)據(jù)。

2、脫敏數(shù)據(jù)識(shí)別:在元數(shù)據(jù)的基礎(chǔ)上,進(jìn)一步識(shí)別需要脫敏的具體數(shù)據(jù)項(xiàng)。

3、數(shù)據(jù)脫敏方案制定:根據(jù)實(shí)際需求和數(shù)據(jù)特性,制定脫敏規(guī)則和方案。

4、任務(wù)執(zhí)行:按照脫敏方案對(duì)數(shù)據(jù)進(jìn)行脫敏處理。

5、效果比對(duì):對(duì)比脫敏前后的數(shù)據(jù),確保脫敏效果符合預(yù)期。

二、安當(dāng)客戶的數(shù)據(jù)脫敏場景

安當(dāng)有客戶需要定期做行業(yè)的大數(shù)據(jù)分析,數(shù)據(jù)需要周期性從業(yè)務(wù)系統(tǒng)中導(dǎo)出。數(shù)據(jù)導(dǎo)出和拷貝都需要申請和審批,數(shù)據(jù)拷貝前必須經(jīng)過脫敏處理。


客戶最初為了滿足安全需求,事先由工程師操作導(dǎo)出CSV格式的數(shù)據(jù),然后分析方在場的情況下,現(xiàn)場使用腳本對(duì)關(guān)鍵字段做替換處理,由于導(dǎo)出數(shù)據(jù)動(dòng)輒百萬量級(jí),處理效率非常低,經(jīng)常出現(xiàn)腳本卡死或者替換過程出現(xiàn)異常數(shù)據(jù)的情況。




以上步驟是在客戶紙件流程審批之后完成的。雖然有流程約束,但是我們看這四個(gè)實(shí)際操作過程,都是雙方工程師手工執(zhí)行的,這中間事實(shí)上存在執(zhí)行階段的漏洞。比如人員權(quán)限問題,比如誤拷貝問題,比如腳本算法安全性問題,比如數(shù)據(jù)轉(zhuǎn)換后的分析效率問題等等等等。


三、安當(dāng)脫敏技術(shù)方案

根據(jù)上一節(jié)客戶的業(yè)務(wù)需求場景,我們也能看到,數(shù)據(jù)脫敏不止是算法和腳本那么簡單,還涉及到流程審批、人員權(quán)限、操作執(zhí)行效率、算法標(biāo)準(zhǔn)化等諸多問題。安當(dāng)?shù)腒TM組件是如何來解決這些問題的呢?


1、首先是用戶管理,通過用戶添加、用戶修改、密碼重置、刪除用戶功能, 實(shí)現(xiàn)脫敏這種敏感業(yè)務(wù)操作人員可控。




2、其次KTM提供日志和審計(jì)功能,以確保全面的追蹤和驗(yàn)證系統(tǒng)中的關(guān)鍵操作。這個(gè)功能對(duì)于維護(hù)安全和合規(guī)性至關(guān)重要。




3、用戶和日志解決了權(quán)限控制和問題追溯的難點(diǎn)。KTM還可以管理所有需要數(shù)據(jù)處理的源庫和目標(biāo)庫,管理數(shù)據(jù)庫IP、端口、賬號(hào)、密碼等信息,密碼加密存儲(chǔ)在數(shù)據(jù)庫中。展示都是密文展示。這樣對(duì)于數(shù)據(jù)的操作就由手工變成了系統(tǒng)。




4、KTM系統(tǒng)支持配置數(shù)據(jù)脫敏策略。我們提供了各種行業(yè)模板,這些模板旨在滿足特定行業(yè)的隱私和合規(guī)性要求。這些模板定義了哪些數(shù)據(jù)應(yīng)該被脫敏,以及脫敏的程度。




5、KTM系統(tǒng)提供廣泛的加密函數(shù)算法支持,以滿足不同的加密需求。我們支持多種對(duì)稱密鑰算法,包括:


?高級(jí)加密標(biāo)準(zhǔn)AES,用于加密和解密數(shù)據(jù),提供強(qiáng)大的數(shù)據(jù)保護(hù)。

?保留格式加密算法,我們支持FF1、FF3。

四、方案后續(xù)

這個(gè)案例中,客戶最終部署KTM系統(tǒng)后,在原有紙件審批的流程之外,解決了原手工脫敏的權(quán)限、誤操作、執(zhí)行效率等方面的問題。


部署了KTM系統(tǒng)后,原來以天為單位的數(shù)據(jù)脫敏交付,通過專用KTM服務(wù)器,實(shí)現(xiàn)了處理10萬數(shù)據(jù)30秒左右、1000萬數(shù)據(jù)30分鐘左右的高效交付。


除了數(shù)據(jù)靜態(tài)脫敏,安當(dāng)也建議客戶考慮數(shù)據(jù)全生命周期的安全方案,依托安當(dāng)?shù)腒DPS解決方案,可以實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)動(dòng)態(tài)脫敏、數(shù)據(jù)庫實(shí)例落盤透明加密等能力,幫助客戶實(shí)現(xiàn)敏感數(shù)據(jù)的全生命周期管理。


文章作者:太白?本文章解釋權(quán)歸安當(dāng)西安研發(fā)中心所有

————————————————

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容