數(shù)據(jù)脫敏的處理方法

背景:

需要在非生產(chǎn)環(huán)境下對(duì)敏感信息進(jìn)行數(shù)據(jù)脫敏,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù)。

脫敏數(shù)據(jù)特征:

1.保持原有數(shù)據(jù)特征:例如身份證由17位數(shù)字本體碼和1位檢驗(yàn)碼組成。

2.保持?jǐn)?shù)據(jù)之間一致性:出生年月和出生日期之間的關(guān)系。

3.保持業(yè)務(wù)規(guī)則的關(guān)聯(lián)性。

4.多次脫敏之間的數(shù)據(jù)一致性。

脫敏的方法:

1.數(shù)據(jù)替換

要求:用設(shè)置的固定虛構(gòu)值替換真值。例如將手機(jī)號(hào)碼統(tǒng)一替換為 13800013800

2.無效化

要求:通過對(duì)數(shù)據(jù)值得截?cái)唷⒓用?、隱藏等方式使敏感數(shù)據(jù)脫敏,使其不再具有利用價(jià)值,例如將地址以 ****** 代替真值。數(shù)據(jù)無效化與數(shù)據(jù)替換所達(dá)成的效果基本類似。

3.隨機(jī)化

要求:用隨機(jī)數(shù)據(jù)代替真值,保持替換值的隨機(jī)性以模擬樣本的真實(shí)性。例如用隨機(jī)生成的姓和名代替真值。

【注意】這個(gè)例子中我們針對(duì)數(shù)據(jù)脫敏引入了外部字典表,實(shí)際情況中可以根據(jù)數(shù)據(jù)脫敏要求,隨時(shí)引入任意外部字典表,通過數(shù)據(jù)的隨機(jī)化組合,實(shí)現(xiàn)替換真值數(shù)據(jù)的脫敏處理。

4.偏移和取整

要求:通過隨機(jī)移位改變數(shù)字?jǐn)?shù)據(jù),例如日期 2018-01-02 8:12:25 變?yōu)?2018-01-02 8:00:00,偏移取整在保持了數(shù)據(jù)的安全性的同時(shí)保證了范圍的大致真實(shí)性,此項(xiàng)功能在大數(shù)據(jù)利用環(huán)境中具有重大價(jià)值。

5.掩碼屏蔽

要求:掩碼屏蔽是針對(duì)賬戶類數(shù)據(jù)的部分信息進(jìn)行脫敏時(shí)的有力工具,比如銀行卡號(hào)或是身份證號(hào)的脫敏。將身份證號(hào)的出生日期進(jìn)行掩碼屏蔽脫敏。使用left()函數(shù)截取身份證號(hào)的左邊 6 位 + 字符串 ********+right()函數(shù)截取身份證號(hào)右邊 4 位替換源身份證字符串。

6.靈活編碼

要求:在需要特殊脫敏規(guī)則時(shí),可執(zhí)行靈活編碼以滿足各種可能的脫敏規(guī)則。比如用固定字母和固定位數(shù)的數(shù)字替代合同編號(hào)真值。將合同編號(hào)進(jìn)行自定義編碼脫敏。自定義編碼規(guī)則:4 位固定碼 + 當(dāng)前年份 + 源目標(biāo)字符串 4 位號(hào)碼 +9 位數(shù)值組成。

脫敏相關(guān)文章參考:http://www.itdecent.cn/p/43d9882ed24a

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容