背景:
需要在非生產(chǎn)環(huán)境下對(duì)敏感信息進(jìn)行數(shù)據(jù)脫敏,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù)。
脫敏數(shù)據(jù)特征:
1.保持原有數(shù)據(jù)特征:例如身份證由17位數(shù)字本體碼和1位檢驗(yàn)碼組成。
2.保持?jǐn)?shù)據(jù)之間一致性:出生年月和出生日期之間的關(guān)系。
3.保持業(yè)務(wù)規(guī)則的關(guān)聯(lián)性。
4.多次脫敏之間的數(shù)據(jù)一致性。
脫敏的方法:
1.數(shù)據(jù)替換
要求:用設(shè)置的固定虛構(gòu)值替換真值。例如將手機(jī)號(hào)碼統(tǒng)一替換為 13800013800
2.無效化
要求:通過對(duì)數(shù)據(jù)值得截?cái)唷⒓用?、隱藏等方式使敏感數(shù)據(jù)脫敏,使其不再具有利用價(jià)值,例如將地址以 ****** 代替真值。數(shù)據(jù)無效化與數(shù)據(jù)替換所達(dá)成的效果基本類似。
3.隨機(jī)化
要求:用隨機(jī)數(shù)據(jù)代替真值,保持替換值的隨機(jī)性以模擬樣本的真實(shí)性。例如用隨機(jī)生成的姓和名代替真值。
【注意】這個(gè)例子中我們針對(duì)數(shù)據(jù)脫敏引入了外部字典表,實(shí)際情況中可以根據(jù)數(shù)據(jù)脫敏要求,隨時(shí)引入任意外部字典表,通過數(shù)據(jù)的隨機(jī)化組合,實(shí)現(xiàn)替換真值數(shù)據(jù)的脫敏處理。
4.偏移和取整
要求:通過隨機(jī)移位改變數(shù)字?jǐn)?shù)據(jù),例如日期 2018-01-02 8:12:25 變?yōu)?2018-01-02 8:00:00,偏移取整在保持了數(shù)據(jù)的安全性的同時(shí)保證了范圍的大致真實(shí)性,此項(xiàng)功能在大數(shù)據(jù)利用環(huán)境中具有重大價(jià)值。
5.掩碼屏蔽
要求:掩碼屏蔽是針對(duì)賬戶類數(shù)據(jù)的部分信息進(jìn)行脫敏時(shí)的有力工具,比如銀行卡號(hào)或是身份證號(hào)的脫敏。將身份證號(hào)的出生日期進(jìn)行掩碼屏蔽脫敏。使用left()函數(shù)截取身份證號(hào)的左邊 6 位 + 字符串 ********+right()函數(shù)截取身份證號(hào)右邊 4 位替換源身份證字符串。
6.靈活編碼
要求:在需要特殊脫敏規(guī)則時(shí),可執(zhí)行靈活編碼以滿足各種可能的脫敏規(guī)則。比如用固定字母和固定位數(shù)的數(shù)字替代合同編號(hào)真值。將合同編號(hào)進(jìn)行自定義編碼脫敏。自定義編碼規(guī)則:4 位固定碼 + 當(dāng)前年份 + 源目標(biāo)字符串 4 位號(hào)碼 +9 位數(shù)值組成。
脫敏相關(guān)文章參考:http://www.itdecent.cn/p/43d9882ed24a