excel數(shù)據(jù)清洗與身份證號碼校驗

老規(guī)矩,先說背景:

收集上來的都是excel文件,包含了姓名、證件號碼、金額、和日期,因為都是手工錄入的,會出現(xiàn)千奇百怪的符號,可以用excel的替換、分列和函數(shù)來清洗與校驗

接下來介紹幾個技巧,幫助快速清洗數(shù)據(jù)(均用wps表格來操作)


1,替換功能去除文檔內(nèi)各種意外符號

????①把各列數(shù)據(jù)的格式先確定:根據(jù)內(nèi)容來確定單元格格式,主要有三種:文本格式、數(shù)值格式、日期格式

? ? 修改單元格格式后會發(fā)現(xiàn)并沒有什么變化,做一下下一步操作:選擇需要更新的列,點擊【數(shù)據(jù)】>【分列】功能來更新一下,注意分列的間隔符全部去掉勾選,選擇當(dāng)前列的格式,點擊完成即可。

????②姓名、證件號碼均不能包含字母、漢字、數(shù)字以外的字符,使用CTRL+H來查詢替換為空,替換的字符有:空格、回車、Tab、逗號、括號、句號、頓號、斜杠、反斜杠等等

? ? 多一個技巧,采用篩選和排序可以方便直觀的看到有哪些數(shù)據(jù)是不合規(guī)范的,復(fù)制整個單元格,粘貼到替換窗口,可以把不可見的字符粘貼出來,這樣就可以批量刪除了

2,校驗身份證號碼是否不符合規(guī)范

????在身份證號右側(cè)插入一列,在身份證號碼的第一行輸入以下公式:

=IF(LOOKUP((LEFT(A2,1)*7+MID(A2,2,1)*9+MID(A2,3,1)*10+MID(A2,4,1)*5+MID(A2,5,1)*8+MID(A2,6,1)*4+MID(A2,7,1)*2+MID(A2,8,1)+MID(A2,9,1)*6+MID(A2,10,1)*3+MID(A2,11,1)*7+MID(A2,12,1)*9+MID(A2,13,1)*10+MID(A2,14,1)*5+MID(A2,15,1)*8+MID(A2,16,1)*4+MID(A2,17,1)*2)-ROUNDDOWN((LEFT(A2,1)*7+MID(A2,2,1)*9+MID(A2,3,1)*10+MID(A2,4,1)*5+MID(A2,5,1)*8+MID(A2,6,1)*4+MID(A2,7,1)*2+MID(A2,8,1)+MID(A2,9,1)*6+MID(A2,10,1)*3+MID(A2,11,1)*7+MID(A2,12,1)*9+MID(A2,13,1)*10+MID(A2,14,1)*5+MID(A2,15,1)*8+MID(A2,16,1)*4+MID(A2,17,1)*2)/11,0)*11,{0,1,2,3,4,5,6,7,8,9,10},{"1","0","x","9","8","7","6","5","4","3","2"})=RIGHT(A2,1),"","證件號碼校驗錯誤")

注意錄入后回車,按ctrl+h替換 A2?至你的表格數(shù)據(jù)里第一條證件號碼的位置;

填充該列即可校驗出哪些證件號碼是錯誤的,意思是這個身份證號碼是不存在的,屬于偽造或者錄入錯誤

再使用篩選功能把該列非空白的數(shù)據(jù)篩選出來,ctrl+a?全選,alt(左)+;?選擇可見單元格,復(fù)制粘貼到一個空白表格,即可把非有效證件號碼篩選出來,返給數(shù)據(jù)錄入員重新審核錄入;

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容