一篇通讀信貸產(chǎn)品的身份核驗設(shè)計

本文主要介紹信貸產(chǎn)品設(shè)計中基于實名信息、身份證上傳、人臉識別三者進(jìn)行身份核驗的產(chǎn)品流程設(shè)計。

一、實名認(rèn)證

信貸產(chǎn)品開展的第一步基本都是實名認(rèn)證,后續(xù)所有的行為都是圍繞客戶身份信息識別和資料驗證等來展開,是建立客戶檔案的第一步。在信貸產(chǎn)品做實名認(rèn)證的操作設(shè)計通常有三種方法:

1.1 實名二要素認(rèn)證

顧名思義,由用戶主動輸入姓名和身份證號提交,然后調(diào)用第三方的數(shù)據(jù)接口,驗證是否是有效的實名信息,如圖所示,這是支付寶的實名二要素操作認(rèn)證


實名認(rèn)證

目前實名認(rèn)證的驗證終端的底層接口數(shù)據(jù)都是來自公安部下轄的事業(yè)單位全國公民身份證號碼查詢服務(wù)中心提供的的“全國人口信息社會應(yīng)用平臺”,

公民個人在進(jìn)行社會和經(jīng)濟(jì)活動(例如到電信、銀行辦理相關(guān)業(yè)務(wù))時,向有關(guān)機(jī)構(gòu)主動出示居民身份證件,有關(guān)機(jī)構(gòu)工作人員(稱為“認(rèn)證人”或“用戶”)獲得公民(稱為“被認(rèn)證人”)授權(quán)后,將被認(rèn)證人的“公民身份號碼”、“姓名”等數(shù)據(jù)通過電信運營商的網(wǎng)絡(luò)通道傳送至公安部“全國人口信息社會應(yīng)用平臺”進(jìn)行比對,返回“一致”或“不一致”的比對結(jié)果。

但一般的平臺無法直接進(jìn)行對接,僅有少部分平臺直接同該平臺直接進(jìn)行接口對接,然后對外提供封裝的接口。因此絕大多數(shù)都是對接的第三方提供的聚合接口進(jìn)行校驗,如調(diào)用第三方支付公司的二要素認(rèn)證接口。

1.2 OCR身份證識別認(rèn)證

本質(zhì)上也屬于實名二要素認(rèn)證,只是不需要用戶手動輸入姓名身份證信息,而是需要用戶上傳身份證正反面圖片,根據(jù)OCR識別信息進(jìn)行認(rèn)證,本質(zhì)上是將實名認(rèn)證和身份證上傳兩個步驟合二為一,目前絕大多數(shù)信貸產(chǎn)品的實名認(rèn)證采用的是這類方式。


OCR實名認(rèn)證

關(guān)于OCR,百度百科的定義是OCR (Optical Character Recognition,光學(xué)字符識別是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機(jī)文字的過程“。簡單點來說就是圖片輸入后,輸出圖片上文章的加工處理過程。OCR的處理流程一般為,以身份證上傳說明:

  1. 身份證圖片輸入。用戶調(diào)用手機(jī)的相機(jī)權(quán)限或者相冊權(quán)限,將身份證圖片進(jìn)行上傳;
  2. 圖片預(yù)處理。主要是針對身份證圖片進(jìn)行二值化、圖像降噪處理。二值化的大概意思就是將彩色圖片分為黑色前景和白色背景信息,以提高識別處理的效率和準(zhǔn)確度。[注:二值化和降噪是百科說的,我也不太懂],整體而言是對圖片拍攝質(zhì)量進(jìn)行判斷,是否曝光過度或者圖片反光無法正確識別信息];
  3. 傾斜矯正。拍攝身份證時每個用戶上傳的圖片方向可能有差異,因此需要對圖形方向進(jìn)行矯正;
  4. 文字特征抽取和識別。識別身份證上的字段信息,包括姓名、性別、民族、出生日期、住址、身份證號、簽發(fā)機(jī)關(guān)、有效期限;
  5. 對比識別和人工校正。OCR識別的準(zhǔn)確率無法達(dá)到百分百,尤其是某些生僻字類型,可能在識別的算法過程中會存在偏差,因此還需要由人工在根據(jù)OCR識別的信息來判斷實名信息是否準(zhǔn)確。

目前針對身份證OCR識別的服務(wù)已經(jīng)比較成熟,如百度、依圖、商湯等都有提供這類產(chǎn)品,目前的OCR身份證識別除了簡化實名操作以外,一般還可以進(jìn)行一定的圖像風(fēng)險和質(zhì)量檢測,可識別圖片是否為復(fù)印件或臨時身份證,是否被翻拍或編輯,是否存在正反顛倒、模糊、欠曝、過曝等質(zhì)量問題,對于欺詐判斷有比較重要的意義,。感興趣的可以擴(kuò)展閱讀下百度身份證OCR接口文檔了解下:百度身份證識別接口文檔

1.3 實名綁卡認(rèn)證

有的產(chǎn)品在設(shè)計過程中,可能直接使用銀行卡三要素或者四要素同時進(jìn)行實名認(rèn)證和銀行卡鑒權(quán)認(rèn)證。如金融類產(chǎn)品的開戶可能會采用這類設(shè)計。一般適合需要綁卡強(qiáng)場景的環(huán)節(jié),非講優(yōu)點的話可以降低數(shù)據(jù)調(diào)用成本。不過現(xiàn)階段的金融產(chǎn)品應(yīng)該很少在此用該種設(shè)計方式,可人認(rèn)為主要有以下幾點原因,不一定準(zhǔn)確,大家可以自己思考下為什么

  1. 當(dāng)認(rèn)證異常時,難以準(zhǔn)確返回錯誤原因引導(dǎo)用戶進(jìn)行相應(yīng)修改,一般可能第三方支付渠道返回的結(jié)果是身份信息不正確或卡號不正確,對用戶的錯誤引導(dǎo)是不清晰的;

  2. 身份證號和卡號一般用戶是不太記得住的,如果需要全部一個頁面完成,整體的產(chǎn)品流失率也會比較高?;诋a(chǎn)品轉(zhuǎn)化和召回的考慮,實名會比綁卡的優(yōu)先級更高,當(dāng)用戶完成實名后,可以結(jié)合運營手段等去召回用戶進(jìn)行綁卡操作;

  3. 另外目前的主流產(chǎn)品設(shè)計在綁卡環(huán)節(jié)會默認(rèn)代入用戶的實名要素,讓用戶無法編輯,通常在于引導(dǎo)用戶需要&僅能綁定用戶自己本人的儲蓄卡,目前基于反洗錢等的規(guī)定,要求各類證券賬戶的出入金需要用戶本人所綁定的借記卡


    實名綁卡認(rèn)證

1.4 實名認(rèn)證的作用

實名認(rèn)證成功后,除了第一步進(jìn)行客戶身份的建立以外,還具有如下作用:

  1. 建立客戶的基本身份,并作為后續(xù)資料核身的基礎(chǔ)。例如判斷用戶的綁定銀行卡是否本人所有,用戶提交的相關(guān)材料是否是本人所有;
  2. 基于身份證號碼識別生成衍生字段。國家質(zhì)量技術(shù)監(jiān)督局發(fā)布的《公民身份號碼》中對身份證號碼的編碼規(guī)則做了明確的規(guī)定,因此可以基于編碼規(guī)則得出不少字段信息。公民身份號碼是特征組合碼,由十七位數(shù)字本體碼和一位校驗碼組成。排列順序從左至右依次為:六位數(shù)字地址碼,八位數(shù)字出生日期碼,三位數(shù)字順序碼和一位數(shù)字校驗碼。
  • 根據(jù)地址碼我們可以得到用戶的常住戶口所在地,銀行的一些風(fēng)控可能會對特定地區(qū)的戶口所在地的申請人進(jìn)行限制等;
  • 根據(jù)出生日期碼可以計算得出用戶的年齡信息;
  • 根據(jù)順序碼可以識別用戶的性別,第十七位奇數(shù)則為男性,偶數(shù)則為女性。
  1. 實名信息基本上是調(diào)用一切第三方數(shù)據(jù)的基礎(chǔ),一般常見的貸超類API合作對接的撞庫、黑名單庫判斷等,基本都是以實名信息進(jìn)行入?yún)⒉樵儯?/li>

二、信貸產(chǎn)品的身份證上傳

一般而言,銀行開戶、辦理信用卡或者證券卡戶等,都需要進(jìn)行身份信息核驗,上傳身份證影像資料。衍生到互聯(lián)網(wǎng)金融領(lǐng)域場景,也會發(fā)現(xiàn)線上信貸場景也都需要做身份證上傳的操作。網(wǎng)上查詢了下資料,主要是2007年6月,人行、證監(jiān)、保監(jiān)、銀監(jiān)等部門基于發(fā)洗錢法的規(guī)定聯(lián)合發(fā)布了《金融機(jī)構(gòu)客戶身份識別和客戶身份資料及交易記錄保存管理辦法》,對用戶身份識別、客戶身份和交易資料的保存行為進(jìn)行了規(guī)范。

第十六條 金融資產(chǎn)管理公司、財務(wù)公司、金融租賃公司、汽車金融公司、貨幣經(jīng)紀(jì)公司、保險資產(chǎn)管理公司以及中國人民銀行確定的其他金融機(jī)構(gòu)在與客戶簽訂金融業(yè)務(wù)合同時,應(yīng)當(dāng)核對客戶的有效身份證件或者其他身份證明文件,登記客戶身份基本信息,并留存有效身份證件或者其他身份證明文件的復(fù)印件或者影印件。

如上所示,雖然目前的網(wǎng)貸業(yè)務(wù)開展暫時不屬于規(guī)定的相關(guān)金融業(yè)務(wù),但目前線上信貸的資金來源尤其是頭部消費信貸平臺,其資金來源主要以銀行資金、消費金融資金、網(wǎng)絡(luò)小貸等金融資金為主。因而,這些金融機(jī)構(gòu)在開展金融業(yè)務(wù)(實質(zhì)的放貸業(yè)務(wù))需要按照辦法規(guī)定,等級客戶的身份基本信息同時留存相關(guān)的影響資料。這就是為什么現(xiàn)在的消費信貸產(chǎn)品都需要進(jìn)行身份證上傳的原因。另外采集身份證影像資料,還有另外的作用,下面會提及。

身份證上傳一般可以結(jié)合實名認(rèn)證一起進(jìn)行,也可以單獨作為一個流程,具體是否合并或拆分取決于各自產(chǎn)品的實際情況。如授信環(huán)節(jié)需要查詢征信的產(chǎn)品流程設(shè)計,則通??梢允褂肙CR身份認(rèn)證,不過一般基于OCR實名可能會導(dǎo)致初始轉(zhuǎn)化下降。產(chǎn)品層面關(guān)于身份證上傳流程示意,大致分為三層,具體可見如下圖的業(yè)務(wù)流程示意

  • 判斷層:即當(dāng)前用戶是否需要上傳身份證
  • 操作層:即用戶進(jìn)行身份證上傳及識別
  • 校驗層:進(jìn)行身份ocr識別校驗以及是否本人證件的規(guī)則校驗


    身份證上傳流程
  1. 身份證上傳的判斷層主要是判斷用戶當(dāng)前是否需要上傳身份證,一般兩種情況下需要進(jìn)行上傳:a)用戶尚未上傳身份證;b)用戶的身份證已過期。
  2. 如果用戶需要進(jìn)行身份證上傳,則需要判斷當(dāng)前是否已具有相機(jī)權(quán)限(或者相冊權(quán)限),如果沒有相應(yīng)的權(quán)限需要提示用戶進(jìn)行開啟;
  3. 上傳身份證可以接入第三方的OCR識別SDK,也可以僅進(jìn)行API的識別接口對接。但是一般客戶端SDK組件可以提供身份證圖片質(zhì)量的檢測以及包括額外的身份證風(fēng)險類型的識別,如圖所示的幾種異常身份證


    身份證識別五類-From:百度AI開放平臺身份核驗接口文檔

    如下所示:

  • 是否清晰度合適、是否反光,確保身份證圖像質(zhì)量
  • 是否包含占比合適的身份證,確保避免過于傾斜、非身份證
  • 身份證中的關(guān)鍵字段是否清晰、反光,確保字段內(nèi)容清晰
  • 身份證國徽、人像部分是否位置匹配,確保檢測位置準(zhǔn)確,正反面正確
  • 連續(xù)輸入算法的兩幀是否差異過大,確保避免鏡頭或證件晃動
  • 身份證是否占比過小,確保鏡頭遠(yuǎn)近合適
  1. OCR上傳識別成功后,與用戶的實名信息進(jìn)行比對,校驗OCR識別信息是否準(zhǔn)確。

三、人臉識別

目前人臉識別已經(jīng)被廣泛應(yīng)用于各類生活場景,比如手機(jī)的人臉解鎖、線下支付寶推出的人臉支付、機(jī)場和火車站的人臉識別等。另外目前在金融信貸場景也會采用人臉識別來作為反欺詐、申貸身份的核驗。

基于信貸場景而言,完整的人臉識別一般是包含如下幾個過程:活體檢測、人臉采集、比對三個過程,而其目的一般在于確保申貸人為【真人】操作,避免黑產(chǎn)等通過機(jī)器批量操作等模式攻擊,另外在于確認(rèn)為【本人】操作,防止中介代辦、身份冒用等情況。

一般現(xiàn)在人臉識別都是使用的專門的第三方提供的SDK集成服務(wù),集成SDK后,通過客戶端本地離線活體檢測和人臉采集,然后調(diào)用第三方API服務(wù)接口進(jìn)行身份核驗判斷。具體示意可參考如下流程


人臉識別SDK流程-From:百度AI開放平臺接口文檔

3.1 活體檢測

活體檢測是驗證當(dāng)前操作的人是一個活物,主要防止靜態(tài)活體(如照片)的攻擊,打個簡單的比方來說比如人臉考勤,直接拿照片可能也可以完成打卡。
目前活體檢測大致有如下幾種方法:(聲明,這部分描述是來自基于百度SDK文檔概述)

  • 有動作交互活體檢測:通過要求用戶配合做出一些面部動作,驗證是否為身份偽造攻擊,此方式往往結(jié)合靜默圖片活體檢測一起使用。
  • 靜默圖片活體檢測:通過提交圖片,檢測圖片中的屏幕邊框、反光、摩爾紋、成像畸變等線索,來區(qū)分是否為二次翻拍攻擊(舉例:如用戶A用手機(jī)拍攝了一張包含人臉的圖片一,用戶B翻拍了圖片一得到了圖片二,并用圖片二偽造成用戶A去進(jìn)行識別操作,這種情況普遍發(fā)生在金融開戶、實名認(rèn)證等環(huán)節(jié));
  • H5視頻活體檢測:通過上傳一段視頻,進(jìn)行視頻隨機(jī)抽幀分析,對隨機(jī)圖片進(jìn)行靜默圖片活體檢測,得出綜合攻擊情況分析結(jié)果。為確保視頻唯一性,可以結(jié)合語音校驗碼接口使用;

目前主流信貸產(chǎn)品絕大多數(shù)都采用的是基于Native app的人臉識別SDK,一般會內(nèi)置動作交互活體檢測功能。但如果信貸場景是通過第三方H5實現(xiàn),且需要人臉識別的話,一般需要考慮H5視頻活體檢測。

3.2 人臉采集

在活體檢測的同時,會進(jìn)行人臉圖片的獲取和采集,可以根據(jù)需要定制需要采集存儲的活體底照數(shù)量?;谌四槻杉蟮娜俗C比對分析的準(zhǔn)確性,對于采集的圖像質(zhì)量有很高的要求。百度將人臉的質(zhì)量檢測概括為五方面,一般如果集成了第三方人臉識別SDK,都會內(nèi)置這部分質(zhì)量檢測,不符合時可以中斷操作,提示用戶重新進(jìn)行人臉識別。

  • 遮擋:指人臉各部位的遮擋比例;
  • 模糊度:指人臉的清晰程度;
  • 光照:指人臉的光照強(qiáng)度;
  • 完整性:指圖片中的人臉是否完整;
  • 姿態(tài):指人臉在三維空間的角度分布;

3. 身份核驗

人臉識別的最后一步是進(jìn)行身份核驗,也就是判斷是否是用戶本人操作,是否允許用戶完成該行為。一般被應(yīng)用于應(yīng)用異常操作風(fēng)險安全攔截,如設(shè)備異常登錄或銀行卡交易操作異常等。類似目前手機(jī)移動支付的人臉驗證也可以歸屬為人臉比對的過程。身份核驗的常規(guī)核驗流程是使用用戶當(dāng)前采集的人臉同注冊人臉進(jìn)行比對。所謂的注冊人臉是用戶首次進(jìn)行識別輸入存儲的圖片或者其他方式存儲的用于作為基準(zhǔn)對比的圖片。人臉比對是將兩張照片進(jìn)行比對,得到一個比對分?jǐn)?shù)結(jié)果,根據(jù)設(shè)定的閾值分?jǐn)?shù),判斷是否通過。

另外關(guān)于身份核驗一般有3種對比場景:

  1. 活體vs活體
    即剛所說的當(dāng)前采集的人臉同注冊人臉進(jìn)行比對。主要用于判斷當(dāng)前操作人是否為本人進(jìn)行操作;
  2. 活體vs身份證芯片照
    將采集到的人臉及用戶身份證影響件的圖片照片進(jìn)行比對,判斷是否人證一致;
  3. 活體vs公安部網(wǎng)紋照
    將采集到的活體同公安部網(wǎng)紋照進(jìn)行比對,公安部網(wǎng)紋照對接是公安部身份系統(tǒng),調(diào)用比對的花費成本較高,但一般被認(rèn)為是最可靠的核驗方式。

綜上,基于以上三點的描述,我們基本可以知道信貸產(chǎn)品針對借款人的身份核驗及欺詐判斷基本上是結(jié)合用戶的實名信息(姓名+身份證號)、身份證照片、活體照片(或公安部網(wǎng)紋照)等進(jìn)行相互驗證和識別。不過這無法完全杜絕團(tuán)伙欺詐騙貸的防范,比如花幾千塊全額雇人進(jìn)行操作。

敲黑板,劃重點

  1. 信貸產(chǎn)品流程中實名、身份證、銀行卡是核心要素,不論流程如何設(shè)計,最終一定是包含了這三者;
  2. 信貸產(chǎn)品基于反欺詐的風(fēng)險防范要求,一般需要進(jìn)行完整的身份核驗,通過實名+身份證照+活體等聯(lián)動來進(jìn)行判斷,可以杜絕大多數(shù)的欺詐騙貸情況;
  3. 身份證OCR除了基本的OCR信息識別,一般還可以進(jìn)行圖片質(zhì)量檢測和風(fēng)險檢測,識別上傳的身份證件是否有效證件
  4. 人臉識別的完整一般包含活體檢測、人臉采集、人臉比對三個方面,活體檢測主要是通過動作式活體檢測隨機(jī)采集底照根據(jù)算法對圖片是否活體進(jìn)行判斷,人臉采集則是采集人像的一個過程,人臉比對則是通過當(dāng)前活體底照和其他來源存儲照片進(jìn)行比對,判斷是否為同一個人;

作者 :可飛,公眾號(ID:abckefei)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容