初識大數(shù)據(jù)風(fēng)控

現(xiàn)在負責(zé)一款風(fēng)控產(chǎn)品的開發(fā),想跟大家聊一下關(guān)于大數(shù)據(jù)風(fēng)控的話題,下面是我整理的一些材料,歡迎討論...

什么是大數(shù)據(jù)風(fēng)控?

簡單來說,就是在互聯(lián)網(wǎng)時代,人們大量的信息都被數(shù)字信息記錄了下來,形成一個龐大的數(shù)據(jù)庫,通過一些技術(shù)手段可以將傳統(tǒng)金融風(fēng)控所需要的信息提取出來,通過機器的大規(guī)模數(shù)據(jù)運算,完成大量用戶的貸款申請審核工作,提升工作效率。同時也可以依據(jù)這些數(shù)據(jù)及網(wǎng)上驗證身份主體的手段,建立一套針對互聯(lián)網(wǎng)人群的小額貸款風(fēng)控體系,最近炒的比較熱的大數(shù)據(jù)風(fēng)控,主要是通過“數(shù)據(jù)庫”做好反欺詐、身份核實、失聯(lián)修復(fù)、用戶資質(zhì)授信、還款意愿評估、還款能力評估及穩(wěn)定性評估等,決定是否放貸以及放貸額度、貸款利率。

數(shù)據(jù)來源

對于大數(shù)據(jù)風(fēng)控業(yè)務(wù)而言,數(shù)據(jù)來源主要包括幾部分:

一是用戶申請時提交的數(shù)據(jù)信息,如年齡、性別、籍貫、收入狀況等,這些數(shù)據(jù)可以了解用戶的基本情況,驗證用戶的身份;

二是用戶在使用過程中產(chǎn)生的行為數(shù)據(jù),包括資料的更改、選填資料的順序、申請中使用的設(shè)備等,可以通過用戶的行為來進行特征挖掘;

三是用戶在平臺上累積的交易數(shù)據(jù),如果公司運營比較久的話,可以累積比較多的用戶借款相關(guān)數(shù)據(jù),這類數(shù)據(jù)對于判斷用戶信用會有很高的價值;

四是第三方數(shù)據(jù),包括來自政府、公用事業(yè)、銀行、運營商等機構(gòu)的數(shù)據(jù),以及用戶在電商、社交網(wǎng)絡(luò)、網(wǎng)絡(luò)新聞等互聯(lián)網(wǎng)應(yīng)用上留存的數(shù)據(jù)。這類數(shù)據(jù)可以從多角度展示用戶的特征,利用這些數(shù)據(jù)進行建模分析,可以找出不同特征與信用水平之間的相關(guān)性。

建模分析

大數(shù)據(jù)風(fēng)控模型構(gòu)建的兩個必要步驟,一是發(fā)現(xiàn)不同特征與違約之間是否有相關(guān)性,二是為不同的特征賦予權(quán)重或違約概率,以確定擁有多項特征的用戶的信用狀況,決定是否提供金融服務(wù)、具體的額度以及利率水平。

建模的技術(shù)主要包括logistic回歸、決策樹、普通線性回歸、分層分析、聚類分析、時間序列等機器學(xué)習(xí)算法,隨著人工智能技術(shù)的進步,神經(jīng)網(wǎng)絡(luò)、強化學(xué)習(xí)等前沿的算法也已經(jīng)運用到大數(shù)據(jù)建模過程中。

模型開發(fā)出來后,應(yīng)用到具體的信貸等金融活動中,等若干個放款周期結(jié)束后,會有結(jié)果數(shù)據(jù)出來,這時候需要依據(jù)這些運營數(shù)據(jù)對模型進行修正,經(jīng)過一次次的迭代,模型的有效性、實用性會逐步提升。

例如,一家企業(yè)完成了100萬單的信貸記錄,這就意味著在貸款陸續(xù)到期后,其大數(shù)據(jù)風(fēng)控體系將收獲100萬的數(shù)據(jù)樣本,這些數(shù)據(jù)樣本與用戶信用高度相關(guān),具有很高的價值,使用這些數(shù)據(jù)對風(fēng)控模型進行進一步的優(yōu)化,可以提升風(fēng)控的有效性。由此可見,大數(shù)據(jù)風(fēng)控需要與具體業(yè)務(wù)緊密結(jié)合,不斷“學(xué)習(xí)”,才能夠穩(wěn)定、可持續(xù)的升級,對業(yè)務(wù)有進一步的指導(dǎo)意義。

總體來說,目前大數(shù)據(jù)風(fēng)控還在發(fā)展初期,未來行業(yè)一個可能的演化路徑是:一些擁有數(shù)據(jù)資源和技術(shù)算法優(yōu)勢的企業(yè)在市場規(guī)模上具備了一定優(yōu)勢后,擁有更多的數(shù)據(jù)資源來支持模型的優(yōu)化迭代,強化其技術(shù)優(yōu)勢,從而可以在控制風(fēng)險的基礎(chǔ)上提高貸款申請的通過率,使自己技術(shù)支持下的交易規(guī)模越做越大。在不考慮黑天鵝事件的前提下,行業(yè)可能出現(xiàn)強者恒強的馬太效應(yīng)。

就我所見到的數(shù)據(jù)分析維度比較全面的公司是蝙蝠征信

http://www.bianfuzhengxin.com/dataCenter/1.html

大數(shù)據(jù)風(fēng)控企業(yè)


就線上小額貸款來說最關(guān)鍵的還是數(shù)據(jù)來源和數(shù)據(jù)的真實性,風(fēng)控模型的構(gòu)建和優(yōu)化都是建立在前期不斷的試錯上,而這確是需要很大的資金投入。技術(shù)都是在數(shù)據(jù)基礎(chǔ)上的應(yīng)用,只有構(gòu)建好底層數(shù)據(jù),技術(shù)才能發(fā)揮優(yōu)勢。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容