風(fēng)控模型的實(shí)踐思考

風(fēng)控架構(gòu)

需要解決用戶是否是黑名單,是否是高質(zhì)量用戶,是否行為觸發(fā)風(fēng)控的角度;必須將實(shí)時(shí)模型和離線模型整合,這樣才能做好一個(gè)模型

實(shí)時(shí)模型

離線模型

規(guī)則引擎

需要解決動(dòng)態(tài)增加模型,實(shí)時(shí)加載模型;比如說超過一定金額進(jìn)行風(fēng)控;比如說特定設(shè)備風(fēng)控;比如說特定直接進(jìn)入支付頁面的進(jìn)行風(fēng)控等等;其中就包含了復(fù)雜時(shí)間流(CEP)的處理過程,或者一個(gè)常見的黑名單的場(chǎng)景;都依賴一個(gè)健壯的規(guī)則引擎的模型;

模型格式

如果需要解決大規(guī)模下運(yùn)行模型特點(diǎn),需要將模型轉(zhuǎn)換成和語言無關(guān)的文件,方便將python文件轉(zhuǎn)換成Java文件;常見的文件模型有

PMML

PB(是MetaGraph的protocol buffer格式的文件,MetaGraph包括計(jì)算圖,數(shù)據(jù)流,以及相關(guān)的變量和輸入輸出)

模型和數(shù)據(jù)的加載

  • 對(duì)于數(shù)據(jù)的加載,開發(fā)者首先要對(duì)于數(shù)據(jù)質(zhì)量和模型有個(gè)初始的認(rèn)知;選用什么樣的模型;該模型需要什么維度的數(shù)據(jù);數(shù)據(jù)質(zhì)量怎么樣;需要對(duì)數(shù)據(jù)進(jìn)行去重,填充等一系列數(shù)據(jù)初始加工的流程;
  • 當(dāng)模型訓(xùn)練,并在小范圍驗(yàn)證之后,需要對(duì)于模型進(jìn)行進(jìn)一步的大規(guī)模的運(yùn)用或者說進(jìn)行下一步的驗(yàn)證;
    • 大數(shù)據(jù)比較大時(shí),需要考慮將模型跑在spark 集群上,當(dāng)然也要驗(yàn)證模型是否支持Java或者spark的方式加載,實(shí)時(shí)或者先落庫(kù)在進(jìn)行下一步的加工
    • 當(dāng)數(shù)據(jù)比較大時(shí),可以考慮將模型跑在flink集群上,利用flink以及flink CEP的特點(diǎn),對(duì)數(shù)據(jù)進(jìn)行進(jìn)步的加工;實(shí)時(shí)輸出模型

附件

風(fēng)控建模流程.4itrwgl5mh00.png
下一步打算.ac0gsi9ruzc.png

)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容