風(fēng)控架構(gòu)
需要解決用戶是否是黑名單,是否是高質(zhì)量用戶,是否行為觸發(fā)風(fēng)控的角度;必須將實(shí)時(shí)模型和離線模型整合,這樣才能做好一個(gè)模型
實(shí)時(shí)模型
離線模型
規(guī)則引擎
需要解決動(dòng)態(tài)增加模型,實(shí)時(shí)加載模型;比如說超過一定金額進(jìn)行風(fēng)控;比如說特定設(shè)備風(fēng)控;比如說特定直接進(jìn)入支付頁面的進(jìn)行風(fēng)控等等;其中就包含了復(fù)雜時(shí)間流(CEP)的處理過程,或者一個(gè)常見的黑名單的場(chǎng)景;都依賴一個(gè)健壯的規(guī)則引擎的模型;
模型格式
如果需要解決大規(guī)模下運(yùn)行模型特點(diǎn),需要將模型轉(zhuǎn)換成和語言無關(guān)的文件,方便將python文件轉(zhuǎn)換成Java文件;常見的文件模型有
PMML
PB(是MetaGraph的protocol buffer格式的文件,MetaGraph包括計(jì)算圖,數(shù)據(jù)流,以及相關(guān)的變量和輸入輸出)
模型和數(shù)據(jù)的加載
- 對(duì)于數(shù)據(jù)的加載,開發(fā)者首先要對(duì)于數(shù)據(jù)質(zhì)量和模型有個(gè)初始的認(rèn)知;選用什么樣的模型;該模型需要什么維度的數(shù)據(jù);數(shù)據(jù)質(zhì)量怎么樣;需要對(duì)數(shù)據(jù)進(jìn)行去重,填充等一系列數(shù)據(jù)初始加工的流程;
- 當(dāng)模型訓(xùn)練,并在小范圍驗(yàn)證之后,需要對(duì)于模型進(jìn)行進(jìn)一步的大規(guī)模的運(yùn)用或者說進(jìn)行下一步的驗(yàn)證;
- 大數(shù)據(jù)比較大時(shí),需要考慮將模型跑在spark 集群上,當(dāng)然也要驗(yàn)證模型是否支持Java或者spark的方式加載,實(shí)時(shí)或者先落庫(kù)在進(jìn)行下一步的加工
- 當(dāng)數(shù)據(jù)比較大時(shí),可以考慮將模型跑在flink集群上,利用flink以及flink CEP的特點(diǎn),對(duì)數(shù)據(jù)進(jìn)行進(jìn)步的加工;實(shí)時(shí)輸出模型
附件

風(fēng)控建模流程.4itrwgl5mh00.png

下一步打算.ac0gsi9ruzc.png
)