怎樣使用用戶畫(huà)像建設(shè)征信系統(tǒng)?

用戶畫(huà)像在征信中的應(yīng)用

問(wèn)題描述

?????? 傳統(tǒng)金融機(jī)構(gòu)的征信信息來(lái)源主要是央行征信,但央行征信系統(tǒng)中僅有3億多人有信貸記錄。這部分信貸記錄又主要來(lái)源于商業(yè)銀行和農(nóng)村信用社等金融機(jī)構(gòu),其數(shù)據(jù)的時(shí)效性、全面性和層次性上存在明顯短板,無(wú)法全面反映客戶的真實(shí)信息。央行整體的征信系統(tǒng)收集了8.68億個(gè)自然人的信息,還有將近6億多人的信息沒(méi)有被收集。此外,民間借貸的信息不會(huì)錄入征信系統(tǒng)??梢哉f(shuō),目前央行征信數(shù)據(jù)缺失,情況不容樂(lè)觀。

?????? 在央行征信數(shù)據(jù)缺失的前提下,我們?cè)撊绾螒?yīng)用大數(shù)據(jù)方法,準(zhǔn)確評(píng)估用戶信用風(fēng)險(xiǎn),建立征信系統(tǒng)呢?

當(dāng)前存在的征信系統(tǒng)

芝麻信用是國(guó)內(nèi)最大的個(gè)人信用評(píng)分系統(tǒng)。其數(shù)據(jù)來(lái)源于阿里巴巴生態(tài)系統(tǒng)內(nèi)部的數(shù)據(jù)、政府公共部門(mén)數(shù)據(jù)和合作機(jī)構(gòu)的數(shù)據(jù)等。芝麻信用通過(guò)網(wǎng)絡(luò)數(shù)據(jù)的收集和評(píng)估,對(duì)不同的個(gè)體給出相應(yīng)的評(píng)分。其主要考慮的是個(gè)人信用歷史、行為偏好、履約能力、身份特征和人脈關(guān)系等。其評(píng)分模型以線性回歸和邏輯回歸為主。

國(guó)外的征信系統(tǒng)有FICO、ZestFinance等。

解決方案

用戶畫(huà)像構(gòu)建的目的:

?????? 解決當(dāng)前商業(yè)銀行和部分p2p金融機(jī)構(gòu)征信困難的問(wèn)題,幫助互聯(lián)網(wǎng)金融機(jī)構(gòu)挖掘潛在用戶。

用戶畫(huà)像構(gòu)建的步驟:

(一)數(shù)據(jù)收集

對(duì)于一個(gè)用戶,需要收集的信息有:

1、用戶個(gè)人信息:如用戶姓名、年齡、性別、職業(yè)、國(guó)籍、居住地址、聯(lián)系方式等。

2、消費(fèi)信息明細(xì):消費(fèi)物品、價(jià)格、線上消費(fèi)還是線下消費(fèi)、購(gòu)買(mǎi)什么服務(wù)、發(fā)生消費(fèi)時(shí)間等。

3、行為信息:在什么時(shí)間瀏覽了什么網(wǎng)站或頁(yè)面、發(fā)生什么點(diǎn)擊行為、發(fā)生什么停留行為、使用搜索引擎搜索了什么信息等。

4、地理位置信息:常用的登錄IP,常用的收貨地址,常去的地點(diǎn)等。

5、 產(chǎn)品明細(xì):用戶購(gòu)買(mǎi)的產(chǎn)品信息,如價(jià)格、產(chǎn)地等。

6、 財(cái)務(wù)明細(xì):用戶每個(gè)月收支情況、使用哪種消費(fèi)方式較多等。

7、 社交明細(xì):用戶經(jīng)常與哪些人發(fā)生金錢(qián)交易等

其他還有用戶的心理分析等。收集時(shí)盡量提高數(shù)據(jù)的真實(shí)性。

(二)數(shù)據(jù)整理歸納

在收集了海量的數(shù)據(jù)以后,需要進(jìn)行數(shù)據(jù)的整理歸納,以從中獲取有用的信息?;ヂ?lián)網(wǎng)金融企業(yè)從企業(yè)的業(yè)務(wù)需求出發(fā),可將用戶的基礎(chǔ)數(shù)據(jù)劃分為人口屬性、信用評(píng)級(jí)、消費(fèi)傾向、投資傾向、社交屬性、潛在價(jià)值等信息。

具體的步驟有:

1、 數(shù)據(jù)核對(duì)

唯一性核對(duì):評(píng)估是否符合業(yè)務(wù)邏輯要求的唯一性,同一用戶能否在不同的系統(tǒng)環(huán)境中唯一識(shí)別。

完整性核對(duì):評(píng)估數(shù)據(jù)是否涵蓋了建模所需的信息。

有效性核對(duì):確保數(shù)據(jù)的有效性。所有數(shù)據(jù)都落在取值范圍內(nèi)。

關(guān)聯(lián)性核對(duì):識(shí)別有關(guān)聯(lián)的屬性,對(duì)關(guān)聯(lián)性進(jìn)行核對(duì)。

及時(shí)性檢查:確保數(shù)據(jù)的時(shí)效性。

一致性核對(duì):檢查數(shù)據(jù)在傳輸過(guò)程中是否有缺漏。

2、 數(shù)據(jù)清洗

檢查數(shù)據(jù)的有效性,對(duì)于有問(wèn)題的數(shù)據(jù),通過(guò)一定方法調(diào)整后使用。如果無(wú)法調(diào)整,則刪除。

3、單變量分析

單變量分析的目的是確保變量符合實(shí)際業(yè)務(wù)的意義。

????????1、變量區(qū)分能力分析:使用多個(gè)統(tǒng)計(jì)指標(biāo)進(jìn)行計(jì)算,如AR等,通過(guò)計(jì)算結(jié)果對(duì)變量進(jìn)行篩選。

????????2、經(jīng)濟(jì)學(xué)含義分析:分析篩選后各變量的經(jīng)濟(jì)學(xué)含義。變量應(yīng)當(dāng)反映業(yè)務(wù)需要,并具有明確的經(jīng)濟(jì)學(xué)含義。

????????3、變量轉(zhuǎn)換:部分變量可能具有多種類型的數(shù)據(jù),不同變量的取值范圍也有可能不同。常用的轉(zhuǎn)換方法是將不同類型的變量轉(zhuǎn)換為概率值。

4、 多變量分析

目的是降低變量間的相關(guān)性。

????????1、 變量相關(guān)性分析。使用相關(guān)性矩陣、聚類分析等技術(shù),進(jìn)行變量的相關(guān)性分析。

????????2、 聚合。將相關(guān)性高的變量聚合,使用新的變量來(lái)替換這些變量。

5、 變量衍生

部分互聯(lián)網(wǎng)數(shù)據(jù)業(yè)務(wù)相關(guān)性較低,在單變量分析中可能被淘汰。但是將這些變量通過(guò)相關(guān)性分析后,這些變量與業(yè)務(wù)解釋性強(qiáng)的變量之間可能有強(qiáng)關(guān)聯(lián)。這就需要變量衍生,將這些數(shù)據(jù)整合衍生為更加稠密、業(yè)務(wù)解釋性更強(qiáng)的衍生變量。衍生變量主要側(cè)重于商品的消費(fèi)信息。

(三)? 模型構(gòu)建以及標(biāo)簽

可選用的技術(shù)有文本挖掘、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、各種分類算法。

傳統(tǒng)的模型是從業(yè)務(wù)邏輯出發(fā),通過(guò)人工調(diào)參的方式建立評(píng)估模型。而在這里,我們可以使用隨機(jī)森林模型為基本架構(gòu)搭建隨機(jī)模型,隨后使用線性回歸技術(shù)進(jìn)行分析,確定各種風(fēng)險(xiǎn)因子的權(quán)重。這樣就克服了傳統(tǒng)模型對(duì)于數(shù)據(jù)噪聲相當(dāng)敏感的缺陷,提高了系統(tǒng)的穩(wěn)定性。

通過(guò)分析分析用戶的人口屬性、信用屬性等,可以給用戶貼上年齡、消費(fèi)行為、理財(cái)理念、風(fēng)險(xiǎn)愛(ài)好、消費(fèi)場(chǎng)景偏好等標(biāo)簽

(四)? 用戶畫(huà)像

用上述提到的各種標(biāo)簽,可以對(duì)用戶進(jìn)行畫(huà)像。

用戶的各種行為會(huì)以數(shù)據(jù)形式被記錄。分析這些行為數(shù)據(jù),我們給用戶貼上標(biāo)簽,最后得到一個(gè)用戶畫(huà)像。一個(gè)用戶會(huì)不斷地產(chǎn)生行為數(shù)據(jù),我們?cè)诓粩嗟孬@取這些數(shù)據(jù)的同時(shí),用戶畫(huà)像也會(huì)越來(lái)越貼近用戶的真實(shí)情況。

通過(guò)對(duì)不同的標(biāo)簽分配不同權(quán)值,我們可以評(píng)估一個(gè)用戶的信用情況。在這基礎(chǔ)之上,我們就能建立征信系統(tǒng),使用大數(shù)據(jù)的方式來(lái)補(bǔ)足央行征信系統(tǒng)的不足,降低互聯(lián)網(wǎng)金融企業(yè)的運(yùn)營(yíng)風(fēng)險(xiǎn)。

以支付寶為例,用戶在使用支付寶的過(guò)程中,會(huì)產(chǎn)生如網(wǎng)購(gòu)消費(fèi)、線下消費(fèi)、轉(zhuǎn)賬、理財(cái)?shù)葦?shù)據(jù)。支付寶會(huì)給用戶貼上不同的標(biāo)簽如平衡型、小有資金等。支付寶通過(guò)建立用戶畫(huà)像,判斷一個(gè)用戶的信用狀態(tài),由此決定了對(duì)每個(gè)用戶的花唄、借唄放款額度。

結(jié)語(yǔ)

?????? 當(dāng)前的央行征信系統(tǒng)尚不完備,這方面的缺陷可以由各金融機(jī)構(gòu)建立大數(shù)據(jù)征信系統(tǒng)來(lái)補(bǔ)足。

在互聯(lián)網(wǎng)金融的發(fā)展過(guò)程中,大數(shù)據(jù)手段正不斷被應(yīng)用到實(shí)際業(yè)務(wù)中,其中用戶畫(huà)像就是一個(gè)強(qiáng)有力的工具。用戶畫(huà)像在互聯(lián)網(wǎng)金融企業(yè)提供個(gè)性化服務(wù)、精準(zhǔn)營(yíng)銷、風(fēng)險(xiǎn)控制等方面發(fā)揮著重要作用。

我們要發(fā)展互聯(lián)網(wǎng)金融,就得用好用戶畫(huà)像這一工具。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容