一、案例背景
Thera Bank是一家擁有不斷增長客戶群的銀行。這銀行中大多數(shù)客戶的存款規(guī)模都是不一樣的。由于貸款業(yè)務(wù)的客戶數(shù)量很少,所以銀行希望有效地將存款用戶轉(zhuǎn)化為貸款用戶以此擴(kuò)大貸款業(yè)務(wù)量的基礎(chǔ),以帶來更多的貸款業(yè)務(wù),并在此過程中,通過貸款利息賺取更多。
因此,該銀行去年為存款用戶但未辦理個人貸款業(yè)務(wù)的客戶開展了一項推廣活動來促使其辦理個人貸款業(yè)務(wù),有部分客戶通過此活動已經(jīng)辦理了相關(guān)服務(wù)。這時的零售營銷部門希望制定更好的策略去定位營銷,以最小的預(yù)算提高成功率。該部門希望識別出更有可能購買貸款的潛在客戶,提高轉(zhuǎn)化的成功率,降低營銷的費用。
二、理解數(shù)據(jù)
1.導(dǎo)入數(shù)據(jù)

2.數(shù)據(jù)內(nèi)容和數(shù)據(jù)理解

數(shù)據(jù)集共包含5000條記錄,14個字段,對應(yīng)字段含義如下:
ID - 客戶
Age - 客戶年齡
Experience - 客戶工作經(jīng)驗
Income - 客戶年收入(單位:千美元)
ZIPCode - 家庭地址郵政編碼
Family - 客戶的家庭規(guī)模
CCAvg - 每月信用卡消費額(單位:千美元)
Education - 教育水平 (1: 本科; 2: 研究生; 3: 高級)
Mortgage - 房屋抵押價值(如有)(單位:千美元)
Personal Loan - 此客戶是否接受上一次活動中提供的個人貸款?(1:是 0:否)
Securities Account - 是否有證券賬戶?(1:是 0:否)
CD Account - 是否有存款證明(CD)帳戶嗎(1:是 0:否)
Online - 是否開通網(wǎng)上銀行?(1:是 0:否)
CreditCard - 是否有信用卡?(1:是 0:否)
3.觀察各字段基礎(chǔ)信息,數(shù)據(jù)并無重復(fù),缺失情況;對于一些數(shù)值型的字段則需要做一些數(shù)據(jù)類型的轉(zhuǎn)化

4. 更改變量類型,方便后續(xù)做統(tǒng)計分析

5.觀察數(shù)據(jù)的一個描述性信息

6.向上述表中可以看到,Experience的min值為負(fù)數(shù),而工作經(jīng)驗是沒有負(fù)數(shù)的,所以考慮將Experience(客戶工作經(jīng)驗)的負(fù)值改為0

三、數(shù)據(jù)處理
整體思路:
一、去年銀行舉辦的推廣活動的效果如何?
二、什么類型的存款用戶成為銀行貸款業(yè)務(wù)的潛在客戶可能性更大?
三、隨著客戶年收入的增長,貸款情況是如何變化?
四、隨著客戶年齡的增長,貸款情況如何變化?
對整體思路進(jìn)行逐一分析:
一、去年銀行舉辦的推廣活動的效果如何?
1.活動推廣結(jié)果基礎(chǔ)分析
(Personal Loan - 此客戶是否接受上一次活動中提供的個人貸款?)

可以看到此次參加活動的4520名客戶中,有480名客戶開通了個人貸款業(yè)務(wù),由于該活動是針對未辦理個人貸款業(yè)務(wù)的客戶開展的,對比從以往數(shù)據(jù)來看,個人貸款業(yè)務(wù)增長了近10%,說明此次推廣活動的效果還是不錯的
2.探索其他變量與Personal Loan變量的關(guān)系,corr()函數(shù)找出相關(guān)關(guān)系大小,數(shù)值越大關(guān)系越強


用熱力圖展示所有關(guān)系之間的強弱,顏色越深,相關(guān)性越強


從圖中可以看出:
1、和開通信貸強相關(guān)的變量有:收入,信用卡還款額及是否有該銀行存單賬戶;
2、和開通信貸弱相關(guān)的變量有:受教育程度,房屋抵押貸款數(shù),家庭人數(shù);
3、郵編、是否是證券賬戶,是否開通網(wǎng)上銀行及是否有信用卡,關(guān)系都不大;
4、年齡、工作經(jīng)驗雖然關(guān)系也不大,但它們屬于連續(xù)的數(shù)值變量,所以需要分箱后再做觀察,看看是否有某一段存在特殊值。
3.對強弱關(guān)系的做進(jìn)一步的分析
3.1先剔除無關(guān)的變量,對其余相關(guān)變量進(jìn)行分析
定性變量與開通貸款的關(guān)系(對定性變量中是否有該銀行存單賬戶、受教育程度、家庭人數(shù)與是否開通貸款的關(guān)系進(jìn)行探究)
3.1.1是否有該銀行存單賬戶 (CD Account--是否有存款證明)

可以看出開通了銀行存單賬戶的客戶,其申請貸款的可能性是沒有開通的6倍多,說明開通了銀行賬戶的客戶是一個主要的目標(biāo)客戶;找到方法讓客戶開通該銀行存款賬單也是一個提高申請貸款率的可能選項。
3.1.2 教育水平
Education - 教育水平 (1: 本科; 2: 研究生; 3: 高級)

可以看出,學(xué)歷越高,申請貸款的客戶也在上升,說明高學(xué)歷更容易發(fā)展為潛在的貸款用戶。
3.1.3 家庭人數(shù)

可以看出,單身人士與沒有孩子的家庭的貸款率都比較低,有孩子的家庭用戶相對而言更有意愿轉(zhuǎn)化為貸款用戶,特別是獨生子女家庭
3.2 探究定量與開通貸款的關(guān)系
(對定量變量中的年齡、收入、信用卡還款額和房屋抵押貸款與是否開通貸款的關(guān)系進(jìn)行探究)
3.2.1年齡


綜合來看,各階段的年齡的貸款意愿都相差不大,相對來說區(qū)間在(32.0, 39.0]的客戶意愿較強
3.2.2對收入分層


當(dāng)年收入超過82時,貸款意愿會有5倍以上的上升,超過98時,貸款意愿達(dá)到17%以上,超過170時,貸款意愿達(dá)到一半,相對收入越高,貸款的意愿越強烈
3.2.3房屋抵押值和抵押值分層


大部分沒有申請貸款的,信用卡消費額的均值在1.7K美元左右,而申請貸款的客戶信用款消費額均值達(dá)到3.9K美元,是其2倍有多。
3.2.4對每月消費額進(jìn)行分層


大概在每月消費額為2.8千美元時,申請貸款率會增大將近4倍,超過6千美元時,申請申請貸款率會有所回落到31%左右,但這個貸款意愿相對還是很強烈的,可對每月消費額在2.8千美元以上的客戶加大力度去營銷
四、結(jié)論
通過這次活動,個人貸款業(yè)務(wù)增長了近10%,說明此次推廣活動的效果還是不錯的
對于開通了銀行賬戶的用戶需要加強營銷力度,他們的貸款意愿相對于沒有開通銀行賬戶更強
教育水平越高的客戶越容易接受貸款
家庭人口較多的家庭貸款意愿較強,尤其是獨生子女的家庭
年齡區(qū)間在30-40歲的客戶相對貸款意愿更強
相對收入越高,貸款的意愿越強烈, 當(dāng)年收入超過82時,貸款意愿會有5倍以上的上升,超過98時,貸款意愿達(dá)到17%以上,超過170時,貸款意愿達(dá)到一半
當(dāng)房屋抵押值大于190.5千美元時,貸款申請的意愿有明顯的提升
每月消費額在2.8千美元以上的客戶,貸款申請的意愿有明顯的提升