某銀行定期理財產(chǎn)品的電話營銷數(shù)據(jù)分析


一、 提出問題

1) 哪些年齡段的客戶更有可能購買此產(chǎn)品?

2) 業(yè)務(wù)員對客戶營銷的日期會對營銷結(jié)果產(chǎn)生顯著影響么?

3) 客戶的信貸情況對產(chǎn)品營銷的影響及原因有哪些?

二、 數(shù)據(jù)獲取

Kaggle

https://www.kaggle.com/janiobachmann/bank-marketing-dataset

三、 數(shù)據(jù)清洗

a) 理解數(shù)據(jù)

  原數(shù)據(jù)字段共17個,age(年齡)、job(職業(yè))、marital(婚姻狀況)、education(學歷)、default(失信記錄)、housing(房屋貸款情況)、loan(個人貸款)、balance(資產(chǎn)余額)、deposit(有無存款)、contact(聯(lián)系方式)、month(最后一次營銷的月份)、day(最后一次營銷的日期)、duration(通話時間)、campaign(這次營銷期間與這位客戶聯(lián)系的次數(shù))、pdays(從上次營銷到最后一次與客戶聯(lián)系的天數(shù))、previous(在這次營銷前與這位客戶聯(lián)系的次數(shù))、poutcome(上次營銷結(jié)果)。

  以下字段可以選擇隱藏:

  balance(資產(chǎn)余額)因?qū)儆趥€人敏感信息,所以暫不納入分析;

? ? ? ?duration(通話時間)該數(shù)據(jù)由業(yè)務(wù)人員營銷完后記錄,所以無分析意義。

b) 刪除重復(fù)值

由于此項數(shù)據(jù)集的字段都不具有唯一性,而年齡、職業(yè)等單個數(shù)據(jù)可能搜集到的正好一致,如果直接用Excel“刪除重復(fù)項”會造成有效數(shù)據(jù)的缺失,因此我通過CONCATENATE函數(shù)來連接所有字段,并結(jié)合IF函數(shù)來判斷是否存在兩列重復(fù)的數(shù)據(jù)記錄,驗證后發(fā)現(xiàn)沒有重復(fù)的數(shù)據(jù)記錄。

c) 處理缺失值

可以使用COUNTA函數(shù)來判斷是否存在空白缺失值,經(jīng)檢查,此項數(shù)據(jù)集完整無需對空白值進行填充或刪除。

d) 對無效數(shù)據(jù)進行刪除

經(jīng)查發(fā)現(xiàn),job(職業(yè))、education(學歷)、poutcome(上次營銷結(jié)果)字段均有unknown(不知道)的數(shù)據(jù),可通過篩選的方法將其清理后再作后續(xù)分析,而contact(聯(lián)系方式)字段也有大量unknown(不知道)的數(shù)據(jù),由于不影響分析結(jié)果故不作處理。

e) 數(shù)據(jù)一致化處理

檢查各字段數(shù)據(jù)的內(nèi)容發(fā)現(xiàn),只需要對日期相關(guān)的字段進行一些格式化處理,以方便后續(xù)作進一步的分析。

將month(最后一次營銷的月份)字段的內(nèi)容通過MONTH函數(shù)統(tǒng)一轉(zhuǎn)換為阿拉伯數(shù)字格式;

將day(最后一次營銷的日期)字段與之前month(最后一次營銷的月份)字段的內(nèi)容結(jié)合,轉(zhuǎn)換成周數(shù)據(jù),并將單元格格式設(shè)置成易讀的數(shù)據(jù)格式。

f) 異常值處理

從age(年齡)字段數(shù)據(jù)來看,該數(shù)據(jù)波動范圍比較大,最小18歲到最大88歲,由于此分析是銀行產(chǎn)品的營銷分析,正常情況下需要客戶本人親自辦理,考慮到實際的業(yè)務(wù)營銷成本,此次分析只篩選出80歲以內(nèi)客戶的數(shù)據(jù),并通過VLOOKUP函數(shù),將age(年齡)字段數(shù)據(jù)劃分成不同的客戶群體。

四、 分析結(jié)論

1) 將營銷結(jié)果數(shù)據(jù)通過年齡分組統(tǒng)計:

統(tǒng)計占比結(jié)果如下圖:

老年人和青年人組的營銷成功率遠高于其他兩個組,所以如果按既定的營銷方案來繼續(xù)推廣產(chǎn)品的話,應(yīng)將主要目標客戶群體定位于老年人(65<X<81)和青年人(0<X<25)群體。這兩組群體對產(chǎn)品的接受程度遠高于其他組,主要原因是他們均屬于抗風險能力低的群體,而銀行的定期理財產(chǎn)品風險遠低于低于其他產(chǎn)品,此款產(chǎn)品的定位正好符合他們的風險偏好。

結(jié)論:老年人和青年人群體接受程度高,符合產(chǎn)品定位,營銷部門在后續(xù)的營銷渠道和模式上應(yīng)注重觀察這兩個群體的特質(zhì)和喜好。

2) 將營銷結(jié)果數(shù)據(jù)按照電話營銷當天的星期數(shù)統(tǒng)計:

可以發(fā)現(xiàn)周三是非常特殊的。周六的失敗率接近97%,但令人費解的是周日的失敗率卻又是整周最低的。

造成此異常日期數(shù)據(jù)的原因可能是多方面的因素導致:

a) 在搜集日期數(shù)據(jù)是未考慮到法定節(jié)假日,法定節(jié)假日的調(diào)休日或者客戶行業(yè)的特殊日;

b) 數(shù)據(jù)記錄錯誤;

c) 樣本不夠大造成的數(shù)據(jù)偏差;

d) 其他不確定的行業(yè)或者該公司的內(nèi)部業(yè)務(wù)人員因素確實造成了實際營銷結(jié)果的偏差。故此項異常特征需要進一步分析。

結(jié)合第一個數(shù)據(jù)分析結(jié)論,老年人和青年人群體對此產(chǎn)品接受程度較高,通過Excel的切片器的功能對上表數(shù)據(jù)進行篩選:

從以上兩張圖中可以發(fā)現(xiàn)老年人和青年人這兩個成功率最高的分組并沒有周六的數(shù)據(jù),也就是說業(yè)務(wù)員們周六進行電話營銷的客戶群體恰巧都剔除了這兩個群體,由此也可以部分解釋這個異常值了。這個錯誤可以規(guī)劃到樣本偏差里,建議之后再搜集數(shù)據(jù)時擴大樣本種類數(shù)據(jù)并再次進行分析和了解異常值產(chǎn)生的原因。

結(jié)論:周六營銷失敗率最低,周日成功率最高,隨機數(shù)據(jù)樣本有問題,建議擴大樣本種類數(shù)據(jù)后再次進行進一步的分析。

3) 客戶信貸情況對產(chǎn)品營銷的影響分析

a) 失信記錄(no代表無失信記錄,yes代表有過信用不良記錄)

由于此數(shù)據(jù)中有失信記錄的樣本只有7個,建議擴大樣本種類的采集。但其100%的失敗率也說明了失信客戶并不是此次營銷活動的目標客戶群體,他們沒有多余自己購買銀行推出的定期產(chǎn)品,更無法在以后為其聯(lián)動推廣其他銀行理財產(chǎn)品。

b) 房屋貸款與個人貸款

由上圖可知,無房屋及個人貸款客戶的營銷成功率為62.78%,為所有分組中最高,此類客戶群體經(jīng)濟壓力小,有較多的積蓄可以用來理財投資;單獨有房屋貸款的營銷成功率為29.51%,低于僅有個人貸款客戶的營銷成功率40.91%,這應(yīng)是有房屋貸款客戶的經(jīng)濟壓力比僅有個人貸款客戶的經(jīng)濟壓力更大所導致的。

結(jié)論:銀行該產(chǎn)品的最有價值客戶應(yīng)為無失信記錄且無任何貸款的客戶群體,其次是有個人貸款而無房屋貸款的客戶群體。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容