CDNow網(wǎng)站用戶消費(fèi)行為分析

項(xiàng)目背景

CDNOW是美國的一家網(wǎng)上唱片公司,成立于1994年,后來被貝塔斯曼音樂集團(tuán)收購。

數(shù)據(jù)來源

本次分析的數(shù)據(jù)來源是CDNow網(wǎng)站在1997年1月1日至1998年6月30日期間的用戶消費(fèi)數(shù)據(jù)。數(shù)據(jù)集一共有用戶ID,購買日期,購買數(shù)量,和購買金額四個(gè)字段。

分析目標(biāo)

通過對(duì)網(wǎng)站的用戶消費(fèi)行為進(jìn)行分析,得出用戶消費(fèi)行為能力,建立RFM模型,分析復(fù)購率、回購率等關(guān)鍵指標(biāo)結(jié)果,以便更清楚了解用戶,為進(jìn)一步的營銷策略提供依據(jù)。

目錄:

一、導(dǎo)入數(shù)據(jù)
二、查看數(shù)據(jù)基本信息
三、時(shí)間數(shù)據(jù)類型轉(zhuǎn)換
四、用戶消費(fèi)趨勢(shì)分析
--4.1每月的總銷售額
--4.2每月的銷量
--4.3每月消費(fèi)次數(shù)
--4.4每月消費(fèi)人數(shù)
--4.5每月用戶平均消費(fèi)金額
--4.6每月用戶平均消費(fèi)次數(shù)
五、用戶個(gè)體消費(fèi)數(shù)據(jù)分析
--5.1用戶購買金額、購買數(shù)量的描述性統(tǒng)計(jì)
--5.2用戶購買金額、購買數(shù)量的散點(diǎn)圖
--5.3用戶購買金額的分布圖
--5.4用戶購買數(shù)量的分布圖
--5.5用戶累計(jì)消費(fèi)金額占比
六、用戶生命周期
--6.1用戶第一次消費(fèi)時(shí)間分布
--6.2用戶最后一次消費(fèi)時(shí)間分布
--6.3用戶生命周期的描述
--6.4用戶生命周期的分布
七、用戶消費(fèi)周期(用戶的每次購買時(shí)間間隔)
--7.1用戶消費(fèi)周期的描述
--7.2用戶消費(fèi)周期的分布
八、用戶分層
--8.1按用戶價(jià)值分層——RFM模型
--8.2按用戶活躍程度分層——新用戶、活躍用戶、不活躍用戶、回流用戶數(shù)量和占比
九、復(fù)購率和回購率分析
--9.1多少用戶僅消費(fèi)一次
--9.2每月新用戶占比
--9.3復(fù)購率
--9.4回購率
十留存率
--10.1留存率計(jì)算
--10.2計(jì)算各個(gè)時(shí)間段內(nèi)再次購買的用戶占總用戶的比重
十一、小結(jié)

一、導(dǎo)入數(shù)據(jù)

import pandas as pd

columns=['user_id','order_dt','order_products','order_amount']  #表頭為用戶ID,購買日期,購買數(shù)量,購買金額
df=pd.read_csv('CDNOW_master.txt',names=columns,sep='\s+')

加載包和數(shù)據(jù),文件是txt,用read_csv方法打開,因?yàn)樵紨?shù)據(jù)不包含表頭,所以需要賦予。字符串是空格分割,用\s+表示匹配任意空白符。

二、查看數(shù)據(jù)基本信息

print(df.head())

out:



查看數(shù)據(jù)的前五行。

print(df.info())

out:



數(shù)據(jù)共4列,每列有69659個(gè)非空值,購買金額數(shù)據(jù)類型為浮點(diǎn)數(shù),其他為整數(shù)。沒有缺失值,所以不用進(jìn)行缺失值的處理。

print(df.describe())

out:



最大購買數(shù)量為99個(gè),最小為1個(gè),最大購買金額為1286.01,最小為0。每個(gè)訂單平均購買2.41個(gè)商品,平均消費(fèi)35.89元。

三、時(shí)間數(shù)據(jù)類型轉(zhuǎn)換

df['order_dt']=pd.to_datetime(df['order_dt'],format='%Y%m%d')
df['month'] = df.order_dt.values.astype('datetime64[M]')
print(df.head())

out:


因?yàn)橹百徺I時(shí)間列數(shù)據(jù)類型為整數(shù),所以把它變成時(shí)間類型。添加新列 month,對(duì)order_dt列(取values),轉(zhuǎn)換類型為datetime64[M],默認(rèn)是每月的第1天。

四、用戶消費(fèi)趨勢(shì)分析(按月)

4.1每月的總銷售額

ze=df['order_amount'].groupby(df['month']).sum()
print(ze)

out:


#繪制折線圖
import matplotlib.pyplot as plt   #加載可視化包
plt.style.use('ggplot')    #更改設(shè)計(jì)風(fēng)格

ze.plot()
plt.show()

由上圖可知,銷售額在前3個(gè)月持續(xù)增長,在第3個(gè)月達(dá)到最高峰,接近40萬元,后續(xù)消費(fèi)額較為穩(wěn)定,有輕微下降趨勢(shì)。

4.2每月的銷量

xl=df['order_amount'].groupby(df['month']).sum()
xl.plot()
plt.show()

銷量同銷售額一樣,銷量在前3個(gè)月持續(xù)增長,在第3個(gè)月達(dá)到最高峰,超過25000,后續(xù)銷量較為穩(wěn)定,有輕微下降趨勢(shì)。

4.3每月消費(fèi)次數(shù)

cs=df['order_dt'].groupby(df['month']).count()
cs.plot()
plt.show()

購買次數(shù)在前3個(gè)月持續(xù)增長,在第3個(gè)月達(dá)到最高峰,接近12000,后續(xù)穩(wěn)定在每月3000左右。

4.4每月消費(fèi)人數(shù)

rs=df['user_id'].groupby(df['month']).apply(lambda x:len(x.unique()))
rs.plot()
plt.show()

前3個(gè)月每月的消費(fèi)人數(shù)在8000-10000之間,后續(xù)月份的平均消費(fèi)人數(shù)穩(wěn)定在2000左右。

4.5每月用戶平均消費(fèi)金額

zee=ze/rs
zee.plot()
plt.show()

每月用戶平均消費(fèi)金額都在37.5元以上,1997年1月份最低,1998年11月最高,約為57元。

4.6每月用戶平均消費(fèi)次數(shù)

css=cs/rs
css.plot()
plt.show()

每月用戶平均消費(fèi)次數(shù)都在1次以上

五、用戶個(gè)體消費(fèi)數(shù)據(jù)分析

5.1用戶購買金額、購買數(shù)量的描述性統(tǒng)計(jì)

mg=df.groupby(df['user_id']).sum()   #統(tǒng)計(jì)每個(gè)用戶的購買金額和購買數(shù)量
print(mg.describe())

out:



從用戶角度看,平均每位用戶購買7張CD,中位數(shù)為 3 張,平均數(shù)大于中位數(shù),說明小部分用戶購買了大部分的CD。平均每個(gè)用戶消費(fèi)106元,中位數(shù)為43元,說明高額消費(fèi)用戶集中在小部分用戶中。

5.2用戶購買金額、購買數(shù)量的散點(diǎn)圖

mg.plot.scatter(x='order_amount',y='order_products')
plt.show()

絕大部分的數(shù)據(jù)集中分布,小部分極值對(duì)分析有一定的干擾??梢允褂胵uery方法,篩選出order_amount<4000的用戶,排除極值的干擾。

mg.query('order_amount<4000').plot.scatter(x='order_amount',y='order_products')
plt.show()

由散點(diǎn)圖可知,用戶購買金額和購買數(shù)量基本呈線性關(guān)系,購買數(shù)量越多,購買金額越高。

5.3用戶購買金額的分布圖

mg.order_amount.plot.hist(bins=20)
plt.show()

從圖上可以看出,用戶的消費(fèi)金額絕大部分呈現(xiàn)集中趨勢(shì),可能是有個(gè)別的極大值干擾了判斷,可以使用query過濾操作排除極值。

mg.query('order_products<100').order_amount.plot.hist(bins=20)
plt.show()

可以看出,大多數(shù)用戶消費(fèi)金額并不高,大部分不超過200元。

一點(diǎn)說明,根據(jù)切比雪夫定理,所有數(shù)據(jù)中至少有96%的數(shù)據(jù)位于平均數(shù)5個(gè)標(biāo)準(zhǔn)差之內(nèi),剩下4%的極值就過濾掉。這里以order_products作為過濾條件,購買數(shù)量的均值為7.12,標(biāo)準(zhǔn)差為16.98,7.12+5*16.98=92.02,所以選擇100作為閾值。

5.4用戶購買數(shù)量的分布圖

mg.query('order_products<100').order_products.plot.hist(bins=20)
plt.show()

大部分用戶購買數(shù)量并不高,一般不超過20個(gè),超16000位用戶購買數(shù)量為0-5個(gè)。

5.5用戶累計(jì)消費(fèi)金額占比

mgj=df['order_amount'].groupby(df['user_id']).sum().sort_values()
ljx=mgj.cumsum()/mgj.sum()
print(ljx)

out:


ljx.reset_index(drop=True).plot()   # reset_index()重置索引是為了得到一個(gè)自然數(shù)的行標(biāo)簽
plt.show()

橫坐標(biāo)表示用戶數(shù)量(總共有23570名用戶),縱坐標(biāo)表示累計(jì)消費(fèi)金額占比??梢钥闯?,排名前3000的用戶貢獻(xiàn)了近60%的消費(fèi)總金額,這也反映出了二八法則。

六、用戶生命周期

6.1用戶第一次消費(fèi)時(shí)間分布

df['order_dt'].groupby(df['user_id']).min().value_counts().plot()
plt.show()

可以看出,用戶第一次購買時(shí)間主要集中在前三個(gè)月。其中,在2月5日到2月25日之間有劇烈的波動(dòng)。

6.2用戶最后一次消費(fèi)時(shí)間分布

df['order_dt'].groupby(df['user_id']).max().value_counts().plot()
plt.show()

用戶最后一次購買的時(shí)間分布范圍較廣,大部分用戶的最后一次購買時(shí)間集中在前3個(gè)月,說明這部分用戶只購買了一次,忠實(shí)用戶較少。出現(xiàn)斷崖式下跌很正常,一開始用戶數(shù)量迅猛增長,流失的也比較多。

6.3用戶生命周期的描述

user_life=df['order_dt'].groupby(df['user_id']).max()-df['order_dt'].groupby(df['user_id']).min()
print(user_life.describe())

結(jié)果表明,用戶平均生命周期為 134 天;用戶生命周期中位數(shù)僅為 0 天,說明一半以上用戶僅消費(fèi)1次,這部分用戶屬于低質(zhì)量用戶;用戶最大生命周期為 544 天,差不多一年半的時(shí)間,和數(shù)據(jù)集時(shí)間相近,該用戶屬于重要客戶。

6.4用戶生命周期的分布

(user_life/np.timedelta64(1,'D')).hist(bins=40)
plt.show()

因?yàn)閿?shù)據(jù)類型是timedelta時(shí)間,無法直接作出直方圖,所以先換算成數(shù)值。換算的方式直接除timedelta函數(shù)即可,np.timedelta64(1, ‘D’),D表示天,1表示1天,作為單位使用。



生命周期為0,即僅消費(fèi)1次的用戶對(duì)結(jié)果分布影響較大,可以將這部分用戶篩選掉。

life=user_life/np.timedelta64(1,'D')
life[life>0].hist(bins=40)
plt.show()
print(life[life>0].describe())

排除掉生命周期為0的用戶后,用戶生命周期呈現(xiàn)雙峰趨勢(shì),20天內(nèi)生命周期的用戶是一個(gè)高峰,400至500天內(nèi)生命周期的用戶是另一個(gè)高峰。根據(jù)此情況,應(yīng)該在20天內(nèi)對(duì)客戶進(jìn)行引導(dǎo),促進(jìn)其再次消費(fèi)并形成消費(fèi)習(xí)慣,延長其生命周期;在100至400天的用戶,也要根據(jù)其特點(diǎn)推出有針對(duì)性的營銷活動(dòng),引導(dǎo)其持續(xù)消費(fèi)。消費(fèi)兩次以上的用戶平均生命周期是 276 天,遠(yuǎn)高于總體的134天。

七、用戶消費(fèi)周期(用戶的每次購買時(shí)間間隔)

7.1用戶消費(fèi)周期的描述

order_diff=df.groupby(df['user_id']).apply(lambda x:x.order_dt-x.order_dt.shift())
print(order_diff.describe())

錯(cuò)行相減計(jì)算相鄰兩個(gè)訂單的時(shí)間間隔,shift 函數(shù)是對(duì)數(shù)據(jù)進(jìn)行錯(cuò)位,所有數(shù)據(jù)會(huì)往下平移一位。



平均每個(gè)用戶的購買時(shí)間間隔是68天,間隔最長的是533天。想要召回用戶,在60天左右的消費(fèi)間隔是比較好的。大部分用戶的消費(fèi)周期都低于90天。

7.2用戶消費(fèi)周期的分布

(order_diff/np.timedelta64(1,'D')).hist(bins=20)
plt.show()

可以看出,大部分用戶的消費(fèi)間隔確實(shí)比較短。

八、用戶分層

8.1按用戶價(jià)值分層——RFM模型

RFM模型主要通過三個(gè)指標(biāo)對(duì)客戶價(jià)值進(jìn)行細(xì)分:
最近一次消費(fèi)-R:客戶最近一次交易時(shí)間的間隔。R值越大,表示客戶交易發(fā)生的日期越久,反之則交易發(fā)生的日期越近。
消費(fèi)頻率-F:客戶在最近一段時(shí)間內(nèi)交易的次數(shù)。F值越大,表示客戶交易越頻繁,反之則表示客戶交易不夠活躍。
消費(fèi)金額-M:客戶在最近一段時(shí)間內(nèi)交易的金額。M值越大,表示客戶價(jià)值越高,反之則表示客戶價(jià)值越低。
通過這三個(gè)指標(biāo),將客戶細(xì)分為八類:



rfm=df.pivot_table(['order_dt','order_products','order_amount'],index='user_id',
               aggfunc={'order_dt':'max','order_products':'count','order_amount':'sum'})

使用透視表得出每個(gè)用戶最后一次消費(fèi)時(shí)間,總交易次數(shù),總交易金額。


rfm['time']=(rfm['order_dt'].max()-rfm['order_dt'])/ np.timedelta64(1, 'D')
print(rfm.head())

因?yàn)閿?shù)據(jù)集距今日期太久,所以我們用數(shù)據(jù)集的最大日期來算用戶最后一次消費(fèi)時(shí)間距今日期。


#比較每一項(xiàng)和均值的大小,分出高低(實(shí)際工作中RFM的劃分標(biāo)準(zhǔn)應(yīng)該以業(yè)務(wù)為準(zhǔn))
rfm['r_m']=rfm['time']-rfm['time'].mean()
rfm['f_m']=rfm['order_products']-rfm['order_products'].mean()
rfm['m_m']=rfm['order_amount']-rfm['order_amount'].mean()

def hanshu(x):
    if x>0:
        return 1
    else:
        return 0

rfm['r']=rfm['r_m'].apply(hanshu)
rfm['f']=rfm['f_m'].apply(hanshu)
rfm['m']=rfm['m_m'].apply(hanshu)

print(rfm.head())

out:


rfm['jieguo']=rfm['r'].map(str)+rfm['f'].map(str)+rfm['m'].map(str)

ppp={'111':'重要價(jià)值客戶',
     '011':'重要保持客戶',
     '101':'重要發(fā)展客戶',
     '001':'重要挽留客戶',
     '110':'一般價(jià)值客戶',
     '010':'一般保持客戶',
     '100':'一般發(fā)展客戶',
     '000':'一般挽留客戶'}

rfm['leixing']=rfm['jieguo'].map(ppp)
print(rfm.head())

out:


#統(tǒng)計(jì)不同類型客戶的總消費(fèi)金額、消費(fèi)次數(shù)
asd=rfm.pivot_table(['order_amount','order_products'],index='leixing',aggfunc=sum)
print(asd)

out:


8種客戶中,重要保持客戶的消費(fèi)金額和消費(fèi)次數(shù)最高,其次是一般發(fā)展客戶。

#統(tǒng)計(jì)各類用戶的人數(shù)
print(rfm['leixing'].value_counts())

out:



8種客戶中,一般發(fā)展客戶的人數(shù)最多,為13608人,其次是重要保持客戶。

8.2按用戶活躍程度分層——新用戶、活躍用戶、不活躍用戶、回流用戶數(shù)量和占比

dff=df.pivot_table(['order_dt'],index='user_id',columns='month',aggfunc='count')
dff.fillna(0,inplace=True)
print(dff.head())

out:


def active_status(data):
    status = []
    for i in range(18):      # 數(shù)據(jù)一共有18個(gè)月份
        if data[i] == 0:
            if len(status) > 0:
                if status[i - 1] == 'unreg':      #unreg為未注冊(cè)
                    status.append('unreg')
                else:
                    status.append('unactive')     #上月有消費(fèi),本月沒有消費(fèi),則為不活躍
            else:
                status.append('unreg')

        else:        #若本月消費(fèi)
            if len(status) > 0:
                if status[i - 1] == 'unactive':
                    status.append('return')        #上個(gè)月不消費(fèi),這個(gè)月消費(fèi)了,則為回流用戶
                elif status[i - 1] == 'unreg':
                    status.append('new')           #上個(gè)月未注冊(cè),這個(gè)月消費(fèi)了,則為新用戶
                else:
                    status.append('active')        #上個(gè)月消費(fèi),這個(gè)月也消費(fèi),則為活躍用戶
            else:
                status.append('new')
    return pd.Series(status)

sdff=dff.apply(active_status,axis=1)
print(sdff.head())

out:



把未注冊(cè)的替換為空值,這樣count不會(huì)計(jì)算到,得到每個(gè)月的用戶分布

# 把未注冊(cè)的替換為空值,這樣count不會(huì)計(jì)算到,得到每個(gè)月的用戶分布
sdff2=sdff.replace('unreg',np.NaN)
yhfb=sdff2.apply(lambda x:x.value_counts())
print(yhfb)

out:



把null值填充為0,并進(jìn)行轉(zhuǎn)置

# 把null值填充為0,并進(jìn)行轉(zhuǎn)置
yhfb=yhfb.fillna(0).T
print(yhfb)

out:



從表中可以看出,新客都是集中在前三個(gè)月,第三個(gè)月出現(xiàn)回流用戶,數(shù)量較為穩(wěn)定,整體在1000左右,活躍用戶前四個(gè)月較多,后面逐步下降,不活躍用戶數(shù)量很多,基本上每月都在20000以上。

# 繪制面積圖
yhfb.plot.area()
plt.show()

計(jì)算每月各類用戶占比:

# 計(jì)算每月各類用戶占比
yhzb=yhfb.apply(lambda x:x/x.sum(),axis=1)
print(yhzb)

out:


九、復(fù)購率和回購率分析

9.1多少用戶僅消費(fèi)一次

yici=df['order_dt'].groupby(df['user_id']).count()
yici=yici[yici==1]
print(yici.count())

out:



這表明約一半的用戶只消費(fèi)了一次,留存效果不好。

9.2每月新用戶占比

#先找出每個(gè)用戶消費(fèi)的最小月份
xx=df['month'].groupby(df['user_id']).min()
print(xx.value_counts())

out:



發(fā)現(xiàn)只有前三個(gè)月有新用戶。

print(xx.value_counts()/df['month'].value_counts())  #再除以每個(gè)月的總用戶數(shù)

out:



所以,前三個(gè)月的新用戶占比為88%,75%,62%。

9.3復(fù)購率

復(fù)購率:自然月內(nèi),購買多次的用戶占比。即一個(gè)月內(nèi)購買兩次及以上用戶占該月總用戶的比率。

#把消費(fèi)兩次及以上記為1,消費(fèi)一次記為0,其他記為空值,以便于計(jì)算復(fù)購率
def han(y):
    if y>1:
        return 1
    elif y==1:
        return 0
    else:
        return np.nan

ddf=dff.applymap(han)
print(ddf.head())

out:


fgl=ddf.sum()/ddf.count()
print(fgl)

out:


fgl.plot()
plt.show()

復(fù)購率穩(wěn)定在20%左右,前3個(gè)月因?yàn)橛写罅啃掠脩粲咳耄@批用戶只購買了一次,所以導(dǎo)致復(fù)購率較低。

9.4回購率

回購率:是某一個(gè)時(shí)間窗口內(nèi)消費(fèi)的用戶,在下一個(gè)時(shí)間窗口仍舊消費(fèi)的占比。比如,我1月消費(fèi)用戶1000,他們中有300個(gè)2月依然消費(fèi),回購率是30%。所以要計(jì)算一個(gè)月的回購率,要用下一個(gè)月依然消費(fèi)的用戶數(shù)除以本月的總消費(fèi)用戶數(shù)。

#把當(dāng)月有購買的記為1,無購買的記為0
def hansu(z):
    if z>=1:
        return 1
    else:
        return 0

ddff=dff.applymap(hansu)
print(ddff.head())

out:


#如果本月進(jìn)行消費(fèi),下月也進(jìn)行消費(fèi),則記為1;如果下月沒有消費(fèi),則記為0,若本月沒有消費(fèi),則記為nan
def han(data):
    status=[]
    for i in range(17):#循環(huán)17個(gè)月
        if data[i]==1:#若本月消費(fèi)
            if data[i+1]==1:#下個(gè)月也消費(fèi)
                status.append(1)#就記為1
            if data[i+1]==0:#下個(gè)月不消費(fèi),就記為0
                status.append(0)
        else:
            status.append(np.nan)

    return pd.Series(status)

ddd=ddff.apply(han,axis=1)   #axis=1表示計(jì)算方向在行的方向上
print(ddd)

out:


#計(jì)算回購率
hgl=ddd.sum()/ddd.count()
print(hgl)

out:


hgl.plot()
plt.show()

上圖可以看出,初期用戶的回購率并不高,前三個(gè)月的回購率在15%-20%之間,4月份起回購率大概在30%左右。

十、留存率

10.1留存率計(jì)算

#得到用戶ID及其下單的時(shí)間
df1=df[['user_id','order_dt']].drop_duplicates()

#得到用戶ID及其首次下單時(shí)間
df2=df['order_dt'].groupby(df['user_id']).min()

#把他們關(guān)聯(lián)起來,得到用戶ID,下單時(shí)間,首次下單時(shí)間
df3=pd.merge(df1,df2,on='user_id')
df3.columns=['user_id','time','mtime']    #修改列名
print(df3.head())

out:


#計(jì)算留存率,按最小時(shí)間、下單時(shí)間分組
df4=df3.pivot_table('user_id',index=['mtime','time'],aggfunc='count')
print(df4)

out:



現(xiàn)在我們已經(jīng)可以清晰的看到1997-01-01的次日留存率=3/209,三日留存率=3/209,同理可得其他日的n日留存率。

#重置索引
df4=df4.reset_index()
print(df4)

out:



如果我們想看具體某一日的留存率,把它篩選出來就好了

df5=df4[df4['mtime']=='1997-01-01']
print(df5)

out:


10.2計(jì)算各個(gè)時(shí)間段內(nèi)再次購買的用戶占總用戶的比重

接下來我們計(jì)算每個(gè)用戶每次下單和首次下單時(shí)間的時(shí)間差

df3['diff']=df3['time']-df3['mtime']    #計(jì)算每次下單時(shí)間和首次下單時(shí)間的時(shí)間差
print(df3.head())

out:



去除時(shí)間單位并更改數(shù)據(jù)類型為整數(shù)

df3['diff']=df3['diff'].map(str).str[0:-14]    #去除時(shí)間單位
df3['diff']=df3['diff'].astype('int64')        #更改數(shù)據(jù)類型
print(df3.head())

out:



將時(shí)間差按3天、7天、半個(gè)月、一個(gè)月、兩個(gè)月、三個(gè)月、半年、一年、兩年進(jìn)行分組

#將時(shí)間差按3天、7天、半個(gè)月、一個(gè)月、兩個(gè)月、三個(gè)月、半年、一年、兩年進(jìn)行分組
bins=[0,3,7,15,30,60,90,180,365,730]
df3['fen']=pd.cut(df3['diff'],bins=bins)
print(df3.head())

out:



計(jì)算各個(gè)時(shí)間段有多少人

df6=df3['fen'].value_counts()
print(df6)

out:



計(jì)算各個(gè)時(shí)間段發(fā)生購買的人數(shù)占總用戶的比重

df7=df6/df['user_id'].drop_duplicates().count()
print(df7)

out:


#繪制柱狀圖
df7.plot.bar()
plt.show()

只有2.7%的用戶在3天內(nèi)有過再次消費(fèi),3.6%的用戶在3~7天內(nèi)有過再次消費(fèi)。數(shù)字并不好看,但CD購買確實(shí)不是高頻消費(fèi)行為。有60%的用戶在半年后至1年內(nèi)有過再次購買。

十一、小結(jié)

1、用戶消費(fèi)趨勢(shì)方面,前3個(gè)月有大量新用戶涌入,銷售額、銷量、消費(fèi)次數(shù)、消費(fèi)人數(shù)均達(dá)到高峰,后續(xù)月份較為穩(wěn)定。銷售額在第3個(gè)月達(dá)到最高峰,接近40萬元,后續(xù)消費(fèi)穩(wěn)定在100000左右。前3個(gè)月產(chǎn)品購買量達(dá)到20000以上,后續(xù)月份平均7000;前3個(gè)月消費(fèi)次數(shù)都在10000筆左右,后續(xù)月份的平均2500;前3個(gè)月消費(fèi)人數(shù)在8000以上,后續(xù)月份平均2000左右。
2、用戶個(gè)體消費(fèi)方面,小部分用戶購買了大量的CD,拉高了平均消費(fèi)金額。大多數(shù)用戶消費(fèi)金額并不高,大部分不超過200元,大約有17000名。大部分用戶購買數(shù)量并不高,一般不超過20個(gè),超16000位用戶購買數(shù)量為0-5個(gè)。排名前3000的用戶貢獻(xiàn)了近60%的消費(fèi)總金額,反映出了消費(fèi)的二八法則。
3、用戶生命周期方面,用戶第一次購買時(shí)間主要集中在前三個(gè)月,大部分用戶的最后一次購買時(shí)間也集中在前3個(gè)月,說明這部分用戶只購買了一次,忠實(shí)用戶較少。用戶平均生命周期為 134 天;用戶生命周期中位數(shù)僅為 0 天,說明一半以上用戶僅消費(fèi)1次,這部分用戶屬于低質(zhì)量用戶。
4、用戶消費(fèi)周期方面,平均每個(gè)用戶的購買時(shí)間間隔是68天,間隔最長的是533天,最小0天,大部分用戶的消費(fèi)周期都低于90天。
5、從RFM模型來看,8種客戶中,重要保持客戶的消費(fèi)金額和消費(fèi)次數(shù)最高,人數(shù)排在第二,有4617人;一般發(fā)展客戶消費(fèi)頻次和消費(fèi)金額排第二位,人數(shù)最多,為13608人。
6、從用戶活躍度分層情況來看,新客都是集中在前三個(gè)月,第三個(gè)月出現(xiàn)回流用戶,數(shù)量較為穩(wěn)定,整體在1000左右,活躍用戶前四個(gè)月較多,后面逐步下降,不活躍用戶數(shù)量很多,基本上每月都在20000以上。
7、從整體消費(fèi)記錄來看,有一半的用戶,只消費(fèi)了一次。從每月新用戶占比來看,只有前三個(gè)月有新用戶,第一個(gè)月新用戶占比最高,為88%,第二個(gè)月為75%,第三個(gè)月為62%。
8、復(fù)購率和回購率方面,復(fù)購率穩(wěn)定在20%左右,回購率穩(wěn)定在30%左右,前3個(gè)月因?yàn)橛写罅啃掠脩粲咳耄@批用戶只購買了一次,所以導(dǎo)致復(fù)購率和回購率都比較低。
9、留存率方面,只有2.7%的用戶在3天內(nèi)有過再次消費(fèi),3.6%的用戶在3~7天內(nèi)有過再次消費(fèi)。數(shù)字并不好看,但CD購買確實(shí)不是高頻消費(fèi)行為。有60%的用戶在半年后至1年內(nèi)有過再次購買。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容