? ? 數(shù)據(jù)的重要性毋庸置疑,所謂成大事者,三觀要正。數(shù)據(jù)分析大致可以分為描述性數(shù)據(jù)分析、診斷性數(shù)據(jù)分析和預(yù)測(cè)性數(shù)據(jù)分析。

????從分類不難看出,數(shù)據(jù)無(wú)非就是要有龐大的數(shù)據(jù)然后利用一定的技術(shù)進(jìn)行預(yù)測(cè)。
????那么數(shù)據(jù)常用的分析方法包括對(duì)比分析、平均分析、交叉分析等數(shù)。不同的人有不同的技巧和方法,當(dāng)然目的是一致的。都是一定的方法(比如:機(jī)器學(xué)習(xí))建立模型,預(yù)測(cè)數(shù)據(jù)。
????那么數(shù)據(jù)分析又有各種各樣的工具,常見的比如:Excel、SPSS、PYTHON、R還有其他的工具(比如:JMP、SAS、ALstat等),當(dāng)然咯我最喜歡的事python。曾經(jīng)鬧出一個(gè)笑話,在做一個(gè)獎(jiǎng)勵(lì)機(jī)制,我用python吭哧坑次搞了好久搞出來(lái)了,然后一同事說(shuō)這個(gè)用Excel不是很簡(jiǎn)單嗎?仔細(xì)一想還真是,哈哈哈(這怕是python被黑比較慘的一次了)
??? 喲,扯遠(yuǎn)了,是說(shuō)產(chǎn)品與數(shù)據(jù)糾纏不清的關(guān)系,“數(shù)據(jù)”這個(gè)詞,是產(chǎn)品經(jīng)理永遠(yuǎn)繞不過(guò)的話題,很多產(chǎn)品對(duì)數(shù)據(jù)的理解任然是一團(tuán)漿糊,甚至在做產(chǎn)品的時(shí)候從不考慮數(shù)據(jù)。就會(huì)有很多的理所當(dāng)然的事情發(fā)生,最近發(fā)生了一件很有趣的事情,市場(chǎng)部門售賣一款產(chǎn)品,產(chǎn)品開始介入主導(dǎo),做著做著發(fā)現(xiàn)業(yè)績(jī)不行了,至于原因不得而知了,后來(lái)大佬調(diào)整,說(shuō)按照原來(lái)的模式吧,還是銷售部門的老套路,業(yè)績(jī)突然就上去了。為啥?產(chǎn)品部門造出來(lái)的產(chǎn)品為啥市場(chǎng)不買賬?(這里就不說(shuō)原因了,以后再說(shuō)吧,我想表達(dá)的意思是一定要有數(shù)據(jù)來(lái)支撐產(chǎn)品,不能瞎想,胡編亂造)
??? 什么是數(shù)據(jù)分析?
數(shù)據(jù)分析就是提取有用的數(shù)據(jù)來(lái)指導(dǎo)實(shí)踐。
1、數(shù)據(jù)不要流于形式,要以結(jié)果為導(dǎo)向。
2、數(shù)據(jù)可視化,這樣便于發(fā)現(xiàn)數(shù)據(jù)背后提供的信息。
3、提取有用的數(shù)據(jù),不是自嗨。
????舉個(gè)例子:互聯(lián)網(wǎng)金融都會(huì)有渠道推廣這個(gè)東西,比如有A B C D 四個(gè)渠道,可以統(tǒng)計(jì)從各個(gè)渠道過(guò)來(lái)的用戶數(shù)量和在投金額。站在老板的角度就會(huì)選擇花的錢最少,但是帶來(lái)收益最高的那個(gè)渠道,也就是ROI最高的那個(gè)渠道。
????如果再進(jìn)一步細(xì)分,如果A渠道10個(gè)人帶來(lái)了200萬(wàn),B渠道300個(gè)人帶來(lái)了200萬(wàn),那么說(shuō)明A渠道高凈值人群比較多,如果和我們目標(biāo)用戶一樣的話,可以重點(diǎn)維護(hù)!加大宣傳投入成本,所以目的不一樣,看的數(shù)據(jù)也不一樣
1、入口分析
????用戶從哪些渠道進(jìn)入產(chǎn)品,對(duì)比運(yùn)營(yíng)策略分析量多或量少的原因,提出優(yōu)化方案。例如,你的app用戶有從app store來(lái)的,有從不同的安卓市場(chǎng)來(lái)的,有從第三方渠道來(lái)的,有地推來(lái)的,有運(yùn)營(yíng)發(fā)布的文章來(lái)的,你需要分析從不同渠道來(lái)的用戶數(shù)量和質(zhì)量以及投入成本,就像我上面舉得互聯(lián)網(wǎng)金融的例子,通過(guò)投入產(chǎn)出比來(lái)選擇渠道,同時(shí)通過(guò)每個(gè)渠道來(lái)的用戶貢獻(xiàn)程度,來(lái)分析出每個(gè)渠道的用戶質(zhì)量。
2、用戶分析
????分類用戶群體,獲取用戶基本信息,包括地區(qū)、性別、職業(yè)等你的產(chǎn)品需要關(guān)心的元素;這一部分相當(dāng)于用戶畫像,你可以通過(guò)自己建立的power BI系統(tǒng)來(lái)進(jìn)行分析,也可以通過(guò)第三方提供的工具來(lái)進(jìn)行分析,可以根據(jù)這些數(shù)據(jù)信息來(lái)做你的用戶畫像。用戶畫像的五個(gè)維度,可以參考我之前的文章《產(chǎn)品經(jīng)理如何進(jìn)行用戶畫像上》
????統(tǒng)計(jì)新增用戶、活躍用戶、流失用戶數(shù)據(jù),思考如何刺激轉(zhuǎn)化;這就是用戶運(yùn)營(yíng)的工作,哪些是新增用戶,哪些是活躍用戶,哪些是流失用戶。重點(diǎn)考慮新增用戶的轉(zhuǎn)化和流失用戶流失的原因,以及定期做一些運(yùn)營(yíng)活動(dòng)來(lái)促進(jìn)用戶的活躍。
3、事件分析
????各個(gè)功能的使用情況,驗(yàn)證功能設(shè)計(jì)時(shí)的想法,有沒(méi)有出現(xiàn)與設(shè)計(jì)時(shí)相悖的數(shù)據(jù),例如 PV、UV、頁(yè)面跳出率、頁(yè)面停留時(shí)長(zhǎng)、轉(zhuǎn)化率這些指標(biāo)。一件很有趣的事情,愛彼迎民宿剛上線的時(shí)候用戶多轉(zhuǎn)化率低,到后來(lái)轉(zhuǎn)化率大大提升就是數(shù)據(jù)分析起到了主導(dǎo)性的作用。
4、漏斗分析
????也叫做漏斗模型,比如一個(gè)p2p購(gòu)買流程。
瀏覽標(biāo)的—-》查看標(biāo)的詳情—》購(gòu)買—》輸入支付密碼—》成功支付
????你可以分析用戶的每一個(gè)操作步驟,你如有100個(gè)人瀏覽你的標(biāo)的,80個(gè)人查看詳情,60個(gè)購(gòu)買,5個(gè)人購(gòu)買成功。說(shuō)明用戶在輸入支付密碼那一塊漏的比較厲害,需要重點(diǎn)優(yōu)化,這就是漏斗模型的作用。
????我覺(jué)得對(duì)于產(chǎn)品來(lái)說(shuō),有兩大流程需要進(jìn)行漏斗模型分析。一個(gè)就是注冊(cè)流程,這個(gè)決定了用戶會(huì)不會(huì)在你注冊(cè)環(huán)節(jié)流失。另外一個(gè)就是主要流程。例如電商的支付流程,金融平臺(tái)產(chǎn)品購(gòu)買流程和充值流程。
5、留存分析
????次日留存、三日留存、月留存。所謂留存率,就是指一組用戶在初始時(shí)間(比如首次打開應(yīng)用)之后第 N 天,還在使用產(chǎn)品的用戶比例(即留存下來(lái)的用戶比例),一般稱之為N 天留存率。對(duì)于留存率你要辯證的看,如果你是做的社交產(chǎn)品,那么留存率是一個(gè)很重要的指標(biāo)。如果你做的是旅游機(jī)票這種產(chǎn)品,類似于攜程,可能有的用戶半年就買一次機(jī)票,買機(jī)票的時(shí)候才想起你,這種低頻的使用產(chǎn)品,你再分析留存率就沒(méi)啥意思。
????總而言之,數(shù)據(jù)分析是一個(gè)很重要的產(chǎn)品需求來(lái)源,你自己提的想法可能不靠譜,老板的想法可能在天上,覺(jué)得運(yùn)營(yíng)提的需求太傻逼,但是數(shù)據(jù)永遠(yuǎn)不會(huì)說(shuō)謊,
附上基本術(shù)語(yǔ):
埋點(diǎn):一般意義上的埋點(diǎn),是利用如友盟、Talkingdata等第三方公司的SDK,通過(guò)在App中嵌入一段SDK代碼,設(shè)定觸發(fā)條件,當(dāng)滿足條件時(shí),SDK會(huì)記錄日志,并將日志發(fā)送到第三方服務(wù)器進(jìn)行解析,并可視化地呈現(xiàn)給我們。這一過(guò)程就叫埋點(diǎn)。埋點(diǎn)方式也分“簡(jiǎn)單埋點(diǎn)”和“自定義埋點(diǎn)”,所謂“簡(jiǎn)單埋點(diǎn)”就是直接拿到第三方key,寫到App代碼的配置文件中即可。而“自定義埋點(diǎn)”則對(duì)應(yīng)一種叫“自定義事件”的功能,一般第三方統(tǒng)計(jì)工具都支持,我們可通過(guò)設(shè)置“自定義事件”查看App特定的操作行為數(shù)據(jù),如點(diǎn)擊按鈕次數(shù)、打開指定頁(yè)面次數(shù)等,通常創(chuàng)建“自定義事件”都需要產(chǎn)品經(jīng)理告知開發(fā)App的哪些條件下需要觸發(fā)“自定義事件”,以及觸發(fā)時(shí)要如何通過(guò)不同參數(shù)區(qū)分不同的點(diǎn)擊行為。如同樣是點(diǎn)擊按鈕事件,可通過(guò)設(shè)置參數(shù)“Action”,來(lái)區(qū)分Action=Yes和Action=No這兩個(gè)按鈕分別點(diǎn)擊的次數(shù)。
維度:維度就是指我們平時(shí)看事物的角度,也可理解成分析一個(gè)數(shù)據(jù)能從哪些方面去分析,這些“角度”都是有值且可被枚舉的。比如我們注冊(cè)用戶數(shù)有10萬(wàn),那可分析的維度有:用戶所在省份、用戶性別、用戶角色、用戶來(lái)源等。不同維度來(lái)觀察數(shù)據(jù),可以得出不同結(jié)論,能否拓展觀察維度,也是評(píng)估數(shù)據(jù)分析能力的一個(gè)關(guān)鍵。
度量:度量和維度相輔相成,是指可量化的數(shù)值,用于考察不同維度觀察的效果,也可理解成“數(shù)據(jù)指標(biāo)”。觀察度量值可總體查看,如App總用戶數(shù),也可配合“維度”分層查看,如不同省份的注冊(cè)用戶數(shù)、活躍用戶數(shù),不同來(lái)源的App啟動(dòng)次數(shù)、平均日使用時(shí)長(zhǎng)等。
渠道:指App的不同安裝來(lái)源,如通過(guò)第三方應(yīng)用市場(chǎng)安裝,通過(guò)廣告點(diǎn)擊安裝,通過(guò)地推二維碼掃碼安裝,通過(guò)官網(wǎng)下載安裝等?;ヂ?lián)網(wǎng)公司的商務(wù)工作一般就是拓展渠道,觀察不同渠道帶來(lái)的數(shù)據(jù)表現(xiàn),不斷優(yōu)化渠道質(zhì)量。
新增用戶:安裝App后,首次啟動(dòng)App的設(shè)備數(shù),需要按“設(shè)備號(hào)”去重。新增用戶主要為了衡量推廣效果,以及當(dāng)前產(chǎn)品在整個(gè)生命周期所處階段。
活躍用戶:時(shí)間段內(nèi),啟動(dòng)過(guò)App的設(shè)備數(shù),需要按“設(shè)備號(hào)”去重。活躍用戶主要為了衡量運(yùn)營(yíng)效果,以及產(chǎn)品使用情況。
啟動(dòng)次數(shù):時(shí)間段內(nèi),啟動(dòng)App的次數(shù),無(wú)需去重。啟動(dòng)次數(shù)主要為了衡量推送效果,以及App的內(nèi)容是否足夠吸引人。
留存率:時(shí)間段內(nèi)的新增用戶,經(jīng)過(guò)一段時(shí)間仍啟動(dòng)App的用戶,占原新增用戶的比例?!皶r(shí)間段”的劃分方式有:按日、按周、按月,對(duì)應(yīng)指標(biāo)還可細(xì)分為“日留存率、周留存率、月留存率”。而“經(jīng)過(guò)一段時(shí)間”的劃分方式有:次日、7日、14日;次周、+2周;次月、+2月等。一般一款A(yù)pp的次日留存率為30-40%,次月留存率為20%,已經(jīng)算是不錯(cuò)的成績(jī)了。
使用時(shí)長(zhǎng):時(shí)間段內(nèi),從啟動(dòng)到結(jié)束App使用的總時(shí)長(zhǎng)。所謂“結(jié)束App”,通常指殺掉進(jìn)程,或者將App退到后臺(tái)超過(guò)30秒。一般會(huì)按“人均使用時(shí)長(zhǎng)、次均使用時(shí)長(zhǎng)、單次使用時(shí)長(zhǎng)”分析,衡量產(chǎn)品粘性和活躍情況。
使用頻率:用戶上次啟動(dòng)App的時(shí)間,與再次啟動(dòng)的時(shí)間差。使用頻數(shù)分布,可觀察到App對(duì)用戶的粘性,以及運(yùn)營(yíng)內(nèi)容的深度。
介紹幾個(gè)常用的數(shù)據(jù)分析思路:
對(duì)比:字面上理解,就是非孤立地看數(shù)據(jù),而是多個(gè)數(shù)據(jù)提取進(jìn)行比較。根據(jù)對(duì)比方法不同,分為“橫向?qū)Ρ取焙汀翱v向?qū)Ρ取薄?/p>
橫向?qū)Ρ龋?/b>指空間維度的對(duì)比。相當(dāng)于一個(gè)指標(biāo),在不同條件下的對(duì)比,但每個(gè)條件都屬于一個(gè)層級(jí)。舉個(gè)例子,App功能的A/B測(cè)試數(shù)據(jù)對(duì)比,各個(gè)渠道的新增用戶對(duì)比,都屬于橫向?qū)Ρ取?/p>
縱向?qū)Ρ龋?/b>指時(shí)間維度的對(duì)比。一般的對(duì)比方法有:同比、環(huán)比。同比一般指是指本期數(shù)據(jù)與上年同期數(shù)據(jù)對(duì)比,環(huán)比則是本期統(tǒng)計(jì)數(shù)據(jù)與上期比較。觀察時(shí)間軸上的數(shù)據(jù)折線圖來(lái)判斷產(chǎn)品運(yùn)營(yíng)狀態(tài)也是一種縱向?qū)Ρ取?/p>
拆分:分析這個(gè)詞,從字面意義上理解,就是“拆分”和“解析”,當(dāng)某個(gè)維度對(duì)比后發(fā)現(xiàn)問(wèn)題需要找原因時(shí),就需要進(jìn)一步“拆分”了。舉個(gè)例子,如果發(fā)現(xiàn)某日的銷售額只有昨日的50%,就需要對(duì)銷售額指標(biāo)拆分為:成交用戶數(shù) x 客單價(jià),而成交用戶數(shù) = 訪客數(shù)x 轉(zhuǎn)化率。那么我們接下來(lái)就可分別針對(duì):訪客數(shù)、轉(zhuǎn)化率、客單價(jià),觀察今日和昨日相比的數(shù)據(jù)變化,找出原因。
降維:當(dāng)維度太多時(shí),我們不可能全部分析,這時(shí)就要篩選出有代表性的關(guān)鍵維度,去除掉那些無(wú)關(guān)數(shù)據(jù),這就是“降維”。比如“成交用戶數(shù) = 訪客數(shù) x 轉(zhuǎn)化率”,當(dāng)同時(shí)存在這三個(gè)指標(biāo)時(shí),其實(shí)我們只要三選二就能得出結(jié)論了。
增維:增維和降維是相對(duì)的,如果當(dāng)前觀察的維度無(wú)法解釋當(dāng)前問(wèn)題,就需要對(duì)數(shù)據(jù)進(jìn)行運(yùn)算,多增加一個(gè)指標(biāo)。在可視化分析領(lǐng)域,也可將不同類型的圖表嵌套使用,能達(dá)到增加信息展現(xiàn)維度,擴(kuò)展分析廣度的目的,如下圖所示:(將環(huán)形圖和折線圖進(jìn)行增維嵌套)。
分組:也可叫聚類,合適的分組能更好地理解業(yè)務(wù)和場(chǎng)景。例如用戶畫像過(guò)程,就是一個(gè)按不同維度對(duì)數(shù)據(jù)分組的過(guò)程。通過(guò)用戶畫像,可以很清晰地知道產(chǎn)品的用戶地區(qū)、用戶興趣、用戶年齡、用戶性別等屬性占比,產(chǎn)品經(jīng)理可通過(guò)畫像進(jìn)一步了解用戶需求。
漏斗分析:主要用于分析產(chǎn)品使用的關(guān)鍵路徑,通過(guò)設(shè)定一系列操作步驟,統(tǒng)計(jì)每一步中的操作用戶數(shù),并將用戶數(shù)以柱狀圖縱向排列,就可形成用戶流失漏斗,我們可分析漏斗每個(gè)環(huán)節(jié)的流失率,并觀察改進(jìn)環(huán)節(jié)交互體驗(yàn)后,流失用戶的變化情況,以此來(lái)驗(yàn)證改動(dòng)效果。

漏斗分析模型
AARRR模型:該模型一般用于游戲數(shù)據(jù)分析,是Acquisition、Activation、Retention、Revenue、Refer,這五個(gè)單詞的縮寫,分別對(duì)應(yīng)一款移動(dòng)應(yīng)用生命周期中的5個(gè)重要環(huán)節(jié)。AARRR本身是一個(gè)循環(huán),使用者需觀察每個(gè)環(huán)節(jié)的數(shù)據(jù)情況,以此來(lái)分析產(chǎn)品是否在執(zhí)行一個(gè)正循環(huán)過(guò)程。這其中的任一環(huán)節(jié)除了問(wèn)題,都會(huì)導(dǎo)致產(chǎn)品數(shù)據(jù)的異常。

AARRR模型
最近迷上了python做數(shù)據(jù)分析,發(fā)現(xiàn)這東西越來(lái)越有意思。有沒(méi)有感興趣的一起學(xué)習(xí)一下