無(wú)關(guān)緊要的開頭
最近去辦理了爺爺奶奶的死亡證明,最后在派出所的努力下終于辦成功了。證明中寫明了老人的出生在1920年代,也就是說(shuō)老人的人生歷史距今已經(jīng)足足100年了。三代人已經(jīng)橫跨了整整一個(gè)世紀(jì),而這三代人生活在完全不同的三個(gè)階段,第一代生活在舊中國(guó),第二代生活在新中國(guó)建國(guó)初期,第三代生活在國(guó)盛民強(qiáng)的時(shí)代里。世界的變化可能是瞬息萬(wàn)變的,短短的100年中國(guó)實(shí)現(xiàn)了歷史性的大逆轉(zhuǎn),所以什么不可能發(fā)生呢?
我們做數(shù)據(jù)業(yè)務(wù)的人在最近這短短10多年內(nèi)也發(fā)生了明顯的變化,基本三年一個(gè)顯著變化:
2010年
開始正式在傳統(tǒng)制造企業(yè)里從事數(shù)據(jù)分析工作,數(shù)倉(cāng)采用SAP系統(tǒng)通過(guò)簡(jiǎn)單交互下載數(shù)據(jù)后用excel做分析,數(shù)據(jù)基本月度統(tǒng)計(jì)一次,盡可能通過(guò)不同維度對(duì)比、趨勢(shì)、單價(jià)等總結(jié)出結(jié)論。此時(shí)市面上大量excel可視化教程開始普及,其中可視化理論“data ink”已在國(guó)內(nèi)悄無(wú)聲息的初成氣候,但此時(shí)完全沒(méi)有聽說(shuō)大數(shù)據(jù)、數(shù)據(jù)中臺(tái)、AI等;
2014年
咨詢公司、廣告公司都已強(qiáng)烈地感受到數(shù)據(jù)變現(xiàn)的價(jià)值,通過(guò)各種辦法收集商業(yè)數(shù)據(jù)對(duì)品牌主進(jìn)行廣告效益的評(píng)估及指導(dǎo)。其中擁有海量數(shù)據(jù)的運(yùn)營(yíng)商也在數(shù)據(jù)商業(yè)領(lǐng)域進(jìn)行探索。大數(shù)據(jù)平臺(tái)、更快速的spark都已陸續(xù)進(jìn)入一些企業(yè)的視野內(nèi),但此時(shí)真正把玩olap的企業(yè)并不多,對(duì)生產(chǎn)環(huán)境下實(shí)時(shí)應(yīng)用的能力和意識(shí)并不強(qiáng)烈。只有個(gè)別企業(yè)不停地探索實(shí)時(shí)推薦、DMP變現(xiàn);
2017年
大企業(yè)無(wú)一例外地在探究用戶畫像、模型、風(fēng)險(xiǎn)、千人千面、爬蟲、埋點(diǎn)等相對(duì)更深層次的數(shù)據(jù)服務(wù)。企業(yè)對(duì)數(shù)據(jù)生產(chǎn)應(yīng)用的需求越發(fā)旺盛,原本冷落的數(shù)學(xué)專業(yè)頓時(shí)峰回路轉(zhuǎn)成為熱門專業(yè),貴州等地成為了孵化大數(shù)據(jù)專業(yè)的地方。數(shù)據(jù)運(yùn)營(yíng)的優(yōu)劣直接決定了企業(yè)的生死,A/B測(cè)試也成為企業(yè)精益求精的主要手段之一;
2021年
員工與數(shù)據(jù)的關(guān)系越來(lái)越緊,很多曾經(jīng)被IT拒絕的分析需求逐步都實(shí)現(xiàn)了,市面上可視化工具就像excel一樣在一線、二線企業(yè)中成為基礎(chǔ)工具,甚至像預(yù)測(cè)回歸等都像手機(jī)拍照按鈕一樣供運(yùn)營(yíng)人員一鍵分析。分析的成本越來(lái)越低,參與分析的人越來(lái)越多,分析人員的能力愈發(fā)專業(yè)。所以一些似乎不太現(xiàn)實(shí)的需求沒(méi)準(zhǔn)未來(lái)幾年都能工業(yè)化地順利落地。
正文
做了幾年的埋點(diǎn)產(chǎn)品兼行為分析師,我有一個(gè)關(guān)于埋點(diǎn)的夢(mèng)想,這個(gè)埋點(diǎn)夢(mèng)建立在高度標(biāo)準(zhǔn)化的產(chǎn)品架構(gòu)之上,沒(méi)有測(cè)試、沒(méi)有人負(fù)責(zé)命名、沒(méi)有人去做分析,只有結(jié)果和指導(dǎo)意見。
埋點(diǎn)工程可以大致分為以下幾個(gè)環(huán)節(jié):
1)命名,核心任務(wù)是保障每個(gè)獨(dú)立的按鈕、頁(yè)面其id不重復(fù)
2)測(cè)試,驗(yàn)證埋點(diǎn)采集邏輯、次數(shù)、參數(shù)是否正確
3)分析,找出產(chǎn)品問(wèn)題在探索中不斷優(yōu)化轉(zhuǎn)化及體驗(yàn)
那我就來(lái)闡述下這三個(gè)環(huán)節(jié)在夢(mèng)中的樣子——
一、命名
首先產(chǎn)品或業(yè)務(wù)線需要通過(guò)類似電影膠片一樣接近連續(xù)性地將故事內(nèi)容一一介紹給用戶,所以一個(gè)場(chǎng)景是由多個(gè)被切片的頁(yè)面組承接用戶來(lái)辦理業(yè)務(wù)的,于是有了首頁(yè)、詳情頁(yè)、確認(rèn)頁(yè)、結(jié)果頁(yè)等等,代表不同業(yè)務(wù)進(jìn)程的頁(yè)面需要通過(guò)不同的控件組合實(shí)現(xiàn)信息收集、信息展示及用戶授權(quán)等操作,控件交互過(guò)程中會(huì)攜帶大量的參數(shù)信息,如商品id、訂單id、規(guī)則id等,于是場(chǎng)景+頁(yè)面(及頁(yè)面狀態(tài))+事件+參數(shù)構(gòu)成了產(chǎn)品元素的全部信息。所以命名這塊最高的夢(mèng)想是自動(dòng)命名:

為此需要配套一個(gè)采集后臺(tái),這個(gè)后臺(tái)需要實(shí)現(xiàn)以下幾個(gè)功能:
1)場(chǎng)景的頁(yè)面id與圖自動(dòng)匹配,事件id與頁(yè)面內(nèi)控件自動(dòng)匹配
2)管理場(chǎng)景庫(kù)、頁(yè)面id庫(kù)、頁(yè)面狀態(tài)庫(kù)、控件庫(kù)、參數(shù)庫(kù)
3)確認(rèn)具體某一事件是否要部署埋點(diǎn)
4)確認(rèn)具體某一事件下采集哪些參數(shù)
說(shuō)白了有了這個(gè)后臺(tái)就可以跳過(guò)開發(fā)、測(cè)試直接配置APP版本對(duì)應(yīng)的采集范圍,而且場(chǎng)景內(nèi)每個(gè)頁(yè)面、按鈕都與對(duì)應(yīng)的id產(chǎn)生了對(duì)應(yīng)關(guān)系,便于后續(xù)數(shù)據(jù)直接同步到頁(yè)面流中打下扎實(shí)的基礎(chǔ)。
二、測(cè)試
因?yàn)椴捎昧斯I(yè)流水方式生成和決定埋點(diǎn)與否,已無(wú)需額外執(zhí)行測(cè)試任務(wù)。工業(yè)流水方式生產(chǎn)的頁(yè)面有以下幾個(gè)優(yōu)點(diǎn):
1)頁(yè)面設(shè)計(jì)規(guī)范統(tǒng)一
2)生產(chǎn)效率高,變相節(jié)約生產(chǎn)成本
3)零件升級(jí)則全局同步升級(jí)
4)信息結(jié)構(gòu)化便于查詢、問(wèn)題溯源
近幾年國(guó)家要求用戶信息收集時(shí)需按照最低標(biāo)準(zhǔn)收集,則第四條就能幫助法務(wù)同事快速將所有場(chǎng)景名為confirm的頁(yè)面,即可根據(jù)相關(guān)法律法規(guī)一一排查。

三、分析
分析這個(gè)活兒非??简?yàn)人的水平??山駜赫f(shuō)的是夢(mèng)想,所以分析這個(gè)活得交給人工智能,將用戶行為特征、畫像、產(chǎn)品指標(biāo)相結(jié)合自動(dòng)識(shí)別問(wèn)題,當(dāng)發(fā)現(xiàn)問(wèn)題后自動(dòng)生成閾值并報(bào)警,當(dāng)產(chǎn)品經(jīng)理想要提高產(chǎn)品的效益和體驗(yàn)時(shí)人工智能能提供切實(shí)有效的建議和調(diào)整方案。那退一步或許線實(shí)現(xiàn)以下功能吧:
1)產(chǎn)品流量前意圖——頁(yè)面邏輯設(shè)計(jì)診斷
就是檢查一個(gè)場(chǎng)景內(nèi)所有頁(yè)面間的路徑是否通暢,是否能順利地在每個(gè)頁(yè)面上直接離開場(chǎng)景或者直接從某個(gè)頁(yè)面跳轉(zhuǎn)至另一個(gè)頁(yè)面。設(shè)計(jì)師和產(chǎn)品可以查看任意一個(gè)場(chǎng)景內(nèi)所有頁(yè)面間流量遷移數(shù)據(jù),注意這個(gè)可視化分析并不是傳統(tǒng)意義上的漏斗或者路徑統(tǒng)計(jì),因?yàn)楹髢烧咧魂P(guān)注于結(jié)果而不是場(chǎng)景內(nèi)全部頁(yè)面正反走向的通暢性。系統(tǒng)應(yīng)自動(dòng)提供診斷異常場(chǎng)景的流量遷移圖供設(shè)計(jì)、產(chǎn)品和開發(fā)商議解決方案。

2)異常行為診斷
很少有用戶會(huì)完全按照產(chǎn)品經(jīng)理的意愿進(jìn)行操作,原本看似幾秒的轉(zhuǎn)化成本最終在用戶行為數(shù)據(jù)表現(xiàn)為轉(zhuǎn)輾反側(cè)或早早離去。所以系統(tǒng)應(yīng)該建立幾套異常行為識(shí)別算法,可以設(shè)想到的是:
1)單一事件連續(xù)多次操作,如系統(tǒng)崩潰無(wú)響應(yīng)導(dǎo)致部分用戶反復(fù)確認(rèn)性點(diǎn)擊
2)人均訪問(wèn)、點(diǎn)擊次數(shù)較高的頁(yè)面、事件
3)停留時(shí)長(zhǎng)過(guò)高的頁(yè)面或場(chǎng)景
4)系統(tǒng)異常監(jiān)控及報(bào)警
以上監(jiān)控模型更側(cè)重于實(shí)時(shí)監(jiān)控,系統(tǒng)自動(dòng)分析需結(jié)合用戶關(guān)于場(chǎng)景的標(biāo)簽、自身的畫像標(biāo)簽自動(dòng)進(jìn)行綜合分析,如進(jìn)行異常操作的用戶與未出現(xiàn)異常操作用戶的差異,如對(duì)場(chǎng)景的熟悉程度(累計(jì)轉(zhuǎn)化次數(shù))、行為差異(如從不同入口訪問(wèn))、用戶年齡、消費(fèi)性格差異等,幫助產(chǎn)品和設(shè)計(jì)掌握異常行為背后的真正原因,這種分析可能不得不采用暴力方法用接近哈希的方式計(jì)算所有組合找出差異原因,而這類工作是人類望塵莫及無(wú)法實(shí)現(xiàn)的。因?yàn)榫邆淞宿D(zhuǎn)化標(biāo)記(頁(yè)面id為result,頁(yè)面狀態(tài)為success)就能統(tǒng)計(jì)出當(dāng)頁(yè)面加載時(shí)長(zhǎng)在不同區(qū)間內(nèi)或發(fā)生某個(gè)報(bào)錯(cuò)時(shí)所產(chǎn)生的損失,此種量化將有利于開發(fā)在排期時(shí)決策優(yōu)先級(jí)并評(píng)估改造回報(bào)率。
3)常規(guī)運(yùn)營(yíng)分析
對(duì)于某個(gè)場(chǎng)景的產(chǎn)品而言,單單關(guān)注自己場(chǎng)景的轉(zhuǎn)化率遠(yuǎn)遠(yuǎn)不夠,因?yàn)楦蓴_轉(zhuǎn)化的變量非常地多。入口流量大小及質(zhì)量、獲客渠道質(zhì)量、用戶生命周期階段、活動(dòng)內(nèi)容及效果等都應(yīng)該納入監(jiān)控分析范疇之內(nèi)。在排除外部變量干擾后就可以進(jìn)入用戶分群分析,系統(tǒng)自動(dòng)根據(jù)用戶轉(zhuǎn)化進(jìn)程與意向等級(jí)分組并統(tǒng)計(jì)規(guī)模,自動(dòng)通過(guò)歷史對(duì)比說(shuō)明當(dāng)前產(chǎn)品是否整體健康,針對(duì)不同分組的用戶可采用不同的營(yíng)銷策略促轉(zhuǎn)化。

4)上帝視角
既然頁(yè)面和事件都被唯一命名,那么頁(yè)面流量、事件點(diǎn)擊、頁(yè)面轉(zhuǎn)化率將不再被表格或者sankey圖所束縛。我們完全可以采用類似SNS或病毒傳播可視化方式展示流量的轉(zhuǎn)化過(guò)程,不同入口采用不同顏色,場(chǎng)景內(nèi)流量的逐級(jí)變化過(guò)程都可以通過(guò)頁(yè)面間連線的粗細(xì)直觀地還原出來(lái)。平臺(tái)上通過(guò)場(chǎng)景篩選、流量方向(正、反)、APP版本、畫像標(biāo)簽、行為標(biāo)簽、是否轉(zhuǎn)化等進(jìn)行下鉆。當(dāng)分析師點(diǎn)擊流量線條時(shí)可以提供更多的分析信息,如人均遷移次數(shù)(遷移次數(shù)對(duì)應(yīng)人數(shù)占比)、遷移耗時(shí)、遷移前點(diǎn)擊特征、轉(zhuǎn)化人群等排摸未轉(zhuǎn)化的原因。當(dāng)然,最好是AI直接告訴我放棄的用戶有什么特征而非大海撈針一般去推演、去逐一排摸。
