本文作者葉玎玎,GrowingIO 的聯(lián)合創(chuàng)始人,他也是連續(xù)創(chuàng)業(yè)者,是企業(yè)協(xié)作工具風(fēng)車的聯(lián)合創(chuàng)始人,十多年的工程開發(fā)經(jīng)歷和多年的項目管理經(jīng)驗,現(xiàn)在負(fù)責(zé)核心工程開發(fā)和技術(shù)實施。本文是他對于互聯(lián)網(wǎng)創(chuàng)業(yè)公司數(shù)據(jù)采集和分析的一些思索和心得。
過去的 6 年,因為一直在創(chuàng)業(yè)的緣故,我嘗試過不少分析工具,包括 Google Analytics、Mixpanel、CustomerIO、Optimizely 等等。我遇到的最大問題不是如何去衡量關(guān)鍵業(yè)務(wù)指標(biāo)(KPI),而是很多時候,我并不知道哪些指標(biāo)是我應(yīng)該衡量的。
舉個例子,當(dāng)我去度量注冊轉(zhuǎn)化率的時候,因為入口有限,所以相對來說我還能比較容易的得到結(jié)果。但是一旦我需要去衡量用戶留存率的時候,除了找出不同的功能對于留存的影響,還要考慮渠道、文案等因素,只能不斷胡亂抓瞎假設(shè)和論證。
所以,當(dāng)我 2014 年第一次向GrowingIO 創(chuàng)始人、前LinkedIn高級商務(wù)分析總監(jiān)張溪夢請教他是如何做商業(yè)分析的時候,我發(fā)現(xiàn)即使是在 LinkedIn 這樣大型并且不缺資源的公司,遇到的問題跟我自己創(chuàng)業(yè)所經(jīng)歷的也及其相似:低效,各種低效。
我們在思考,是否可能提供一個簡單、迅速和規(guī)?;臄?shù)據(jù)產(chǎn)品,讓分析回歸價值。而這,就是 GrowingIO 目前主打的無埋點方案,真正的無埋點。
上圖是一個標(biāo)準(zhǔn)的數(shù)據(jù)分析的過程。研究用戶,開發(fā)產(chǎn)品市場銷售,數(shù)據(jù)采集、轉(zhuǎn)化存儲和管理,ETL 處理分析,構(gòu)建 BI,商業(yè)洞察和決策,最后是行動。
這是一個標(biāo)準(zhǔn)的金字塔結(jié)構(gòu),越往上價值力越高。然而目前大量的數(shù)據(jù)分析工作,都浪費在前期的技術(shù)搭建和數(shù)據(jù)清洗上,真正創(chuàng)造價值的商業(yè)分析,雖然占據(jù)了 90% 的價值,卻只剩下 10% 的時間來做,這簡直是對資源和人才的極大浪費。
前不久,知乎上在熱議我們的無埋點分析解決方案,從討論中可以看出,很多人對于無埋點的認(rèn)識是片面的,他們認(rèn)為無埋點只是解決了工程師和產(chǎn)品經(jīng)理或者分析師的協(xié)作問題,讓工程師可以解脫,分析師可以自助。
然而,當(dāng)我們從第一天開始決定變不可能為可能,做無埋點的時候,我們就清楚知道,無埋點只是一個手段,我們真正要解決的根本問題是:底層的數(shù)據(jù)"源"問題。而此源,既是數(shù)據(jù)的源頭,也是分析的源泉。
當(dāng)我們在說無埋點的時候,我們其實是在解決數(shù)據(jù)質(zhì)量問題。好幾次跟朋友聊天時,都聽到抱怨說『數(shù)據(jù)太臟了,連統(tǒng)一的日志格式都打不對,后面分析怎么做』。所以我們的首要目標(biāo),是希望能從源頭上解決數(shù)據(jù)臟亂差的問題。
我們所提供的無埋點采集方案,從分析角度出發(fā),把數(shù)據(jù)劃分成 5 個維度 WWWWH,即時間(when)、地點(where)、任務(wù)(who)、內(nèi)容(what)、行為(how)?;诖私y(tǒng)一的數(shù)據(jù)模式,分析已經(jīng)有了極高質(zhì)量的數(shù)據(jù)做保障。
當(dāng)我們在說無埋點的時候,我們其實是在解決數(shù)據(jù)歷史問題。無數(shù)次的想去做數(shù)據(jù)對比的時候,發(fā)現(xiàn)要不是老的數(shù)據(jù)忘了采集,要不是采集了卻發(fā)現(xiàn)跟一開始定義的不一樣,只能無奈地放棄或者從頭再來一遍,悲催?。?/p>
我們所提供的無埋點采集方案,會根據(jù)用戶在你網(wǎng)頁或者 App 的使用情況,動態(tài)篩選和聚合對你的業(yè)務(wù)最有價值的數(shù)據(jù),讓關(guān)鍵數(shù)據(jù)歷史隨時隨地可以回溯,讓你清楚地知道指標(biāo)的即時變化趨勢。
當(dāng)我們在說無埋點的時候,我們其實是在解決分析效率問題。LinkedIn 組建了一個 27 人的團(tuán)隊,只為做一件事情,在工程師、產(chǎn)品經(jīng)理和分析師之間規(guī)范打點標(biāo)準(zhǔn)。隨便一個分析需求,這個團(tuán)隊需要花上幾個星期去定義規(guī)范,最后才是開發(fā)、測試、上線,非常長的流程。LinkedIn 的做法或許是有點夸張的,但是卻很好地反映了大多數(shù)分析的現(xiàn)狀,即跨部門多人溝通,效率低下。
我們提供的無埋點分析方案,同時提供了可視化的數(shù)據(jù)定義工具,能非常迅速地把用戶查詢的業(yè)務(wù)指標(biāo)跟采集到的用戶行為建立匹配,立刻給出分析結(jié)果。
當(dāng)我們在說無埋點的時候,我們其實是在解決分析決策問題。
我們提供的無埋點數(shù)據(jù)分析方案,涵蓋了上圖提到的金字塔結(jié)構(gòu)里的從數(shù)據(jù)采集到商業(yè)智能這些階段??蛻舨辉傩枰P(guān)心數(shù)據(jù)是如何積累的,只需要關(guān)心業(yè)務(wù)目標(biāo),直接在我們系統(tǒng)里做深度分析。在其之上,無論是商業(yè)洞察、決策或是行動,都是有理可依,有據(jù)可查。
到今天為止,我們已經(jīng)開發(fā)出來了 JS/Android/iOS SDK,都提供了無埋點方案。如果你有興趣,可以來 https://www.growingio.com 注冊體驗一下。在幾次線下活動中,也跟不少人交流了我們的無埋點方案,普通有一點疑問:
埋點方案是否足夠,是否真正需要無埋點技術(shù)?
無論是 Mixpanel、百度統(tǒng)計還是友盟等數(shù)據(jù)產(chǎn)品,都是基于埋點技術(shù)。習(xí)慣上,大家都認(rèn)為數(shù)據(jù)采集和分析就是得要埋點,并且離不開埋點。所以,我們看到一些缺乏思考的觀點,認(rèn)為"埋點足夠了,你應(yīng)該對于自己的業(yè)務(wù)有清晰的認(rèn)識,把這些關(guān)鍵指標(biāo)給埋上就可以了"。
說實話,沒做 GrowingIO 前我也是這么想的,一邊罵一邊還是得接著到處埋點,因為埋點是一個雖痛苦但很容易的事情,人們永遠(yuǎn)會傾向于做容易但低效的事情,而選擇性的忽略艱難但高效的事情。
但當(dāng)我研究越多,越發(fā)現(xiàn)這種想法是在給自己的不作為找借口,是給自己營造一種一切盡在掌握的感覺。但事實上,我們始終不停的在尋找那些最影響商業(yè)行為的關(guān)健指標(biāo),這類探索式分析,如同于迷霧中尋找前方的道路,不能隨意地拍腦袋,也不能任性地走經(jīng)驗主義。
我們想創(chuàng)造的無埋點,是讓機(jī)器代替人,拋離任何情感和假設(shè),去采集所有有用的行為。而之后,驗證就變得簡單,因為數(shù)據(jù)質(zhì)量不再是問題,數(shù)據(jù)歷史也不再是問題。
當(dāng)我們的產(chǎn)品經(jīng)理,有產(chǎn)品優(yōu)化、提取數(shù)據(jù)需求的時候,要耗費時間和精力,去跟工程或研發(fā)溝通埋點需求,寫無數(shù)個產(chǎn)品文檔,仍然無法避免因為思慮不周、溝通不暢存在的錯埋、漏埋等情況,并造成數(shù)據(jù)不全面和不準(zhǔn)確等一系列問題。
因為無埋點的數(shù)據(jù)解決方案,我們可以實時、全量收集用戶行為數(shù)據(jù),所有上述這些問題都不再是問題,產(chǎn)品經(jīng)理可以想要什么數(shù)據(jù)就有什么數(shù)據(jù),優(yōu)化產(chǎn)品、找到用戶流失關(guān)鍵點等一切都有數(shù)可依,有指標(biāo)可以衡量。
作者:葉玎玎
來源:GrowingIO