記得曾聽人說過,最重要的構(gòu)建起自己的思維體系。現(xiàn)在隱隱約約能夠有些理解,成長(zhǎng)就是建立并不斷完善自己思維體系的過程。
????很久沒寫東西,但是對(duì)于最近的這幾本書我覺得帶給我蠻多驚喜,給了我不同的視角去看事情,需要將自己的一點(diǎn)點(diǎn)想法化成文字記錄下來。僅對(duì)于大數(shù)據(jù)這塊,淺談一下自己想法。
作為一只小碼農(nóng),兵來將擋水來碼掩,一心撲在實(shí)現(xiàn)具體需求上,只注重技術(shù)實(shí)現(xiàn),而沒有從整體,站在更高的視角去看待數(shù)據(jù)問題。大數(shù)據(jù)不在于數(shù)據(jù)量大小,不在于使用什么具體的技術(shù)實(shí)現(xiàn),而在于分析,在于解決問題,助力業(yè)務(wù)。
大數(shù)據(jù)時(shí)代,企業(yè)應(yīng)該開啟數(shù)據(jù)化運(yùn)營(yíng)來保證業(yè)務(wù)發(fā)展和用戶增長(zhǎng)。《增長(zhǎng)黑客》一書中始終圍繞著,數(shù)據(jù)分析->提出想法->排定優(yōu)先級(jí)->快速驗(yàn)證,這四點(diǎn)在進(jìn)行。用戶在哪里高流失,熱點(diǎn)功能,留存率,激活率等,只有數(shù)據(jù)才能實(shí)實(shí)在在反映公司的運(yùn)營(yíng)情況和產(chǎn)品的使用情況,用數(shù)據(jù)來作為產(chǎn)品的領(lǐng)航標(biāo)。對(duì)于整體的數(shù)據(jù)分析來講,如下四步:
數(shù)據(jù)分析:如《決戰(zhàn)大數(shù)據(jù)》中很令我豁然開朗的觀點(diǎn),大數(shù)據(jù)就是盡可能還原用戶當(dāng)時(shí)的場(chǎng)景。從用戶當(dāng)時(shí)的場(chǎng)景出發(fā),去分析為什么用戶會(huì)在這個(gè)點(diǎn)流失?為什么這個(gè)點(diǎn)轉(zhuǎn)化率低?具體的術(shù),不限于頁(yè)面埋點(diǎn),或者問卷調(diào)查等。用數(shù)據(jù)找出產(chǎn)品中體驗(yàn)不佳的問題點(diǎn)。
提出想法:對(duì)于解決產(chǎn)品中分析出的問題,或者一些好的idea,可以拉上研發(fā)、產(chǎn)品、市場(chǎng)同事一起做頭腦風(fēng)暴,不同職責(zé)的人看問題的角度不一樣,更可能會(huì)出現(xiàn)一些好的idea。必要時(shí)候,甚至可以請(qǐng)完全不同項(xiàng)目的人進(jìn)來頭腦風(fēng)暴,激發(fā)靈感。
排定優(yōu)先級(jí):?對(duì)于上述的很多想法,肯定不可能在一個(gè)迭代里全部實(shí)現(xiàn)??梢詮闹鞣较蛳嚓P(guān)度、實(shí)現(xiàn)成本、時(shí)間周期、帶來效果等方面打分,評(píng)定需求優(yōu)先級(jí),來確定當(dāng)前這個(gè)迭代周期該實(shí)現(xiàn)哪些。
快速驗(yàn)證:?互聯(lián)網(wǎng)行業(yè)的快速迭代,對(duì)于確定好的需求就需要快速推出進(jìn)行驗(yàn)證,是否有效,是否確實(shí)提升了用戶留存等。當(dāng)然對(duì)于改變來講,都可能會(huì)帶來未知的風(fēng)險(xiǎn),不能保證效果是正還是負(fù),所以可以使用A/B測(cè)試,確定部分效果后再推廣。對(duì)于新的改變,一定要跟蹤用戶數(shù)據(jù),對(duì)前后數(shù)據(jù)進(jìn)行分析,產(chǎn)生了多大效果,一切應(yīng)該以數(shù)據(jù)說話。
最后循環(huán)不斷上面流程,堅(jiān)持用數(shù)據(jù)去領(lǐng)航產(chǎn)品。
?????
?????以上是從產(chǎn)品迭代去講數(shù)據(jù)分析,但是回歸到大數(shù)據(jù)技術(shù)呢?數(shù)據(jù)湖,數(shù)據(jù)平臺(tái),整合了整個(gè)公司的海量數(shù)據(jù),這些在于公司的意義又該怎樣。現(xiàn)在數(shù)據(jù)處理大致下面幾步:
????數(shù)據(jù)采集:
?????1. 從大數(shù)據(jù)浪潮之后,現(xiàn)在幾乎每家公司都在瘋狂收集數(shù)據(jù),每個(gè)角落數(shù)據(jù)都不放過。但是用起來的卻少之又少,最后發(fā)現(xiàn)數(shù)據(jù)指數(shù)級(jí)上升,成本高昂,卻沒產(chǎn)生該有的價(jià)值。在這里,我并不是反對(duì)數(shù)據(jù)收集,但是收集前需要對(duì)問題和數(shù)據(jù)做一些界定,這些數(shù)據(jù)對(duì)我業(yè)務(wù)真的有影響么?
???? 2. 不要太過相信數(shù)據(jù)準(zhǔn)確。特別是作為數(shù)據(jù)平臺(tái),你需要對(duì)接上游無數(shù)個(gè)數(shù)據(jù)源,同時(shí)需要將數(shù)據(jù)服務(wù)下游諸多系統(tǒng)。數(shù)據(jù)的準(zhǔn)確性越來越重要,你并不能保證上游系統(tǒng)百分百的數(shù)據(jù)準(zhǔn)確,所以請(qǐng)做好“臟”數(shù)據(jù)打算,不要過于樂觀。
????數(shù)據(jù)存儲(chǔ):
????數(shù)據(jù)進(jìn)來以后就需要存儲(chǔ)??赡芎芏鄻I(yè)務(wù)部門會(huì)各自都有一套數(shù)據(jù)處理框架,優(yōu)點(diǎn)在于更加靈活,缺點(diǎn)在于大量的數(shù)據(jù)冗余,成本飛升和數(shù)據(jù)不一致等。所以稍大型公司內(nèi)部基本會(huì)將基礎(chǔ)數(shù)據(jù)統(tǒng)一,這也是數(shù)據(jù)湖的初衷。關(guān)于數(shù)據(jù)存儲(chǔ)一塊,可以考慮三層結(jié)構(gòu):基礎(chǔ)層,中間層,應(yīng)用層。其中基礎(chǔ)層數(shù)據(jù),統(tǒng)一維護(hù)一份,保證數(shù)據(jù)一致,并盡量保持?jǐn)?shù)據(jù)的原始狀態(tài),防止數(shù)據(jù)失真。中間層,可以按照業(yè)務(wù)模塊,數(shù)據(jù)再生狀態(tài),時(shí)間等維度生成多張大寬表,或者使用雪花模型等,對(duì)一模塊提供服務(wù),允許各個(gè)模塊之間一定的數(shù)據(jù)冗余,提供適度靈活性。
當(dāng)然我們收集數(shù)據(jù),最終是為了分析和使用。對(duì)于當(dāng)下趨勢(shì),越來越實(shí)時(shí)化。我們還需要放很大部分精力在存儲(chǔ)的同時(shí),考慮如何快速索引,怎么保證我們能盡快的按照某些標(biāo)簽就能從海量數(shù)據(jù)中提取出我們需要的數(shù)據(jù)。一大團(tuán)雜亂無序的數(shù)據(jù),除了占服務(wù)器資源,沒有任何意義。
????數(shù)據(jù)應(yīng)用:
????如同前邊產(chǎn)品中的數(shù)據(jù)分析一樣,大公司和具體的數(shù)據(jù)建模的目的也是為了指導(dǎo)業(yè)務(wù)和商業(yè)。如果數(shù)據(jù)沒有應(yīng)用,沒有去結(jié)合業(yè)務(wù),那么數(shù)據(jù)本身也就沒有什么意義。一個(gè)好的數(shù)據(jù)流程,應(yīng)該如前所講一樣,是一個(gè)閉環(huán)。用數(shù)據(jù)應(yīng)用指導(dǎo)產(chǎn)品,再通過產(chǎn)品收集自己需要的數(shù)據(jù),豐富我們的數(shù)據(jù)。正如《刻意練習(xí)》中最重要的觀點(diǎn),反饋才是進(jìn)步的動(dòng)力,才能讓自己看到哪里做得不夠,哪里需要改進(jìn),而做數(shù)據(jù)也是一樣。
對(duì)于數(shù)據(jù)開發(fā)人員,《決戰(zhàn)大數(shù)據(jù)》里的“混”,“通”,“曬”還是很有思考的價(jià)值?!盎臁?,與業(yè)務(wù)混在一起,了解業(yè)務(wù),才能真正理解數(shù)據(jù),提升數(shù)據(jù)敏感?!巴ā保瑪?shù)據(jù)之間需要連通才有價(jià)值,而在紛亂的數(shù)據(jù)中做到不同部門,甚至不同行業(yè)之間的數(shù)據(jù)串聯(lián)在一起本身不管技術(shù)和溝通上都是一個(gè)大挑戰(zhàn),只有“通”,才能更好的還原用戶當(dāng)時(shí)的場(chǎng)景,甚至精確的預(yù)測(cè)下一步?!皶瘛毙枰褦?shù)據(jù)指標(biāo)都曬出來,老板關(guān)心的不是指標(biāo),而是指標(biāo)背后的why和how。計(jì)算出指標(biāo),還要更多的去想想能發(fā)現(xiàn)什么問題。
世間一切都是相同的,這也是為什么要構(gòu)建自己的思維體系,以一應(yīng)萬。大數(shù)據(jù)分析這條道,同樣也適用于個(gè)人,將個(gè)人看作一個(gè)產(chǎn)品,或者公司去做數(shù)據(jù)分析。那怎么用數(shù)據(jù)思維做個(gè)人管理?
數(shù)據(jù)收集:知乎上有個(gè)問題,給我留下了很深的印象??戳四敲炊鄷?,真的有用嗎?我不敢說自己看過很多的書,但是仔細(xì)回想,曾經(jīng)看過的書中內(nèi)容確實(shí)大多都已記不住了。所以我慢慢在強(qiáng)迫自己去做一些讀書筆記這樣的事情。但是我所做的還遠(yuǎn)遠(yuǎn)不夠,讀書時(shí),遇到喜歡的句子,醍醐灌頂?shù)囊欢卧?,其?shí)都可以加上備注和所思所想,記錄下來。這就是一個(gè)最基本的數(shù)據(jù)收集階段。
數(shù)據(jù)存儲(chǔ):數(shù)據(jù)最終的目的是使用,并不是把數(shù)據(jù)收集回來就算完成目標(biāo)。存儲(chǔ)所對(duì)應(yīng)的就是檢索,能夠在我們需要某個(gè)知識(shí)的時(shí)候,很快的從庫(kù)里邊調(diào)出這部分相關(guān)知識(shí)。所以對(duì)上一步收集回來的數(shù)據(jù),可以通過標(biāo)簽、知識(shí)范疇、場(chǎng)景、時(shí)間等組合歸類,便于我們快速的檢索。(當(dāng)然歸納碎片知識(shí)的時(shí)候,很多人會(huì)和我一樣不知道該把這個(gè)知識(shí)歸類到哪個(gè)標(biāo)簽上,其實(shí)是我們?nèi)鄙賹?duì)這個(gè)標(biāo)簽的具體和邊界定義。正如一個(gè)思想所說,一個(gè)好的問題,就是具體完成后,答案就出來了)
數(shù)據(jù)應(yīng)用:?對(duì)于生活中遇到的問題,我們求助于我們的知識(shí)庫(kù)。但是這些知識(shí)都是沒有經(jīng)過檢驗(yàn)的,而且整個(gè)社會(huì)一直處于動(dòng)態(tài)變化中,所以我們應(yīng)用這部分知識(shí)以后,還需要給給到反饋和反思。它是否適用,給我?guī)砹耸裁礃拥挠绊懀@個(gè)知識(shí)是不是需要怎么調(diào)整能更好適合我自己,再修改回自己的知識(shí)庫(kù)。
命運(yùn)二字,命中注定的某些東西無法更改,但是運(yùn)這一項(xiàng),財(cái)富,人際關(guān)系,知識(shí)和思考模式都是可以靠自己積累的。
建立完善自己的思維體系,會(huì)發(fā)現(xiàn)萬物皆通。