
有時候,跟我們的學(xué)生開玩笑說:“以后聽講數(shù)據(jù)分析的人講課,我教你一個最搗蛋的提問題的方法。就是他講得很好,最后你問他so what——你做完分析后你能干什么,怎么實施?基本上10個里面,有9.9個會被問慘?!?/p>
我們給大家看幾個例子。第一個是什么?這是我們自己團(tuán)隊的講的時候,我就問這種問題。我們曾經(jīng)做車聯(lián)網(wǎng)的數(shù)據(jù),給公交汽車做。
公交汽車它的油耗很大,那么我們很好奇油耗發(fā)生在什么地方。很快這張熱力圖就會告訴我們,大量的油耗發(fā)生在公交站的進(jìn)出,這個你改變不了。
那第二個事是,同樣是公交站的進(jìn)出,有的油耗相對小,有的就高,為什么?后來又發(fā)現(xiàn),這跟我們的起步是否勻速滑行的距離有關(guān)系,這些也都是一些常識被印證了,然后一般我們的分析就到此結(jié)束了。
那么,可以問一個so what,又怎么樣。你怎么把這個知識變成一個東西能夠幫助公交集團(tuán),能改善它的服務(wù)?我們總不能跟司機說,樊師傅,你起步要慢慢起。
他說,“我本來就是慢慢起的,我開得好著呢,你自己覺得不舒服是你的問題”,不好弄。所以,后來我自己也沒辦法,跟一個朋友講——他經(jīng)常管這樣的團(tuán)隊。
他說:“這很簡單,每一個月我們就考核油耗,油耗差的那幾個就罰,他自然就會來找原因。這個時候你再跟他講慢慢起步,他就會愿意聽?!?/p>
我覺得,這個如果實施了,那就變成一個把數(shù)據(jù)分析的結(jié)果真的在實施過程中,變成可操作的東西了,這是個特別好的事情,
樊登:就是還要結(jié)合管理的智慧,結(jié)合管理的手段,然后把它慢慢地變成一個可操作的東西。
王漢生:沒錯,這個時候有一個案例對我啟發(fā)特別大。這個案例也是一個老掉牙的案例,很多的大數(shù)據(jù)上都會講farecast(價格預(yù)測)。它講的是什么故事呢?有一個計算機的教授,他做了一個算法,能夠預(yù)測機票價格的漲和跌。那對于我來說,如果你告訴我機票看漲,我應(yīng)該趕緊買票;如果看跌,我就該等一等。他通過大量的隨機模擬發(fā)現(xiàn),這個算法能夠為普通人能夠節(jié)省大概20%以上的預(yù)算,而且是非常開心的事。但是,問題是這是個平均數(shù),那意味著有人就節(jié)省了,有人就賠了;有人這次節(jié)省了,下次可能就賠了。
在用戶的體驗過程中,很遺憾的事情是這樣的,你給大家創(chuàng)造價值他就很開心,但是也很快可能會把你忘掉。給大家創(chuàng)造不愉快的體驗的時候,大家會形成強烈的情緒反映在對你不利的媒體和各個角落里。這時怎么辦?
我們有兩種解決的辦法,一種是我們看到很多的學(xué)者,很多的企業(yè)努力做的就是我提高預(yù)測精度,這是一個深坑,我個人是非常不看好的。但是,在這個領(lǐng)域里面,有不同的學(xué)者不同的看法,有些樂觀的學(xué)者會認(rèn)為,終于有一天我數(shù)據(jù)量非常大,計算能力超級強,以至于你的喜笑顏開我全可預(yù)測,這是一種看法。那你就照這個方向努力??赡苡悬c信仰問題,我個人根本不相信這個。我相信諸行無常。我覺得,有預(yù)測的東西就一定有反預(yù)測的東西出現(xiàn),所以,我們說這個事情,在給定X給定Y的情況下,給定時間和場景的情況下,能預(yù)測多準(zhǔn)是有上界的。這個上界是天說了算的,不會通過任何的技術(shù)上的改變而有任何的改變,但不代表我就沒有意義。
因為如果你胡蒙亂猜在這兒,我改善到這兒,改善的這個margin(范圍)不大,但這是很可能可以通過技術(shù)手段改變的,那怎么辦?
farecast(價格預(yù)測)給我們的最大的啟發(fā),是通過一個產(chǎn)品上的商業(yè)模式上的改變,讓這個東西體現(xiàn)它怎么改變的。他說,“反正我預(yù)測不了特別準(zhǔn),那我們給你做一個保險產(chǎn)品,咱們對賭,你給我9塊9毛9買一個保險,我再給你出一主意。你賺了自個兒留著,賠了我給你,我賠償差價”。他就把這個margin(范圍)從一個平均水平變成了一個每個人都可以體驗到的東西。
所以,我自己的一個信念是什么?在數(shù)據(jù)產(chǎn)品商業(yè)化的這個過程中,我認(rèn)為,我們要核心思考的事不是精度無限制地提高。我經(jīng)常講一個特別負(fù)能量的俗語,我說,預(yù)測不準(zhǔn)是常態(tài),預(yù)測準(zhǔn)確是變態(tài),一定是錯了。我自己的職業(yè)生涯中從不失手,看到預(yù)測過準(zhǔn)的東西,十有八九是錯了。我們要思考的是,我們在預(yù)測不準(zhǔn),但是有改進(jìn)的前提下,怎么樣通過產(chǎn)品和商業(yè)模式上的創(chuàng)新,讓更多的人能夠體會到它的美好,這個事是努力的方向。
樊登:類似的案例我聽過是,有一個人在路邊喝咖啡,然后他就看到下雨了。下雨了以后就好多人在抱怨說,完了,今天這個生意又糟糕了。他說,這有意思。他就去研究下雨以后,到底對多少人的生意有影響。然后,竟然通過數(shù)據(jù)的分析和精算出了一款下雨險,讓這些商家、個人買。你買了我這下雨險,如果下了雨賠給你,但如果沒下雨我就賺錢了。這就是從一個數(shù)據(jù)慢慢地變成一個產(chǎn)品的過程。
王漢生:而且它最巧妙的地方是,它即使是預(yù)測下雨,我相信它再準(zhǔn)也準(zhǔn)不過中央電視臺,它的資源有限。但是,它可以準(zhǔn)到一定的程度,實現(xiàn)一個平均水平上的盈利,然后通過一個保險產(chǎn)品把這個東西實現(xiàn)掉。
樊登:它接受了不準(zhǔn)確,把它量化成了一個數(shù)字,然后用一個產(chǎn)品來抵消它。
王漢生:沒錯,您說得特別對。所以,在數(shù)據(jù)這個模型的產(chǎn)品化的過程中,一定要注意一個問題,我們要認(rèn)可和接受它的不準(zhǔn)確。如果我們的產(chǎn)品設(shè)計是假設(shè)它超級準(zhǔn),那這一定是不可能的。
樊登:那現(xiàn)在我們老講大數(shù)據(jù),說大數(shù)據(jù)跟過去的統(tǒng)計最根本的區(qū)別就在于統(tǒng)計是抽樣。我抽了100個樣、抽了50個樣。大數(shù)據(jù)不抽樣,所有的數(shù)據(jù)都在這兒。所以,那不是準(zhǔn)確度就應(yīng)該是非常高了?
王漢生:樊老師,我得為我們學(xué)科說幾句話,這是大家的一個誤會。統(tǒng)計學(xué)關(guān)心的核心問題是對數(shù)據(jù)的分析、建模以及采集的整個流程。它沒有在任何一個角度說要定義統(tǒng)計學(xué)關(guān)心的問題只是抽樣,這是第一個問題。不是這樣的。所以,大數(shù)據(jù)在我們看來,是統(tǒng)計學(xué)研究的一個自然而然的一個目標(biāo),而且事實上統(tǒng)計學(xué)對它貢獻(xiàn)非常大。
第二個問題,至少在我目前的職業(yè)生涯中,從沒有看到過一個場景說,大數(shù)據(jù)可以代替抽樣的貢獻(xiàn)。最典型的,特朗普競選總統(tǒng)的時候,所有的大數(shù)據(jù)都認(rèn)為希拉里會贏。但是他贏了,為什么?因為我們來自于——比方說,F(xiàn)acebook的意見可能不能代表一大批當(dāng)年退伍老兵的意見。所以,任何情況下,我們看到騰訊的數(shù)據(jù),那只是騰訊用戶的數(shù)據(jù),阿里的數(shù)據(jù)永遠(yuǎn)是阿里用戶的數(shù)據(jù)。它能不能代表一個更廣泛的群眾,是不清楚的。
第三個問題,我一直認(rèn)為越是大數(shù)據(jù)抽樣越重要,第一個要抹平不必要的誤差。第二個節(jié)省計算量。我們現(xiàn)在有一個誤會,認(rèn)為計算機很厲害了。計算量就不是問題了,其實不是的。我們看一下我們的CPU它改進(jìn)的速度,每年它是線性增長一點點的。但是,我們的存儲增長得非???,那意味著我們變量的個數(shù)也是差不多是同樣甚至更快的速度在增加。
增加的過程中,我們極少數(shù)有模型和算法,它的復(fù)雜度是線性的,也就是說我增加一倍,那么計算量要增加四倍,然后我數(shù)據(jù)增加十倍,我的計算復(fù)雜度要增加一百倍甚至更高。所以,越是到這個數(shù)據(jù)量大的時候,這種smart (智慧)的computation(計算)會越來越重要,而且大量的巧妙的計算是依賴于抽樣的智慧的。
樊登:數(shù)據(jù)太大了以后,的確會造成特別大的資源浪費和包括環(huán)保問題。我聽他們講是哪個公司,就每年的電費就是好幾千萬美金,電費就這么多。所以,像您說的,如果用抽樣的方法,能夠有效地去提高它的效率的話,那這門學(xué)科也是會一直這樣存在下去的。
還有一種,就是您也批評過這種大數(shù)據(jù)的誤區(qū),說大數(shù)據(jù)強調(diào)的是相關(guān)關(guān)系;然后我們過去做統(tǒng)計,我們是想找到因果關(guān)系。有的專家就講以后相關(guān)關(guān)系最重要了,因果關(guān)系不重要了。這個您怎么看?
王漢生:這個可能樊老師剛才說的也不是非常準(zhǔn)確。統(tǒng)計學(xué)關(guān)心的是數(shù)據(jù)分析問題,其中包括因果關(guān)系,也包括大量的相關(guān)關(guān)系,它都關(guān)心。而且事實上,能夠建立因果關(guān)系的機會特別少。例如,我們經(jīng)常能看到是在臨床實驗中。所以,事實上統(tǒng)計學(xué)研究的大量問題是相關(guān)關(guān)系,但是這不代表因果關(guān)系就不重要了。
事實上,我認(rèn)為因果關(guān)系永遠(yuǎn)都是最重要的。比方說,大數(shù)據(jù)表明公雞一叫,太陽就升起來了。把雞殺光,太陽就不起來了嗎?那這就是相關(guān)關(guān)系而已。這時候我們看到一個現(xiàn)象是什么?如果我的這個數(shù)據(jù)應(yīng)用的場景,主要是為了做預(yù)測,我想預(yù)測什么時候太陽該起來了,這行。我看到雞一叫太陽就起來了,這是預(yù)測。
那如果說,我們在實際應(yīng)用中,我是想有動作,比方說,我想改變明天太陽升起的時間,你會發(fā)現(xiàn)這時候相關(guān)關(guān)系就慫了,殺雞不管用。
我們再回到咱們樊登讀書來,比方說,我們明年的一個重要的任務(wù),要增加多少粉絲量,我們需要的是什么?我們需要的是動作。我到底應(yīng)該做什么才會產(chǎn)生這樣的增量?所以,這時是要因果關(guān)系。
但是因果關(guān)系極其奢侈,我們在非常少的條件能看到。所以,大量的數(shù)據(jù)分析,事實上我們是通過相關(guān)關(guān)系在盡量地把我們的注意力聚焦到一個很小的范圍內(nèi)。然后剩下的真的是用點主觀的判斷,覺得也就差不多了。
所以,這里面有點繞腦袋,一方面統(tǒng)計學(xué)研究了大量問題是相關(guān)關(guān)系,但是我們從不認(rèn)為相關(guān)關(guān)系就能把因果關(guān)系給替代掉了。
樊登:那就像我說,這篇文案寫得很好,今天的銷量上升。這兩個當(dāng)中為什么不能夠建立因果關(guān)系?因為文案寫得好,所以它上升,有兩種可能。一種是因為文案寫得好,所以今天銷量好;第二種,因為今天正好趕巧了,比方說,禮拜一,是一個特別好的銷售的日子,所以它銷量也好。
我們在分析過程中的思路是這樣的,我們首先建立的相關(guān)關(guān)系,懷疑是因為這樣的優(yōu)秀的文案產(chǎn)生的結(jié)果。這是一個懷疑。那么,接下來怎么驗證?接下來,我用同樣的套路再寫類似的文案,在不同的場景下都去測試,如果大量地被驗證了,我會覺得確實由于是文案的原因。
樊登:這就是您說的,特別難以追求到的因果關(guān)系。
王漢生:非常艱難,這個問題不能想太深,想太深是哲學(xué)問題。
樊登:找到這些因果關(guān)系以后,就形成了一個企業(yè)的方法論,工具和動作,這就是數(shù)據(jù)思維的一個基本的架構(gòu)。您在這本書里邊有很大一章節(jié)在寫回歸分析。回歸分析,我們上數(shù)學(xué)課的時候?qū)W過這個詞,現(xiàn)在忘得差不多了,你給大家用通俗的語言講講什么叫回歸分析?
王漢生:首先還是這個問題,每個人有不同的定義,那我說我的定義是什么。在我看來只要有Y和X的都叫回歸分析。那有Y和X之后,我們一般在大學(xué)學(xué)習(xí)中,第一門線性回歸分析課,會講一個線性模型,那么現(xiàn)在的計算機技術(shù)更好以后,我們會有大量的非線性方法。其中包括非線性模型、非參數(shù)模型、機器學(xué)習(xí)、深度學(xué)習(xí)算法。在我腦袋里統(tǒng)統(tǒng)都算回歸分析,這是一個技術(shù)的層面。這些我還不是最感興趣的,我最感興趣的還是剛才說的在道的層面去做回歸分析,我把它認(rèn)為是一種思想方法。它能夠幫助我們把一個業(yè)務(wù)問題迅速地定義成一個數(shù)據(jù)可分析問題,從那個位置開始往后都是純技術(shù)的。
樊登:我聽您講完這意思,就是我們反正也是聽不懂,所以不需要我們懂。
王漢生:我覺得不需要。我是覺得我們是從數(shù)據(jù)到價值這個通路,它們有一節(jié)一節(jié)的。我們就前一節(jié),可能是首先要理解業(yè)務(wù)和數(shù)據(jù)這種關(guān)系,把業(yè)務(wù)問題變成數(shù)據(jù)可分析問題,這一步是不可或缺的。
第二部分,就是比方說機器學(xué)習(xí),各種各樣的回歸模型,還有深度學(xué)習(xí)的算法。它是從這里解決到下一節(jié),這兩節(jié)我覺得都很重要,哪一節(jié)都是不可或缺的。但是在市場上,我們看到對這節(jié)關(guān)注特別多,對這節(jié)關(guān)注特別少,而這節(jié)存在的問題體量非常大,這部分相對要少。
樊登:所以您寫《數(shù)據(jù)思維》這書的目的就是為了提醒大家說,其實建立前期的這個思維是很重要的,后邊那部分是專業(yè)人士干的。
王漢生:所以,這本書事實上就是兩種人都可以嘗試去看。一個是我想理解它整個的思維方式,那么不涉及到數(shù)據(jù)分析的計算,另外一部分人像我們自己,還有我們的學(xué)生研究生的團(tuán)隊。那么,后面技術(shù)這一部分,是每個案例后面是配著數(shù)據(jù)和代碼的,所以他們也需要學(xué)后面。所以,我自己的看法里面,這兩部分都很重要。
樊登:所以,看這本書的人,就是找能看懂的部分看就行了??床欢牟糠?,交給北大的研究生們看就行。最后,給大家普及一下大數(shù)據(jù)的基本常識,因為很多人都老聽大數(shù)據(jù)這個詞,都覺得很有意思很神秘。比如說,谷歌一大堆數(shù)據(jù)放在那兒,說只要大家搜這個詞多了,那感冒就來了。這種大數(shù)據(jù)跟老百姓有什么關(guān)系?
王漢生:這是一個特別好的問題,你說,我們天天都在談大數(shù)據(jù),里面充滿了那么多好玩的故事,跟我們老百姓真正相關(guān)的特別少。所以,如果我們把老百姓也看作一個自然成長的個體,我們希望將來為自己、為社會創(chuàng)造價值的話,我覺得需要的是最樸素的一些數(shù)據(jù)價值觀和它的這種方法論,那么這個價值觀正好是《數(shù)據(jù)思維》里面想去強調(diào)的價值觀。
我們對數(shù)據(jù)的理解,首先我們要理解分析的目的是什么,我們要先問這個問題。這個問題都不清楚可能就變成一個學(xué)校里的作業(yè)了,然后有了目的之后我們再問:我的業(yè)務(wù)分析的核心訴求中,Y是什么,X是什么,能不能梳理出來?那個變量帶來的改變目標(biāo)又是什么?那么,Y,我們把它叫作因變量,它是業(yè)務(wù)最核心的訴求。X是它相關(guān)的解釋性的變量,我能不能梳理出來?如果能夠梳理出來,然后我在這上面可以嘗試一些最簡單的分析。它能夠帶給我們一些什么樣的價值?我們可以嘗試慢慢地去做。
時間長了,你會發(fā)現(xiàn)生活中處處都是回歸分析。我經(jīng)常有時候跟我們同學(xué)開玩笑。我給大家看一個我的自己的銀行電子賬單。那是我在美國訪問的時候——那時候訪問了大概五六個月,有一個電子賬單,上面的廣告請我去萬達(dá)看電影,去吃漢堡包。我經(jīng)常開玩笑說:“我特別喜歡看電影,相當(dāng)喜歡萬達(dá)影院,但是太遠(yuǎn)了。我當(dāng)時是在美國?!?/p>
我說,這里面就一個很標(biāo)準(zhǔn)的這個模型中,可能是個失敗的回歸分析。這個廣告是電子版的,個性化廣告推送過程中,它缺失了一個重要的X變量。就是我最近一次刷卡到service provider(服務(wù)商)位置之間的距離。如果有這種數(shù)據(jù)思維,回歸分析的思想的話,你一開始加進(jìn)去,可能發(fā)生這種場景的機會就會被避免。
樊登:也是為了提高整個社會的精度,讓我們減少一些浪費和無謂的損失。那我是大致聽懂了,就是數(shù)據(jù)思維有這么三個方面。我們需要首先找到可以量化的數(shù)據(jù),然后找到我們需要去改變的因變量,然后看看它們倆之間X 和 Y是怎么發(fā)生關(guān)系的,接下來,我們后半段交給技術(shù)人員去幫我們做處理。
王漢生:后半段它可以建立一個模型,但最后我們要把它產(chǎn)品化 ,讓它成為一個流程或者是一個算法也好,還是一個可體驗的A P P也好,這個時候還是需要比較大的智慧的。
樊登:那這個現(xiàn)在講明白了。那么,對于比如說我們會員里邊好多正在創(chuàng)業(yè)的企業(yè)家,中小企業(yè)者剛剛創(chuàng)業(yè),他們應(yīng)該做些什么事,往這個方向前進(jìn)?
王漢生:我覺得我們按照數(shù)據(jù)思維的基本的框架。如果我們正在創(chuàng)業(yè),我們首先問第一個問題:我這個創(chuàng)業(yè)的方向,數(shù)據(jù)是不是能幫上你很大的忙,對你重不重要?
事實上,我們不能排除很多場景數(shù)據(jù)也許在可見的方面,幫不了太大的忙,那我們必須得承認(rèn),這種現(xiàn)象是存在的。也許我覺得就probably(可能)不用太操心了。那如果認(rèn)為在我未來數(shù)據(jù)將成為自己的創(chuàng)業(yè)項目最核心的資產(chǎn)的話,還是涉及到我要對我自己的業(yè)務(wù)梳理得很清楚,把我的業(yè)務(wù)中的Y和X一定要梳理得非常清楚。在這個過程中我們要盡量地保證Y和X的非常高質(zhì)量的供給,不至于被一家壟斷。最好是自己能生產(chǎn),長時間一積累才好。
這個聽起來很抽象,我們看一個具體的例子還是車聯(lián)網(wǎng)。車聯(lián)網(wǎng)的數(shù)據(jù)關(guān)于這個司機而言,它能夠非常了解這輛車的駕駛情況,但是它如果想成為一個優(yōu)質(zhì)的保險產(chǎn)品,它需要建立一個模型。什么模型?從車聯(lián)網(wǎng)的數(shù)據(jù)能夠預(yù)測你未來是否出險,出險是它的Y。這兩個數(shù)據(jù)放在一起的時候,才可能變成一個完整的技術(shù)問題是后面的專家去做,如果這兩個缺任何一個都是不可能的。
但是很遺憾的是,車聯(lián)網(wǎng)數(shù)據(jù)是由車聯(lián)網(wǎng)駕駛行為數(shù)據(jù),一般而言,它沒有出險的數(shù)據(jù)。出險數(shù)據(jù)是在保險公司那里。而我們的保險公司一般是非常強勢的。
如果說,我們在這個方向上創(chuàng)業(yè),作為老大的腦袋里要時時刻刻記住要拿到這個保險公司的Y,這個是戰(zhàn)略問題,這不是個簡單問題。所以,你在這個層面上有思考就好。
非常有意思的發(fā)現(xiàn)是,同樣的這個問題從小汽車變成大卡車的時候故事全變了,為什么?大卡車都是物流企業(yè),物流企業(yè)它自己知道哪輛車出沒出險,所以同樣的數(shù)據(jù),不僅保險公司有,物流企業(yè)也有,而物流企業(yè)正好是你的合作伙伴,它有很好的配合的意愿把這數(shù)據(jù)給你,所以同樣是一個數(shù)據(jù)創(chuàng)業(yè)的項目。
你會發(fā)現(xiàn)在某一個細(xì)分行業(yè)里,可能你有一部分的數(shù)據(jù)資源的獲得是非常有挑戰(zhàn)的,不是不可能,一定是極具挑戰(zhàn)的,而另外一個方向上,可能是很容易獲得的。那么,如果我們創(chuàng)業(yè)在這個過程中,要盡早地思考這個問題,不要走到那兒跟前才發(fā)現(xiàn)我們要拿的這個Y或者X,是動了人家的核心利益,那是不可能給你的,那個時候就太晚了。
樊登:像我們樊登讀書會其實跑著特別多的數(shù)據(jù),但是好像沒有好好利用過。我們沒有認(rèn)真地去分析每一個用戶的使用習(xí)慣,像我們這里邊可采集的數(shù)據(jù)點有哪些?
王漢生:樊老師,我自己有一個看法,首先我們對數(shù)據(jù)的商業(yè)價值可能在大量的媒體上被放大了,我們還是要承認(rèn)一個現(xiàn)實,我認(rèn)為在大多數(shù)場景下,我們是看不到數(shù)據(jù)能產(chǎn)生特別了不起的效果,首先這是個非常謙卑的起點。
在這個基礎(chǔ)上再說我們數(shù)據(jù)到底能產(chǎn)生什么價值。一般我的習(xí)慣是說,倒著我們的業(yè)務(wù)線去問,那我們今年的預(yù)算主要花在哪些方向上,肯定都是希望有產(chǎn)出的。比方說,我們是有多少的預(yù)算是花在了廣告,或者某些銷售投入上。那這個時候我的數(shù)據(jù)的采集點,就要圍著廣告和營銷的手段這些點去采集。比方說,我在哪些地方組織了什么活動,它的參與的人是多少,地理位置是多少,它的人群是什么樣的。在這樣的這個過程中,把數(shù)據(jù)的采集點采集下來,所以,它的所有的采集點是圍繞著我的業(yè)務(wù)線來執(zhí)行的。
樊登:我覺得您這個態(tài)度特別好,就是作為一個統(tǒng)計學(xué)、研究數(shù)據(jù)的教授并沒有把數(shù)據(jù)神話,并沒有說大數(shù)據(jù)特別了不起,大家要緊張起來、要小心。你就坦然地承認(rèn)有的數(shù)據(jù)它也掙不了錢。所以,給我們普及了數(shù)據(jù)思維的最基本的框架,我再給大家梳理一遍,看我說得對不對?
首先,是要知道所有能夠被電子記錄的東西才被稱作是數(shù)據(jù),然后通過它能夠形成具體的動作產(chǎn)品化才能夠創(chuàng)造價值。所謂的數(shù)據(jù)思維,就是了解從數(shù)據(jù)到價值之間的這個過程。然后把我們整個業(yè)務(wù)當(dāng)中的因變量,就是你希望改變的那個Y找到,對它所影響的X都有哪些。把這些數(shù)據(jù)采集出來之后,我們交給專業(yè)人士去做回歸分析,找到它們的相關(guān)關(guān)系。回歸分析之后,就能夠得出哪些東西的影響更大,哪些東西影響更小,之后形成一個具體的動作,就叫產(chǎn)品化的過程,從而創(chuàng)造價值。所以,真的得培養(yǎng)很多這方面的人才。
王漢生:因為寫這本書的時候,也有一個背景。我經(jīng)常被問到一個問題,說漢生老師,我們公司經(jīng)常會碰到兩個選擇,有的朋友是說我們應(yīng)該在公司里面做一個大數(shù)據(jù)部,一個專業(yè)的職能部門。有的朋友是說,“也許我們應(yīng)該讓數(shù)據(jù)分析師進(jìn)入各個職能部門,到底是哪一種方式好”?我想了很久,有一天我明白了,我說不出哪種方式好,但我知道我們一個優(yōu)秀的團(tuán)隊,尤其是數(shù)據(jù)成為重要資產(chǎn)的企業(yè),數(shù)據(jù)思維應(yīng)該是從上到下全部都得有。
因為如果說我們的銷售,講不清楚我們的數(shù)據(jù)產(chǎn)品之于別人的商業(yè)價值,無論是收入也好、支出也好、風(fēng)險也好,那我怎么去售賣?在售賣過程中,我們的銷售常常做的一個事情,就是過度承諾。過度承諾之后,因為自己不懂,回來之后,后面的人實現(xiàn)不了,兩邊就開始扯皮打架。
我們的產(chǎn)品經(jīng)理有了數(shù)據(jù)思維會知道我怎么樣讓我的數(shù)據(jù)價值能夠在一個圖表和dashboard(商業(yè)智能儀表盤)上表達(dá)出來。我們的企業(yè)的老大要知道,就像您剛才問我那個問題,我們要讓樊登讀書做到更好,我的數(shù)據(jù)上戰(zhàn)略性的動作是什么?別告訴我什么數(shù)據(jù)都要采集,那是有成本的,你應(yīng)該告訴我說哪些環(huán)節(jié)上的數(shù)據(jù)可能之于我現(xiàn)在的核心業(yè)務(wù),是最有價值的,我就采那些就行了。哪些是不足的,我要通過什么樣的BD(商務(wù)拓展)的手段,形成戰(zhàn)略性的合作能夠獲得的。所以,從上到下都需要這樣的東西。當(dāng)然,技術(shù)人員就更需要知道后面所有的技術(shù)方法,包括我們的程序代碼可能都是需要的。
樊登:所以,這讓我們知道數(shù)據(jù)思維不僅僅是創(chuàng)始人一個人的事,是公司從上到下所有人都應(yīng)該具備的一種基礎(chǔ)的素養(yǎng)。也許將來有一天,它會成為高中的一門課,讓所有的這些中學(xué)生都能夠有數(shù)據(jù)思維,能夠知道用統(tǒng)計學(xué)的方法來更確切地了解這個世界。
王漢生:是的,也許不一定是一種課,課也是一種形式。另外一種形式就是潤物細(xì)無聲,可能是在各個的課程里面,大家都涉及到這些東西。
樊登:非常有可能,您的工作特別有意義,也感謝您給我們傳遞這么好的知識。感謝大家收看今天的作者光臨,我們下周再見,謝謝。