本期是藍莓群訪,我們邀請到了北京大學營銷模型專業(yè)博士、百分點集團數據科學總監(jiān)杜曉夢來與莓果們分享——如何讓“大數據營銷”成為企業(yè)的掘金神器?
|本期嘉賓:
杜曉夢
北京大學營銷模型專業(yè)博士,百分點集團數據科學總監(jiān)
|本期主持:
章茜 藍莓會副秘書長
以下是群訪實錄
▼
章茜:
曉夢先給大家介紹一下你過往在大數據方面的經歷和背景吧。
杜曉夢:
大家好,我是百分點數據科學部負責人杜曉夢。我本科在北大讀管理信息系統(tǒng)專業(yè),然后在北大光華讀的營銷模型的博士。
“畢業(yè)前在一家廣告技術公司做了一年的數據分析、數據建模方面的工作,建立了對營銷領域大數據挖掘方向的興趣。
現在我在百分點主要做量化分析、數據挖掘相關的工作。營銷其實是大數據技術應用的很廣泛的領域之一,也是和消費者的行為分析結合得比較緊密,各行業(yè)、各企業(yè)都非常關注的領域。
我今天非常高興能跟大家分享一些利用大數據在營銷上做過的實踐,從數據科學的角度或從大數據應用的角度談一些我自己的看法。
企業(yè)數據建設不是一蹴而就
`Q1---
章茜:
您曾經幫過華為、萬科這些知名企業(yè)做過大數據項目,橫跨地產、汽車、金融、通訊、快消等領域。對于身處不同行業(yè)的這些企業(yè),大數據在企業(yè)發(fā)展的不同階段能為他們提供什么樣的幫助?企業(yè)一般應該在什么階段開始自己的數據建設呢?
杜曉夢:
我們接觸的企業(yè)粗略地可以分成2B和2C企業(yè)。
對于2B企業(yè),大數據更集中于幫他們發(fā)現銷售的線索,我們可以從社交網絡、移動互聯網上爬取相關的內容,從中發(fā)現銷售的線索,包括銷售線索的評級、培育、管理等都有大數據的技術做支撐。
對于2C企業(yè),大數據更重要的是在于客戶的經營,包括會員的運營。對于營銷,可分為新用戶的獲取和老用戶的經營兩部分。
大數據不光用在企業(yè)營銷的領域,在銷售方面,包括銷量預測、個性化定價、物流規(guī)劃、庫存優(yōu)化、產品設計,客服售后都是可以有大數據技術做支撐的。
企業(yè)對于大數據的利用取決于企業(yè)自身的業(yè)務需求以及自身數據的積累。初創(chuàng)企業(yè)主要是為了生存下來,規(guī)劃好核心競爭力是什么。隨著企業(yè)的業(yè)務發(fā)展,數據量包括數據觸點、數據渠道,接觸消費者的渠道不斷擴張,這時候企業(yè)就要開始規(guī)劃自己的數據建設。如何打通不同的渠道,線上線下消費者的數據,也是企業(yè)開始要考慮的問題了。
當企業(yè)發(fā)展到比較大的規(guī)模時,數據建設會面臨性價比的問題。閉源的商業(yè)數據庫軟件成本就會比較高。很多企業(yè)開始用一些開源的組件、底層框架做數據庫的搭建,做數據的分析和上層的應用以及可視化的展示。
企業(yè)在不同的階段都會有數據的建設,包括應用底層的架構、上層數據的分析、積累數據的能力,都不太一樣。我們建議企業(yè)從一開始就考慮自己發(fā)展的規(guī)模,到后期數據有哪些可以獲取的,提前要做預估。
`Q2---
章茜:
但不是所有的企業(yè)都有實力構建自己的大數據中心,中小型企業(yè)該如何應對?
杜曉夢:
企業(yè)的大數據中心不是一蹴而就的,而是隨著自己業(yè)務發(fā)展,數據的積累,逐漸調整過來的。淘寶、京東、百度等在開始的時候也用過如SQL Server、My SQL等小量的數據庫。但是當數據量隨著業(yè)務量提升而提升的時候,他們都會做架構的重構和升級。
如果企業(yè)屬于小數據的階段,每天的PV或者數據量只有幾十萬、幾百萬的時,建議在底層的數據庫就使用SQL Server、My SQL這樣的數據庫,效率會比較高。

當PV每天超過了五千萬或者數據量已經膨脹到每天要處理幾百G、TB級的數據時,就需要更強大的數據庫,比如剛剛開源的Greenplum數據庫也是非常強大的,適合處理中型的數據。
到這個階段,企業(yè)不管在營銷運營還是銷售,都需要深入的分析,可能需要統(tǒng)計的模型,比如時間序列模型、因子分析等等。這時候企業(yè)就會用SPSS、SAS這樣的分析軟件去支持稍微大規(guī)模數據的分析和統(tǒng)計,利用機器學習算法進行一些分析。
當數據量繼續(xù)擴張,比如現在已經到了每天要處理幾十億數據的時候,就需要把數據架構做更大的調整,開始考慮上分布式的架構,比如hadoop,分布式計算的框架能便利分析實時流式的數據,比如日志的數據。
企業(yè)通常都會有專門的數據分析team幫助企業(yè)處理日常的數據的分析,通常Python、R是用的比較多的。在可視化方面,在小數據時可以用Tableau這樣的傳統(tǒng)可視化商業(yè)軟件,在數據量比較大的時候,都是自主研發(fā)比較多。
所以企業(yè)該如何去構建自己的數據中心、數據架構,應該選擇什么樣的分析軟件,可視化等等完全取決于它的數據量,以及它的業(yè)務需要多大量的數據進行支撐。
一些開源的組件,開源的框架使我們能夠分析很多以前在小數據領域分析不了的數據,比如消費者點擊流數據,日志的數據,語音數據,甚至一些圖片和視頻的解析,現在都是大數據技術可以支撐的。
隨著企業(yè)的數據不斷的擴張,底層數據存儲、計算結構也在慢慢的變復雜。我見過一個企業(yè)雖然數據量總量不是很大,但是因為結構比較復雜,可能有三、五十個數據系統(tǒng),存儲不同的數據。這時候需要提醒大家一定要做主數據的梳理,即要建立數據庫之間拉通體系。比如一個消費者的數據到底是以哪個數據庫為主,主數據庫的梳理以及元數據庫是一定要做的,即數據的數據,我改了哪些表,存了哪些主鍵,元數據的梳理也是非常重要的。
章茜:
不同的流量階段,不同的解決方案。
核心:主數據的梳理。
什么時候不再說大數據了
就是大數據時代真正來臨的那一天
`Q3---
章茜:
移動互聯網時代,許多行業(yè)都希望通過大數據達到精準營銷,哪些行業(yè)對大數據的應用走在最前沿?這對其他行業(yè)如地產有怎樣的指導意義?
杜曉夢:
肯定是互聯網的企業(yè)是最前沿的。比如BAT,做個性化的推薦,搜索、地圖導航、量化分析等等。
在傳統(tǒng)的非互聯網的企業(yè)里,各行各業(yè)都看到很前沿的企業(yè),大致的規(guī)律就是各行業(yè)的龍頭企業(yè)對大數據的應用都是比較前沿的。
原因:一是資金比較雄厚,二是龍頭企業(yè)數據量很大,三是管理層非常關注新技術。
比如消費類的3C企業(yè),做手機、電腦的企業(yè),對大數據的應用都是比較早,這跟他們的主營業(yè)務與大數據技術稍微有點關聯性是有關系的。
擁有大量數據的行業(yè)也是應用比較早的,如金融領域。被互聯網擠壓得比較嚴重的行業(yè)如零售行業(yè)要尋求轉型,所以對大數據的應用也是比較早的。
這對其他行業(yè)有怎樣的指導意義呢?大數據遲早是會被普及的,美國一位大數據的學者說,未來所有的生意都是數據生意,所有的企業(yè)都將擁抱大數據,就像互聯網一樣?,F在基本上沒有太多的人提互聯網了,是因為所有的企業(yè)都已經是互聯網企業(yè)了,以后所有的企業(yè)也都會是數據型的企業(yè),不會再有非數據企業(yè)和數據企業(yè)的差異,而是對大數據技術利用的深度以及擁抱程度的區(qū)別。
大數據的技術在方方面面都是有應用的,大家要結合自身業(yè)務的特征,找到自己的突破點,不要盲從,要找準自己的核心定位以及自己的業(yè)務壁壘,核心競爭力,這是非常重要的。
總之,結合行業(yè)業(yè)務點找到自己的法門。
`Q4---
章茜:
人人都在說大數據,那大數據跟我們的日常生活有什么樣的密切聯系?對媒體傳播又有什么影響?
杜曉夢:
大數據滲入到大家的日常生活里,結合地已經非常緊密了,我們的衣食住行都已經離不開大數據,購物用淘寶,出行用uber、滴滴、易道,社交用微信、微博,餐飲會用大眾點評,投資理財用雪球。在教育、醫(yī)療行業(yè)都會看到基因組測繪等等,都是大數據技術的應用。
我覺得對傳播的影響,媒體的傳播會越來越碎片化。
從紙媒體,到收音機,到電視、互聯網、移動互聯網,現在有了如今日頭條這樣的APP,這使得媒體的傳播變得越來越碎片化?,F在新興的一些現象如直播平臺、網紅、自媒體、公眾號等等,媒體傳播變得越來越個性化,越來越軟。
隨著大數據技術、物聯網技術的進一步發(fā)展,我們可能會看到很多現在我們都沒有看到的媒體的渠道。比如早上起來的時候鏡子上也可能會有新聞、廣告的互動,例如天氣預報、提醒我昨天的新聞、時政有哪些內容,這些都是以后可能會出現的新的媒體渠道。
任何一項新技術剛剛誕生的時候,都會有人質疑、恐慌、害怕,下一個階段,就會有人冷靜下來認清技術的應用點、做新的拓展、新的應用。當這個技術已經運用到日常生活中來的時候,我們就已經感覺不到這個技術的存在了。
什么時候我們不再說大數據了,就是大數據時代真正來臨的那一天。
Data Driven
永遠是營銷未來發(fā)展趨勢
`Q5---
章茜:
大數據時代正在來臨,莓果們大多是營銷精英人,最關心大數據怎樣應用于營銷?例如做效果監(jiān)測如何提升營銷活動的有效性?
杜曉夢:
目前看到大數據技術在兩個領域的發(fā)展都非常好,一個就是個性化推薦,一個是精準廣告,這兩個領域都是屬于營銷的領域。
營銷中非常關鍵的三個因素:人群、場景、內容,都是由大數據以及大數據技術可以做支撐的,
但是核心前提要具備從各種渠道收集數據的能力。線下的數據采集以及線上線下數據的打通串聯,如何去分析挖掘,如何去洞察結果也是非常重要的。
如何評價不同的渠道給我的官網或者我的商城帶來的引流效果,我如何做站內的分析,不同渠道帶來的人群停留時長、跳出率、轉化率都是怎樣的,這些都需要一些數據做為支撐。我們也看到越來越多的CMO開始關心數據,也有一些CIO和CMP身份開始做一些融合。伊美爾現在的CIO就是兼任CMO,因為越來越多的會是數據驅動運營、數據驅動營銷,Data Driven永遠是營銷未來發(fā)展的一個趨勢。

營銷其實是科學和藝術的結合體。科學部分有數據,有數據技術進行支撐。在藝術部分,有各位營銷人員的創(chuàng)造力、想象力進行支持。
打動消費者:建立強鏈接
`Q6---
章茜:
營銷是科學和藝術的結合體,我們都是營銷手藝人。創(chuàng)意群有莓果問:大數據營銷是怎么跟消費者建立關系呢?
杜曉夢:
互聯網大數據的時代,消費者的觸點越來越多,越來越碎片化。渠道是非常豐富的,核心就是能否通過某一個渠道或者某一個觸電打動這個人,這是非常重要的。
怎么去打動一個消費者呢?我們要建立跟她內心的強連接,
非常深入的了解他,了解他的特征、偏好,建立一個統(tǒng)一的完整的消費者的畫像,去給他提供個性化的內容和服務。
現在的消費者變得越來越個性,他們越來越關注自己的內心和價值觀,比較標新立異。尤其當90后、00后成為主流消費者的時候,也許提供統(tǒng)一的產品或者統(tǒng)一的溝通方式都是無法打動消費者的。
所以也看到更多的企業(yè)開始轉變從以往的以產品為中心的營銷方式,變成以消費者為中心的組織方式,甚至會根據不同的消費者群體組建自己的營銷team,專門的做定制化的個性化服務。
這就是為什么在現在網紅、比較火爆公眾號的營銷效果非常好,因為他抓住了一群鐵粉的內心,所以他們隨便推銷任何的產品都是會有很多人追捧的。
還有一點非常重要的就是及時的響應,非常及時的響應,不是秒級的也應該是分鐘級的響應和回復。
回復包括營銷自動化系統(tǒng)觸達的一些規(guī)則,比如生日到了是否自動給他觸發(fā)優(yōu)惠券,各種節(jié)日到了是否自動觸發(fā)短信等等,也包括人工主動去觸發(fā)的互動。比如在微博、微信上面的及時的回復,都是對維護消費者關系非常重要的。這也是大數據技術可以去做支撐的部分。
`Q7---
章茜:
作為消費者大家可能都有過這樣的體驗,已經購買過并且短時間內不會再次購買的商品也會頻繁出現在網頁推薦上,重復推薦是對廣告資源的浪費,如何優(yōu)化?
杜曉夢:
出現這樣的情況是因為推薦以前或者推薦算法做得不夠好。
因為百分點是向兩千多家電商和媒體提供集全網的推薦服務,這是一個非常好解決的問題,就是你在買了這個商品以后我們的推薦引擎就會自動關閉這個品類,在短期之內不會再去推薦同樣的商品了。
跨界重要的是數據的打通和整合
`Q8---
章茜:
近來我們經??吹较裥吕?阿里、騰訊+京東這樣的社交媒體平臺跟電商平臺之間的跨界合作,社交媒數據和電商數據的整合,會有什么樣的化學反應?
杜曉夢:
營銷媒體和電商的跨界,最重要的就是數據的打通和整合,可以做一些數據的共享。比如新浪調取了我在淘寶的瀏覽記錄幫我做微博精準廣告。這是一個典型的數據和流量共享,使得阿里、新浪能夠提升在分析的消費者維度的能力,可以把廣告位基于個人消費者的購買記錄做一個更精準的投放。這是很好的基于數據共享的個性化應用的整合。
以后,社交媒體和電商的界限會越來越模糊,會有很多兼具社交功能和電商功能的新媒體、平臺或者渠道出現。
隨著商家的服務意識提高,更多的品牌會跟消費者成為朋友。
現在很多小眾的文化在崛起,包括個人的設計師、獨立的藝人,他們一邊積累了一群粉絲跟他們進行社交互動,同時又可以在自己的社交平臺做一些周邊的銷售。所以社交和電商的界限真的會越來越模糊。
章茜:
京騰計劃,品效合一在2016成為BAT的重點。已經有很多品牌懂得和用戶“談戀愛”,文化和價值感的認同讓品牌和用戶走在了一起。未來,這是主流。
大數據需要堅守
`Q9---
章茜:
目前,像長虹、速8酒店這樣的傳統(tǒng)企業(yè)開始部署自己的大數據項目,但一旦面對項目的前期投入,卻讓一些企業(yè)望而怯步,不知您怎么看待大數據項目的投入產出比和回報率呢?
杜曉夢:
基礎建設是非常重要的。就像蓋一個酒店,地基是非常重要的,然后才是裝修,買家具,才能把酒店搭起來。但是在打地基的時候,基本上就決定了酒店最后的價值能多大。就像我們的一個客戶提出的,平臺先行,應用跟上,分期分批去實現一個大數據項目落地。
一期的基礎平臺的搭建期確實看不到直接的應用上的產出,因為更多的是去衡量底層的數據平臺是否是穩(wěn)定的,是否是健壯的、兼容性高的,是否支持多源異構數據的接入和打通,這是非常重要的基本功。
隨著底層平臺的不斷穩(wěn)健,數據的接入,比如消費者在各個渠道的觸點都被打通的時候,我們就可以建立了一個完整的應用化體系。那么在上層就可以搭建各種各樣大數據的應用,比如營銷的應用,個性化推薦,精準營銷,包括消費者的深入挖掘,價值度的衡量,流失概率的預測等等,這些都是能直接看到投入產出的。
應用部分是不斷迭代的過程,我們在做大數據項目的時候總結出來3D的模型:
第一個D是Datafy---數據化,第二個D,Discover---發(fā)現洞見,第三個D---Design,重構應用體系,這三個D不是一蹴而就,而是不斷的迭代循環(huán)的。
Datafy部分,我們把消費者、商品、庫存、物流等等都數據化,把不同的數據接入到底層平臺上。
在對這些數據做很深入的分析和挖掘大數據建模之上后,我會發(fā)現很多的洞察,比如什么樣的消費群體喜歡買A款產品,什么樣的消費群體喜歡買B款產品,他們在社交媒體上都說些什么,這些都是Discover的部分。
基于Discover,會重新Design,比如產品的設計,包括營銷Campaign的流程。通過應用的投入又能采集到新一輪的消費者的數據,這些數據又迭代到Datafy部分,形成數據的閉環(huán)。所以3D的模型是不斷的往復循環(huán)迭代的過程。
所以我們在做一個完整的大數據項目的時候一定要有遠見,前期的投入是磨刀不誤砍柴工,把底層的數據基礎做好,做到平臺是可擴容的,那么我們現在想象不到的多源異構的新渠道數據在未來都可以進入到現有構建的大數據平臺上來。
我們的另外一個經驗就是一般的大企業(yè)和大集團,通常都是IT部或者科技部發(fā)起大數據底層平臺的項目,到一期尾聲或者二期開始的時候就會有業(yè)務部門介入,包括互聯網營銷的部門,包括線下銷售的部門,客服部等等。我們就會結合業(yè)務的需求,去看看大數據底層平臺收集的數據該如何去滿足業(yè)務的需求。這是分階段的項目。
章茜:
大數據中心的基礎建設期都不短,而且看不到即時的回報,但這個時期才更要堅守。
`Q10---
章茜:
市場上也有很多專注于提供大數據產品的第三方機構,企業(yè)應該怎樣挑選這些大數據機構和產品?什么樣的數據解決方案對于企業(yè)才是最合適的呢?
杜曉夢:
在這方面建議企業(yè)根據自身的需求,主要是自己的核心業(yè)務來選擇合適的,因為選擇確實是非常多的,所以還是結合企業(yè)的業(yè)務來選擇最合適的數據。
`Q11---
章茜:
有些企業(yè)開始設置首席數據官這個職位,您是如何看待這個問題的?
杜曉夢:
這還是要看企業(yè)的發(fā)展階段以及數據量有多大。中小企業(yè)、數據量不大的企業(yè),負責數據的人通常會在運營或者IT的team里,一般不會獨立出來。
企業(yè)發(fā)展到比較大的階段或者企業(yè)的數據對于業(yè)務驅動非常重要的時候,首席數據官還是非常重要的,他會擔任起來整個公司的數據治理,包括數據資產的盤點,尤其是DMP平臺的管控。比如各自的業(yè)務部門都有數據,這些數據接入到DMP平臺的準則是什么,做什么處理,輸出的標準是什么,這些都是CDO需要考慮的問題。
如何利用數據3D模型,形成數據驅動業(yè)務的閉環(huán),這時CDO就非常重要的了。一些大的美國公司如Linkedin、Airbnb,都會有專門的數據科學team及CDO做整個公司的數據治理和資產盤點,數據化等工作。
當企業(yè)數據積累到一定程度的時候,CDO也會去做數據的變現,這就是DaaS模式,Data as aService模式。比如在百分點,我們有一個非常大的消費者用戶畫像數據庫,我們現在能覆蓋到中國5.5億消費者人群的數據,每天的增量數據是在15T左右。我們的CDO就會考慮這些數據應該怎么去服務外部的企業(yè),能否去做數據的變現等等,這些都是能直接給公司帶來利潤的。這時候CDO的職位是非常非常的重要的
數據驅動、技術驅動、渠道多樣化
`Q12---
章茜:
在您看來,大數據營銷應用未來的核心是什么?
杜曉夢:
有幾點我是能看到的。
比如一定是越來越數據驅動,一定是大數據和小數據的融合。
因為大數據更注重人的行為分析,比如你的瀏覽,你的點擊,你的購買收藏等等行為體現出來的偏好。小數據永遠不會被取代,比如從消費者的訪談,問卷里收集的消費者的態(tài)度,對于品牌的愛,這些都是營銷也是未來非常需要的。所以大小數據融合的數據驅動會是未來的方向。
越來越多的技術驅動一定也是一個趨勢。
現在很多新的科技,包括黑科技,比如人臉識別,瞳孔識別,生物技術,人工智能,都是會可能驅動未來營銷應用的發(fā)展方向。
渠道的分散化也是一種趨勢,包括自媒體會出現,軟性營銷渠道的增加,如網紅、直播等等,營銷會變得越來越讓你覺得不是在賣東西,不是在做營銷,體會不到這是一個廣告。
營銷的永恒就是核心受眾、價值觀和場景,這三個因素是缺一不可的。
`Q13---
英子-中海達-品牌總監(jiān):
我想問一下,基于大數據的營銷,我印象中廣州有一個互動派,時趣跟互動派之間的差異體現在哪些地方?
杜曉夢:
互動派了解不多,但是對時趣互動還是了解比較多的。他們主要是基于社交去做的營銷的Campaign,消費者的分析,營銷活動的監(jiān)測這些方案。
社交營銷更多的是人的參與。比如之前在微博營銷上,一個非常流行的案例就是博圣云峰給杜蕾斯做的形象的維護和設計,其中非常重要的一點就是實時的回復。在杜蕾斯的官方微博下面發(fā)任何一個問題,都會有一個人工運營在兩分鐘之內跟你做互動。
`Q14---
章茜:
百分點目前大數據除了應用在營銷,還主要應用在哪些方面?經營業(yè)績占比中數據業(yè)務占了多少?
杜曉夢:
對于百分點大數據,營銷只是其中的一個部分。我們應用在其他的方面,比如幫助金融公司如消費金融、P2P等做大數據的風控分析,基于消費者的購買行為做償還力、消費能力的判斷。
我們的業(yè)務服務模式可以大體分為TaaS、SaaS、DaaS三部分,技術服務部分主要幫助企業(yè)構建大數據的平臺,數據倉庫,上層的數據應用。SaaS部分我們線上的產品,包括個性化推薦,包括運營分析,包括輿情監(jiān)測,這些都是SaaS的服務。
在DaaS服務方面,我們會做一些數據的補充,標簽的輸出,包括一些數據報告的輸出給營銷公司去做全案的包裝,幫助營銷部門洞察他的用戶等等。
`Q15---
章茜:
有位傳統(tǒng)廣電廣告的莓果問:他各種硬廣都有,在互聯網時代,如何收集、利用好大數據,開展營銷?
杜曉夢:
硬廣的數據收集還是比較難的,如果不去做調研收集,廣告效果是比較難測繪的。但現在我們也可以用一些包括二維碼、條形碼采集數據。
在互聯網時代,如何收集利用好大數據,比較重要的一點就是珍惜任何一個跟消費者接觸的觸點,去做消費者ID的拉通。
消費者的觸點,消費者行為非常碎片化導致的結果就是一個人的ID可能有十幾個甚至幾十個。如果你不去做拉通,就很難把一個人的行為做一個完整描述。
當一個消費者用他的電腦上了官網的時候,就鼓勵他用他的郵箱去注冊賬號,或者用手機號去注冊,這就是為了把他的手機號和他的瀏覽器cookie和ID做一個打通。
當一個人又去了線下門店的時候,鼓勵銷售人員讓他先連上店里的wifi,他買東西的時候又會讓他填上他的地址,這樣就試圖去把這個人的手機號、地址,甚至他的信用卡卡號和他連wifi時候的Mac地址做一個拉通。
所有的數據或者ID都被拉通之后,作為商家的自由度就會比較大。就可以跟各種的DP去做數據的匹配,提取數據。