《大數(shù)據(jù)時代》
一、思維變革
大數(shù)據(jù)和三個思維的轉(zhuǎn)變有關
1.要分析與某事物相關的“所有數(shù)據(jù)”,而不是依靠“少量樣本”
數(shù)據(jù)處理技術的進步,讓樣本等于總體成為現(xiàn)實。大數(shù)據(jù)即指不用隨機分析法這樣的捷徑,而采用所有數(shù)據(jù)的方法,而這較為有效。比如,專門從事跨境匯款業(yè)務的XOOM公司,它對一筆交易的所有相關數(shù)據(jù)進行分析,系統(tǒng)曾因注意到用“發(fā)現(xiàn)卡”從新澤西州匯款的交易量比正常情況多而自動啟動報警,事實證明,確是犯罪集團試圖詐騙。
2.人們樂于接受數(shù)據(jù)的紛繁復雜,而不是精確性
大數(shù)據(jù)不僅讓人們不再期待精確性,也讓人們無法實現(xiàn)精確性——數(shù)據(jù)庫一般分散在多個硬盤和多臺電腦上,一個記錄可能分開儲存在多個地方,同步更新不太現(xiàn)實。而當數(shù)量規(guī)模夠大時,確切的數(shù)量就沒那么重要了——想想社交帖閱讀量的標示以及人們的心理:閱讀量1萬以上,就很少有人在乎最末的個位數(shù)了。如谷歌翻譯系統(tǒng),為了訓練計算機,會吸收它能找到的所有翻譯——各類語言的公司網(wǎng)站、聯(lián)合國和歐盟發(fā)布的官方文件的譯本、迅讀項目中的書籍翻譯等,盡管其輸入源很混亂,但翻譯質(zhì)量更高,可翻譯的內(nèi)容更多了。
3.人們的思想發(fā)生了轉(zhuǎn)變,不再探究難以捉摸的因果關系,轉(zhuǎn)而關注事物的相關關系
過去人們通過因果關系了解世界:比如感冒和不帶帽子;肚子不舒服和剛在某家飯店吃過飯……并不一定準確。大數(shù)據(jù)時代,理解世界不再需要建立在假設的基礎上,建立相關關系分析法基礎上的預測是大數(shù)據(jù)的核心。
亞馬遜團隊最初想通過分析“客戶之間的相似性”建立推薦系統(tǒng),后來發(fā)現(xiàn)這非?,嵥槎鵁o效,最后轉(zhuǎn)向“找到產(chǎn)品之間的關聯(lián)性”,這為亞馬遜帶來三分之一的銷售額。沃爾瑪對包含每一個顧客的購物清單、消費額、具體購買時間、購買天氣的龐大數(shù)據(jù)庫進行分析發(fā)現(xiàn),每當在季節(jié)性颶風來臨之前,不僅手電筒銷量增加,某品牌蛋撻的銷量也增加了,沃爾瑪接下來會在同樣的天氣來臨前把庫存的蛋撻放在颶風用品旁邊以增加銷量。
二、商業(yè)變革
1.理解數(shù)字化和數(shù)據(jù)化
數(shù)字化:谷歌把所有版權(quán)書籍通過掃描存入谷歌服務器的高分辨率數(shù)字圖像文件中,書本上的內(nèi)容變成了網(wǎng)絡上的數(shù)字文本,任何地方任何人都可以方便查閱,然而這還需要用戶在浩瀚的內(nèi)容中尋覓自己需要的片段。
2.量化一切,數(shù)據(jù)化的核心
1)文字變成數(shù)據(jù):人們可以用來閱讀,機器可以用之分析。
2)方位變成數(shù)據(jù):典型代表GPS,手機用戶地理位置的價值——根據(jù)他所居住的地點和要去的地方的預測數(shù)據(jù),為他定制廣告。
3)溝通變成數(shù)據(jù):FACEBOOK的“社交圖譜”;推特讓人們記錄和分享零散的想法讓情緒數(shù)據(jù)化得以實現(xiàn)……潛在用途如消費信貸公司考慮開發(fā)以臉書社交圖譜為依據(jù)的信用評分——物以類聚,人以群分,一項研究表明,個人償還債務的可能性和朋友會償還的可能性呈正相關。
4)萬物數(shù)據(jù)化:如觸感技術先導可以通過一個人的體重、站姿和走路方式確認身份;將感應器綁定到哮喘病人佩戴的呼吸器上,通過GPS定位,可以判斷環(huán)境對哮喘的影響等。
3.數(shù)據(jù)再利用
在數(shù)字化時代,數(shù)據(jù)是被交易的對象;大數(shù)據(jù)時代,數(shù)據(jù)將發(fā)揮潛在價值。對于組織來說,應收集盡可能多的使用數(shù)據(jù)并保存盡可能長的時間,同時在保留“延展性”權(quán)利的前提下與第三方分享,分得潛在價值一杯羹。
1)數(shù)據(jù)再利用:如移動電話運營商收集用戶位置信息傳輸電話信號,調(diào)整網(wǎng)絡性能,而手機制造商可以用它來了解影響信號強度的因素,改善手機接收質(zhì)量,電話公司甚至創(chuàng)立獨立公司向零售商和買家出售其收集到的匿名用戶位置信息。
2)重組數(shù)據(jù):如房地產(chǎn)網(wǎng)站將房地產(chǎn)信息和價格添加在美國的社區(qū)地圖上,同時聚合大量信息,如社區(qū)近期的交易和物業(yè)規(guī)格,以此來預測區(qū)域內(nèi)具體每套住宅的價值。
3)可擴展數(shù)據(jù):攝像頭一直用于安全保衛(wèi),是一項成本支出,但還可以跟蹤購物客戶流和他們停留的位置,用來參考店面最佳布局并判斷營銷活動的有效性。
4)數(shù)據(jù)的折舊值:如亞馬遜某客戶十年前購買了一本書,現(xiàn)在對這類書可能不感興趣,如果這個時候亞馬遜繼續(xù)用這個數(shù)據(jù)推薦其他相關書籍,則可能被質(zhì)疑。因此,亞馬遜利用時間及各種因素的復雜模型分離有用和無用的數(shù)據(jù),使得模型的“折舊率”更明顯。
5)數(shù)據(jù)廢氣:指用戶在線交互的副產(chǎn)品,包括瀏覽了哪些頁面、停留了多久、鼠標光標停留位置、輸入什么信息等。如電子閱讀器捕捉讀者閱讀一頁或一節(jié)的時長,是否畫線強調(diào)或者在空白處作筆記,通過記錄、聚集,可以展示一些出版商和作者永遠不可能知道的信息。
6)開放數(shù)據(jù):如奧巴馬開放政府數(shù)據(jù)的data.gov網(wǎng)站的建立。
4.給數(shù)據(jù)估值
數(shù)據(jù)被計入和品牌、人才、戰(zhàn)略并列的無形資產(chǎn)范疇,其潛在價值被投資者注意,擁有數(shù)據(jù)或能輕松收集數(shù)據(jù)的公司股價上漲。價值利用最常見的可能性是將數(shù)據(jù)授權(quán)給第三方,給數(shù)據(jù)定價的市場已經(jīng)出現(xiàn),如冰島一家公司向人們提供聯(lián)合國、世界銀行和歐盟統(tǒng)計局等的免費數(shù)據(jù)集,靠倒賣商業(yè)供應商(市場研究公司)的數(shù)據(jù)來獲利。
5.大數(shù)據(jù)價值鏈的3大構(gòu)成
1)基于數(shù)據(jù)本身的公司:擁有或能夠收集大量數(shù)據(jù),不一定能從中催生創(chuàng)新思想的節(jié)能那個,如推特,擁有海量數(shù)據(jù),但只能通過兩個獨立的公司授權(quán)給別人使用。
2)基于技能的公司:咨詢公司、技術供應商、分析公司,掌握專業(yè)技能但不一定擁有數(shù)據(jù)或提出數(shù)據(jù)創(chuàng)新性用途,如沃爾瑪?shù)臄?shù)據(jù)分析商天睿公司。
3)基于思維的公司:擁有挖掘數(shù)據(jù)價值的獨特想法,如JETPAC公司通過用戶分享到網(wǎng)上的旅行照片來為人們推薦下次旅行的目的地。
3.管理的變革
1)個人隱私保護,從個人許可到讓數(shù)據(jù)使用者承擔責任。
2)個人可以并應該為他們的行為而非傾向負責。
3)大數(shù)據(jù)需要被監(jiān)督并保持透明度以防變成一個“黑盒子”。
4)大數(shù)據(jù)算法師的崛起:來自計算機科學、數(shù)學和統(tǒng)計學領域,是擔任大數(shù)據(jù)分析和預測的評估專家,必須保證公正和保密。他們可以評估數(shù)據(jù)源的挑選,分析和預測工具的選取,甚至包括運算法則和模型,以及計算結(jié)果的解讀是否正確合理。一旦出現(xiàn)爭議,他們有權(quán)考察與分析結(jié)果相關的運算法則、統(tǒng)計方法以及數(shù)據(jù)集。
5)反數(shù)據(jù)壟斷大亨:參考19世紀美國反壟斷的歷程,保護極具競爭力的大數(shù)據(jù)市場。
4.大數(shù)據(jù)和不確定性
大數(shù)據(jù)改變了人們的生活,能優(yōu)化、提高、高效化并最終捕捉住利益,但發(fā)明的火花往往存在于數(shù)據(jù)未顯示的信息之中。科技再先進也無法將世界上數(shù)據(jù)的總量盡數(shù)收集,人們收集的數(shù)據(jù)不過是現(xiàn)實的投影,大數(shù)據(jù)不能提供最終答案,它只提供參考答案。人類最偉大的地方正是運算法和硅片沒有也無法揭示的東西,如信仰、不確定性和創(chuàng)意。
