書聲2020/蛋苗苗

我的職業(yè)和數(shù)據(jù)相關(guān),前一陣子把涂子沛的《數(shù)據(jù)之巔》翻出來,躺床上又看了一遍。這書嚴格來說不是大數(shù)據(jù)相關(guān)的著作,不過作為美國歷史書籍,倒是很有意思的一種分析。
初數(shù)時代,利用數(shù)據(jù)來劃分國家權(quán)力,從而使國家權(quán)力相對共和,而共和的政治反過來促進數(shù)據(jù)的發(fā)展;內(nèi)戰(zhàn)時代,通過數(shù)據(jù)分析講述了南北戰(zhàn)爭的原因,也展示了北方軍隊逐步取勝的過程;鍍金時代,內(nèi)戰(zhàn)結(jié)束的美國,隨著數(shù)據(jù)量的積累,對數(shù)據(jù)的分析利用逐漸增多;進步時代,通過水利工程的數(shù)據(jù)競爭、給生命定價、福特公司的道德危機及成本收益分析方法講述了以數(shù)據(jù)決策已成為時代的主流。抽樣時代,抽樣統(tǒng)計的發(fā)展以及應(yīng)用,經(jīng)典案例如戴明質(zhì)量控制,人口普查與統(tǒng)計學,總統(tǒng)競選等。第二部分講述了大數(shù)據(jù)浪潮的來龍去脈,雖然明為大數(shù)據(jù),但從現(xiàn)在的觀點來看狹隘了一點。數(shù)據(jù)量大不能成為大數(shù)據(jù),多維度的不同數(shù)據(jù)的綜合分析,挖掘出有用的商業(yè)模式才是大數(shù)據(jù)的應(yīng)用。
?結(jié)合自身工作相關(guān)的內(nèi)容,對本書中提到的機器學習和智慧城市有點心得感悟。機器學習指機器通過統(tǒng)計學算法,對大量的歷史數(shù)據(jù)進行學習從而生成經(jīng)驗模型,利用經(jīng)驗模型指導業(yè)務(wù)。最近工作物聯(lián)網(wǎng)上遇到過一次移動物聯(lián)網(wǎng)對某個客戶不通的情況,此客戶用的是移動APN專線,類似的其他客戶沒有遇到此類問題,這次事故造成這家客戶的對外平臺系統(tǒng)無法正常使用,用戶無法控制自己的物聯(lián)網(wǎng)系統(tǒng),損失可想而知。在解決問題的過程中,最后發(fā)現(xiàn)中國移動和中國電信的網(wǎng)絡(luò)之間的某個節(jié)點數(shù)據(jù)不通,排除掉運營商之間的原因,最后通過路由器機器學習的方法,自我識別到這個案例的情況,最終打通了這類通訊的壁壘。如果讓人去尋找并通過運營商合作來解決這個問題,估計這家客戶的用戶等不及問題解決就要流失光了,并且該客戶會面臨巨額的索賠。最近也在自學機器學習相關(guān)的內(nèi)容,推薦朋友們到coursea網(wǎng)站上參與學習。
智慧城市,是指運用信息和通信技術(shù)手段,感測、分析整個城市運行核心系統(tǒng)的各項關(guān)鍵信息,從而對包括民生、環(huán)保、公共安全、城市服務(wù)、工商業(yè)活動在內(nèi)的各種需求做出智能響應(yīng)。對我們感受最大的就是智慧交通了,智慧交通是在交通智能調(diào)度系統(tǒng)的基礎(chǔ)上,融入物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、移動互聯(lián)等IT技術(shù),通過信息技術(shù)對交通信息的匯集和處理,提供實時交通數(shù)據(jù)服務(wù)。簡單案例手機打車,調(diào)度,智能跟蹤等,每個人的出行信息均可在網(wǎng)絡(luò)上體現(xiàn),人人均是互聯(lián)的一環(huán)。2017年上海外灘踩踏事故發(fā)生之后,對于人流量的管理控制應(yīng)用有了很大的提高,從技術(shù)而言,就是通過數(shù)據(jù)來分析某個區(qū)的熱力。想到的辦法就是通過基站檢測區(qū)域內(nèi)的手機活躍數(shù),對于達到閾值的場景及時加以人工干預。
?讀完這本書,對專業(yè)數(shù)據(jù)應(yīng)用而言,不值得太過深入。不過作為歷史數(shù)據(jù)資料可以一讀,對數(shù)據(jù)應(yīng)用感興趣了,才會更加深入數(shù)據(jù)之巔。本書好評雖多,個人推薦度一般。主流的數(shù)據(jù)分析,需要有良好的數(shù)學基礎(chǔ),懂的圖像識別技術(shù),數(shù)據(jù)挖掘,深度學習,機器學習,自然語言處理,路漫漫兮修遠兮,Python上下而求索。
