原文: Data Scientist versus Statistician
https://www.datasciencecentral.com/profiles/blogs/data-scientist-versus-statistician
許多統(tǒng)計學家認為數(shù)據(jù)科學是關于分析數(shù)據(jù)的,但不止于此。數(shù)據(jù)科學還包括自動處理的實現(xiàn)算法,以提供自動化預測和操作,例如:
自動出價系統(tǒng)
估計(實時)美國所有房屋的價值(Zillow.com)
高頻交易
將Google廣告與用戶和網(wǎng)頁進行匹配,最大限度地提高轉(zhuǎn)化率
與任何Google搜索高度相關
亞馬遜網(wǎng)站或Facebook上的圖書和好友推薦
稅務欺詐偵查和恐怖主義偵查
評分所有信用卡交易
計算化學模擬癌癥治療的新分子
早期發(fā)現(xiàn)流行病
分析美國國家航空航天局圖片以尋找新的行星或小行星
天氣預報
自動駕駛(飛機和汽車)
客戶定制的定價體系(實時)的所有酒店房間的問題涵蓋天文,欺詐檢測,社交網(wǎng)絡分析,搜索引擎,金融(交易進球),環(huán)境,藥物研發(fā),貿(mào)易,工程,定價優(yōu)化(零售)能源(智能電網(wǎng)),招標和套利系統(tǒng)。
所有這些都涉及統(tǒng)計科學和TB級數(shù)據(jù)。大多數(shù)人這樣做并不稱自己為統(tǒng)計學家。他們稱自己為數(shù)據(jù)科學家。
統(tǒng)計學家一直在收集數(shù)據(jù)并進行數(shù)個世紀的線性回歸。 DAD(發(fā)現(xiàn)/接入/提制)300年前由統(tǒng)計人員進行的,20年前的今天,還是在2015年就此而言,幾乎沒有今天的數(shù)據(jù)科學家演出與爸爸來。這里的關鍵消息做最終,隨著更多的統(tǒng)計學家拿起這些新的技術和更多的數(shù)據(jù)科學家拿起統(tǒng)計科學(取樣,實驗設計,置信區(qū)間 - 不只是在我們的書第五章中所描述的),邊境數(shù)據(jù)科學家和統(tǒng)計人員之間想要模糊。事實上,我們擁有非常高的統(tǒng)計知識庫,并且我們有一個Hadoop。
那么是什么讓數(shù)據(jù)科學家differentFrom計算機科學家是GDP有一個更強大的統(tǒng)計背景,在計算統(tǒng)計尤其是愛情,但有時這是在實驗設計,取樣和Monte Carlo模擬。