最近對(duì)數(shù)據(jù)科學(xué)產(chǎn)生了濃厚的興趣。在人工智能時(shí)代,數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)早已成為了熱門(mén)話題。尤其是在中國(guó),政府不斷加大對(duì)人工智能的投入力度,力圖“趕英超美”。一時(shí)間,數(shù)據(jù)科學(xué)家成為了炙手可熱的人物,很多機(jī)構(gòu)也都推出了各自的數(shù)據(jù)培訓(xùn)課程。最近讀了一些有關(guān)數(shù)據(jù)科學(xué)的文章,遇到了很多新鮮的名詞,例如機(jī)器學(xué)習(xí),深度學(xué)習(xí),人工智能。這些名詞的語(yǔ)義和數(shù)據(jù)科學(xué)不但互相引用而且相互重疊,很難在腦海里形成明確的概念。因此,查閱了一些資料并整理出來(lái),也算是總結(jié)了我對(duì)數(shù)據(jù)科學(xué)的初步認(rèn)識(shí)。
在阿里云云棲社區(qū)的一篇翻譯文章中,對(duì)這三個(gè)領(lǐng)域差異進(jìn)行了簡(jiǎn)化【1】:
假設(shè)我們正在制造一輛自動(dòng)駕駛汽車,并且正在研究如何在停車標(biāo)記處自動(dòng)停車的具體問(wèn)題。那么我們將需要使用這三個(gè)領(lǐng)域的技能。
機(jī)器學(xué)習(xí)做出預(yù)測(cè):汽車必須能夠通過(guò)攝像頭識(shí)別停車標(biāo)志。我們構(gòu)建了數(shù)據(jù)集,其中包含數(shù)以百萬(wàn)計(jì)的街邊對(duì)象的照片,并訓(xùn)練一種算法來(lái)預(yù)測(cè)哪些有停止標(biāo)志。
人工智能生成行為:一旦我們的汽車能夠識(shí)別停車標(biāo)志了,就需要決定什么時(shí)候執(zhí)行剎車動(dòng)作。太早太晚都非常危險(xiǎn),而且我們需要它能應(yīng)對(duì)不同的路況(例如,它要能意識(shí)到在濕滑路面上剎車不會(huì)快速減速),這是一個(gè)控制理論的問(wèn)題。
數(shù)據(jù)科學(xué)產(chǎn)生洞察力:在街頭測(cè)試中,我們發(fā)現(xiàn)車輛性能不夠好,因?yàn)榭倳?huì)略過(guò)一些停車標(biāo)志。通過(guò)對(duì)街頭測(cè)試數(shù)據(jù)的分析,我們得出了結(jié)論:在日出之前和日落之后,更容易錯(cuò)過(guò)停車標(biāo)志。這讓我們意識(shí)到,我們大部分的訓(xùn)練數(shù)據(jù)只包含白天的影像,所以我們構(gòu)造了一個(gè)包括了夜間圖像的更好的數(shù)據(jù)集,然后重新回到機(jī)器學(xué)習(xí)步驟進(jìn)行研究測(cè)試。
但是,不得不承認(rèn)在實(shí)際的研究和工作中這三者的區(qū)分并不明顯。
首先,數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)就有很多重疊之處。都可以用邏輯回歸來(lái)獲取對(duì)有關(guān)關(guān)系的見(jiàn)解(越富裕的人越有可能購(gòu)買(mǎi)我們的產(chǎn)品,所以我們應(yīng)該改變我們的營(yíng)銷策略),并且可以做出預(yù)測(cè)(該用戶有53%的幾率購(gòu)買(mǎi)我們的產(chǎn)品,所以我們應(yīng)該向他推銷)。因此,大多數(shù)的從業(yè)者能夠非常自在的在兩個(gè)領(lǐng)域之間來(lái)回切換。
其次,人工智能最為古老也是最為廣為人知。1956年被認(rèn)為是人工智能元年。這一年,一群先知般存在的科學(xué)家在美國(guó)達(dá)特茅斯學(xué)院,舉行了一次“不食人間煙火”的會(huì)議,與會(huì)者包括摩爾,(提出了摩爾定律)約翰.麥卡錫(人工智能之父,LISP的發(fā)明者),馬文.閔斯基(第一個(gè)模擬人活動(dòng)的機(jī)器robot C的發(fā)明者)等。該會(huì)議的主題是:用機(jī)器來(lái)模仿人類學(xué)習(xí)以及其他方面的智能,其內(nèi)容被總結(jié)成了一個(gè)驚世駭俗的名字:人工智能。自此,對(duì)人工智能的研究?jī)陕淙?,已?jīng)被炒作泛濫。歷史上的ML經(jīng)常被認(rèn)為是人工智能的一個(gè)分支(特別是計(jì)算機(jī)視覺(jué),其實(shí)它是一個(gè)典型的人工智能問(wèn)題)??慈A為在自己的AI培訓(xùn)課程中對(duì)其關(guān)系的描述:

最后,數(shù)據(jù)科學(xué)的定義強(qiáng)調(diào):
- 統(tǒng)計(jì)推斷
- 數(shù)據(jù)可視化
- 實(shí)驗(yàn)設(shè)計(jì)
- 領(lǐng)域知識(shí)
- 通訊
從事數(shù)據(jù)科學(xué)工作的前提條件(包括但不完全):
python,統(tǒng)計(jì)學(xué),數(shù)據(jù)處理,變成全棧式工程師,數(shù)據(jù)庫(kù)知識(shí)(NoSQL & SQL),可視化技術(shù)。。。
【1】數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和AI的區(qū)別
【2】## HCIA-AI華為認(rèn)證AI工程師在線課程