作為一個數(shù)據(jù)科學(xué)家了解數(shù)據(jù)的處理流程及數(shù)據(jù)處理系統(tǒng)的架構(gòu)有哪些有很有必要的(廢話真多~~)。如果還不知道什么是數(shù)據(jù)科學(xué)家的,讓移步我的另一篇文章什么是數(shù)據(jù)科學(xué)家?
數(shù)據(jù)處理流程
萬物皆有生命,只是體現(xiàn)的形式不同步而已。那么數(shù)據(jù)也是有生命的!
數(shù)據(jù)的生命周期包括數(shù)據(jù)的產(chǎn)生、數(shù)據(jù)的表示和保存、數(shù)據(jù)的銷毀等各個階段。如下圖:
數(shù)據(jù)分析處理的流程
數(shù)據(jù)處理系統(tǒng)的架構(gòu)
數(shù)據(jù)處理系統(tǒng)依賴于計(jì)算機(jī)的存儲和計(jì)算能力建立。整個系統(tǒng)可以切分成數(shù)據(jù)庫、存儲/檢索與分析系統(tǒng)、應(yīng)用系統(tǒng)(數(shù)據(jù)產(chǎn)品)等主要層次或者子系統(tǒng)如下圖:數(shù)據(jù)處理系統(tǒng)的層次架構(gòu)圖

