2019-07-23 大數(shù)據(jù)BigData-5V

大數(shù)據(jù)是指一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合。

1. 多樣(Variety) 大數(shù)據(jù)的多樣性是指數(shù)據(jù)的種類和來源是多樣化的,數(shù)據(jù)可以是結(jié)構(gòu)化的、半結(jié)構(gòu)化的以及非結(jié)構(gòu)化的,數(shù)據(jù)的呈現(xiàn)形式包括但不僅限于文本,圖像,視頻,HTML頁面等等。

?2. 大量(Volume) 大數(shù)據(jù)的大量性是指數(shù)據(jù)量的大小,這個(gè)就是上面筆者介紹的內(nèi)容,不再贅述。

3. 高速(Velocity) 大數(shù)據(jù)的高速性是指數(shù)據(jù)增長快速,處理快速,每一天,各行各業(yè)的數(shù)據(jù)都在呈現(xiàn)指數(shù)性爆炸增長。在許多場景下,數(shù)據(jù)都具有時(shí)效性,如搜索引擎要在幾秒中內(nèi)呈現(xiàn)出用戶所需數(shù)據(jù)。企業(yè)或系統(tǒng)在面對(duì)快速增長的海量數(shù)據(jù)時(shí),必須要高速處理,快速響應(yīng)。

4. 低價(jià)值密度(Value) 大數(shù)據(jù)的低價(jià)值密度性是指在海量的數(shù)據(jù)源中,真正有價(jià)值的數(shù)據(jù)少之又少,許多數(shù)據(jù)可能是錯(cuò)誤的,是不完整的,是無法利用的。總體而言,有價(jià)值的數(shù)據(jù)占據(jù)數(shù)據(jù)總量的密度極低,提煉數(shù)據(jù)好比浪里淘沙。

?5. 真實(shí)性(Veracity) 大數(shù)據(jù)的真實(shí)性是指數(shù)據(jù)的準(zhǔn)確度和可信賴度,代表數(shù)據(jù)的質(zhì)量。 數(shù)據(jù)一直都在,變革的是方式 大數(shù)據(jù)的意義不僅僅在于生產(chǎn)和掌握龐大的數(shù)據(jù)信息,更重要的是對(duì)有價(jià)值的數(shù)據(jù)進(jìn)行專業(yè)化處理。 人類從來不缺數(shù)據(jù),缺的是對(duì)數(shù)據(jù)進(jìn)行深度價(jià)值挖掘與利用??梢哉f,從人類社會(huì)有了文字以來,數(shù)據(jù)就開始存在了,現(xiàn)在亦是如此。這其中唯一改變的是數(shù)據(jù)從產(chǎn)生,到記錄,再到使用這整個(gè)流程的形式。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容