大數據入門 | 二、初識hadoop

網易云課堂《大數據技術原理與應用》課程Chapter 2學習筆記


01?

Hadoop是什么?

Hadoop是Apache軟件基金會旗下的一個開源分布式計算平臺,為用戶提供了系統(tǒng)底層細節(jié)透明的分布式基礎架構。它是基于Java語言開發(fā)的,具有很好的跨平臺特性,并且可以部署在廉價的計算機集群中。

Hadoop的核心是分布式文件系統(tǒng)HDFS(Hadoop Distributed File System)和MapReduce。它被公認為行業(yè)大數據標準開源軟件,在分布式環(huán)境下提供了海量數據的處理能力。

幾乎所有主流廠商都圍繞Hadoop提供開發(fā)工具、開源軟件、商業(yè)化工具和技術服務,如谷歌、雅虎、微軟、思科、淘寶等,都支持Hadoop。

02?

Hadoop的特性

Hadoop是一個能夠對大量數據進行分布式處理的軟件框架,并且是以一種可靠、高效、可伸縮的方式進行處理的,它具有以下幾個方面的特性:

??? 高可靠性

??? 高效性

??? 高可擴展性

??? 高容錯性

??? 成本低

??? 運行在Linux平臺上

??? 支持多種編程語言

03

Hadoop在企業(yè)中的應用

Hadoop在企業(yè)中的應用框架

04?

Hadoop生態(tài)圈

Hadoop生態(tài)圈
Hadoop生態(tài)圈
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內容