網易云課堂《大數據技術原理與應用》課程Chapter 2學習筆記
01?
Hadoop是什么?
Hadoop是Apache軟件基金會旗下的一個開源分布式計算平臺,為用戶提供了系統(tǒng)底層細節(jié)透明的分布式基礎架構。它是基于Java語言開發(fā)的,具有很好的跨平臺特性,并且可以部署在廉價的計算機集群中。
Hadoop的核心是分布式文件系統(tǒng)HDFS(Hadoop Distributed File System)和MapReduce。它被公認為行業(yè)大數據標準開源軟件,在分布式環(huán)境下提供了海量數據的處理能力。
幾乎所有主流廠商都圍繞Hadoop提供開發(fā)工具、開源軟件、商業(yè)化工具和技術服務,如谷歌、雅虎、微軟、思科、淘寶等,都支持Hadoop。
02?
Hadoop的特性
Hadoop是一個能夠對大量數據進行分布式處理的軟件框架,并且是以一種可靠、高效、可伸縮的方式進行處理的,它具有以下幾個方面的特性:
??? 高可靠性
??? 高效性
??? 高可擴展性
??? 高容錯性
??? 成本低
??? 運行在Linux平臺上
??? 支持多種編程語言
03
Hadoop在企業(yè)中的應用

Hadoop在企業(yè)中的應用框架
04?
Hadoop生態(tài)圈

Hadoop生態(tài)圈

Hadoop生態(tài)圈