教程簡介
Flume是Apache下面的一個分布式組件,它提供高效,可靠的收集,整合,傳輸日志數(shù)據(jù)的服務。Flume可以理解成一個管道,它連接數(shù)據(jù)的生產者和消費者,它從數(shù)據(jù)的生產者(Source)獲取數(shù)據(jù),保存在自己的緩存(Channel)中,然后通過Sink發(fā)送到消費者。它不對數(shù)據(jù)做保存和復雜的處理(可以做簡單過濾和改寫)。
Apache Flume入門教程 - 從基本到高級概念的簡單步驟了解Apache Flume,其中包括簡介,Hadoop中的數(shù)據(jù)傳輸,架構,數(shù)據(jù)流,環(huán)境,配置,獲取Twitter數(shù)據(jù),序列生成器源,NetCat源。
教程目錄
- Apache Flume教程
- Apache Flume - 簡介
- Apache Flume - Hadoop中的數(shù)據(jù)傳輸
- Apache Flume - 架構
- Apache Flume - 數(shù)據(jù)流
- Apache Flume - 環(huán)境
- Apache Flume - 配置
- Apache Flume - 獲取Twitter數(shù)據(jù)
- Apache Flume - 序列發(fā)生器源
- Apache Flume - NetCat Source
- Apache Flume - 有用的資源