基于Spark2.x新聞網(wǎng)大數(shù)據(jù)實(shí)時(shí)分析可視化系統(tǒng)項(xiàng)目

課程大綱

第一章:案例需求分析與設(shè)計(jì)

1. 全套課程內(nèi)容概述

2. 案例需求分析

3. 系統(tǒng)架構(gòu)設(shè)計(jì)

4. 系統(tǒng)數(shù)據(jù)流程設(shè)計(jì)

5. 集群資源規(guī)劃設(shè)計(jì)

第二章:linux環(huán)境準(zhǔn)備與設(shè)置

1. Linux系統(tǒng)常規(guī)設(shè)置

2. 克隆虛擬機(jī)并進(jìn)行相關(guān)的配置

3. 對(duì)集群中的機(jī)器進(jìn)行基本配置

第三章:Hadoop2.X分布式集群部署

1. Hadoop2.X版本下載及安裝

2. Hadoop2.X分布式集群配置

3. 分發(fā)到其他各個(gè)機(jī)器節(jié)點(diǎn)

4. HDFS啟動(dòng)集群運(yùn)行測(cè)試

5. YARN集群運(yùn)行MapReduce程序測(cè)試

6. 配置集群中主節(jié)點(diǎn)到各個(gè)機(jī)器的SSH無(wú)密鑰登錄

第四章:Zookeeper分布式集群部署

1. Zookeeper版本下載及安裝

2. 分布式集群配置及參數(shù)介紹

3. Zookeeper服務(wù)啟動(dòng)及測(cè)試

第五章:Hadoop2.X HA架構(gòu)與部署

1. HDFS-HA架構(gòu)原理介紹

2. HDFS-HA 詳細(xì)配置

3. HDFS-HA 服務(wù)啟動(dòng)及自動(dòng)故障轉(zhuǎn)移測(cè)試

4. YARN-HA架構(gòu)原理介紹

5. YARN-HA 詳細(xì)配置

6. YARN-HA 服務(wù)啟動(dòng)及自動(dòng)故障轉(zhuǎn)移測(cè)試?

第六章:HBase分布式集群部署與設(shè)計(jì)

1. 下載HBase版本并安裝

2. 分布式集群的相關(guān)配置

3. 啟動(dòng)依賴于Zookeeper和HDFS的兩個(gè)服務(wù)

4. 通過(guò)shell測(cè)試數(shù)據(jù)庫(kù)

5. 日志信息存儲(chǔ)需求分析及表的創(chuàng)建

第七章:Kafka分布式集群部署

1. 下載Kafka版本并安裝

2. Kafka集群配置

3. 啟動(dòng)Kafka依賴于Zookeeper的服務(wù)并進(jìn)行測(cè)試

第八章:Flume數(shù)據(jù)采集準(zhǔn)備

1. Flume節(jié)點(diǎn)服務(wù)設(shè)計(jì)

2. Flume版本下載安裝

3. Flume agent-1采集節(jié)點(diǎn)服務(wù)配置

4. Flume agent-2采集節(jié)點(diǎn)服務(wù)配置

第九章:Flume+HBase+Kafka集成與開(kāi)發(fā)

1. 下載Flume源碼并導(dǎo)入Idea開(kāi)發(fā)工具

2. 根據(jù)業(yè)務(wù)需求做采集入庫(kù)的程序設(shè)計(jì)

3. 自定義SinkHBase程序開(kāi)發(fā)

4. idea程序打包并部署

5. 官方Flume與HBase集成的參數(shù)介紹

6. Flume agent-3聚合節(jié)點(diǎn)與HBase集成的配置

7. 官方Flume與Kafka集成的參數(shù)介紹

8. Flume agent-3聚合節(jié)點(diǎn)與Kafka集成的配置

第十章:數(shù)據(jù)采集/存儲(chǔ)/分發(fā)完整流程測(cè)試

1. idea工具開(kāi)發(fā)數(shù)據(jù)生成模擬程序

2. 編寫啟動(dòng)Flume服務(wù)程序的shell腳本

3. 啟動(dòng)Flume采集相關(guān)的所有服務(wù)

4. 編寫腳本并啟動(dòng)Flume agent三臺(tái)采集節(jié)點(diǎn)服務(wù)

5. 編寫Kafka consumer執(zhí)行腳本并運(yùn)行

6. java開(kāi)發(fā)業(yè)務(wù)數(shù)據(jù)生成模擬器

7. 運(yùn)行模擬程序并通過(guò)HBase shell檢查數(shù)據(jù)

第十一章:MySQL安裝

1. 配置linux本地鏡像源

2. linux聯(lián)網(wǎng)安裝mysql數(shù)據(jù)庫(kù)

3. myql設(shè)置用戶連接權(quán)限

4. 分析業(yè)務(wù)需求并設(shè)計(jì)表結(jié)構(gòu)

5. 創(chuàng)建數(shù)據(jù)庫(kù)和與業(yè)務(wù)相關(guān)的表

第十二章:Hive與HBase集成進(jìn)行數(shù)據(jù)分析

1.Hive 概述

2.Hive 架構(gòu)設(shè)計(jì)

3.Hive 應(yīng)用場(chǎng)景

4.Hive 安裝部署

5.Hive與MySQL集成

6.Hive 服務(wù)啟動(dòng)與測(cè)試

7.根據(jù)業(yè)務(wù)創(chuàng)建表結(jié)構(gòu)

8.Hive與HBase集成進(jìn)行數(shù)據(jù)離線分析

第十三章:Cloudera HUE大數(shù)據(jù)可視化分析

1.Hue概述

2.Hue安裝部署

3.Hue基本配置與服務(wù)啟動(dòng)

4.Hue與HDFS集成

5.Hue與YARN集成

6.Hue與Hive集成

7.Hue與MySQL集成

8.Hue與HBase整合

9.對(duì)采集的數(shù)據(jù)進(jìn)行可視化分析

10.Hue使用的經(jīng)驗(yàn)總結(jié)

第十四章:Spark2.X環(huán)境準(zhǔn)備、編譯部署及運(yùn)行

1.Spark 概述

2.Spark 生態(tài)系統(tǒng)介紹

3.Spark2.X學(xué)習(xí)注意事項(xiàng)

4.Spark2.2源碼下載及編譯

5.Scala安裝及環(huán)境變量設(shè)置

6.Spark2.2本地模式運(yùn)行測(cè)試

7.Spark服務(wù)WEB監(jiān)控頁(yè)面

第十五章:基于IDEA環(huán)境下的Spark2.X程序開(kāi)發(fā)

1.Windows開(kāi)發(fā)環(huán)境配置與安裝

2.IDEA Maven工程創(chuàng)建與配置

3.開(kāi)發(fā)Spark Application程序并進(jìn)行本地測(cè)試

4.打Jar包并提交spark-submit運(yùn)行

第十六章:Spark2.X集群運(yùn)行模式

1.Spark幾種運(yùn)行模式介紹

2.Spark Standalone集群模式配置與運(yùn)行

3.Spark on YARN集群模式配置與運(yùn)行

第十七章:Spark2.X分布式彈性數(shù)據(jù)集

1.三大彈性分布式數(shù)據(jù)集介紹

2.Spark RDD概述與創(chuàng)建方式

3.Spark RDD五大特性

4.Spark RDD操作方式及使用

5.DataFrame創(chuàng)建方式及功能使用

6.DataSet創(chuàng)建方式及功能

7.數(shù)據(jù)集之前的對(duì)比與轉(zhuǎn)換

第十八章:Spark SQL快速離線數(shù)據(jù)分析

1.Spark SQL概述及特點(diǎn)

2.Spark SQL服務(wù)架構(gòu)

3.Spark SQL與Hive集成(spark-shell)

4.Spark SQL與Hive集成(spark-sql)

5.Spark SQL之ThirftServer和beeline使用

6.Spark SQL與MySQL集成

7.Spark SQL與HBase集成

第十九章:Spark Streaming實(shí)時(shí)數(shù)據(jù)分析

1.Spark Streaming功能介紹

2.NC服務(wù)安裝并運(yùn)行SparkStreaming

3.Spark Streaming服務(wù)架構(gòu)及工作原理

4.Spark Streaming編程模型

5.Spark Streaming讀取Socket流數(shù)據(jù)

6.Spark Streaming結(jié)果數(shù)據(jù)保存到外部數(shù)據(jù)庫(kù)

7.SparkStreaming與Kafka集成進(jìn)行數(shù)據(jù)處理

第二十章:Structrued Streaming業(yè)務(wù)數(shù)據(jù)實(shí)時(shí)分析

1.Structured Streaming 概述及架構(gòu)

2.Structured Streaming 編程模型

3.實(shí)時(shí)數(shù)據(jù)處理業(yè)務(wù)分析

4.Stuctured Streaming 與Kafka集成(一)

5.Stuctured Streaming 與Kafka集成(二)

6.Stuctured Streaming 與MySQL集成

7.基于結(jié)構(gòu)化流完成業(yè)務(wù)數(shù)據(jù)實(shí)時(shí)分析(一)

8.基于結(jié)構(gòu)化流完成業(yè)務(wù)數(shù)據(jù)實(shí)時(shí)分析(二)

9.基于結(jié)構(gòu)化流完成業(yè)務(wù)數(shù)據(jù)實(shí)時(shí)分析(三)

第二十一章:大數(shù)據(jù)Web可視化分析系統(tǒng)開(kāi)發(fā)

1.基于業(yè)務(wù)需求的WEB系統(tǒng)設(shè)計(jì)

2.下載Tomcat并創(chuàng)建Web工程

3.Web系統(tǒng)數(shù)據(jù)處理服務(wù)層開(kāi)發(fā)

4.基于WebSocket協(xié)議的數(shù)據(jù)推送服務(wù)開(kāi)發(fā)

5.基于Echart框架的頁(yè)面展示層開(kāi)發(fā)(一)

6.基于Echart框架的頁(yè)面展示層開(kāi)發(fā)(二)

7.工程編譯并打包發(fā)布

8.啟動(dòng)各個(gè)服務(wù)并展示最終項(xiàng)目運(yùn)行效果

下載地址:http://feixueteam.net/thread-2265-1-1.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容