在進(jìn)行以下操作前,以經(jīng)在虛擬機(jī)中安裝了Hadoop集群環(huán)境。 下載解壓 將spark下載解壓到虛擬機(jī)中: 修改配置文件 以下命令進(jìn)入spark配...
投稿
在進(jìn)行以下操作前,以經(jīng)在虛擬機(jī)中安裝了Hadoop集群環(huán)境。 下載解壓 將spark下載解壓到虛擬機(jī)中: 修改配置文件 以下命令進(jìn)入spark配...
一、安裝虛擬機(jī) 點(diǎn)擊從光盤或映像中安裝,選擇創(chuàng)建虛擬機(jī)的鏡像 繼續(xù)下一步,點(diǎn)擊自定設(shè)置,修改虛擬機(jī)的名稱 打開虛擬機(jī)設(shè)置菜單打開虛擬機(jī)設(shè)置菜單....
一些命令:ifconfig命令:查看與配置網(wǎng)絡(luò)狀態(tài)命令ifconfig eth0 192.168.0.200 netmask 255.255.2...
Source API 以下scala代碼展示了幾種source類型: flink從kafka獲取源數(shù)據(jù) 首先pow文件需要添加如下依賴: 以下代...
Scala編寫批處理和流處理wordcount 這部分,我們在idea上使用Maven編寫Scala程序?qū)崿F(xiàn)批處理wordcount功能。 po...
環(huán)境搭建 1、測試Hadoop集群環(huán)境 首先我們已經(jīng)成功部署安裝了一個hadoop集群,然后本地可以連接到集群的Master節(jié)點(diǎn)。假設(shè)集群Mas...
概述 Sqoop是一款開源的工具,主要用于在Hadoop(Hive)與傳統(tǒng)的數(shù)據(jù)庫(mysql、postgresql…)間進(jìn)行數(shù)據(jù)的傳遞,可以將...
MySQL的安裝和部署 MySQL下載 hive的元數(shù)據(jù)一般存儲在MySQL中,所以我們需要先安裝一個MySQL: 如果centos報如下錯誤:...
什么是數(shù)據(jù)漂移 通常我們把從源系統(tǒng)同步進(jìn)入數(shù)倉的第一層數(shù)據(jù)稱為 ODS或者staging層數(shù)據(jù),接入層 。數(shù)據(jù)漂移是接入層數(shù)據(jù)的一個頑疾。 數(shù)據(jù)...
概念 消費(fèi)者和消費(fèi)組 kafka消費(fèi)者是消費(fèi)組的一部分,當(dāng)多個消費(fèi)者形成一個消費(fèi)組來消費(fèi)主題時,每個消費(fèi)者會接收到不同分區(qū)的消息。假設(shè)有一個T1...