CarbonData Carbon Thrift Server集成OSS - 環(huán)境搭建

1、基礎(chǔ)環(huán)境

見:CarbonData集成OSS - 基礎(chǔ)環(huán)境搭建

2、spark環(huán)境

cd ~
wget http://archive.apache.org/dist/spark/spark-2.2.1/spark-2.2.1-bin-hadoop2.7.tgz
tar -xzvf spark-2.2.1-bin-hadoop2.7.tgz

sudo vim /etc/profile
#增加spark home
export SPARK_HOME=/home/carbondata/spark-2.2.1-bin-hadoop2.7 
source /etc/profile

cd  spark-2.2.1-bin-hadoop2.7 && mkdir carbonlib && cd ~
cp ./carbondata/assembly/target/scala-2.11/apache-carbondata-1.6.0-SNAPSHOT-bin-spark2.2.1-hadoop2.7.2.jar ./spark-2.2.1-bin-hadoop2.7/carbonlib/
cp ./carbondata/conf/carbon.properties.template ./spark-2.2.1-bin-hadoop2.7/conf/
cd $SPARK_HOME
tar -zcvf carbondata.tar.gz carbonlib/
mv carbondata.tar.gz carbonlib/
mv ./conf/carbon.properties.template ./conf/carbon.properties
mv ./conf/spark-defaults.conf.template ./conf/spark-defaults.conf
mv ./conf/spark-env.sh.template ./conf/spark-env.sh
cp ~/hadoop-2.7.2/share/hadoop/tools/lib/aws-java-sdk-1.7.4.jar ~/spark-2.2.1-bin-hadoop2.7/jars/
cp ~/hadoop-2.7.2/share/hadoop/tools/lib/hadoop-aws-2.7.2.jar ~/spark-2.2.1-bin-hadoop2.7/jars/

3、配置carbondata和spark

1) carbon.properties
在carbon.properties中增加配置store location

carbon.storelocation=s3a://demo20190203/carbon/data/store
  1. spark-defaults.conf
    在spark-defaults.conf中增加如下配置
spark.driver.extraJavaOptions -Dcarbon.properties.filepath=$SPARK_HOME/carbon.properties
spark.executor.extraJavaOptions -Dcarbon.properties.filepath=$SPARK_HOME/carbon.properties
spark.master yarn-client
spark.yarn.dist.files conf/carbon.properties
spark.yarn.dist.archives carbonlib/carbondata.tar.gz
spark.executor.extraClassPath carbondata.tar.gz/carbonlib/*
spark.driver.extraClassPath $SPARK_HOME/carbonlib/*

3)spark-env.sh
在spark-env.sh中增加如下配置

export SPARK_CLASSPATH=$SPARK_CLASSPATH:$SPARK_HOME/carbonlib/*:/home/carbondata/hadoop-2.7.2/share/hadoop/tools/lib/*
export HADOOP_HOME=/home/carbondata/hadoop-2.7.2
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
  1. 創(chuàng)建hdfs carbondata臨時目錄
hadoop fs -mkdir /tmp
hadoop fs -mkdir /tmp/carbondata
hadoop fs -chmod -R 777 /tmp/carbondata

4、準(zhǔn)備sample.csv

cd ~
vim sample.csv
#拷貝如下內(nèi)容
id,name,city,age
1,david,shenzhen,31
2,eason,shenzhen,27
3,jarry,wuhan,35

#上傳sample.csv
hadoop fs -put ./sample.csv /tmp
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容