CDH-Spark/2環(huán)境搭建(pyspark測試)

1,CDH的搭建可以參考

https://blog.csdn.net/q1370992706/article/details/79578444

2,在CDH安裝spark

沒有在CDH集成環(huán)境安裝spark

1)新建spark虛擬主機 :安裝spark環(huán)境,

? ? 1.1參考://blog.csdn.net/red_stone1/article/details/71330101

? ? 1.2 ping 各個CDH節(jié)點

2)拷貝cdh下hive-site.xml 到spark主機conf下

3)啟動spark-sql查看是否鏈接成功。

HIVE默認一個default庫,可先用HUE創(chuàng)建一個表

show databases;

use default;

show tables;

slelect * from xxTable;

3,ubuntu16.04 python2/3,pip安裝

????????https://blog.csdn.net/qq_31307013/article/details/79668453

4,安裝py4j,pyspark

? ? 換源:

????pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ pyspark

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容