1. 創(chuàng)建鍵值對RDD ( Pair RDD)
RDD中可以包含任何類型的對象。其中,鍵值對是一種比較常見的RDD元素類型,在分組和聚合中經(jīng)常會用到。
首先在本地創(chuàng)建一個word.txt,然后上傳到hadoop目錄中。
方法a:從文件中加載,來創(chuàng)建鍵值對RDD
pyspark --queue 隊列名? ?[進入spark]
lines = sc.textFile("hadoop地址/word.txt") [加載文件到rdd中]
1. 創(chuàng)建鍵值對RDD ( Pair RDD)
RDD中可以包含任何類型的對象。其中,鍵值對是一種比較常見的RDD元素類型,在分組和聚合中經(jīng)常會用到。
首先在本地創(chuàng)建一個word.txt,然后上傳到hadoop目錄中。
方法a:從文件中加載,來創(chuàng)建鍵值對RDD
pyspark --queue 隊列名? ?[進入spark]
lines = sc.textFile("hadoop地址/word.txt") [加載文件到rdd中]