24
10
2
4137
12
3
Shuffle分類 一個作業(yè)經過spark的DAGSchedule調度器劃分為多個stage,同時有些下游的stage依賴上游的stage,這樣...
RDD是什么 RDD(Resilient Distributed Datasets)可擴展的彈性分布式數(shù)據(jù)集,rdd是spark最基本的數(shù)據(jù)抽象...