色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

<center id="w5jzu"><delect id="w5jzu"></delect></center>

^{<bdo id="w5jzu"></bdo>}

<rt id="w5jzu"><cite id="w5jzu"></cite></rt>

登錄注冊(cè)寫文章

1.5.1.4 Spark算子詳解(總覽)

1.5.1.4 Spark算子詳解(總覽)

總目錄：http://www.itdecent.cn/p/e406a9bc93a9

Hadoop - 子目錄：http://www.itdecent.cn/p/9428e443b7fd

算子的分類

從大方向來(lái)說(shuō)，算子有兩種類型，對(duì)應(yīng)著sparkRDD的兩種操作--轉(zhuǎn)換類型操作和動(dòng)作類型操作。也就是：

Transformation
轉(zhuǎn)換類型操作，這種變換并不觸發(fā)提交作業(yè)，完成作業(yè)中間過(guò)程處理。
Transformation算子是延遲計(jì)算的，也就是說(shuō)從一個(gè)RDD 轉(zhuǎn)換生成另一個(gè) RDD 的轉(zhuǎn)換操作不是馬上執(zhí)行，需要等到有 Action 操作的時(shí)候才會(huì)真正觸發(fā)運(yùn)算。
Action
動(dòng)作類型操作，這類算子會(huì)觸發(fā) SparkContext 提交 Job 作業(yè)。
Action 算子會(huì)觸發(fā) Spark 提交作業(yè)，并將數(shù)據(jù)輸出 Spark系統(tǒng)。

如果在細(xì)致劃分一下，轉(zhuǎn)換類型算子由兩種類型：針對(duì)于value數(shù)據(jù)的Transformation算子和針對(duì)K-V數(shù)據(jù)的Transformation算子。

Value數(shù)據(jù)類型的Transformation算子

輸入分區(qū)與輸出分區(qū)一對(duì)一型

map算子
flatMap算子
mapPartitions算子
glom算子

輸入分區(qū)與輸出分區(qū)多對(duì)一型

union算子
cartesian算子

輸入分區(qū)與輸出分區(qū)多對(duì)多型

grouBy算子

輸出分區(qū)為輸入分區(qū)子集型

filter算子
distinct算子
subtract算子
sample算子
takeSample算子

Cache型

cache算子
persist算子

Key-Value數(shù)據(jù)類型的Transfromation算子

輸入分區(qū)與輸出分區(qū)一對(duì)一

mapValues算子

對(duì)單個(gè)RDD或兩個(gè)RDD聚集

單個(gè)RDD聚集

combineByKey算子
reduceByKey算子
partitionBy算子

兩個(gè)RDD聚集

Cogroup算子

連接

join算子
leftOutJoin和 rightOutJoin算子

Action算子

無(wú)輸出

foreach算子

HDFS

saveAsTextFile算子
saveAsObjectFile算子

聚合算子

collect算子
collectAsMap算子
reduceByKeyLocally算子
lookup算子
count算子
top算子
reduce算子
fold算子
aggregate算子

最后編輯于：2020.03.29 18:04:40

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點(diǎn)，簡(jiǎn)書系信息發(fā)布平臺(tái)，僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

（轉(zhuǎn)）Spark常用算子講解
Spark的算子的分類從大方向來(lái)說(shuō)，Spark 算子大致可以分為以下兩類: 1）Transformation 變...
達(dá)微閱讀 947評(píng)論 0贊 6
Spark算子總結(jié)版
Spark的算子的分類從大方向來(lái)說(shuō)，Spark 算子大致可以分為以下兩類: 1）Transformation 變...
姚興泉閱讀 1,466評(píng)論 0贊 6

1.4　彈性分布式數(shù)據(jù)集
Spark大數(shù)據(jù)分析實(shí)戰(zhàn) 1.4彈性分布式數(shù)據(jù)集本節(jié)將介紹彈性分布式數(shù)據(jù)集RDD。Spark是一個(gè)分布式計(jì)算框架，...
Albert陳凱閱讀 954評(píng)論 0贊 0
Spark計(jì)算模型與I/O機(jī)制
Part 1 1. Spark計(jì)算模型 1.1 Spark程序模型首先通過(guò)一個(gè)簡(jiǎn)單的實(shí)例了解Spark的程序模型...
ZyZhu閱讀 2,466評(píng)論 0贊 1
Spark 基礎(chǔ)學(xué)習(xí)第一講：彈性分布式數(shù)據(jù)集RDD
引子任何一個(gè)概念的引入都是為了解決某種問(wèn)題，RDD亦然。關(guān)于RDD這個(gè)概念，先拋幾個(gè)問(wèn)題。為什么引入RDD這個(gè)...
陸云子安閱讀 2,090評(píng)論 1贊 7

友情鏈接更多精彩內(nèi)容

贊1贊

贊賞

手機(jī)看全文

双峰县| 通州区| 郓城县| 阳山县| 天祝| 日喀则市| 海兴县| 泰来县| 日照市| 沁源县| 河西区| 云和县| 宝鸡市| 古交市| 太康县| 北京市| 溧阳市| 安岳县| 于田县| 德惠市| 莱西市| 喜德县| 绵阳市| 龙里县| 长丰县| 隆昌县| 苍山县| 彭州市| 德庆县| 绥芬河市| 扎兰屯市| 锡林郭勒盟| 邹城市| 定陶县| 罗江县| 昆明市| 上虞市| 河南省| 宁武县| 岐山县| 平阴县|

<rt id="harmj"></rt>