日韩欧美在线中文字幕,久久久免费看片

先上圖：

shuffle過(guò)程.png

shuffle的過(guò)程大致范圍是：map task開(kāi)始到reduce task開(kāi)始其中分成map端和reduce端

map端shuffle執(zhí)行順序
maptask 執(zhí)行過(guò)程中會(huì)不斷的產(chǎn)生數(shù)據(jù)。在這些數(shù)據(jù)開(kāi)始產(chǎn)生到最終完成經(jīng)歷的過(guò)程如下：
1. 分區(qū) partition?？梢酝ㄟ^(guò)Partitioner的子類來(lái)自定義分區(qū)行為。默認(rèn)是通過(guò)key的hashcode模除以reduce的任務(wù)數(shù)。分區(qū)的目的是平均reduce的處理任務(wù)
2. 緩存 buffer。map在內(nèi)存中有一個(gè)環(huán)形緩沖區(qū)，默認(rèn)是100M，它有個(gè)溢出比例spill percent可以設(shè)置，默認(rèn)是0.8，也就是說(shuō)80%的容量用來(lái)緩存，當(dāng)這部分容量滿了的時(shí)候會(huì)啟動(dòng)一個(gè)溢出線程進(jìn)行溢出操作，在溢出的過(guò)程中，仍然可以利用剩余的20%對(duì)新生產(chǎn)的數(shù)據(jù)進(jìn)行緩存。
3. 溢出 spill、排序 sort、combiner。當(dāng)緩存已滿時(shí)，溢出線程開(kāi)始啟動(dòng)前，需要對(duì)這80%的數(shù)據(jù)做快速排序。同時(shí)由于可能產(chǎn)生許多相同key的數(shù)據(jù)，例如：“aaa 1"、"aaa 1"、"aaa 1",如果job中指定了combiner，則可以先進(jìn)行相同key的合并，得到 ”aaa 3"這樣的結(jié)果，這樣可以對(duì)結(jié)果進(jìn)行優(yōu)化。需要注意的是使用combiner時(shí)必須是reduce的輸入和輸出類型一致，且不會(huì)影響最終結(jié)果。combiner其實(shí)可以看做是一個(gè)map端的reducer。一個(gè)溢出線程完成時(shí)會(huì)產(chǎn)生一個(gè)已經(jīng)排序、combiner優(yōu)化（combiner過(guò)程可選）并且包含分區(qū)信息的臨時(shí)文件。
4. 合并 merge。當(dāng)map任務(wù)執(zhí)行完后，如果數(shù)據(jù)量不是太小，會(huì)生成多個(gè)臨時(shí)的溢出文件，假設(shè)臨時(shí)文件如下：splill1("aaa 1" "bbb 3")、spill2("aaa 3" "bbb 5")、spill3("aaa 5 "bbb 2")。因?yàn)槊總€(gè)map task生成的最終文件只有一個(gè)，因此會(huì)對(duì)這些臨時(shí)文件進(jìn)行merge,這個(gè)過(guò)程中會(huì)使用歸并排序，并且如果指定了combiner,也會(huì)進(jìn)行combiner的操作。merge后的結(jié)果{"aaa",[1,3,5]}、{“bbb",[3,5,2]},如果指定了combiner對(duì)結(jié)果相加的話，那么結(jié)果是{”aaa",9}{"bbb",10}。merge完成會(huì)得到最終的文件
reduce端
當(dāng)有map task完成后，yarn會(huì)告知reducer拉取(fetch)任務(wù)，在所有的map任務(wù)完成之前，reducer都是在重復(fù)的拉取數(shù)據(jù)、merge。過(guò)程如下：
1. copy過(guò)程。啟動(dòng)copy線程(Fetcher)拉取數(shù)據(jù)
2. merge階段。和map端的merge類似，只是數(shù)據(jù)的來(lái)源是從不同map端copy過(guò)來(lái)的。copy過(guò)來(lái)的數(shù)據(jù)也會(huì)首先進(jìn)入內(nèi)存緩存，只是這里的內(nèi)存大小要比map端的更靈活，它基于JVM的heap size設(shè)置。當(dāng)copy數(shù)據(jù)過(guò)來(lái)時(shí)，就會(huì)進(jìn)入內(nèi)存緩存，內(nèi)存緩存滿了就溢出成臨時(shí)文件，溢出過(guò)程同map端，當(dāng)所有map任務(wù)結(jié)束后，所有的溢出文件merge成最終文件。

至此。shuffle過(guò)程結(jié)束。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

hadoop中shuffle過(guò)程詳解

hadoop中shuffle過(guò)程詳解

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

hadoop中shuffle過(guò)程詳解

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av