中文字幕一区 2区,久久精品123,无码后入日韩

Hive中bucket-mapjoin和smb-join的區(qū)別

1 bucket-mapjoin

1.1 條件
1） set hive.optimize.bucketmapjoin = true;
2）一個(gè)表的bucket數(shù)是另一個(gè)表bucket數(shù)的整數(shù)倍
3） bucket列 == join列
4）必須是應(yīng)用在map join的場(chǎng)景中

1.2 注意
1）如果表不是bucket的，只是做普通join。

2 smb-join（針對(duì)bucket mapjoin 的一種優(yōu)化）

2.1 條件
1）參數(shù)設(shè)置

set hive.auto.convert.sortmerge.join=true;
set hive.optimize.bucketmapjoin = true;
set hive.optimize.bucketmapjoin.sortedmerge = true;
set hive.auto.convert.sortmerge.join.noconditionaltask=true;

2）小表的bucket數(shù)=大表bucket數(shù)
3） Bucket 列 == Join 列 == sort 列
4）必須是應(yīng)用在bucket mapjoin 的場(chǎng)景中

2.2 注意事項(xiàng)
hive并不檢查兩個(gè)join的表是否已經(jīng)做好bucket且sorted，需要用戶自己去保證join的表，否則可能數(shù)據(jù)不正確。有兩個(gè)辦法

1）hive.enforce.sorting 設(shè)置為 true。
2）手動(dòng)生成符合條件的數(shù)據(jù)，通過(guò)在sql中用distributed c1 sort by c1 或者 cluster by c1
表創(chuàng)建時(shí)必須是CLUSTERED且SORTED，如下

create table test_smb_2(mid string,age_id string)
CLUSTERED BY(mid) SORTED BY(mid) INTO 500 BUCKETS;

3 smb-join: 即sorted merge join

smb-join基于sorted-merge的有序bucket可實(shí)現(xiàn)在map端完成join操作，可以有限地減少或避免shuffle的數(shù)據(jù)量。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點(diǎn)，簡(jiǎn)書(shū)系信息發(fā)布平臺(tái)，僅提供信息存儲(chǔ)服務(wù)。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

Hive中bucket-mapjoin和smb-join的區(qū)別

Hive中bucket-mapjoin和smb-join的區(qū)別

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

Hive中bucket-mapjoin和smb-join的區(qū)別

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av