亚洲精品日韩一区二区,婷婷的精选mp4,毛片国产伊人

spark-sql的優(yōu)化器是cost-based的嗎？

這是一個(gè)很有意思的問題。

大概兩年以前，剛開始準(zhǔn)備用spark-sql來做點(diǎn)事情的時(shí)候，抱著工欲善其事必先利其器的想法，大概看了看關(guān)于spark的那幾篇論文。

鄙人才疏學(xué)淺，其他的也看不太懂，但是對(duì)于cbo略知一二，所以下意識(shí)的就想看看spark-sql是怎么計(jì)算cost的，特別是spark對(duì)data geography的處理和我所了解的teradata 截然不同，想知道spark是怎么做的。

結(jié)果論文看了半天，發(fā)現(xiàn)對(duì)于cbo這一塊寫的及其含糊，讀了幾遍都不得要領(lǐng)，索性書看不懂去看看代碼唄，去github上翻了半天源代碼?之后，發(fā)現(xiàn)了這么一段：

/**

* Abstract class for transforming [[LogicalPlan]]s into physical plans.

* Child classes are responsible for specifying a list of [[GenericStrategy]] objects that

* each of which can return a list of possible physical plan options.

* If a given strategy is unable to plan all

* of the remaining operators in the tree, it can call [[planLater]], which returns a placeholder

* object that will be filled in using other available strategies.

*

* TODO: RIGHT NOW ONLY ONE PLAN IS RETURNED EVER...

*? ? ? PLAN SPACE EXPLORATION WILL BE IMPLEMENTED LATER.

*

*@tparamPhysicalPlanThe type of physical plan produced by this [[QueryPlanner]]

*/

是的，直到前兩天發(fā)布的2.2.版本之前，spark根本沒實(shí)現(xiàn)cbo,所有的優(yōu)化都是基于規(guī)則的，跟spark-sql那篇論文上寫的一點(diǎn)都不一樣。

如果有人只讀過論文沒實(shí)際去看過的話，是不可能知道這個(gè)問題的正確答案的。所以現(xiàn)在看到那些寫spark-sql 的 blog，很容易就知道水平了。

我打算下次碰見有人自稱精通spark的時(shí)候，就問問他這個(gè)問題 :-)

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

spark-sql 是 cbo 的嗎？

spark-sql 是 cbo 的嗎？

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

spark-sql 是 cbo 的嗎？

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

spark-sql 是 cbo 的嗎？