Hive SQL執(zhí)行計(jì)劃深度解析 - An342647823的專欄 - 博客頻道 - CSDN.NET
http://blog.csdn.net/an342647823/article/details/36385479
美團(tuán)網(wǎng)技術(shù)陳純大作,值得擁有。
Hive是基于Hadoop的一個(gè)數(shù)據(jù)倉庫系統(tǒng),在各大公司都有廣泛的應(yīng)用。美團(tuán)數(shù)據(jù)倉庫也是基于Hive搭建,每天執(zhí)行近萬次的Hive ETL計(jì)算流程,負(fù)責(zé)每天數(shù)百GB的數(shù)據(jù)存儲(chǔ)和分析。Hive的穩(wěn)定性和性能對(duì)我們的數(shù)據(jù)分析非常關(guān)鍵。
在幾次升級(jí)Hive的過程中,我們遇到了一些大大小小的問題。通過向社區(qū)的咨詢和自己的努力,在解決這些問題的同時(shí)我們對(duì)Hive將SQL編譯為MapReduce的過程有了比較深入的理解。對(duì)這一過程的理解不僅幫助我們解決了一些Hive的bug,也有利于我們優(yōu)化Hive SQL,提升我們對(duì)Hive的掌控力,同時(shí)有能力去定制一些需要的功能。