Hive作為SQL on Hadoop最穩(wěn)定、應(yīng)用最廣泛的查詢引擎被大家所熟知。但是由于基于MapReduce,查詢執(zhí)行速度太慢而逐步引入其他的...
前言 數(shù)據(jù)時(shí)代,數(shù)據(jù)的多源集成和快速檢索查詢是第一步,配上數(shù)據(jù)分析及可視化才能算窺得大數(shù)據(jù)一角。 創(chuàng)建這個(gè)項(xiàng)目的主要目的一是對(duì)前期工作的一些總結(jié)...
文章導(dǎo)讀: 什么是RBO? 什么是CBO? 我們?cè)诠ぷ髦薪?jīng)常會(huì)聽到這樣的聲音:“SQL查詢慢?你給數(shù)據(jù)庫加個(gè)索引啊”。雖然加索引并不一定能解決問...
文章導(dǎo)讀: 什么是Calcite? Calcite的主要功能? 如何快速使用Calcite? 什么是Calcite Apache Calcite...
最近幾年IT技術(shù)的發(fā)展真的是日新月異,什么云計(jì)算、大數(shù)據(jù)、機(jī)器學(xué)習(xí)、AI等等名詞層出不窮。多數(shù)程序員內(nèi)心其實(shí)是恐慌的,我也時(shí)常會(huì)感到危機(jī)感。每每...
當(dāng)我們決定要自己動(dòng)手做一個(gè)Hadoop生態(tài)集群管理服務(wù)的時(shí)候我們已經(jīng)入了運(yùn)維的坑了。如果我們對(duì)于Hadoop生態(tài)集群管理服務(wù)到底有哪些功能,應(yīng)該...
前面我們提到了兩個(gè)比較火的Hadoop集群運(yùn)維管理工具 Ambari和Cloudera Manager。它們集安裝,配置,監(jiān)控于一身,對(duì)于Had...
現(xiàn)在想學(xué)習(xí)大數(shù)據(jù)肯定學(xué)習(xí)Hadoop,每個(gè)新手在學(xué)習(xí)Hadoop的時(shí)候都需要去安裝一個(gè)屬于自己的測試環(huán)境才能開始愉快的玩耍。但是Hadoop的發(fā)...
2018年4月30日HBase發(fā)布了2.0的Release版本。HBase的2.0版本承載了太多的Features,共包含4551個(gè)Issues...