一、 Q&A Q1:什么是維度?維就可以相當于角度,當說按什么維度看數據就是你想從什么角度分析數據。Q2:什么是次留用戶,7日留存?次留用戶指的...
此篇內容:hive自定義函數UDF、UDTF,壓縮存儲方式,hive優(yōu)化、hive實際編程基本涵蓋了hive基礎及常用場景,輸出這篇單純是為了忘...
更多精彩好文首發(fā),盡在公眾號《大數據階梯之路》我是Akin,給大家整理了一些hive函數的高級用法,作為Hive進階系列文章第四篇,其中有些SQ...
更多精彩好文,盡在微信公眾號《大數據階梯之路》 一、數據倉庫工程師是什么 首先,我要聲明一點,數倉工程師不能有一個慣性思維,那便是把自己當成一個...
肝了幾個晚上,梳理總結了一份萬字長文超詳述hive企業(yè)級優(yōu)化文章,也整理了一份hive優(yōu)化總結思維導圖和hive優(yōu)化詳細PDF文檔,有需要可關注...
更多精彩好文,盡在微信公眾號《大數據階梯之路》 一、數據湖是什么 數據湖相當于一個匯集著來自各個異構數據源的原生態(tài)數據,不經過加工清洗數據,數據...
更多精彩好文,盡在微信公眾號《大數據階梯之路》 一、前言 大家好,我是Akin,考慮寫下這篇文章的時候我已在互聯(lián)網大數據領域工作了幾年,主要是給...
一、前言 hive優(yōu)化除了有hql語句邏輯優(yōu)化,hql參數調優(yōu)等等,還有一個不起眼的細節(jié)容易被忽視掉,那便是hive數倉模型表的存儲格式和壓縮方...
大家好,本篇聊一下數倉建設,講一下面試常遇到的主題域與主題劃分,更多精彩文章優(yōu)先從微信公眾號《大數據階梯之路》首發(fā),歡迎關注,公眾號回復:大數據...