需求:從性別、年齡、 職業(yè)、城市、居住年限,婚姻狀況等維度找到高質(zhì)量用戶,并查看高質(zhì)量用戶人群的占比,為其提供高價(jià)值消費(fèi)品 (定位高價(jià)值消費(fèi)品以...
投稿
需求:從性別、年齡、 職業(yè)、城市、居住年限,婚姻狀況等維度找到高質(zhì)量用戶,并查看高質(zhì)量用戶人群的占比,為其提供高價(jià)值消費(fèi)品 (定位高價(jià)值消費(fèi)品以...
使用場(chǎng)景 需要查找最近修改時(shí)間在指定范圍內(nèi)的hive表或者h(yuǎn)ive表的相關(guān)分區(qū),代碼如下:
日常檢查ETLjob時(shí)發(fā)現(xiàn)一段sql采用hive on mr執(zhí)行比hive on spark要快70%,與正常的認(rèn)知正好相反,所以對(duì)該sql進(jìn)行...
本文種記錄的大多是開源版本hive調(diào)優(yōu)方式 我也會(huì)補(bǔ)充TDH集群Inceptor的優(yōu)化方式 面試必備技能-HiveSQL優(yōu)化 Hive SQL基...
分桶字段選擇 進(jìn)行分桶之前需要對(duì)表的數(shù)據(jù)分布情況進(jìn)行大致的分析,一般遵循的原則為,選擇離散度高的字段進(jìn)行分桶??梢酝ㄟ^收集的數(shù)據(jù)特征,如Dist...
Hive的數(shù)學(xué)函數(shù)包含兩種,一種是內(nèi)嵌函數(shù),一種是由java定義的自定義函數(shù)。對(duì)于不懂Java的數(shù)據(jù)分析師,掌握Hive的內(nèi)嵌函數(shù)就顯得尤為重要...
一、安裝hive前提條件 hive運(yùn)行在hadoop集群上,所以先要確保你的hadoop集群已經(jīng)安裝完畢并且可正常啟動(dòng)運(yùn)行。如果沒安裝好hado...
前言: 針對(duì)有sql基礎(chǔ),剛熟悉linux界面,在此進(jìn)行hive的入門學(xué)習(xí)分享,文章結(jié)合網(wǎng)絡(luò)資料并加以細(xì)化步驟。本文步驟參照:https://w...
前言: 以sql為基礎(chǔ),利用題目進(jìn)行hive的語(yǔ)句練習(xí),逐步體會(huì)sql與hive的不同之處。本次練習(xí)題來(lái)源:https://www.cnblog...
前言: 以sql為基礎(chǔ),利用題目進(jìn)行hive的語(yǔ)句練習(xí),逐步體會(huì)sql與hive的不同之處。 題目用到hive的集合函數(shù),使用了collect_...