0x00 什么是hive hive是構(gòu)建在hadoop之上的數(shù)據(jù)倉庫組件,是目前大數(shù)據(jù)領(lǐng)域最常用的數(shù)據(jù)倉庫開源實現(xiàn)框架,hive定義了一種類sql語言,稱為hql,hive能...
hadoop面試問題,不定期更新 0x00 什么是hadoop 我們通常說的hadoop有兩種意思,一種是hadoop生態(tài)圈,包含hadoop、hive、hbase等組件,另...
整理的數(shù)倉的一些基本問題,不定期更新 0x01 什么是數(shù)據(jù)倉庫 數(shù)據(jù)倉庫是一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合 數(shù)據(jù)倉庫是將源系統(tǒng)數(shù)據(jù)抽取、轉(zhuǎn)化、清洗,...
0x00 前言 參加居士的數(shù)據(jù)挖掘?qū)W習(xí)小組,按周產(chǎn)出筆記,這周的學(xué)習(xí)內(nèi)容是 【數(shù)據(jù)的描述性統(tǒng)計】,按照居士的推薦,學(xué)習(xí)資料主要是【人人都會數(shù)據(jù)分析這本書】,這周的學(xué)習(xí)內(nèi)容主要...
0x00 前言 專欄這一講主要講解寫鏈表代碼的一些技巧,就我的經(jīng)驗來說,鏈表代碼寫起來很麻煩,主要是鏈表的指針指來指去就會變得很混亂,還有就是邊界問題的處理,使得鏈表的處理很...
1、前言 從各個業(yè)務(wù)線的數(shù)據(jù)到運營決策的報表,數(shù)據(jù)在流轉(zhuǎn)過程中,如何安全、高效、準(zhǔn)確的流轉(zhuǎn),這是數(shù)據(jù)倉庫需要解決的問題。 關(guān)于建模的方式主要有兩種流派,分別有兩本書 1、in...