1.HIve是什么?
-由facebook開(kāi)源,最初用于解決海量結(jié)構(gòu)化的日志數(shù)據(jù)統(tǒng)計(jì)問(wèn)題;2008年facebook把hive項(xiàng)目貢獻(xiàn)給Apache;ETL(Extraction-Transformation-Loading)數(shù)據(jù)抽取、加載、處理工具;
-構(gòu)建在Hadoop上的數(shù)據(jù)倉(cāng)庫(kù)框架,數(shù)據(jù)計(jì)算使用MapReduce,數(shù)據(jù)存儲(chǔ)使用HDFS
-設(shè)計(jì)目的是讓SQL技能良好,但Java技能較弱的分析師可以查詢(xún)海量數(shù)據(jù)
-Hive 定義了一種類(lèi) SQL 查詢(xún)語(yǔ)言——HQL(類(lèi)似SQL,但不完全相同)
通常用于進(jìn)行離線數(shù)據(jù)處理(采用MapReduce);
可認(rèn)為是一個(gè)HQL→MR的語(yǔ)言翻譯器