MapReduce是一種編程模型,用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運(yùn)算。 概念"Map(映射)"和"Reduce(歸約)",是它們的主要思想...
術(shù)語又稱技術(shù)名詞、科學(xué)術(shù)語、科技術(shù)語或技術(shù)術(shù)語,是在特定專業(yè)領(lǐng)域中一般概念的詞語指稱,一個(gè)術(shù)語表示一個(gè)概念。研究術(shù)語的學(xué)科有術(shù)語學(xué)。由于文化差異...
Java HotSpot 虛擬機(jī)是 Java SE 平臺(tái)的一個(gè)核心組件。它實(shí)現(xiàn) Java 虛擬機(jī)規(guī)范,并作為 Java 運(yùn)行時(shí)環(huán)境中的一個(gè)共享庫...
JVM(Java Virtual Machine Java 虛擬機(jī))是一種用于計(jì)算設(shè)備的規(guī)范,基于這套規(guī)范,許多團(tuán)隊(duì)開發(fā)了多種不同的虛擬機(jī)實(shí)現(xiàn),...
ETL是英文Extract-Transform-Load 的縮寫,用來描述將數(shù)據(jù)從來源端經(jīng)過抽?。╡xtract)、轉(zhuǎn)換(transform)、...
大數(shù)據(jù)平臺(tái)通過將所有數(shù)據(jù)整合起來,充分分析與挖掘數(shù)據(jù)的內(nèi)在價(jià)值,為業(yè)務(wù)部門提供數(shù)據(jù)平臺(tái),數(shù)據(jù)產(chǎn)品與數(shù)據(jù)服務(wù)。大數(shù)據(jù)平臺(tái)接入的數(shù)據(jù)中可能包括很多用...
Scrapy吸引人的地方在于它是一個(gè)框架,任何人都可以根據(jù)需求方便的修改。它也提供了多種類型爬蟲的基類,如BaseSpider、sitemap爬...
Apache Spark 是專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎。Spark是UC Berkeley AMP lab (加州大學(xué)伯克利分...
Hive是建立在 Hadoop 上的數(shù)據(jù)倉庫基礎(chǔ)構(gòu)架。它提供了一系列的工具,可以用來進(jìn)行數(shù)據(jù)提取轉(zhuǎn)化加載(ETL),這是一種可以存儲(chǔ)、查詢和分析...