上一篇主要講解什么是 URL Search 和 Request Body Search 的語法。本篇對 Mapping 的 Dynamic Mapping 以及手動創(chuàng)建 Ma...
上一篇主要講解什么是 URL Search 和 Request Body Search 的語法。本篇對 Mapping 的 Dynamic Mapping 以及手動創(chuàng)建 Ma...
本節(jié)主要講解 Elasticsearch 的 搜索相關(guān)功能 Search-API,講解什么是 URL Search 和 Request Body Search 的語法,對常用...
上一篇,什么是倒排索引以及原理是什么。本篇講解 Analyzer,了解 Analyzer 是什么 ,分詞器是什么,以及 Elasticsearch 內(nèi)置的分詞器,最后再講解中...
上一篇,我們介紹了 ES 文檔的基本 CURE 和批量操作。我們都知道倒排索引是搜索引擎非常重要的一種數(shù)據(jù)結(jié)構(gòu),什么是倒排索引,倒排索引的原理是什么。 1 索引過程 在講解倒...
上一篇,我們介紹了什么是 Elasticsearch,它能做什么用以及基本概念(索引 Index、文檔 Document、類型 Type)理解。這篇主要對文檔的基本 CRUD...
最近我在 Github 上查找一個(gè)可以快速開發(fā) excel 導(dǎo)入導(dǎo)出工具,偶然發(fā)現(xiàn)由阿里開發(fā) easyexcel 開源項(xiàng)目,嘗試使用后感覺這款工具挺不錯(cuò)的,下面分享一下我的 ...
本篇文章對 Elasticsearch 做了基本介紹,在后續(xù)將通過專欄的方式持續(xù)更新,本系列以 Elasticsearch7 作為主要的講解版本,歡迎各位大佬指正,共同學(xué)習(xí)進(jìn)...
Redis 經(jīng)常用于系統(tǒng)中的緩存,可以極大地提高了系統(tǒng)性能和效率,但同時(shí)也帶來一些問題。一個(gè)是數(shù)據(jù)一致性問題。從嚴(yán)格意義上講,只要使用緩存,就會出現(xiàn)一致性問題,這是無法解決的...
現(xiàn)在大多數(shù)開發(fā)人員都會聽說過 Redis。Redis 是目前市場上最好的開源內(nèi)存 NoSQL 數(shù)據(jù)庫之一。它為前端以及后端服務(wù)(如鍵值查找,隊(duì)列,哈希等)提供了非常多的幫助。...
迄今,相信大家肯定聽說過 HBase,但是對于 HBase 的了解可能僅僅是它是 Hadoop 生態(tài)圈重要的一員,是一個(gè)大數(shù)據(jù)相關(guān)的數(shù)據(jù)庫技術(shù)。今天我?guī)銈円黄痤I(lǐng)略一下 HB...
如果你關(guān)注大數(shù)據(jù)科技動向,你對 NoSQL 一定不陌生,NoSQL 是一個(gè)分布式數(shù)據(jù)庫。在過去時(shí)間,數(shù)據(jù)存儲一直關(guān)系型數(shù)據(jù)庫天下,有著良好的控制并發(fā)操作、事務(wù)功能。雖然RDB...
一. Hadoop Yarn 是什么 在古老的 Hadoop1.0 中,MapReduce 的 JobTracker 負(fù)責(zé)了太多的工作,包括資源調(diào)度,管理眾多的 TaskTr...
一、什么是 Apache Hive? Apache Hive 是一個(gè)基于 Hadoop Haused 構(gòu)建的開源數(shù)據(jù)倉庫系統(tǒng),我們使用它來查詢和分析存儲在 Hadoop 文件...
1. 概述 在 Google 三篇大數(shù)據(jù)論文發(fā)表之后,Cloudera 公司在這幾篇論文的基礎(chǔ)上,開發(fā)出了現(xiàn)在的 Hadoop 。但 Hadoop 開發(fā)出來也并非一帆風(fēng)順的,...
學(xué)習(xí)了
Mysql 流增量寫入 Hdfs(二) --Storm + hdfs 的流式處理一. 概述 上一篇我們介紹了如何將數(shù)據(jù)從 mysql 拋到 kafka,這次我們就專注于利用 storm 將數(shù)據(jù)寫入到 hdfs 的過程,由于 storm 寫入 hdfs 的...