elasticsearch全文檢索

示例：

1.準(zhǔn)備數(shù)據(jù)

使用kibana，準(zhǔn)備兩條數(shù)據(jù)

PUT /testindex/users/102
{
  "name":"zhangsan",
  "age":25
}
PUT /testindex/users/101
{
  "name":"ZHANgsan",
  "age":24
}

2.查詢示例

GET /testindex/users/_search
{
  "query": {
    "match": {
      "name":  "誰(shuí)是zhangsan啊"
    }
  }
}

我們發(fā)現(xiàn)兩條數(shù)據(jù)都被查詢了出來(lái)。那么es是如何實(shí)現(xiàn)的呢？

分析器（analyzer ）

官網(wǎng)描述.
概括來(lái)說(shuō)分析器一般有三部分組成，
1、字符過(guò)濾器（Character Filters）
2、分詞器（Tokenizers）
3、分詞過(guò)濾器（Token filters）

ES 給我們內(nèi)置了若干分析器類型。其中常用的是標(biāo)準(zhǔn)分析器，名稱叫做
"standard"。我們肯定需要擴(kuò)展，并使用一些第三方分析器。

不過(guò)我們得先了解標(biāo)準(zhǔn)分析器是怎么工作的。Anaylyzer通常由一個(gè)Tokenizer （怎么分詞），以及若干個(gè) TokenFilter（過(guò)濾分詞）、 Character Filters（過(guò)濾字符）組成。
下面我們使用具體例子來(lái)學(xué)習(xí)一下

1.標(biāo)準(zhǔn)分析器（es內(nèi)置）

POST _analyze
{
  "analyzer": "standard",
  "text": "誰(shuí)是zhangsan啊"
}

2.簡(jiǎn)單分析器

POST _analyze
{
  "analyzer": "simple",
  "text": "誰(shuí)是zHangsan啊"
}

3.標(biāo)準(zhǔn)分詞器(注意框選中的單詞)

POST _analyze
{
  "tokenizer": "standard",
  "text": "誰(shuí)是zhANgSan啊"
}

顯然僅僅使用標(biāo)準(zhǔn)分詞器并不能做到大小寫的忽略。

4.組合使用

POST _analyze
{
  "tokenizer": "standard",
  "filter": ["lowercase"], 
  "char_filter": ["html_strip"], 
  "text": "誰(shuí)是<b>zhANg</b>San啊"
}

在運(yùn)行結(jié)果中，我們看到他和我們預(yù)想的結(jié)果是一致的。我們使用的標(biāo)準(zhǔn)的分詞器（"tokenizer": "standard",）使中文和單詞分開(kāi)，使用小寫分詞過(guò)濾器（"filter": ["lowercase"], ）使單詞小寫化，使用字符過(guò)濾器（"char_filter": ["html_strip"], ）使text中的html標(biāo)簽過(guò)濾掉。最終的效果是和標(biāo)準(zhǔn)分析器("analyzer": "standard",)是一致的。

通過(guò)上面的例子，我們顯然可以知道，我們是可以根據(jù)自己的業(yè)務(wù)自定義分析器的。
我們自定義一個(gè)自己的分析器

PUT testindex
{
  "settings": 
  {
    "analysis": {
      "analyzer": {
        "my-analyzer":{
          "type":"custom",
          "tokenizer":"standard",
          "char_filter":["html_strip"],
          "filter":["lowercase"]
        }
      }
    }
  }
}

這樣執(zhí)行會(huì)報(bào)錯(cuò)，因?yàn)樗饕呀?jīng)存在了。而自定義分析器需要在索引建立之前建立。所以這樣又引出了我們要學(xué)習(xí)的另一個(gè)知識(shí)點(diǎn)：索引的備份和恢復(fù)。

索引的備份和恢復(fù)

我使用的是docker 拉取sebp/elk鏡像來(lái)搭建的。運(yùn)行容器正常之后，我們來(lái)進(jìn)行下面的操作。

1.配置elasticsearch.yml文件

進(jìn)入容器

docker exec -it elk /bin.bash

sudo vim  /opt/elasticsearch/config/elasticsearch.yml

//在配置文件最后加上,path.repo: /var/backups
path.repo: /var/backups

2.創(chuàng)建倉(cāng)庫(kù)

//創(chuàng)建倉(cāng)庫(kù)
PUT /_snapshot/mybak
{
  "type": "fs",
  "settings": {
    "location": "/var/backups/testindex"
  }
}
//查看倉(cāng)庫(kù)信息
GET /_snapshot/mybak

3.備份索引

//備份索引
PUT /_snapshot/mybak/bak1?wait_for_completion=true
{
  "indices": "testindex"
}

4.刪除索引和自定義分析器

#刪除索引
DELETE testindex

#自定義分析器
PUT testindex
{
  "settings": 
  {
    "analysis": {
      "analyzer": {
        "my-analyzer":{
          "type":"custom",
          "tokenizer":"standard",
          "char_filter":["html_strip"],
          "filter":["lowercase"]
        }
      }
    }
  }
}

5.備份和恢復(fù)

#備份恢復(fù)
#1.關(guān)閉索引
POST testindex/_close
#2.恢復(fù)
POST _snapshot/mybak/bak2/_restore?wait_for_completion=true
{
  "indices": "testindex"
}
#3.打開(kāi)索引
POST testindex/_open

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

自定義elasticsearch分析器(索引備份和恢復(fù))

自定義elasticsearch分析器(索引備份和恢復(fù))

elasticsearch全文檢索

1.準(zhǔn)備數(shù)據(jù)

2.查詢示例

分析器（analyzer ）

1.標(biāo)準(zhǔn)分析器（es內(nèi)置）

2.簡(jiǎn)單分析器

3.標(biāo)準(zhǔn)分詞器(注意框選中的單詞)

4.組合使用

索引的備份和恢復(fù)

1.配置elasticsearch.yml文件

2.創(chuàng)建倉(cāng)庫(kù)

3.備份索引

4.刪除索引和自定義分析器

5.備份和恢復(fù)

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

自定義elasticsearch分析器(索引備份和恢復(fù))

elasticsearch全文檢索

1.準(zhǔn)備數(shù)據(jù)

2.查詢示例

分析器（analyzer ）

1.標(biāo)準(zhǔn)分析器（es內(nèi)置）

2.簡(jiǎn)單分析器

3.標(biāo)準(zhǔn)分詞器(注意框選中的單詞)

4.組合使用

索引的備份和恢復(fù)

1.配置elasticsearch.yml文件

2.創(chuàng)建倉(cāng)庫(kù)

3.備份索引

4.刪除索引和自定義分析器

5.備份和恢復(fù)

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av