伊人在线久久久久久久,激情五月综合亚洲另类,只有这里精品99

GET /customer/_search
{
  "size": 0,
  "aggs": {
    "group_by_state": {
      "terms": {
        "field": "state.keyword"
      },0
      "aggs": {
        "group_by_gender": {
          "terms": {
            "field": "gender.keyword"
          },
          "aggs": {
            "avg_pri": {
              "avg": {
                "field": "balance"
              }
            }
          }
        }
      }
    },
    "avg_balance":{
      "avg": {
        "field": "balance"
      }
    }
  }
}

GET /customer/_search?size=0
{
  "aggs": {
    "avg_grade": {
      "avg": {
        "field": "balance"
      }
    }
  }
}

GET /customer/_search?size=0
{
  "aggs": {
    "avg_grade": {
      "avg": {
        "script": {
          "source": "doc.balance.value"
        }
      }
    }
  }
}

POST /customer/_search?size=0
{
    "aggs" : {
        "avg_corrected_grade" : {
            "avg" : {
                "field" : "balance",
                "script" : {
                    "lang": "painless",
                    "source": "_value * params.correction",
                    "params" : {
                        "correction" : 1
                    }
                }
            }
        }
    }
}

自定義分詞器

# 指定analyer進(jìn)行分詞校驗(yàn)
POST _analyze
{
  "analyzer": "ik_smart",
  "text": "這里是江西的師范大學(xué)"
}

# 指定字段進(jìn)行校驗(yàn)，得出檢索不出預(yù)期結(jié)果的原因
POST /test_index/_analyze
{
  "field": "name",
  "text": "Hello world"
}

# 指定char_filter和tokenizer
POST _analyze
{
  "tokenizer": "keyword",
  "char_filter": [
    "html_strip"
  ],
  "text": "<p>Hello&nbsp;World</p>"
}

# 在創(chuàng)建index時(shí)指定analyer
PUT test_index_1
{
  "settings": {
    "analysis": {
      "analyzer": {
        "my_custom_analyer": {
          "type": "custom",
          "char_filter": [
            "html_strip"
          ],
          "tokenizer": "standard",
          "filter": [
            "lowercase",
            "asciifolding"
          ]
        }
      }
    }
  }
}

# 自定義分詞器
PUT test_index_2
{
  "settings": {
    "analysis": {
      "analyzer": {
        "my_custom_analyer": {
          "type": "custom",
          "char_filter": [
            "emoticons"
          ],
          "tokenizer": "punctuation",
          "filter": [
            "lowercase",
            "english_stop"
          ]
        }
      },
      "tokenizer": {
        "punctuation": {
          "type": "pattern",
          "pattern": "[.,!?]"
        }
      },
      "char_filter": {
        "emoticons": {
          "type": "mapping",
          "mappings": [
            ":> => happy",
            ":< => sad",
            "cat => yjn"
          ]
        }
      },
      "filter": {
        "english_stop": {
          "type": "stop",
          "stopwords": "_english_"
        }
      }
    }
  }
}

POST test_index_2/_analyze
{
  "analyzer":"my_custom_analyer",
  "text": "cat.cat.cat"
}

PUT test_analyze
{
  "settings": {
    "analysis": {
      "analyzer": {
        "pinyin_test": {
          "char_filter": [
            "html_strip",
            "mymap",
            "mypattern"
          ],
          "tokenizer": "test_tokenizer"
        }
      },
      "tokenizer": {
        "test_tokenizer": {
          "type": "keyword"
        }
      },
      "char_filter": {
        "mymap": {
          "type": "mapping",
          "mappings": [
            "* => 我",
            "# => 愛",
            "^ => 你"
          ]
        },
        "mypattern": {
          "type": "pattern_replace",
          "pattern": "\\s+",
          "replacement": ""
        }
      }
    }
  }
}

GET test_analyze/_analyze
{
  "text": "<p>fkj<br>s<ajf>*ld#fk^^d</p>",
  "analyzer": "pinyin_test"
}

自定義Mapping

PUT test_index_3
{
    "mappings" : {
      "properties" : {
        "age" : {
          "type" : "long"
        },
        "name" : {
          "type" : "keyword"
        },
        "sex" : {
          "type" : "boolean"
        }
      }
    }
  }
  
GET /test_index_3/_mapping

自定義mapping和dynamic對新增字段的意義

dynamic值	結(jié)果
false	可以正常插入新字段數(shù)據(jù)，但是不會創(chuàng)建新字段
true	可以正常插入新字段數(shù)據(jù)，會創(chuàng)建新字段
"strict"	插入新的字段會報(bào)錯(cuò)

PUT my_index
{
  "mappings" : {
      "dynamic": true, 
      "properties" : {
        "age" : {
          "type" : "long"
        },
        "name" : {
          "type" : "keyword"
        },
        "sex" : {
          "type" : "boolean"
        }
      }
    }
}

GET my_index/_mapping

PUT my_index/_doc/1
{
  "name": "zjb",
  "title": "yjn"
}

GET my_index/_search

DELETE my_index

自定義mapping之index，字段能否被檢索

PUT my_index
{
  "mappings": {
    "properties": {
      "cookie": {
        "type": "text",
        "index": false
      }
    }
  }
}

PUT my_index/_doc/1
{
  "cookie": "name=zjb"
}

GET my_index/_search
{
  "query": {
    "match": {
      "cookie": "TEXT"
    }
  }
}

自定義mapping之copy_to

DELETE my_index

PUT my_index
{
  "mappings": {
    "properties": {
      "first_name":{
        "type": "text",
        "copy_to": "full_name"
      },
      "last_name":{
        "type":"text",
        "copy_to": "full_name"
      },
      "full_name":{
        "type": "text"
      }
    }
  }
}

POST my_index/_doc/1
{
  "first_name":"zhan",
  "last_name":"jinbing"
}

GET my_index/_search
{
  "query": {
    "match":{
      "full_name": {
        "query":"zhan jinbing",
        "operator": "or"
      }
    }
  }
}

自定義Mapping--index_options

index_options 用于控制倒排索引記錄的內(nèi)容，有如下4中配置
- docs只記錄 doc id
- freqs 記錄doc id 和 term frequencies
- positions 記錄 doc id、term frequencies和term position
- offsets 記錄 doc id、term frequencies、term position 和character offsets
text類型默認(rèn)配置 positions,其他默認(rèn)為 docs
記錄內(nèi)容越多，占用空間越大

自定義Mapping--null_value

當(dāng)字段遇到null值的處理策略，默認(rèn)為null，即空值，此時(shí)es會忽略該值?？梢酝ㄟ^設(shè)定該值設(shè)定字段的默認(rèn)值

PUT my_index
{
  "mappings": {
    "properties": {
      "first_name":{
        "type": "text",
        "null_value": "這是默認(rèn)值"
      }
    }
  }
}

自定義mapping--數(shù)據(jù)類型

多字段特性 multi-fields

允許對同一個(gè)字段采用不同的配置，比如分詞，常見例子如對人名實(shí)現(xiàn)拼音搜索，只需要在人名中新增一個(gè)子字段為pinyin即可

PUT my_index
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "fields": {
          "pinyin": {
            "type": "text",
            "analyzer": "pinyin"
          }
        }
      }
    }
  }
}

# 檢索方式
GET test_index/_search
{
  "query": {
    "match": {
      "username.pinyin": "hanhan"
    }
  }
}

# 配置多個(gè)附屬字段方便查詢
PUT test_index
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "fields": {
          "py_name": {
            "type": "text",
            "analyzer": "pinyin"
          },
          "ik_name": {
            "type": "text",
            "analyzer": "ik_smart"
          },
          "smartcn_name": {
            "type": "text",
            "analyzer": "smartcn"
          }
        },
        "analyzer": "keyword"
      }
    }
  }
}

這里要注意分詞器analyzer是要具有將文字轉(zhuǎn)拼音的功能的

配置多個(gè)查詢字段

自定義mapping之通過numeric_detection開啟字符串?dāng)?shù)值探測和dynamic_date_formats設(shè)置日期格式

Query

URI Search

通過url query參數(shù)來實(shí)現(xiàn)搜索，常用參數(shù)如下：
- q指定查詢的語句，語法為Query String Syntax
- df q 中不指定字段時(shí)默認(rèn)查詢的字段，如果不指定，es會查詢所有字段
- sort 排序
- timeout 指定超時(shí)時(shí)間，默認(rèn)不超時(shí)
- from，size用于分頁

GET /my_index/_search?q=alfred&df=user&sort=age:asc&from=4&size=10&timeout=1s

查詢user字段包含alfred的文檔，結(jié)果按照age升序排序，返回第5個(gè)-到第14個(gè)文檔，如果超過1s沒有結(jié)束，則超時(shí)結(jié)束

查看這個(gè)查詢es執(zhí)行的過程

布爾操作符

AND(&&) ，OR(||) ，NOT(!)
- name:(tom NOT lee) 查詢name中有tom但是沒有l(wèi)ee
- 注意大寫，不能小寫
+ -分別對應(yīng) must 和 must_not
- name: (tom +lee -alfred )
- name: ((lee && !alfred) || (tom && lee && !alfred))
- + 在 url中會被解析為空格，要使用encode后的結(jié)果才可以，為%2B

范圍查詢，支持?jǐn)?shù)值和日期

區(qū)間寫法，閉區(qū)間用[]，開區(qū)間用{}
- age: [1 TO 10]意為1<=age<=10
- age: [1 TO 10]意為1<=age<=10
- age:[1 TO ]意為age>=1
- age:[* TO 10]意為age<=10
算數(shù)符號寫法
- age: >= 1
- age:(>=1 && <=10)或者 age:(+>=1 +<=10)
通配符查詢
- ？代表1個(gè)字符，* 代表0或多個(gè)字符
  - name: t?m
  - name: tom*
  - name:t*m
通配符匹配執(zhí)行效率低，且占用較多內(nèi)存，不建議使用
如無特殊需求，不要將?/*放在最前面，這樣很吃內(nèi)存
正則表達(dá)式匹配
- name:/[mb]oat/ ===> +name:(moat boat)
模糊匹配 fuzzy query
- name: roam ~ 1
- 匹配與roam 差一個(gè) character 的詞，比如foam roams等
近似度查詢 proximity search
- "fox quick" ~ 5
- 以term為單位進(jìn)行差異比較，比如"quick fox" "quick brown fox"都會被匹配

Query DSL - 字段類查詢

全文匹配
- 針對text類型的字段進(jìn)行全文檢索，會對查詢語句先進(jìn)行分詞處理，如match、match_phrase等query類型
單詞匹配
- 不會對查詢的語句做分詞處理，直接去匹配字段的倒排索引，如term、terms，range等query類型
  
  term和match區(qū)別
  
  operator控制match匹配的方式

fuzziness 模糊一個(gè)character，（可以錯(cuò)一個(gè)，多一個(gè)，少一個(gè)）

GET test_index/_search
{
  "_source": "name",
  "profile": "true", 
  "query": {
    "match": {
      "name.py_name":{
        "query":  "占金兵1",
        "analyzer": "keyword",
        "fuzziness": 1
      }
    }
  }
}

minimum_should_match至少包含幾個(gè)

GET test/_search
{
  "query": {
    "match": {
      "name": {
        "query": "zhan jin bing1",
        "minimum_should_match": 2
      }
    }
  }
}

query_string

query_string就是URI方式的q，df就是default_field,也可以指定fields字段數(shù)組

query_string

Simple Query String Query

類似Query String，但是會忽略錯(cuò)誤的查詢語法，并且僅支持部分查詢語法
其常用的邏輯符號如下，不能使用AND、OR、NOT等關(guān)鍵詞：
- + 代指 AND
- | 代指OR
- - 代指NOT

Simple Query String Query

注意simple_query_string容錯(cuò)性很好

Term和Terms

match會對查詢的語句進(jìn)行分詞處理，但是有時(shí)候我們并不想查詢的詞被分詞處理，這時(shí)候就可以使用term和terms了

image.png

Range Query - Date Math

range查詢用于數(shù)值范圍和日期范圍的查詢

針對日期提供的一種更友好地計(jì)算方式，格式如下：
now - 1d：這里地now是基準(zhǔn)日期，也可以使用具體地日期來當(dāng)作基準(zhǔn)，比如2018-01-01，使用具體日期地時(shí)候要用||做隔離
計(jì)算公式，主要有如下3種，
+1h 加1個(gè)小時(shí)
-1d 減1天
/d 將時(shí)間舍入到天
可以使用的單位：
- y - year - 年
- M - month - 月
- w - week - 周
- d - day - 天
- h - hour - 時(shí)
- m - minute - 分
- s - second - 秒
  這里舉個(gè)例子：防止以后懵逼 = - =

假設(shè)now為 2018-01-02 12:00:00，那么如下的計(jì)算結(jié)果實(shí)際為：

計(jì)算公式	實(shí)際結(jié)果
now+1h	2018-01-02 13:00:00
now-1h	2018-01-02 11:00:00
now-1h/d	2018-01-02 00:00:00
2016-01-01`\|\|`+1M/d	2016-02-01 00:00:00

上面的公式不能有空格

GET test/_search
{
  "profile": true,
  "query": {
    "range": {
      "age": {
        "gte": 25,
        "lte": 29
      }
    }
  }
}

GET test/_search
{
  "query": {
    "range": {
      "birth": {
        "gte": "01/1990/10||+4y"
      }
    }
  }
}

Query DSL - 復(fù)合查詢

復(fù)合查詢是指包含字段類查詢或復(fù)合查詢的類型，主要包括以下幾類：
- constant_score query
- bool query
- dis_max query
- function_score query
- boosting query

Bool Query

布爾查詢由一個(gè)或多個(gè)布爾子句組成，主要包含如下4個(gè)：

子句key	說明
filter	只過濾符合條件的文檔，不計(jì)算相關(guān)性得分
must	文檔必須符合must中的所有條件，會影響相關(guān)性得分
must_not	文檔必須不符合must_not中的所有條件
should	文檔可以符合should中的條件，會影響相關(guān)性得分

bool格式

GET test/_search
{
  "query": {
   "bool": {
     "filter": {
       "term": {
         "name": "zhan"
       }
     }
   }
  }
}

GET test/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "name": "zjb"
          }
        },
        {
          "match": {
            "age": 22
          }
        }
      ]
    }
  }
}

GET test/_search
{
  "query": {
    "bool": {
      "must_not": [
        {
          "match": {
            "name": "zjb"
          }
        },
        {
          "match": {
            "age": 22
          }
        }
      ]
    }
  }
}


GET test/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "name": "zjb"
          }
        },
        {
          "match": {
            "age": 22
          }
        }
      ]
    }
  }
}

注意：當(dāng)只有should子句沒有must子句時(shí)，should子句是必須至少要匹配一個(gè)條件的document才會返回，當(dāng)有must子句時(shí)，只要滿足了must的條件就會返回，should子句中的條件可以不必滿足，滿不滿足只是對相關(guān)性得分有影響

Query Context VS Filter Context

當(dāng)一個(gè)查詢語句于Query或者Filter上下文時(shí)，es執(zhí)行的結(jié)果會不同，對比如下：

上下文類型	執(zhí)行類型	使用方式
Query	查找與查詢語句最匹配的文檔，對所有文檔進(jìn)行相關(guān)性算分并排序	* query * bool中的must和should
Filter	查詢與查詢語句相匹配的文檔	* bool 中的 filter 與 must_not * constant_score 中的filter

查詢匹配的數(shù)量`count`

GET test/_count
{
  "query": {
    "match_all": {
      
    }
  }
}

指定返回的`source`

GET test/_search
{
  "_source": false,
  "query": {
    "match_all": {}
  }
}
GET test/_search
{
  "_source": "name", 
  "query": {
    "match_all": {}
  }
}
GET test/_search
{
  "_source": ["name","age"], 
  "query": {
    "match_all": {}
  }
}
GET test/_search
{
  "_source": {
    "includes": "n*"
  }, 
  "query": {
    "match_all": {}
  }
}
GET test/_search
{
  "_source": {
    "includes": "n*",
    "excludes": "name"
  },
  "query": {
    "match_all": {}
  }
}

_source用法

分布式特性

es支持集群模式，是一個(gè)分布式系統(tǒng)，其好處主要有兩個(gè)：
- 增大系統(tǒng)容量，如內(nèi)存、磁盤、使得es集群可以支持PB級的數(shù)據(jù)
- 提高系統(tǒng)可用性，即使部分節(jié)點(diǎn)停止服務(wù)，整個(gè)集群依然可以正常服務(wù)
es集群由多個(gè)es實(shí)例組成
- 不同集群通過集群名字來區(qū)分，可通過cluster.name進(jìn)行修改，默認(rèn)為elasticsearch
- 每個(gè)es實(shí)例本質(zhì)上是一個(gè)JVM進(jìn)程，且有自己的名字，通過node.name進(jìn)行修改

安裝cerebro進(jìn)行可視化集群狀態(tài)監(jiān)控

啟動一個(gè)節(jié)點(diǎn)

運(yùn)行如下命令可以啟動一個(gè)es節(jié)點(diǎn)實(shí)例
- bin/elasticsearch -E cluster.name=集群名 -E node.name=節(jié)點(diǎn)名

不同的node需要不同的數(shù)據(jù)目錄和端口，如果在同一臺機(jī)器上部署多個(gè)實(shí)例，啟動節(jié)點(diǎn)時(shí)可以使用-Epath.data=數(shù)據(jù)目錄 -Ehttp.port=端口

PUT /stconvert/
{
  "settings": {
    "analysis": {
      "analyzer": {
        "tsconvert": {
          "tokenizer": "tsconvert"
        }
      },
      "char_filter": {
        "tsconvert": {
          "type": "stconvert",
          "convert_type": "t2s"
        }
      },
      "tokenizer": {
        "tsconvert": {
          "type": "stconvert",
          "delimiter": "#",
          "keep_both": false,
          "convert_type": "t2s"
        }
      },
      "filter": {
        "tsconvert": {
          "type": "stconvert",
          "delimiter": "#",
          "keep_both": false,
          "convert_type": "t2s"
        }
      }
    }
  }
}


GET stconvert/_analyze
{
  "tokenizer": "keyword",
  "filter": [
    "lowercase"
  ],
  "char_filter": [
    "tsconvert"
  ],
  "text": "擴(kuò)大寄生蜂離開的"
}

Fielddata vs DocValues

對比	FieldData	DocValues
創(chuàng)建時(shí)機(jī)	搜索時(shí)即時(shí)創(chuàng)建	索引時(shí)創(chuàng)建，與倒排索引創(chuàng)建時(shí)機(jī)一致
創(chuàng)建位置	JVM Heap	磁盤
優(yōu)點(diǎn)	不會占用額外的磁盤空間	不會占用Heap內(nèi)存
缺點(diǎn)	文檔過多時(shí)，即時(shí)創(chuàng)建會花過多時(shí)間，占用過多的Heap內(nèi)存	減慢索引的速度，占用額外的磁盤資源

image.png

GET _analyze
{
  "tokenizer": "whitespace",
  "filter": [
    {
      "type": "stop",
      "ignore_case": true,
      "stopwords": [
        "這",
        "個(gè)",
        "一",
        "是"
      ]
    },
    {
      "type": "synonym",
      "lenient": true,
      "expand": true,
      "synonyms": [
        "占金兵 => 易江南"
      ]
    }
  ],
  "text": "這 是 一 個(gè) 占金兵"
}

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

ElasticSearch學(xué)習(xí)筆記

ElasticSearch學(xué)習(xí)筆記

自定義分詞器

自定義Mapping

自定義mapping和dynamic對新增字段的意義

自定義mapping之copy_to

自定義Mapping--index_options

自定義Mapping--null_value

自定義mapping--數(shù)據(jù)類型

自定義mapping之通過numeric_detection開啟字符串?dāng)?shù)值探測和dynamic_date_formats設(shè)置日期格式

Query

URI Search

布爾操作符

范圍查詢，支持?jǐn)?shù)值和日期

Query DSL - 字段類查詢

fuzziness 模糊一個(gè)character，（可以錯(cuò)一個(gè)，多一個(gè)，少一個(gè)）

minimum_should_match至少包含幾個(gè)

相關(guān)性算分

相關(guān)性算分 - TF/IDF 模型

match_phrase

match_phrase slop

regexp 正則查詢

query_string

Simple Query String Query

Term和Terms

Range Query - Date Math

Query DSL - 復(fù)合查詢

Bool Query

Query Context VS Filter Context

查詢匹配的數(shù)量`count`

指定返回的`source`

分布式特性

啟動一個(gè)節(jié)點(diǎn)

Fielddata vs DocValues

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

ElasticSearch學(xué)習(xí)筆記

自定義分詞器

自定義Mapping

自定義mapping和dynamic對新增字段的意義

自定義mapping之copy_to

自定義Mapping--index_options

自定義Mapping--null_value

自定義mapping--數(shù)據(jù)類型

自定義mapping之通過numeric_detection開啟字符串?dāng)?shù)值探測和dynamic_date_formats設(shè)置日期格式

Query

URI Search

布爾操作符

范圍查詢，支持?jǐn)?shù)值和日期

Query DSL - 字段類查詢

fuzziness 模糊一個(gè)character，（可以錯(cuò)一個(gè)，多一個(gè)，少一個(gè)）

minimum_should_match至少包含幾個(gè)

相關(guān)性算分

相關(guān)性算分 - TF/IDF 模型

match_phrase

match_phrase slop

regexp 正則查詢

query_string

Simple Query String Query

Term和Terms

Range Query - Date Math

Query DSL - 復(fù)合查詢

Bool Query

Query Context VS Filter Context

查詢匹配的數(shù)量count

指定返回的source

分布式特性

啟動一個(gè)節(jié)點(diǎn)

Fielddata vs DocValues

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

范圍查詢，支持?jǐn)?shù)值和日期

fuzziness 模糊一個(gè)character，（可以錯(cuò)一個(gè)，多一個(gè)，少一個(gè)）

查詢匹配的數(shù)量`count`

指定返回的`source`