查看elasticsearch分詞處理效果

查詢1

POST /bank/_search
{
  "query": {
    "bool": {
      "must": {
       "term": {
         "firstname" : "Amber"
       }
      }
    }
  }
}

查詢1執(zhí)行得到結(jié)果1,找不到匹配結(jié)果

{
  "took" : 0,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 0,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  }
}

查詢2

POST /bank/_search
{
  "query": {
    "bool": {
      "must": {
       "term": {
         "firstname" : "amber"
       }
      }
    }
  }
}

查詢3

POST /bank/_search
{
  "query": {
    "bool": {
      "must": {
       "term": {
         "firstname.keyword" : "Amber"
       }
      }
    }
  }
}

查詢2和查詢3執(zhí)行得到結(jié)果2

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 6.5032897,
    "hits" : [
      {
        "_index" : "bank",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 6.5032897,
        "_source" : {
          "account_number" : 1,
          "balance" : 39225,
          "firstname" : "Amber",
          "lastname" : "Duke",
          "age" : 32,
          "gender" : "M",
          "address" : "880 Holmes Lane",
          "employer" : "Pyrami",
          "email" : "amberduke@pyrami.com",
          "city" : "Brogan",
          "state" : "IL"
        }
      }
    ]
  }
}

查詢1找不到匹配結(jié)果,而查詢2和查詢3可以得到結(jié)果2,用下面的查詢結(jié)果分析原因
查詢分詞結(jié)果:

Get /bank/_analyze
{
  "field":"firstname",
  "text":"Amber nihao  wohao"
}

分詞的結(jié)果:

{
  "tokens" : [
    {
      "token" : "amber",
      "start_offset" : 0,
      "end_offset" : 5,
      "type" : "<ALPHANUM>",
      "position" : 0
    },
    {
      "token" : "nihao",
      "start_offset" : 6,
      "end_offset" : 11,
      "type" : "<ALPHANUM>",
      "position" : 1
    },
    {
      "token" : "wohao",
      "start_offset" : 13,
      "end_offset" : 18,
      "type" : "<ALPHANUM>",
      "position" : 2
    }
  ]
}

通過分詞結(jié)果,可以看出,含有大寫字母的Amber分詞后,變成了amber,這也就是查詢2可以匹配結(jié)果,而查詢1匹配不到結(jié)果的原因。
最根本原因可以參考:https://segmentfault.com/q/1010000017312707

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 常用概念: 自然語言處理(NLP) 數(shù)據(jù)挖掘 推薦算法 用戶畫像 知識(shí)圖譜 信息檢索 文本分類 常用技術(shù): 詞級(jí)別...
    御風(fēng)之星閱讀 9,963評(píng)論 1 25
  • 轉(zhuǎn)載請(qǐng)注明:終小南 ? 中文分詞算法總結(jié) 什么是中文分詞眾所周知,英文是以 詞為單位的,詞和詞之間是靠空格隔開,而...
    kirai閱讀 10,078評(píng)論 3 24
  • 本文是對(duì)ElasticSearch中文分詞學(xué)習(xí)的一個(gè)知識(shí)總結(jié),包括如下章節(jié)的內(nèi)容: 基本概念 ik分詞器的安裝 i...
    我是老薛閱讀 30,373評(píng)論 6 15
  • 初次接觸 Elasticsearch 的同學(xué)經(jīng)常會(huì)遇到分詞相關(guān)的難題,比如如下這些場(chǎng)景: 為什么命名有包含搜索關(guān)鍵...
    rockybean閱讀 4,840評(píng)論 0 6
  • 一 我出生在北方內(nèi)陸的一個(gè)小城鎮(zhèn)里面。 那時(shí)的我見過最大的河流就只是小鎮(zhèn)旁邊的一條小河。彎彎曲曲的流向遠(yuǎn)方,遇...
    鄭少淵閱讀 1,661評(píng)論 0 4

友情鏈接更多精彩內(nèi)容