elasticsearch實踐-提升搜索準(zhǔn)確度

索引相關(guān)度

相關(guān)度評分背后的理論

  • 詞頻:詞在文檔出現(xiàn)頻度越高,權(quán)重越高
    因此:減少非關(guān)鍵詞的出現(xiàn)次數(shù)

  • 逆向文檔頻率:詞在全部文檔出現(xiàn)頻率越高,權(quán)重越低
    因此:標(biāo)題或者概要、問法要獨有

  • 字段長度歸一值:字段越短,字段的權(quán)重越高
    因此,標(biāo)題或者概要、問法要精短

  • 提煉業(yè)務(wù),不盲目增加關(guān)鍵詞,否則會造成誤召回

搜索

GET /_search
{
  "query": {
    "bool": {
      "should": [
        {
          "match": {
            "title": {
              "query": "quick brown fox",
              "boost": 2 
            }
          }
        },
        {
          "match": { 
            "content": "quick brown fox"
          }
        }
      ]
    }
  }
}
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容