索引相關(guān)度
詞頻:詞在文檔出現(xiàn)頻度越高,權(quán)重越高
因此:減少非關(guān)鍵詞的出現(xiàn)次數(shù)逆向文檔頻率:詞在全部文檔出現(xiàn)頻率越高,權(quán)重越低
因此:標(biāo)題或者概要、問法要獨有字段長度歸一值:字段越短,字段的權(quán)重越高
因此,標(biāo)題或者概要、問法要精短提煉業(yè)務(wù),不盲目增加關(guān)鍵詞,否則會造成誤召回
搜索
- 區(qū)分查詢字段權(quán)重,標(biāo)題的權(quán)重要比內(nèi)容更高
查詢時權(quán)重提升
GET /_search
{
"query": {
"bool": {
"should": [
{
"match": {
"title": {
"query": "quick brown fox",
"boost": 2
}
}
},
{
"match": {
"content": "quick brown fox"
}
}
]
}
}
}