【百度云搜索,搜各種資料:http://bdy.lqkweb.com】
【搜網(wǎng)盤,搜各種資料:http://www.swpan.cn】
倒排索引
倒排索引源于實際應(yīng)用中需要根據(jù)屬性的值來查找記錄。這種索引表中的每一項都包括一個屬性值和具有該屬性值的各記錄的地址。由于不是由記錄來確定屬性值,而是由屬性值來確定記錄的位置,因而稱為倒排索引(inverted index)。帶有倒排索引的文件我們稱為倒排索引文件,簡稱倒排文件(inverted file)。
倒排索引原理
就是將一句話進行分詞并記錄分詞所存在的文章,當用戶搜索詞時可以直接查找到當前詞所存在的文章

image
倒排索引分詞權(quán)重記錄(詞瓶)

image
分詞權(quán)重記錄,是通過(TF-IDF)來實現(xiàn)的,詳情https://baike.so.com/doc/433640-459181.html
倒排索引待解決的問題
這些問題elasticsearch(搜索引擎)已經(jīng)解決

image