Whoosh 簡介
關于 Whoosh
Whoosh 由 Matt Chaput 創(chuàng)建。 它最初是一個快速而雜亂 (dirty) 的搜索服務器,用于搜索 Houdini 3D 動畫軟件包的在線文檔。 Side Effects Software 慷慨地允許 Matt 開源代碼,以防它可能對需要非常靈活或純 Python 搜索引擎(或兩者!)的任何其他人有用。
- Whoosh 速度很快,但只使用純 Python,因此它可以在任何 Python 運行的地方運行,而不需要編譯器。
- 默認情況下,Whoosh 使用 Okapi BM25F 排名功能,但與大多數(shù)東西一樣,排名功能可以輕松定制。
- 與許多其他搜索庫相比,Whoosh 創(chuàng)建的索引相當小。
- Whoosh 中的所有索引文本都必須是 unicode。
- Whoosh 允許您存儲帶有索引文檔的任意 Python 對象。
Whoosh 是什么?
Whoosh 是一個快速、純 Python 的搜索引擎庫。
Whoosh 的主要設計動力是它是純 Python。 您應該能夠在任何可以使用 Python 的地方使用 Whoosh,不需要編譯器或 Java。
與其祖先之一 Lucene 一樣,Whoosh 并不是一個真正的搜索引擎,它是一個用于創(chuàng)建搜索引擎的程序員庫 [1]。
實際上,Whoosh 的任何重要行為都不是硬編碼的。 文本索引、每個字段中每個術語存儲的信息級別、搜索查詢的解析、允許的查詢類型、評分算法等都是可定制的、可替換的和可擴展的。
[1] 當然可以在 Whoosh 之上構建交鑰匙搜索引擎,就像 Nutch 和 Solr 使用 Lucene 一樣。
Whoosh 能為您做什么?
Whoosh 讓您可以索引自由格式或結構化文本,然后根據(jù)簡單或復雜的搜索條件快速找到匹配的文檔。
獲得有關 Whoosh 的幫助
您可以在 Whoosh Bitbucket 頁面上查看未解決的問題,并在 Whoosh 郵件列表上獲得幫助。