[Whoosh 搜索引擎之 二 ] Whoosh 簡介

Whoosh 簡介

關于 Whoosh

Whoosh 由 Matt Chaput 創(chuàng)建。 它最初是一個快速而雜亂 (dirty) 的搜索服務器,用于搜索 Houdini 3D 動畫軟件包的在線文檔。 Side Effects Software 慷慨地允許 Matt 開源代碼,以防它可能對需要非常靈活或純 Python 搜索引擎(或兩者!)的任何其他人有用。

  • Whoosh 速度很快,但只使用純 Python,因此它可以在任何 Python 運行的地方運行,而不需要編譯器。
  • 默認情況下,Whoosh 使用 Okapi BM25F 排名功能,但與大多數(shù)東西一樣,排名功能可以輕松定制。
  • 與許多其他搜索庫相比,Whoosh 創(chuàng)建的索引相當小。
  • Whoosh 中的所有索引文本都必須是 unicode。
  • Whoosh 允許您存儲帶有索引文檔的任意 Python 對象。

Whoosh 是什么?

Whoosh 是一個快速、純 Python 的搜索引擎庫。

Whoosh 的主要設計動力是它是純 Python。 您應該能夠在任何可以使用 Python 的地方使用 Whoosh,不需要編譯器或 Java。

與其祖先之一 Lucene 一樣,Whoosh 并不是一個真正的搜索引擎,它是一個用于創(chuàng)建搜索引擎的程序員庫 [1]。

實際上,Whoosh 的任何重要行為都不是硬編碼的。 文本索引、每個字段中每個術語存儲的信息級別、搜索查詢的解析、允許的查詢類型、評分算法等都是可定制的、可替換的和可擴展的。

[1] 當然可以在 Whoosh 之上構建交鑰匙搜索引擎,就像 Nutch 和 Solr 使用 Lucene 一樣。

Whoosh 能為您做什么?

Whoosh 讓您可以索引自由格式或結構化文本,然后根據(jù)簡單或復雜的搜索條件快速找到匹配的文檔。

獲得有關 Whoosh 的幫助

您可以在 Whoosh Bitbucket 頁面上查看未解決的問題,并在 Whoosh 郵件列表上獲得幫助。

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容