Bi-Encoder 與 Cross-Encoder

Bi-Encoder Cross-Encoder
主要功能 兩個(gè)句子分別傳入,分別輸出Embedding向量,計(jì)算兩個(gè)向量的余弦相似度最為兩個(gè)句子的相似度 兩個(gè)句子同時(shí)傳入,輸出一個(gè)0~1值,表示兩個(gè)句子的相似度
優(yōu)點(diǎn) 余弦相似度,計(jì)算速度快 1. 可以同時(shí)獲取兩個(gè)句子的語義信息,相似度計(jì)算結(jié)果效果好
2. 相似度結(jié)果控制在0~1,方便確認(rèn)閾值
缺點(diǎn) 相似程度通過距離遠(yuǎn)近對比獲得,無法確認(rèn)是否真的相關(guān);結(jié)果范圍廣,無法確定閾值 計(jì)算速度慢
使用場景 在數(shù)據(jù)量比較大的數(shù)據(jù)集中找到和某個(gè)句子相關(guān)的數(shù)據(jù) 在小范圍數(shù)據(jù)集中,獲取數(shù)據(jù)與某個(gè)句子的相似度得分
RAG 中的位置 用于數(shù)據(jù)檢索階段,從向量數(shù)據(jù)庫中獲取數(shù)據(jù) 用于重排序階段,計(jì)算檢索結(jié)果與用戶問題的相似度,用于排序或者過濾

Bi-Encoder 和 Cross-Encoder 原理示意圖

Bi-Encoder 和 Cross-Encoder 原理示意圖

Retrieve & Re-Rank Pipeline

結(jié)合 Bi-Encoder 和 Cross-Encoder

pipeline 示意圖

參考:

使用樣例:

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容