- 文檔內(nèi)容增加-文件名稱在切分段內(nèi)容中。
- word文檔按格式切分,無(wú)格式按語(yǔ)義切分。
- 文檔中表格優(yōu)化,按json格式保存,保證內(nèi)容完整連貫。
- pdf文檔按語(yǔ)義切分。
- 文檔構(gòu)建QA對(duì)結(jié)構(gòu)優(yōu)化,保證對(duì)模型無(wú)壓力。
- 文檔構(gòu)建時(shí)創(chuàng)建摘要索引,保證召回率。
- 區(qū)分RAG回答與大模型兜底。
- 增加問(wèn)答效果評(píng)分。召回評(píng)分。
- 去掉dify版本校驗(yàn)邏輯,保證本地部署時(shí)訪問(wèn)不卡頓。
- 在自然段因超長(zhǎng)被切斷時(shí),塊上下文增加標(biāo)識(shí),在召回某塊時(shí)增加上下塊合并召回。
- 增加召回時(shí)圖片的聯(lián)代召回。
- 多知識(shí)庫(kù)時(shí)利用bert模型實(shí)現(xiàn)路由加速器,快速指定到特定知識(shí)庫(kù)召回。提升召回速度10倍。
2024-03-05 dify二次開發(fā)記錄
最后編輯于 :
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
相關(guān)閱讀更多精彩內(nèi)容
- [toc] 數(shù)制與碼制 本章的重點(diǎn)是BCD代碼。難點(diǎn)是數(shù)制及其相互轉(zhuǎn)換。 本章要求學(xué)生掌握數(shù)制和編碼的基本運(yùn)算。 ...
- [TOC] 郵箱 郵箱:xiaodongzhang1025@gmail.com[mailto:xiaodongzh...
- rs_driver 是RoboSense雷達(dá)的基本驅(qū)動(dòng)程序。本文是rs_driver的源代碼解析文檔,原文地址在:...
- 效果大致如下(本來(lái)想上傳GIF圖的,可惜大于10M),還有下面的筆記是直接從MD復(fù)制過(guò)來(lái)的,有點(diǎn)丑,感興趣的可以看...
- ThreadPoolExecutor 是java線程池的默認(rèn)實(shí)現(xiàn)。本文從源代碼的角度來(lái)解析線程池,后續(xù)會(huì)出一個(gè)系列...