2024-03-05 dify二次開發(fā)記錄

  1. 文檔內(nèi)容增加-文件名稱在切分段內(nèi)容中。
  2. word文檔按格式切分,無(wú)格式按語(yǔ)義切分。
  3. 文檔中表格優(yōu)化,按json格式保存,保證內(nèi)容完整連貫。
  4. pdf文檔按語(yǔ)義切分。
  5. 文檔構(gòu)建QA對(duì)結(jié)構(gòu)優(yōu)化,保證對(duì)模型無(wú)壓力。
  6. 文檔構(gòu)建時(shí)創(chuàng)建摘要索引,保證召回率。
  7. 區(qū)分RAG回答與大模型兜底。
  8. 增加問(wèn)答效果評(píng)分。召回評(píng)分。
  9. 去掉dify版本校驗(yàn)邏輯,保證本地部署時(shí)訪問(wèn)不卡頓。
  10. 在自然段因超長(zhǎng)被切斷時(shí),塊上下文增加標(biāo)識(shí),在召回某塊時(shí)增加上下塊合并召回。
  11. 增加召回時(shí)圖片的聯(lián)代召回。
  12. 多知識(shí)庫(kù)時(shí)利用bert模型實(shí)現(xiàn)路由加速器,快速指定到特定知識(shí)庫(kù)召回。提升召回速度10倍。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • [toc] 數(shù)制與碼制 本章的重點(diǎn)是BCD代碼。難點(diǎn)是數(shù)制及其相互轉(zhuǎn)換。 本章要求學(xué)生掌握數(shù)制和編碼的基本運(yùn)算。 ...
    程序猿Cyinen閱讀 147評(píng)論 0 0
  • [TOC] 郵箱 郵箱:xiaodongzhang1025@gmail.com[mailto:xiaodongzh...
    車到山前必有路2021閱讀 1,972評(píng)論 0 1
  • rs_driver 是RoboSense雷達(dá)的基本驅(qū)動(dòng)程序。本文是rs_driver的源代碼解析文檔,原文地址在:...
    RonZheng2010閱讀 731評(píng)論 0 0
  • 效果大致如下(本來(lái)想上傳GIF圖的,可惜大于10M),還有下面的筆記是直接從MD復(fù)制過(guò)來(lái)的,有點(diǎn)丑,感興趣的可以看...
    JMX_dc51閱讀 646評(píng)論 0 0
  • ThreadPoolExecutor 是java線程池的默認(rèn)實(shí)現(xiàn)。本文從源代碼的角度來(lái)解析線程池,后續(xù)會(huì)出一個(gè)系列...
    冰殤之刃閱讀 1,009評(píng)論 0 1

友情鏈接更多精彩內(nèi)容