最近用大模型生成html報(bào)告,或者圖片。都遇到了加載慢的問題。然后核心就是引入 的echart庫的速度嗎。 國外的lib 基本默認(rèn)配置就是國外的源。需要我們手動設(shè)置一下。比如...
最近用大模型生成html報(bào)告,或者圖片。都遇到了加載慢的問題。然后核心就是引入 的echart庫的速度嗎。 國外的lib 基本默認(rèn)配置就是國外的源。需要我們手動設(shè)置一下。比如...
海量畫圖下的機(jī)器卡死 非常慢,線程級別服用chrome內(nèi)核,2000張圖把機(jī)器卡死了。 回退版本 網(wǎng)上看到很多人有遇到同樣的問題,high cpu,慢。我的版本plotly6...
python version 太新也是個(gè)問題 我的python是3.13版本。pip install torch 都不行。原來是太新了,沒有匹配的ERROR: Could n...
目前各家大模型廠商的API接口,基本上都是參照openai的接口格式,所以不管是chat/compelete,還是function-call接口格式都是一樣的,這個(gè)給不同廠家...
找重要的事件 比如給定一個(gè)主題,我們?nèi)≌倩厮夭?,然后把素材給到大模型,在prompt里面讓他挑選重要的事件,并總結(jié)。 效果上看,一般都會做的比較泛泛??偨Y(jié)的內(nèi)容可能也包含多個(gè)...
tool工具的使用 當(dāng)前只設(shè)定一個(gè)工作流,回答上市公司的問題,使用kimi模型,在agent 人設(shè)上要求所有問題使用工作流工具。 效果一般,agent第一步就是選擇工具,比如...
向量召回的先決條件 你的query 比較明確,越具體越好。 如果是比較泛的問題,比如 xxx公司怎么樣? 無論如何都不好召回。 這個(gè)時(shí)候需要好的改寫,將問題具體話,比如 從主...
步驟 cp /var/lib/mysql 到新的目錄 設(shè)置 mysql:mysql owner 設(shè)置 conf配置,看起來都o(jì)k。 service restart 就是起不來...
轉(zhuǎn)化成int8的模型 AutoGPTQ的方式量化:https://github.com/QwenLM/Qwen/issues/464[https://github.com/Q...
工具篇 嘗試各類文本生成的工具,從https://www.waytoagi.com/[https://www.waytoagi.com/]開始。 嘗試了阿里媽媽的營銷文本,選...
Autogent:1,適合將各個(gè)agent 拆分,組合和調(diào)用,主要在規(guī)劃層面。 實(shí)際上做的事情,類似與autogpt調(diào)用各個(gè)agent,未來可能有非常多的大量agent之后,...
最新的論文或者必看榜單 2023-RAG-非常全面: Retrieval-Augmented Generation for Large Language Models: A ...
背景 比如我們有比較確定的幾十類實(shí)體,并且每一類實(shí)體的值都是已知的,也就是在一個(gè)有限集合類做NER實(shí)體識別。 基于lucene的召回 把實(shí)體做成字典,比如 公司名,公司簡稱 ...
幻覺評測工具 factool https://github.com/GAIR-NLP/factool/issues[https://github.com/GAIR-NLP/f...
參考標(biāo)準(zhǔn) gpt4 作為目前公開的天花板,gpt4的價(jià)格可以作為一個(gè)參考 1000token應(yīng)該是英文,輸入token 0.03刀,也就是10K 一萬token=0.3刀=2...
現(xiàn)有方案 基本都是搜索的路子,將doc 中所有的文本進(jìn)行向量化,然后query,將query 做成向量,然后用相似性算法去召回段落來回答問題?,F(xiàn)有方案的缺點(diǎn): 缺失了很多文檔...
持續(xù)迭代的嵌入模型 論文: C-Pack: Packaged Resources To Advance General Chinese Embedding 測試效果看,比m3...