大模型的壓測都是對流式接口進(jìn)行測試,大多是調(diào)用 sse,websock 和 openai sdk 這 3 種形式。流式接口就好像是在調(diào)用異步接口一樣(很像),需要我們通過輪詢的方式去分析每一個傳回來的包并做分析,如果是 openai sdk 的接口,那么交互起來還比較方便,因?yàn)?sdk 里把很多東西都封裝好了。 而如果是 websocket 和 sse 則比較麻煩,需要去分析包的內(nèi)容來判斷哪些是思考包,哪些是答案包,哪些是統(tǒng)計(jì)包,哪些是心跳包。處理起來就麻煩了很多。 為了簡單,我這里還是用 openai sdk 的格式給大家寫個 demo:
大模型性能測試2
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
相關(guān)閱讀更多精彩內(nèi)容
- 大語言模型技術(shù),主要從大模型微調(diào)、AI Agent智能體、RAG檢索增強(qiáng)生成、提示詞工程、多模態(tài)這5個方面進(jìn)行細(xì)化...
- 一、大模型性能測試的核心價值與挑戰(zhàn) 在AI技術(shù)快速發(fā)展的今天,大模型的性能直接影響用戶體驗(yàn)和商業(yè)價值。與傳統(tǒng)軟件不...
- 本文由45歲老架構(gòu)師尼恩分享,感謝作者,有修訂和重新排版。 1、引言 你有沒有想過,為什么 ChatGPT 的回答...
- 本文由阿里云望宸分享,原題“大模型推理主戰(zhàn)場:什么才是通信協(xié)議標(biāo)配?”,下文進(jìn)行了排版優(yōu)化和內(nèi)容修訂。 1、引言 ...
- 原文地址:https://alphahinex.github.io/2025/05/04/mindie-bench...