我們在實際的 AI 應(yīng)用不斷演進的過程中,“多智能體”幾乎成為一個必然話題。
很多系統(tǒng)開始引入:
- 多個 Agent 分工執(zhí)行任務(wù)
- Agent 之間相互對話
- 不同 Agent 處理不同領(lǐng)域問題
在實際工程實踐中,我逐漸意識到一個問題: 多智能體本身并不能解決復(fù)雜性問題。
甚至在很多情況下,“多智能體”會引入更多不確定性。于是我開始重新思考:
多智能體的核心問題,不是“有多少個 Agent”,而是“誰來調(diào)度這些 Agent”。
這也是 OpenVitamin(https://github.com/fengzhizi715/OpenVitamin) 在設(shè)計 Agent 系統(tǒng)時的核心出發(fā)點。
一、為什么單 Agent 很快會失控
在最初的 AI 應(yīng)用設(shè)計中,我們通常從單 Agent 開始:
- 一個 Prompt
- 一組工具
- 一段對話上下文
這種模式在簡單任務(wù)中非常有效,但隨著任務(wù)復(fù)雜度增加,很快會遇到瓶頸:
1. Prompt 復(fù)雜度爆炸
所有邏輯都堆在一個 Prompt 里:決策、工具選擇、錯誤處理等等,很難維護。
2. 能力耦合嚴(yán)重
一個 Agent 同時負責(zé):
- 代碼生成
- 文件操作
- 測試執(zhí)行
- 錯誤修復(fù)
導(dǎo)致系統(tǒng)難以擴展。
3. 行為不可預(yù)測
隨著工具和上下文增加:
- 決策路徑不可控
- Debug 成本極高
最終會出現(xiàn)一個典型現(xiàn)象:
Agent 越“強”,系統(tǒng)越“亂”。
二、多智能體的三種常見形態(tài)
在開發(fā)實踐中,我總結(jié)了多智能體常見的三種模式:
1?? 并行型(Parallel Agents)
多個 Agent 同時執(zhí)行任務(wù),然后匯總結(jié)果。
例如:
- 多個模型同時回答問題
- 多個 Agent 分別分析不同數(shù)據(jù)源
優(yōu)點:簡單
缺點:不能解決復(fù)雜任務(wù)編排問題
2?? 協(xié)作型(Collaborative Agents)
Agent 之間互相對話:
- A 提問
- B 回答
- 再循環(huán)
優(yōu)點:靈活
缺點:
- 不可控
- 成本高
- 難調(diào)試
- 難復(fù)現(xiàn)
3?? 調(diào)度型(Orchestrated Agents)
這是 OpenVitamin 當(dāng)前采用的模式:
- 主 Agent 負責(zé)決策
- 子 Agent 負責(zé)執(zhí)行
- 有明確的調(diào)用關(guān)系
它的本質(zhì)是:
用“調(diào)度系統(tǒng)”替代“自由對話”。
三、OpenVitamin 的多智能體設(shè)計(當(dāng)前階段)
當(dāng)前的 OpenVitamin 的多智能體能力,可以總結(jié)為兩點:
1. Agent Routing(自動選擇智能體)
在 Chat 場景中,系統(tǒng)會自動選擇最合適的 Agent。整體流程如下:

這個機制解決的問題是:
不需要用戶手動選擇 Agent,系統(tǒng)可以自動路由。
2. Agent Delegation(主 Agent 調(diào)用子 Agent)
在復(fù)雜任務(wù)中,一個 Agent 不再獨立完成所有事情,而是可以調(diào)用其他 Agent。
例如一個編程場景:

在這個模型中:
- 主 Agent 負責(zé)任務(wù)拆解
- 多個子 Agent 負責(zé)具體執(zhí)行
四、為什么我們沒有采用“Agent 互相對話”
很多“多智能體系統(tǒng)”強調(diào):Agent ? Agent 對話
但在工程實踐中,這種方式也會有明顯問題:
- 調(diào)用路徑不可預(yù)測
- Token 成本不可控
- Debug 難度極高
- 執(zhí)行結(jié)果不穩(wěn)定
因此 OpenVitamin 選擇了一條不同的路徑:
用“結(jié)構(gòu)化調(diào)度”替代“自由對話”。
五、統(tǒng)一執(zhí)行模型:Agent 只是 Step 的一種類型
在 OpenVitamin 中,多智能體最終會落到統(tǒng)一執(zhí)行模型:

關(guān)鍵點在于:
Agent 并不是特殊存在,而是執(zhí)行單元的一種。
這會帶來幾個好處:
- 統(tǒng)一調(diào)度
- 統(tǒng)一追蹤
- 統(tǒng)一治理
六、當(dāng)前階段 vs 未來演進
這篇文章介紹的是 OpenVitamin 的當(dāng)前階段設(shè)計。
當(dāng)前能力
- Agent Routing(自動選擇)
- Agent Delegation(主從調(diào)用)
OpenVitamin 當(dāng)前階段的 Agent Orchestration 架構(gòu)圖

下一階段(正在設(shè)計)
OpenVitamin 將逐步演進到:
- 多 Agent 并行執(zhí)行
- Event-driven Orchestration
- Agent Memory
- Agent Graph
最終目標(biāo)是:
實現(xiàn)“自治編排系統(tǒng)”(Autonomous Orchestration)
七、總結(jié)
多智能體的本質(zhì),從來不是“多個 Agent”。
而是:
誰來決定,什么時候調(diào)用哪個 Agent。
OpenVitamin 當(dāng)前的設(shè)計選擇是:
- 用 Routing 解決選擇問題
- 用 Delegation 解決協(xié)作問題
- 用統(tǒng)一執(zhí)行模型解決復(fù)雜度問題
這只是第一步,多智能體不是終點,而是起點。
項目地址:https://github.com/fengzhizi715/OpenVitamin
歡迎交流 / Star / PR ??