一、LLM 解決了什么問題
LLM 本質是一臺概率預測機器,通過在海量文本上訓練,涌現(xiàn)出了:
| 能力 | 典型場景 |
|---|---|
| 文本生成與改寫 | 寫作、翻譯、摘要 |
| 代碼生成與解釋 | 寫函數、修 Bug |
| 模式識別與分類 | 情感分析、意圖識別 |
| 知識問答 | 百科問答、概念解釋 |
| 格式轉換 | JSON?表格、Markdown?HTML |
| 少樣本推理 | 給幾個例子,模型舉一反三 |
核心價值:把人類知識壓縮進參數,用自然語言對話即可調用——無需寫代碼、無需專業(yè)培訓。
二、LLM 解決不了什么問題
LLM 有六大根本局限:
| 局限 | 原因 | 后果 |
|---|---|---|
| 精確計算 | 數字也是 Token 預測,不是真正計算 | 大數乘法可能給出自信的錯誤答案 |
| 實時信息 | 訓練數據有截止日期 | 問今天的股價、天氣必然出錯 |
| 內部私有知識 | 只學過公開數據 | 不知道你公司的產品文檔、內部規(guī)范 |
| 精確記憶長文本 | "Lost in the Middle"——對中間內容注意力弱 | 10 萬字文檔中間的細節(jié)容易遺漏 |
| 復雜推理鏈 | 多步錯誤會累積 | 步驟越多,越容易跑偏 |
| 跨會話記憶 | 對話結束后上下文清空 | 每次對話從零開始 |
這些局限共同導致了最核心的工程挑戰(zhàn):幻覺——模型不知道自己不知道,會自信地編造"合理"的錯誤答案。
三、引入 RAG:解決"知識邊界"問題
RAG = Retrieval-Augmented Generation(檢索增強生成)
解決的問題:LLM 的知識是靜態(tài)的、有截止日期的、不含私有內容的。
工作方式:
[離線] 文檔 → 切片 → 向量化 → 存入向量數據庫
[在線] 用戶問題
↓ 向量檢索:從知識庫找最相關片段
↓ 組裝 Prompt:"根據以下資料回答:[檢索內容] + [用戶問題]"
↓ LLM 基于真實文檔生成回答
RAG 帶來的四大收益:
- 解決知識截止:內部文檔、最新資料可以隨時更新入庫
- 減少幻覺:模型有參考資料時傾向于基于資料回答,而非自由發(fā)揮
- 可追溯:回答可附上"來源:第X段",用戶可驗證原文
- 無需重新訓練:更新知識庫只需更新文檔,成本極低
RAG 的局限:檢索質量決定回答質量,難點在"切好文檔、檢索準",而非 LLM 本身。
四、引入 Function Call:解決"執(zhí)行邊界"問題
根本限制:LLM 只能輸出文本,無法執(zhí)行代碼、讀寫文件、調用 API、控制外部系統(tǒng)。
Function Calling 的核心思想:
LLM 輸出的雖然只是文本,但可以是結構化的 JSON。外部程序解析這段 JSON 并真正執(zhí)行,再把結果反饋給模型——LLM 從未"執(zhí)行"任何東西,但等效于調用了外部功能。
完整流程:
用戶問題 + 工具列表描述
↓
LLM 輸出調用指令(JSON)
↓
外部代碼解析并真正執(zhí)行
↓
執(zhí)行結果注入 Context
↓
LLM 讀取結果 → 生成最終回答
Function Call 解鎖了什么:
- 查詢實時數據(告別幻覺)
- 讀寫文件、執(zhí)行命令(從"說"到"做")
- 調用任意 API(連接整個互聯(lián)網和內部系統(tǒng))
- 串聯(lián)多步工具調用(處理復雜任務)
五、引入 AI Agent:解決"自主執(zhí)行"問題
純 LLM 的模式:輸入 → 輸出,一問一答,被動響應,每次從零開始。
Agent 加了什么:在 LLM 之上加一個執(zhí)行循環(huán)(Agent Loop):
用戶給出目標
↓
[循環(huán)執(zhí)行]
思考:現(xiàn)在應該做什么? ← LLM 決策
行動:調用工具 ← 外部工具執(zhí)行
觀察:工具返回了什么? ← 結果注入 Context
判斷:任務完成了嗎?→ 沒有 → 繼續(xù)循環(huán)
↓
目標達成,輸出結果
Agent = LLM 大腦 + Function Calling 協(xié)議 + 外部工具集合
| 對比維度 | 純 LLM | AI Agent |
|---|---|---|
| 交互方式 | 一問一答 | 自主多步執(zhí)行 |
| 工具使用 | 無 | 可調用外部工具 |
| 狀態(tài)保持 | 無 | 有(跨步驟記憶) |
| 主動性 | 被動響應 | 主動規(guī)劃和執(zhí)行 |
Agent 解決的核心問題:把"對話"變成"行動"——用戶只需說出目標,Agent 自行拆解計劃、調用工具、處理錯誤、迭代完成,無需人工逐步介入。
六、引入 MCP:解決"工具能力擴展"問題
Function Call 的局限:工具能力是硬編碼在 Agent 框架內部的,第三方無法擴展,也無法跨平臺復用。
MCP(Model Context Protocol) 是 Anthropic 提出的開放標準協(xié)議,讓任何人都可以把工具能力封裝成獨立服務,Agent 通過統(tǒng)一協(xié)議接入——就像 USB 接口,插上即用。
與 Function Call 的關系:
Function Call(LLM 調用工具的協(xié)議)
↓ 調用的工具來自哪里?
┌──────────────────────────────────┐
│ 內置 Tool(本地直接執(zhí)行) │ ← 讀文件、執(zhí)行命令、搜索等
│ Claude Code 主進程內部實現(xiàn) │
└──────────────────────────────────┘
┌──────────────────────────────────┐
│ MCP Tool(外部進程/遠程服務執(zhí)行) │ ← 支付、數據庫、第三方 API 等
│ 獨立進程或遠程 HTTP 服務提供 │
└──────────────────────────────────┘
兩種部署方式:
| 對比 | 內置 Tool(本地) | MCP Tool(外部) |
|---|---|---|
| 執(zhí)行位置 | Agent 主進程內 | 獨立進程 / 遠程服務器 |
| 誰來實現(xiàn) | 框架內置,固定 | 任何人都可以開發(fā) |
| 擴展性 | 低,改框架才能加 | 高,配置即接入 |
| 適合場景 | 文件、命令等系統(tǒng)操作 | 支付、數據庫、專業(yè) API |
| 通信方式 | 直接函數調用 | JSON-RPC(stdio 或 HTTP) |
| 示例 | Read / Write / Bash | payments-mcp / Context7 |
MCP 解決的核心問題:
- 能力無法擴展:內置工具是固定的,MCP 讓第三方可以自由開發(fā)并插入新能力
- 跨平臺復用:一個 MCP Server 可以被任意 Agent 框架接入,不綁定特定系統(tǒng)
- 領域隔離:專業(yè)領域(錢包、數據庫、監(jiān)控)獨立成服務,主 Agent 不需要關心實現(xiàn)細節(jié)
- 狀態(tài)管理:獨立進程可以維護自己的連接池、緩存、認證狀態(tài),不污染 Agent 主進程
一句話區(qū)分:
Function Call 是 LLM "說我要調用什么"的語言;MCP 是工具能力"住在哪里、怎么被找到"的標準。兩者配合,讓 Agent 的工具集從固定變成無限可擴展。
七、引入 Skill:解決"復用與標準化"問題
Agent 有了工具,但新問題出現(xiàn)了:同一類任務(如 Git 提交、發(fā)送轉賬、跑測試)每次都要靠 LLM 臨時規(guī)劃步驟,流程不穩(wěn)定、容易遺漏、無法沉淀經驗。
Skill(技能)是什么:用戶/團隊預先定義的高級工作流模板,把多個 Tool 調用的固定順序和規(guī)則封裝成一個命名單元,Agent 直接調用即可。
沒有 Skill(純 Agent):
用戶: "幫我提交代碼"
LLM 臨時推理 → 可能忘記 git diff → 可能格式不規(guī)范 → 每次結果不同
有 Skill:
用戶: "/commit"
→ 加載預定義的 commit 工作流
→ 步驟固定: git status → git diff → git log → 生成規(guī)范 message → add → commit → 驗證
→ 結果穩(wěn)定、流程可控
Skill 解決的核心問題:
| 問題 | Skill 的解法 |
|---|---|
| 流程不穩(wěn)定 | 固化多步驟順序,每次執(zhí)行路徑一致 |
| 經驗無法沉淀 | 把最佳實踐寫進 Skill,團隊共享 |
| 工具選擇錯誤 | 預先限定該 Skill 只能用哪些 Tool,避免誤調用 |
| 重復描述需求 | 用 /skill-name 一鍵觸發(fā),無需每次用自然語言解釋 |
| 領域知識缺失 | Skill 的 instructions 里可以內嵌領域規(guī)則和注意事項 |
Skill 的結構:
Skill = {
name: "/commit" ← 觸發(fā)名稱
description: "創(chuàng)建規(guī)范的 git 提交" ← LLM 判斷何時使用
instructions: "1. git status → 2. git diff → 3. 分析變更 → 4. 生成 message → 5. add → 6. commit"
tools: [Bash] ← 限定可用工具范圍
}
Skill 在整個體系中的位置:
用戶指令
↓
Skill(高級工作流) ← 封裝領域知識和最佳實踐
↓
Tools(原子操作) ← Read / Write / Bash / mcp__xxx
↓
Function Call ← LLM 決策調用哪個工具
↓
MCP Server / 外部系統(tǒng) ← 真正執(zhí)行
Skill vs 直接用 Agent 的區(qū)別:
| 對比 | 純 Agent | Agent + Skill |
|---|---|---|
| 步驟規(guī)劃 | LLM 每次臨時推理 | 預定義固定流程 |
| 可重復性 | 不穩(wěn)定,依賴 LLM 發(fā)揮 | 穩(wěn)定,流程標準化 |
| 經驗積累 | 無法沉淀 | 寫入 Skill,持續(xù)優(yōu)化 |
| 工具權限 | 所有工具都可用,風險高 | 限定工具集,更安全 |
| 觸發(fā)方式 | 需要描述意圖 |
/skill-name 精準觸發(fā) |
八、引入 Harness Engineering:解決"工程可靠性"問題
Skill 解決了流程標準化,但新問題出現(xiàn)了:即使有了 Skill,AI 系統(tǒng)在生產環(huán)境中仍然是一個"黑盒"——不知道質量如何、不知道何時出錯、改了 Prompt 不知道效果好壞、出了故障不知道從哪排查。
Harness Engineering 的核心思想:
給 AI 系統(tǒng)套上一整套控制、測試、管理基礎設施,讓原本不可預測的模型行為變得可評估、可觀測、可信賴。
"Harness" 原意是馬具——套在馬身上控制方向和力量的裝置。在 AI 工程中,它是讓 AI 這匹"野馬"可以在生產環(huán)境中安全奔跑的工程體系。
Harness Engineering 解決的核心問題:
| 問題 | 描述 | Harness 的解法 |
|---|---|---|
| 質量不可量化 | "感覺好多了"不是工程標準 | 評估體系(Eval Suite):用數字衡量質量 |
| 改了不知好壞 | 改 Prompt 后無法系統(tǒng)驗證 | 回歸測試:自動對比新舊版本表現(xiàn) |
| 幻覺無法控制 | 模型自信地輸出錯誤內容 | Guardrails:輸入/輸出雙層過濾 |
| 生產無法觀測 | 出了問題不知從何排查 | 可觀測性:Tracing + 日志 + 指標 |
| 成本失控 | Token 消耗難以預測和優(yōu)化 | 成本工程:模型路由 + 消耗監(jiān)控 |
| 安全無保障 | 用戶可能注入惡意指令 | 安全護欄:Prompt 注入防護 |
Harness Engineering 的四層架構:
沒有 Harness 的 AI:
輸入 → [黑盒模型] → 輸出
問題:不知道為什么出錯,無法系統(tǒng)測試,無法評估好壞
有 Harness 的 AI:
輸入
↓
[評估層 Evaluation] ← 持續(xù)測量質量:Eval Suite / Benchmark / LLM-as-Judge
↓
[執(zhí)行層 Runtime] ← 安全可靠運行:Guardrails / Prompt 管理 / 輸出驗證 / 降級策略
↓
[可觀測層 Observability] ← 全鏈路透明:Tracing / Token 成本監(jiān)控 / 異常告警
↓
[測試層 CI/CD] ← 持續(xù)驗證:PR 觸發(fā) Eval / 回歸測試 / 安全掃描
↓
輸出
三類核心實踐:
① 評估體系(Evaluation)——把"感覺"變成"數字"
沒有評估:改 Prompt → 手測幾個例子 → "感覺好多了" → 上線(不知道哪里變差了)
有評估: 改 Prompt → 跑 500 個測試用例 → 準確率 82%→91%
→ 發(fā)現(xiàn)"否定問句"類別退步了 3% → 針對性優(yōu)化
- 自動化 Eval:有標準答案的任務直接對比;復雜任務用 LLM-as-Judge(用強模型評判弱模型)
- Pairwise 對比:不打絕對分,讓評估者判斷"A 和 B 哪個更好"——更符合人類直覺
- 回歸測試集:包含核心場景、邊界情況、對抗樣本、歷史 Bug 案例
② 護欄系統(tǒng)(Guardrails)——在模型兩側建立安全過濾層
用戶輸入 → [輸入護欄: PII檢測 / Prompt注入防護 / 有害內容過濾]
↓
[模型調用]
↓
[輸出護欄: 事實一致性 / 格式驗證 / 敏感信息脫敏 / 品牌安全]
↓
最終輸出
③ 可觀測性(Observability)——AI 系統(tǒng)的專屬監(jiān)控維度
傳統(tǒng)服務監(jiān)控:延遲 / 錯誤率 / 吞吐量
LLM 額外需要:
├── Token 消耗(輸入/輸出分別統(tǒng)計,直接對應成本)
├── Prompt 版本(v2.3 和 v2.4 哪個效果更好)
├── 完整 Prompt + Response 記錄(調試 AI 問題必需)
├── 幻覺檢測率(事實錯誤頻率)
└── 模型降級次數(主模型不可用時的備用觸發(fā)頻率)
與前序技術的關系:
Agent + Skill → 構建了"能做事"的 AI 系統(tǒng)
Harness Engineering → 讓這個系統(tǒng)"做得好、做得穩(wěn)、做得透明"
沒有 Harness 的 Agent:能完成任務,但質量未知、失敗時無法排查
有 Harness 的 Agent:完成任務 + 質量可量化 + 異常可告警 + 失敗可追溯 + 成本可控
主流工具生態(tài):
| 層次 | 工具 | 用途 |
|---|---|---|
| 評估 | DeepEval / Promptfoo / RAGAS | 單元測試 / Prompt 回歸 / RAG 質量評估 |
| 護欄 | Guardrails AI / NeMo Guardrails | 輸入輸出安全過濾 |
| 可觀測 | LangSmith / Helicone / Arize | 鏈路追蹤 + 成本監(jiān)控 |
| Prompt 管理 | LangSmith Hub / Humanloop | 版本控制 + A/B 測試 |
九、引入 Anthropic Harness:解決"長時間 Agent 架構彈性與質量"問題
通用 Harness Engineering 提供了評估、護欄、可觀測性等工程實踐,但當 AI Agent 需要運行數小時、執(zhí)行數百個工具調用時,新的矛盾浮現(xiàn):架構耦合導致任何一處崩潰都全功盡棄;Agent 評估自己產出時存在天然的利益沖突偏差,質量上不去。
Anthropic Harness 的核心洞察:
"Harness 是對模型能力不信任的具象化。隨著信任的建立,Harness 應該變薄,而不是變厚。"
Anthropic 在 2025–2026 年設計 Managed Agents 時,從操作系統(tǒng)設計中借鑒了虛擬化思想,形成了三大設計哲學:
哲學一:為"尚未被構想的程序"設計
操作系統(tǒng)的偉大之處在于:磁盤從機械換成 SSD,應用程序調用的 read() 接口從未改變。Anthropic 用同樣思路設計了三個永不改變的穩(wěn)定接口,讓底層實現(xiàn)隨模型能力自由演化:
底層實現(xiàn)(隨模型進化頻繁變化)
├── 上下文管理策略(今天滑動窗口,明天百萬 token 根本不需要管理)
├── 沙箱技術(今天 Docker,明天 WebAssembly)
└── 錯誤重試邏輯(模型越強,工具調用越穩(wěn),兜底邏輯越不需要)
↓ 虛擬化為三個穩(wěn)定接口
Session(記憶) ← session.append(event) / session.get_history()
Harness(大腦) ← harness.run(session)
Sandbox(雙手) ← sandbox.execute(name, input) → str
↓
上層應用(今天的代碼 Agent,明天的研究 Agent,后天尚未被想到的 Agent)
哲學二:Harness 編碼的是假設,假設會過時
每一個 Harness 組件都隱含著對模型能力的悲觀假設,模型進化后這些假設必須被重新檢驗并果斷刪除:
| Harness 組件 | 隱含的悲觀假設 | 實際演化結果 |
|---|---|---|
| Sprint 任務分解 | "模型無法在腦中維持整個大任務" | Opus 4.6 百萬 token 上下文 → 直接刪除 |
| 上下文重置機制 | "模型跑長了會焦慮漂移" | Opus 4.5 不再出現(xiàn)此行為 → 降級為備用 |
| Contract 協(xié)商機制 | "模型記不住跨 Sprint 的目標" | 隨上述組件一并刪除 |
| 多輪重試邏輯 | "工具調用會頻繁失敗" | 成功率 85%→99% → 逐步簡化 |
實踐:每次模型升級后運行消融測試(Ablation Test),量化各組件的實際貢獻。Anthropic 將 Harness 從 7 個核心組件縮減到 3 個,性能不降,成本和延遲顯著下降。
哲學三:大腦、雙手、記憶徹底解耦
根基原則:狀態(tài)(發(fā)生了什么)和行為(接下來做什么)不應該住在同一個進程里。
傳統(tǒng)耦合架構(單容器):
[LLM 調用 + 工具執(zhí)行 + 上下文管理 + 憑證存儲] = 一個脆弱整體
任何部分崩潰 → 狀態(tài)全部丟失 → 任務從頭開始
解耦架構(三層分離):
┌─────────────────────────────────────────────────────────────┐
│ Session(記憶層):追加式事件日志,獨立持久化,存活于 Harness 之外 │
│ Harness 崩潰 → Session 完好;新實例 wake(sessionId) 接管繼續(xù) │
├─────────────────────────────────────────────────────────────┤
│ Harness(控制層):完全無狀態(tài),讀 Session + 路由工具調用 │
│ 崩潰即換,橫向擴展 = 多啟幾個無狀態(tài)實例("牛群",不是"寵物") │
├─────────────────────────────────────────────────────────────┤
│ Sandbox(執(zhí)行層):隔離容器,懶加載(按需創(chuàng)建),憑證永不進入 │
│ 容器崩潰 = 單次工具調用報錯,Claude 決定重試;TTFT ↓60% │
└─────────────────────────────────────────────────────────────┘
核心安全設計:憑證從不進入 Sandbox——Git Token 僅用于初始化克隆后即丟棄;API Key 存于 Vault,通過專用代理注入,即使 Sandbox 被完全攻陷,憑證依然安全。
三智能體架構:Planner-Generator-Evaluator
對于長時間復雜任務,Anthropic 借鑒 GAN(生成對抗網絡) 哲學,用獨立上下文消除 Agent 的自我評估偏差:
GAN 的洞察:生成器與判別器參數獨立 → 無法共謀 → 對抗性壓力驅動質量提升
Agent 的轉化:Generator 與 Evaluator 上下文獨立 → 無法共謀 → 對抗性質量提升
Planner(規(guī)劃者)
一句話目標 → 功能列表 → Sprint 計劃
輸出持久化 Plan Document(全局狀態(tài)錨點,供所有 Agent 讀取)
↓
主循環(huán)(5-15 次迭代)
↓
Generator(生成者) Evaluator(評估者)
└ 執(zhí)行具體工作 └ 完全獨立上下文(不參與生成)
└ 上下文定期重置(非壓縮) ──→ └ 強制懷疑論角色(System Prompt 注入)
└ 防止上下文漂移 └ 評分維度量化(每項 1-10 分)
└ 從 Plan Doc 重新加載目標 └ 真實瀏覽器測試(Playwright MCP)
↑────── 具體改進建議 ────────┘
實測數據(同一任務:構建 2D 復古游戲制作工具):
| 指標 | 單 Agent | 三智能體 Harness |
|---|---|---|
| 運行時間 | 20 分鐘 | 6 小時 |
| 成本 | $9 | $200 |
| 迭代輪次 | 1 次 | 5-15 次 |
| 產出質量 | 原型級,勉強可用 | 生產級,功能完整完善 |
Managed Agents 平臺(2026年4月正式發(fā)布):
將上述三哲學封裝為云服務($0.08/session hour),開發(fā)者無需自建 Sandbox 基礎設施和狀態(tài)管理,直接運行多小時 Agent 任務。已落地:Notion(工作區(qū)任務委托)、Sentry(自動 Bug 修復)、Rakuten(Slack 企業(yè) Agent)。
與前序技術的關系:
第八章 Harness Engineering → 通用工程實踐:評估體系 + 護欄 + 可觀測性,解決 AI 系統(tǒng)可測性
↓ 局限:長時間運行任務中,架構耦合導致崩潰即全失;單 Agent 自我評估存在天然偏差
第九章 Anthropic Harness → 專攻長時間 Agent 的兩個核心難題:
① 架構解耦:Session/Harness/Sandbox 三層分離,崩潰不丟狀態(tài)
② 質量保障:Generator-Evaluator 對抗循環(huán),消除自我評估偏差
③ 動態(tài)演進:Harness 隨模型進化持續(xù)"減負",不讓舊假設成枷鎖
十、引入 Hermes Agent:解決"自主進化"問題
Harness Engineering 讓 AI 系統(tǒng)變得可測、可信、可運維,但仍有一個根本局限:AI 系統(tǒng)的能力是靜態(tài)的——Prompt 是人工編寫的,Skills 是人工維護的,系統(tǒng)從每次使用中學不到任何東西。使用一年和使用一天,能力沒有差別。
Hermes Agent 的核心思想:
AI 智能體應該像人類一樣,從每次經歷中學習并積累技能,而不是每次對話都從零開始。
"Hermes" 是希臘神話中信使之神,象征信息的傳遞與積累——在 AI 工程中,它是讓 Agent 把每次經驗轉化為可復用知識的自進化框架(Nous Research 出品,2026 年 4 月發(fā)布 v0.9.0,前身為 OpenClaw)。
Hermes Agent 解決的核心問題:
| 問題 | 描述 | Hermes 的解法 |
|---|---|---|
| 經驗無法積累 | 每次對話從零開始,過去解決過的問題下次還要重解 | 程序性記憶(Skill):自動將復雜任務經驗固化為 SKILL.md |
| Skills 靠人工維護 | 最佳實踐需要開發(fā)者手動編寫,使用中發(fā)現(xiàn)的改進無法自動沉淀 | 后臺 review agent:對話結束后靜默分析,決定是否新建/更新 Skill |
| 知識無法定期優(yōu)化 | Skill 寫好就靜止,隨時間推移可能過時或不完整 | Cron 調度器:定期"喚醒" agent 復習并改進既有技能 |
| 模型強綁定 | 換模型需要大量改代碼,遷移成本高 | 模型無關性:20+ 提供商,hermes model 一鍵切換,無需改代碼 |
| 多端重復搭建 | 每個平臺需要單獨接入 Agent 后端 | 多平臺 Gateway:Telegram / Discord / Slack / WeChat 等 16+ 平臺統(tǒng)一路由到同一 Agent 核心 |
三層記憶架構:
程序性記憶(Skill) ← 解決問題的"方法論"沉淀
~/.hermes/skills/SKILL.md
結構:YAML frontmatter(名稱/版本/平臺/依賴)+ Markdown 步驟 + 已知陷阱
來源:后臺自動創(chuàng)建 / 主 Agent 主動調用 / 社區(qū)共享(agentskills.io)
情節(jié)性記憶(SQLite) ← 經歷過"哪些事"的記錄
SQLite + FTS5 全文檢索,輕量替代向量數據庫,無額外依賴
檢索時:FTS5 找相關段落 → LLM 壓縮摘要 → 注入當前 prompt
工作記憶(Context) ← 當前對話的臨時狀態(tài)
達到 token 閾值時自動壓縮歷史(用 LLM 生成摘要保留關鍵信息)
利用 Anthropic prefix caching,可節(jié)省最高 75% 輸入 token 費用
核心自進化機制:后臺 Skill 審查:
[計數器機制]
每次 LLM API 調用,_iters_since_skill 計數器 +1
達到閾值(默認 10 次)→ 設置 review 標志
[執(zhí)行時機:不阻塞主對話]
用戶消息 → LLM 執(zhí)行 N 次工具調用 → 生成最終 response → 發(fā)送給用戶 ?
↓
[后臺靜默] spawn review thread
用戶完全感知不到
[后臺 review agent]
fork 一個全新的 AIAgent 實例
- max_iterations=8(有上限,防止失控)
- quiet_mode=True(完全靜默,輸出不可見)
- _skill_nudge_interval=0(禁止遞歸觸發(fā) review)
注入完整對話歷史快照(深拷貝,不修改主對話)
調用 skills_list() 獲取現(xiàn)有技能列表
LLM 語義判斷:新建 / 更新 / "Nothing to save."
LLM 判斷是否值得創(chuàng)建 Skill 的標準(非硬編碼,完全由模型語義決策):
| 判斷維度 | 說明 |
|---|---|
| 試錯過程 | 任務是否經歷了反復嘗試、多次調整方向? |
| 實驗性發(fā)現(xiàn) | 是否在執(zhí)行中發(fā)現(xiàn)預期外情況,并據此改變策略? |
| 用戶糾偏 | 用戶是否對方法表達不滿,促使 agent 改變方式? |
| 可復用性 | 這個方法下次遇到類似問題時還能用嗎? |
Skill 漸進式加載(三級,節(jié)省 Token):
Level 0(總是加載):技能名稱 + 描述列表(約 3,000 tokens)
幫助 LLM 知道"有哪些技能可用"
Level 1(按需加載):完整技能內容(步驟 + 陷阱 + 示例)
當 LLM 判斷當前任務需要該 Skill 時才加載
Level 2(按需加載):技能引用的外部文檔
當 Skill 內容引用額外資料時才加載
自進化閉環(huán):
用戶完成復雜任務(≥10 次工具調用迭代)
↓
[后臺 review agent] 分析完整對話歷史
↓
┌─────────────┴─────────────┐
▼ ▼
值得保存 不值得保存
↓ ↓
新建 SKILL.md "Nothing to save."
或更新已有 Skill 靜默退出
↓
下次同類任務:直接復用(更快、更準)
↓
Cron 定期觸發(fā):復習使用記錄 → 發(fā)現(xiàn)缺漏 → patch Skill
↓
越用越強的復合收益 ?
與前序技術的關系:
第七章 Skill → 人工預定義工作流模板,靠開發(fā)者手動維護
第八章 Harness Engineering → 讓 AI 系統(tǒng)可測、可觀測,但仍是靜態(tài)系統(tǒng)
第九章 Hermes Agent → 在 Skill + Harness 基礎上加入自主學習閉環(huán)
Skill 從"人工編寫"變成"自動積累 + 持續(xù)優(yōu)化"
傳統(tǒng) AI Agent 是"工具"——你告訴它做什么,它做完就忘。
Hermes Agent 是"同事"——它記得你們一起解決過什么,
并且會在你睡覺的時候自己復習。
總結:能力演進的邏輯鏈
LLM → 解決"理解與生成":用自然語言處理復雜語言任務
↓ 局限:知識靜止、私有盲區(qū)、幻覺
RAG → 解決"知識邊界":接入外部動態(tài)知識庫,讓模型"有據可查"
↓ 局限:只能生成文本,無法執(zhí)行動作
Function Call → 解決"執(zhí)行邊界":讓模型能驅動外部系統(tǒng),從"說"到"做"
↓ 局限:只能單步響應,無法自主完成多步任務
AI Agent → 解決"自主執(zhí)行":加入循環(huán)決策機制,讓模型能自主規(guī)劃和完成復雜目標
↓ 局限:工具能力固定在框架內,第三方無法擴展和復用
MCP → 解決"工具擴展":標準化工具接入協(xié)議,任何人都可開發(fā)并插入新能力
↓ 局限:每次臨時規(guī)劃,流程不穩(wěn)定,經驗無法沉淀
Skill → 解決"復用與標準化":把最佳實踐固化為工作流模板,穩(wěn)定、可復用、可共享
↓ 局限:AI 系統(tǒng)是黑盒,質量不可量化、出錯無從排查、改了不知好壞
Harness Engineering → 解決"工程可靠性":評估體系+護欄+可觀測性,讓 AI 系統(tǒng)可測、可信、可運維
↓ 局限:長時間 Agent 任務中,架構耦合導致崩潰即全失;單 Agent 自我評估存在天然偏差
Anthropic Harness → 解決"長時間 Agent 架構彈性與質量":Session/Harness/Sandbox 三層解耦保證崩潰可恢復,Planner-Generator-Evaluator 對抗循環(huán)消除自我評估偏差;Harness 隨模型進化持續(xù)"減負"
↓ 局限:能力是靜態(tài)的,系統(tǒng)從每次使用中學不到東西,使用一年和一天沒有區(qū)別
Hermes Agent → 解決"自主進化":后臺 review agent 自動積累 Skill、Cron 定期優(yōu)化、SQLite 情節(jié)記憶,讓 AI 從靜態(tài)工具變成越用越強的"同事"
附:各技術實際首發(fā)年份
| 技術 | 時間 | 關鍵事件 |
|---|---|---|
| LLM(Transformer) | 2017年 | Google 發(fā)表《Attention Is All You Need》 |
| LLM(GPT 系列) | 2018–2020年 | GPT-1 → GPT-3,ChatGPT 于 2022年11月爆發(fā) |
| RAG | 2020年5月 | Facebook AI Research 發(fā)表論文,NeurIPS 2020 收錄 |
| AI Agent(理論基礎) | 2022年 | Google 發(fā)表 ReAct 論文,奠定 LLM 驅動 Agent 的理論基礎 |
| Function Call | 2023年6月 | OpenAI 正式發(fā)布 Function Calling API(gpt-4-0613) |
| AI Agent(工具鏈爆發(fā)) | 2023年初–中期 | AutoGPT、LangChain 等框架涌現(xiàn),Agent 進入工程實踐 |
| MCP | 2024年11月 | Anthropic 正式發(fā)布 Model Context Protocol 開放標準 |
| Skill | 2024–2025年 | 在 Claude Code 等 Agent 框架中成為標準化工作流模式 |
| Harness Engineering | 2024–2025年 | LLM 應用進入生產規(guī)?;?,工程可靠性成為核心挑戰(zhàn);DeepEval、Promptfoo、LangSmith 等工具鏈成熟,"AI 工程化"成為熱門方向 |
| Anthropic Harness / Managed Agents | 2025–2026年 | Anthropic 發(fā)布 Managed Agents 平臺(2026年4月);提出 Session/Harness/Sandbox 三層解耦架構,Planner-Generator-Evaluator 對抗循環(huán),以及"Harness 隨模型進化持續(xù)減負"的動態(tài)哲學;$0.08/session hour,Notion / Sentry / Rakuten 等率先落地 |
| Hermes Agent | 2026年4月 | Nous Research 發(fā)布 v0.9.0(前身 OpenClaw);內置 Skill 自進化(后臺 review agent + Cron 優(yōu)化)、SQLite + FTS5 情節(jié)記憶、20+ 模型提供商無鎖定、16+ 平臺 Gateway,首次將"越用越強"的自主學習能力引入生產級 Agent 框架 |