1. 核心概覽 (Core Overview)
如果說之前的 AI 只是“問答機”,那么 Agent 就是一個帶有“循環(huán)控制邏輯”的推理引擎。它不再是單純地輸出答案,而是學(xué)會了“謀定而后動”。
2. 分段拆解 (Breakdown)
A. 什么是思維鏈 (CoT)?
思維鏈就是強制讓 AI 在給出最終答案前,先寫下它的中間推導(dǎo)過程。
對于架構(gòu)師來說,這就像是開啟了 Debug 日志。如果不開啟 CoT,AI 就像一個只有 return 沒有邏輯過程的方法,錯了你都不知道為什么。
B. 生產(chǎn)環(huán)境的王牌:ReAct 框架
ReAct = Reasoning (推理) + Acting (行動)。這是目前最流行的 Agent 運行模式。它的工作流是一個閉環(huán):
- Thought (思考): AI 描述當(dāng)前要做什么。
- Action (行動): AI 決定調(diào)用哪個函數(shù)(Day 3 講的內(nèi)容)。
- Observation (觀察): AI 拿到函數(shù)返回的結(jié)果。
- Loop: 回到第 1 步,根據(jù)觀察到的結(jié)果,決定是繼續(xù)下一步,還是結(jié)束并回答用戶。
C. 全棧視角下的狀態(tài)管理
當(dāng) AI 在進行“思考-行動”循環(huán)時,作為一個 Web 請求,它可能是耗時的。
異步化: 你需要使用 WebSocket 或 SSE (Server-Sent Events) 將 AI 的“思考過程”實時推送到前端,提升用戶體驗(不要讓用戶盯著轉(zhuǎn)圈圈)。
狀態(tài)持久化: 如果循環(huán)中途斷了,你需要把之前的 Thought 和 Observation 存入 Redis 或數(shù)據(jù)庫,以便恢復(fù)“案發(fā)現(xiàn)場”。
3. 最終總結(jié) (Summary)
Agent 的本質(zhì)是“自我修正”的能力。 通過 ReAct 框架,AI 從一個“單次調(diào)用”的函數(shù)變成了一個“有目標(biāo)的執(zhí)行過程”。作為架構(gòu)師,你的任務(wù)是為這個過程提供充足的工具(Tools)和清晰的邊界(Constraints)。
測驗 (架構(gòu)實戰(zhàn))
循環(huán)終止: 如果 AI 在 ReAct 循環(huán)中,發(fā)現(xiàn)工具返回的結(jié)果始終無法滿足用戶需求(比如查不到用戶想要的便宜機票),它應(yīng)該如何優(yōu)雅地終止循環(huán)?
日志審計: 假設(shè) Agent 執(zhí)行了一次錯誤的刪帖操作,你作為架構(gòu)師,如何通過“思維鏈”來復(fù)盤是哪一步出了問題?(是 AI 想錯了,還是工具給的數(shù)據(jù)錯了?)
Prompt 策略: 如果你發(fā)現(xiàn) AI 總是“跳過思考直接行動”,你應(yīng)該在 Prompt 里加一句什么指令來強制它開啟思維鏈?