別人聊天時(shí)提到"Agent"、"Token"、"Skill"這些詞,你感覺自己在聽天書?
別慌,今天用最通俗的方式,帶你一次性搞懂這些概念,以及它們之間的關(guān)系。
先從最基礎(chǔ)的開始:大語言模型(LLM)
大語言模型,英文縮寫是 LLM,你可以把它理解為 AI 領(lǐng)域的"超級大腦"。
想象一個(gè)讀遍了全世界所有圖書館的學(xué)者,什么都懂一點(diǎn)。你問它問題,它能理解你的意思并給出回答。GPT-4、Claude、 Gemini、文心一言、通義千問,這些都是大語言模型。
在 OpenClaw 里,當(dāng)前使用的模型是 MiniMax-M2.5,這就是它的"大腦",負(fù)責(zé)思考和回答問題。
Token:語言的"像素"
Token 這個(gè)詞有兩種含義,你得區(qū)分清楚:
第一種:詞元。這是語言模型處理文本的最小單位。比如"你好"這兩個(gè)字,在 LLM 眼里可能是 2 個(gè) Token。為什么?因?yàn)槟P筒恢苯?看"字,而是把文字切成一個(gè)個(gè)小碎片來處理。
第二種:令牌。這是訪問系統(tǒng)的"身份證",比如你調(diào)用某個(gè) API 時(shí)需要用的 API Token。
為什么 Token 很重要?因?yàn)樗?LLM 的"糧食"。模型一次只能處理固定數(shù)量的 Token,這叫"上下文窗口"。而且對開發(fā)者來說,Token = 費(fèi)用,你用的越多,收費(fèi)越多。
簡單理解:把 Token 想象成語言的"像素"。一張圖片由無數(shù)像素組成,一段文字由無數(shù) Token 組成。LLM 每次"看"文章,只能看固定數(shù)量的"像素"。
Agent:能千活的 AI
Agent,中文叫"智能體"。這是 AI 時(shí)代最重要的概念之一。
普通的 AI 只能回答問題,比如你問 ChatGPT"今天天氣怎么樣",它會(huì)告訴你。而 Agent 不僅能回答,還能自主決策和執(zhí)行。
舉個(gè)例子:
- 普通 AI:你問"幫我訂一張去北京的機(jī)票",它會(huì)告訴你怎么訂。
- Agent:你說"幫我訂一張去北京的機(jī)票",它真的會(huì)去查航班、比較價(jià)格、完成下單。
這就是區(qū)別—— Agent 有"手腳",不只是動(dòng)腦。
Agent 的核心能力包括四個(gè)方面:
- 感知——接收信息(用戶消息、文件、環(huán)境狀態(tài))
- 思考——分析問題、制定計(jì)劃
- 行動(dòng)——執(zhí)行操作(發(fā)送消息、讀寫文件、調(diào)用工具)
- 學(xué)習(xí)——從經(jīng)驗(yàn)中改進(jìn)
在 OpenClaw 里,當(dāng)前運(yùn)行環(huán)境就是 agent=main,OpenClaw 本身就是一個(gè) Agent 運(yùn)行環(huán)境。
Skill:Agent 的工具箱
Skill,中文叫"技能"。如果說 Agent 是"通用人才",那 Skill 就是"專業(yè)證書"。有了某個(gè) Skill,Agent 就能做特定的事情。
舉幾個(gè) OpenClaw 中的 Skill 例子:
- feishu-doc:讀寫飛書文檔
- feishu-wiki:管理飛書知識(shí)庫
- browser:瀏覽器自動(dòng)化
- weather:查詢天氣
- skill-creator:創(chuàng)建新技能
這就像什么?傳統(tǒng)開發(fā)是你要寫代碼、編譯、運(yùn)行,很麻煩。而有了 Skill,就像安裝了一個(gè) App,Agent 自動(dòng)就會(huì)用這個(gè)功能。
OpenClaw:AI 手機(jī)的"操作系統(tǒng)"
OpenClaw 是一個(gè) AI Agent 運(yùn)行環(huán)境,你可以把它理解成 AI 手機(jī)的"操作系統(tǒng)"。
- OpenClaw = 安卓系統(tǒng)
- Agent = 手機(jī)上的 App
- Skill = App 的功能插件
OpenClaw 讓 Agent 能夠:
- 接收和發(fā)送消息(飛書、Discord、Telegram 等)
- 調(diào)用各種工具(瀏覽器、文件、API)
- 使用 Skills 擴(kuò)展能力
- 持久化記憶
Claude Code:編程專用 Agent
Claude Code 是 Anthropic 公司推出的 AI 編程助手,專門幫助開發(fā)者:
- 編寫和調(diào)試代碼
- 執(zhí)行終端命令
- 操作文件
- 自動(dòng)化開發(fā)流程
它和普通對話版 Claude 的區(qū)別在于:普通版是通用 AI 助手,而 Claude Code 是專門為編程場景優(yōu)化的 Agent。
它們是怎么配合干活的?
說了這么多概念,它們實(shí)際是怎么配合工作的?讓我舉個(gè)例子:
場景:用戶問"今天天氣怎么樣?"
- 用戶發(fā)送消息"今天天氣怎么樣?"
- OpenClaw 接收消息,交給 Agent 處理
- Agent 理解用戶意圖:需要查詢天氣
- Agent 調(diào)用 Skill: weather(天氣技能)
- weather Skill 調(diào)用外部天氣 API
- 返回天氣信息給 Agent
- Agent 調(diào)用 LLM 整理回答
- OpenClaw 把回答發(fā)送給用戶
這就是完整的工作流程!
一張圖看懂層次關(guān)系
如果你還是覺得抽象,給你一個(gè)簡單的類比:
| 概念 | 類比 | 角色 |
|---|---|---|
| LLM | 人類的大腦 | 負(fù)責(zé)思考和理解 |
| Token | 語言的像素 | 信息的基本單位 |
| Agent | 公司的員工 | 決策和執(zhí)行者 |
| Skill | 員工的證書 | 專業(yè)能力 |
| OpenClaw | 公司的辦公系統(tǒng) | 運(yùn)行平臺(tái) |
| Claude Code | 專業(yè)編輯器 | 專用工具 |
小結(jié)
今天我們聊了六個(gè)核心概念:
- LLM 是基礎(chǔ)——負(fù)責(zé)理解和生成語言,是所有 AI 的"大腦"
- Token 是燃料——LLM 處理信息的單位,也用于計(jì)費(fèi)
- Agent 是執(zhí)行者——讓 AI 不僅能想,還能做
- Skill 是插件——給 Agent 賦予各種專業(yè)能力
- OpenClaw 是平臺(tái)——讓 Agent 能夠運(yùn)行并與外界交互
- Claude Code 是具體產(chǎn)品——專門用于編程的 Agent
一句話概括:
OpenClaw 是一個(gè)"AI Agent 操作系統(tǒng)",它讓 Agent(內(nèi)置 LLM 作為大腦)通過 Skills(技能)來執(zhí)行任務(wù),并與外部世界交互。
現(xiàn)在,你可以出去和別人聊這些概念了!
本文適合:對 AI 感興趣但不知道從哪開始的小白