嗶哩嗶哩:https://www.bilibili.com/video/BV1Rc411b7ns/
簡介
大模型是發(fā)展通用人工智能的重要途徑。從專用模型(AlphaGo、人臉識別、德州撲克等)到通用大模型,一個模型應對多個任務、多種模態(tài)。
書生-浦語大模型
書生-浦語大模型陸續(xù)推出:
- InternLM-7B:70億參數(shù),8k語境,26種語言
- InternLM-20B:200億參數(shù),4k語境訓練,推理可達16k
- InternLM-123B:千億參數(shù),
從模型到應用
從模型到應用是一個長鏈條:模型選型-續(xù)訓/全參數(shù)微調(算力足夠)-部分參數(shù)微調(算力不足,如LoRA)-構建智能體(與外部系統(tǒng)進行交互)-模型評測-模型部署。
全鏈條開源體系
書生-浦語全鏈條開源體系:
- 數(shù)據(jù):書生-萬卷
- 預訓練框架:InterLM-Train
- 微調:XTuner
- 部署:LMDeploy
- 應用:Lagent、AgentLego
書生-萬卷
50億文檔,1TB數(shù)據(jù)量
OpenDataLab 開放數(shù)據(jù)平臺:30+模態(tài),80TB數(shù)據(jù)
InterLM-Train
可擴展
高性能
無縫對接HuggingFace
開箱即用:支持多規(guī)格語言模型
XTuner
微調
增量續(xù)訓:讓基座模型學習到一些新知識,如垂直領域知識
訓練數(shù)據(jù):文字、書籍或代碼等。
有監(jiān)督微調:讓模型學會和理解各種指令,或者注入少量領域知識。
訓練數(shù)據(jù)以高質量對話、問答數(shù)據(jù)為主
XTuner:支持多種微調算法,適配Huggingface、ModelScope的模型或數(shù)據(jù)集,自動優(yōu)化加速,適配多種硬件(消費級顯卡+數(shù)據(jù)中心顯卡)
OpenCompass
大模型開源評測體系:6個維度進行評測。
主要面向基座模型和對話模型。
LMDeploy
大模型部署LMDeploy:
- 模型并行
- 低比特量化
- Attention優(yōu)化
- 計算和訪存優(yōu)化
- 持續(xù)批處理。
支持模型的輕量化(4bit權重、8bit k/v)、推理(turbomind & pytorch)和服務(open-ai server, gradio, triton inference server),對外提供python、grpc、restful接口。
Lagent
LLM局限:最新知識獲??;回復可靠性;數(shù)學計算;工具使用和交互。
使用LLM驅動智能體。
輕量級Lagent框架:
ReAct:根據(jù)輸入選擇工具
ReWoo:根據(jù)輸入劃分計劃
AutoGPT:人工干預
支持多種大語言模型,集成了一些工具。
AgentLego
多模態(tài)智能體工具箱,聚焦工具集合。
支持多種主流智能體系統(tǒng),如langchain、transformers agent、Lagent
支持多模態(tài)工具調用接口
支持一鍵式部署。
Lagent案例
短期記憶
推理與計劃
長期記憶
環(huán)境互動
多智能體寫作
Agent不是一個app,它是應用LLM的框架。
計劃、行動、反饋、學習
agent架構
LLM for agent(agent對LLM的要求):
- 邏輯推理能力
- 信息抓取能力
- 指令遵循能力
- 工具使用能力
提示工程思維模型
- 把模型想象成沒有任何背景信息的新人 stateless
- 平行宇宙概念模型 model pre-training
- 模型需要文本輸出來思考 auto-regressive
工具:code copilot; EasyDict