書生大模型全鏈路開源體系

嗶哩嗶哩:https://www.bilibili.com/video/BV1Rc411b7ns/

簡介

大模型是發(fā)展通用人工智能的重要途徑。從專用模型(AlphaGo、人臉識別、德州撲克等)到通用大模型,一個模型應對多個任務、多種模態(tài)。

書生-浦語大模型

書生-浦語大模型陸續(xù)推出:

  • InternLM-7B:70億參數(shù),8k語境,26種語言
  • InternLM-20B:200億參數(shù),4k語境訓練,推理可達16k
  • InternLM-123B:千億參數(shù),

從模型到應用

從模型到應用是一個長鏈條:模型選型-續(xù)訓/全參數(shù)微調(算力足夠)-部分參數(shù)微調(算力不足,如LoRA)-構建智能體(與外部系統(tǒng)進行交互)-模型評測-模型部署。

全鏈條開源體系

書生-浦語全鏈條開源體系:

  • 數(shù)據(jù):書生-萬卷
  • 預訓練框架:InterLM-Train
  • 微調:XTuner
  • 部署:LMDeploy
  • 應用:Lagent、AgentLego

書生-萬卷

50億文檔,1TB數(shù)據(jù)量
OpenDataLab 開放數(shù)據(jù)平臺:30+模態(tài),80TB數(shù)據(jù)

InterLM-Train

可擴展
高性能
無縫對接HuggingFace
開箱即用:支持多規(guī)格語言模型

XTuner

微調
增量續(xù)訓:讓基座模型學習到一些新知識,如垂直領域知識
訓練數(shù)據(jù):文字、書籍或代碼等。

有監(jiān)督微調:讓模型學會和理解各種指令,或者注入少量領域知識。
訓練數(shù)據(jù)以高質量對話、問答數(shù)據(jù)為主

XTuner:支持多種微調算法,適配Huggingface、ModelScope的模型或數(shù)據(jù)集,自動優(yōu)化加速,適配多種硬件(消費級顯卡+數(shù)據(jù)中心顯卡)

OpenCompass

大模型開源評測體系:6個維度進行評測。
主要面向基座模型和對話模型。

LMDeploy

大模型部署LMDeploy:

  • 模型并行
  • 低比特量化
  • Attention優(yōu)化
  • 計算和訪存優(yōu)化
  • 持續(xù)批處理。

支持模型的輕量化(4bit權重、8bit k/v)、推理(turbomind & pytorch)和服務(open-ai server, gradio, triton inference server),對外提供python、grpc、restful接口。

Lagent

LLM局限:最新知識獲??;回復可靠性;數(shù)學計算;工具使用和交互。
使用LLM驅動智能體。
輕量級Lagent框架:
ReAct:根據(jù)輸入選擇工具
ReWoo:根據(jù)輸入劃分計劃
AutoGPT:人工干預

支持多種大語言模型,集成了一些工具。

AgentLego

多模態(tài)智能體工具箱,聚焦工具集合。
支持多種主流智能體系統(tǒng),如langchain、transformers agent、Lagent
支持多模態(tài)工具調用接口
支持一鍵式部署。

Lagent案例

短期記憶
推理與計劃
長期記憶
環(huán)境互動
多智能體寫作

Agent不是一個app,它是應用LLM的框架。
計劃、行動、反饋、學習
agent架構
LLM for agent(agent對LLM的要求):

  • 邏輯推理能力
  • 信息抓取能力
  • 指令遵循能力
  • 工具使用能力

提示工程思維模型

  • 把模型想象成沒有任何背景信息的新人 stateless
  • 平行宇宙概念模型 model pre-training
  • 模型需要文本輸出來思考 auto-regressive

工具:code copilot; EasyDict

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容