學(xué)習(xí)LLM(九)- ChatGLM

現(xiàn)在ChatGLM已經(jīng)開(kāi)源了ChatGLM3.

官方github地址

部署環(huán)境:
操作系統(tǒng):Window
Python: 3.10.8
GPU:RTX 4090

嘗試了下本地搭建了一個(gè)本地模型。


配置圖

不過(guò)在部署的時(shí)候torch庫(kù)挺高的,和gpu的版本還有toolkit版本需要高度對(duì)應(yīng)。
不然就會(huì)報(bào)torch.cuda.is_avaliable 為False的錯(cuò)誤。

這個(gè)時(shí)候我們需要到Torch官網(wǎng)去下載對(duì)應(yīng)的GPU驅(qū)動(dòng)。

但是這里這里我還需要先獲取下本地的gpu驅(qū)動(dòng)程序信息
首先我們從終端里輸入

nvidia-smi

顯卡驅(qū)動(dòng)信息

然后從NVIDIA-SMI看到驅(qū)動(dòng)的版本號(hào)385.54,然后從下面這張圖中查看對(duì)應(yīng)的CUDA軟件版本。


CUDA版本對(duì)照1

CUDA版本對(duì)照2

比如這里驅(qū)動(dòng)的版本號(hào)是500那對(duì)應(yīng)的軟件版本是CUDA 11.6 GA,就需要查看老版本對(duì)應(yīng)的軟件版本的下載指令。
首先卸載torch然后重新安裝。

pip uninstall torch
pip install torch==1.13.0+cu116 torchvision==0.14.0+cu116 torchaudio==0.13.0 --extra-index-url https://download.pytorch.org/whl/cu116

這里建議不要用conda安裝,conda每次安裝都會(huì)安裝cpu版本,被坑了好幾次,用pip安裝就沒(méi)問(wèn)題。解決了這個(gè)問(wèn)題之后基本就能順利部署chatGLM3到本地了。當(dāng)然用官方的github跑出來(lái)前端ui代碼各種問(wèn)題,我懶得去看,直接從命令行運(yùn)行是沒(méi)有問(wèn)題的。


image.png

補(bǔ)充下chatGLM3支持工具鏈調(diào)用,在prompt上做了一些規(guī)范,最好閱讀一下prompt指導(dǎo)文件

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容