RAG-Flow部署本地微調(diào)過的模型使用

在Ubuntu服務(wù)器上啟動(dòng)RAGFlow服務(wù)器
在這篇博客中,我們將介紹如何在Ubuntu服務(wù)器上啟動(dòng)RAGFlow服務(wù)器。我們將確保系統(tǒng)配置滿足RAGFlow的要求,然后通過Docker Compose來啟動(dòng)服務(wù)器。

先決條件
在開始之前,請(qǐng)確保您已經(jīng)安裝了以下軟件:

Docker
Docker Compose
Git
如果您還沒有安裝這些軟件,可以參考以下鏈接進(jìn)行安裝:

Docker 安裝指南
Docker Compose 安裝指南
Git 安裝指南
配置系統(tǒng)參數(shù)
RAGFlow要求vm.max_map_count的值不小于262144。首先,我們需要確認(rèn)當(dāng)前系統(tǒng)的vm.max_map_count值,并根據(jù)需要進(jìn)行調(diào)整。

確認(rèn) vm.max_map_count 的大小

打開終端并運(yùn)行以下命令:

sysctl vm.max_map_count

如果輸出的值小于262144,我們需要進(jìn)行調(diào)整。

臨時(shí)設(shè)置 vm.max_map_count

運(yùn)行以下命令將vm.max_map_count的值設(shè)置為262144:

sudo sysctl -w vm.max_map_count=262144

永久設(shè)置 vm.max_map_count

要使設(shè)置在系統(tǒng)重啟后仍然有效,需要編輯/etc/sysctl.conf文件。

使用以下命令編輯文件:

sudo nano /etc/sysctl.conf

在文件末尾添加以下行:

vm.max_map_count=262144

保存文件并退出編輯器。

克隆RAGFlow倉庫
接下來,我們將克隆RAGFlow的Git倉庫。

運(yùn)行以下命令克隆倉庫:

git clone https://github.com/infiniflow/ragflow.git

進(jìn)入docker目錄:

cd ragflow/docker

啟動(dòng)RAGFlow服務(wù)器
我們將使用提前編譯好的Docker鏡像來啟動(dòng)服務(wù)器。

賦予執(zhí)行權(quán)限

運(yùn)行以下命令賦予entrypoint.sh腳本執(zhí)行權(quán)限:

chmod +x ./entrypoint.sh

配置Docker Compose文件

如果您想運(yùn)行特定版本的RAGFlow Docker鏡像,請(qǐng)?jiān)赿ocker/.env文件中找到RAGFLOW_VERSION變量,并將其設(shè)置為對(duì)應(yīng)的版本號(hào)。例如:

RAGFLOW_VERSION=v0.7.0

啟動(dòng)服務(wù)器

運(yùn)行以下命令啟動(dòng)服務(wù)器:

docker compose -f docker-compose-CN.yml up -d

注意,運(yùn)行上述命令會(huì)自動(dòng)下載RAGFlow的開發(fā)版本Docker鏡像。鏡像文件大約9GB,下載過程可能需要一些時(shí)間,請(qǐng)耐心等待。

確認(rèn)服務(wù)器狀態(tài)
服務(wù)器啟動(dòng)成功后,您可以通過以下命令查看服務(wù)器日志,確認(rèn)服務(wù)器是否正常運(yùn)行:

docker logs -f ragflow-server

出現(xiàn)以下界面提示說明服務(wù)器啟動(dòng)成功:

    ____                 ______ __
   / __ \ ____ _ ____ _ / ____// /____  _      __
  / /_/ // __ `// __ `// /_   / // __ \| | /| / /
 / _, _// /_/ // /_/ // __/  / // /_/ /| |/ |/ /
/_/ |_| \__,_/ \__, //_/    /_/ \____/ |__/|__/
              /____/

 * Running on all addresses (0.0.0.0)
 * Running on http://127.0.0.1:9380
 * Running on http://x.x.x.x:9380
 INFO:werkzeug:Press CTRL+C to quit

啟動(dòng)Xinference 部署本地模型
Xinference是一款利用GPU加速推理的強(qiáng)大工具。本篇博客將指導(dǎo)您如何在安裝了CUDA的機(jī)器上正確配置并啟動(dòng)Xinference Docker容器。

準(zhǔn)備工作
啟動(dòng)Xinference容器
使用以下命令啟動(dòng)Xinference容器,將9997端口映射到宿主機(jī)的9998端口,并指定日志級(jí)別為DEBUG:

docker run \
  -v /data1:/data1 \
  -p 9997:9997 \
  --gpus all \
  xprobe/xinference:v<latest> \
  xinference-local -H 0.0.0.0

參數(shù)說明

-p 9998:9997: 將容器內(nèi)的9997端口映射到宿主機(jī)的9998端口。
--gpus all: 使用所有可用的GPU。
xprobe/xinference:v<your_version>: 指定鏡像版本,將<your_version>替換為實(shí)際版本號(hào)。
xinference-local -H 0.0.0.0 

--log-level debug: 啟動(dòng)Xinference服務(wù)并設(shè)置日志級(jí)別為DEBUG。
警告

--gpus 參數(shù)必須指定,因?yàn)殓R像需要運(yùn)行在有GPU的機(jī)器上,否則會(huì)出現(xiàn)錯(cuò)誤。
-H 0.0.0.0 參數(shù)也必須指定,否則在容器外無法連接到Xinference服務(wù)。
可以指定多個(gè)-e選項(xiàng)設(shè)置多個(gè)環(huán)境變量。

在網(wǎng)頁端注冊(cè)本地模型


image.png

在網(wǎng)頁端運(yùn)行模型

image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容