具體可參見博客:https://blog.csdn.net/duguxiaobiao/article/details/91492965
新建容器(新建了一個名字叫 jk 的,鏡像名叫 anibali/pytorch:cuda-10.0 bash 的,掛載了 /media/disk1 的內(nèi)存大小為 10G的 容器)
nvidia-docker run -it -v /media/disk1:/usr/task --shm-size=10g --name jk anibali/pytorch:cuda-10.0 bash
docker run -it --gpus '"device=0,1"' -v /home/jinkan/project:/usr/project --shm-size=10g --name jk pytorch/pytorch:1.6.0-cuda10.1-cudnn7-devel /bin/bash
內(nèi)存不夠報錯:DataLoader worker (pid XXXX) is killed by signal: Bus error(Pytorch多workers讀取Data Loader)
在容器內(nèi)部查看內(nèi)存信息:df -h
解決方案:https://blog.csdn.net/qq_30852205/article/details/98723261
占用所有內(nèi)存的新建容器方案
nvidia-docker run -it -v /media/disk1:/usr/task --ipc=host --name jk_task anibali/pytorch:cuda-10.0 /bin/bash
停止容器
docker stop 容器NAMES/容器ID
刪除容器
docker rm 容器NAMES/容器ID
查看正在運(yùn)行的容器
docker ps
查看所有容器,包括運(yùn)行的和不運(yùn)行的
docker ps -a
進(jìn)入正在運(yùn)行的容器
docker attach 容器NAMES/容器ID
退出容器并且容器繼續(xù)運(yùn)行
ctrl + p + q
退出容器(此時容器會停止運(yùn)行)
exit
重啟已停止的容器
docker start 容器ID