
1. GPU設(shè)置
使用GPU版本的TensorFlow跑程序默認(rèn)是占用所有主機(jī)GPU,但計(jì)算過程中只會(huì)用其中一塊。也就是說所有顯卡都閑著,但其顯存都被占用了,所以別人也用不了。
這種情況通過在程序之前加三行代碼:
import os
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
os.environ['CUDA_VISIBLE_DEVICES'] = "0,1"
如不想使用GPU,第三行代碼 = ""?
?nvidia-smi 觀察一下GPU顯存使用情況。
2. 殺死進(jìn)程
kill -9 + pid