qsub系統(tǒng)適用于服務器集群的任務提交
參考地址
qsub提交系統(tǒng)使用說明
運行命令
qsub run.s
PBS的walltime于qsub -a 的時間格式是不一樣的
#PBS -l walltime=296:00:00這是設置程序最大運行時間為296小時。這個時間不一定嚴格要求是每級2個字符,同時默認的最低級是秒。
制定命令開始運行的時間19小時05分鐘
qsub -a 1905 run.s
qsub -a參數(shù)詳解
默認是[[[YY]MM]DD]hhmm[.ss]對應年月日時分秒,每一級2個字符。
正確的寫法 例如:
qusb -a 070000 run.s #7天后運行程序,此時是處于W狀態(tài)(等待狀態(tài))
qsub -a 2400 run.s #24h后運行程序
運行命令前修改run.s里面的工作路徑和sh腳本名稱
sh腳本是真正需要運行的命令
#參數(shù)解析
#指定節(jié)點數(shù)目 ppn指每個節(jié)點運行的cpu數(shù)量(4個小節(jié)點,每個48個CPU)
#PBS -l nodes=1:ppn=16
#指定合并到標準輸出文件中
#PBS -j oe
#設置程序運行的最大時間192小時
#PBS -l walltime=192:00:00
#指定qsub的所有環(huán)境變量都傳遞到批處理作業(yè)中
#PBS -V
#輸出文件
#PBS -o /public/home/tang/chaim/back_info/$jobname.out
#錯誤輸出文件
#PBS -e /public/home/tang/chaim/back_info/$jobname.err
查看狀態(tài)qstat
#查詢已經(jīng)配置的所有節(jié)點池狀態(tài)信息
qstat -q
#顯示已經(jīng)提交的作業(yè)狀態(tài)信息
qstat -a
#顯示制定作業(yè)的所有狀態(tài)信息
qstat -f 23.console
#顯示服務器狀態(tài)
qstat -B
#查看指定任務的運行情況
qstat -f 1354 #查看任務id為1354的詳細信息
#查看服務器空閑節(jié)點
pbsnodes -l free
#查看所有節(jié)點運行情況
pbsnodes
#查看用戶所提交的作業(yè)
qsub -q long run.s
#刪除任務
qdel 1305
qdel -u mei #刪除mei這個用戶的所有任務
#查看用戶進程
qstat -u * #所有用戶的任務
qstat -u username #查看指定用戶任務
qstat -j 1308 #查看任務1308(id號)的詳細信息
#掛起進程
qmod -s 1323 #掛起1323任務
#繼續(xù)運行某個掛起的任務
qmod -us 1323
qstat
Job id Name User Time Use S Queue
—————- —————- —————- ———— ——
1305.node100 test tang 0 R small
其中,Job id 是任務的標識符,Name 是任務名稱,User是任務所有者,Time Use 是CPU使用時間,S 是任務當前狀態(tài)(本例中 R表示正在運行),Queue表示任務所在隊列。任務的狀態(tài)如下:
* B 只用于任務向量,表示任務向量已經(jīng)開始執(zhí)行
* E 任務在運行后退出
* H 任務被服務器或用戶或者管理員阻塞
* Q 任務正在排隊中,等待被調(diào)度運行
* R 任務正在運行
* S 任務被服務器掛起,由于一個更高優(yōu)先級的任務需要當前任務的資源
* T 任務被轉移到其它執(zhí)行節(jié)點了
* U 由于服務器繁忙,任務被掛起
* W 任務在等待它所請求的執(zhí)行時間的到來(qsub -a)
* X 只用于子任務,表示子任務完成
* C 表示程序正在被關閉,一般是程序運行錯誤,報錯。
在PBS的參數(shù)設置時,不要使用變量,我使用變量,結果是參數(shù)無效。