使用集群运行你的python代码

集群中有四台主机,master(无GPU),node01,node02,node03(GPU主机),直接运行python main.py程序将在CPU中运行。
如下步骤可以运行你的程序:
在你的文件目录下新建一个 lsf.sh 文件,正文写入:

#!/bin/sh#BSUB -q normal#BSUB -o %J.out#BSUB -e %J.err#BSUB -n 1 #BSUB -J JOBNAME#BSUB-R span[ptile=1]#BSUB -m "node03"#BSUB-gpunum=1python main.py

其中 python main.py 是你运行程序的命令,然后:
source activate 你的conda环境
开启环境,用
【使用集群运行你的python代码】bsub 向集群提交运算任务。
即可运行程序,终端会给你一个任务序号,输出文件就是序号.out序号.err
** 其他命令:**
bjobs -W查看你的任务运行状况
bhosts -gpu查看集群GPU使用情况。

    推荐阅读