tensorflow多GPU多进程占用问题机器学习

问题描述： import tensorflow之后， train model时报错；
报错信息：Internal: failed initializing StreamExecutor for CUDA device ordinal 3: Internal: failed call to cuDevicePrimaryCtxRetain: CUDA_ERROR_OUT_OF_MEMORY; total memory reported: 8506179584
报错原因： Tensorflow默认会使用尽可能多的GPU，并且占用所使用的GPU。因此如果有别的Tensorflow正在使用GPU，而自己的程序使用默认配置，那么是无法使用已经被使用的GPU的，也无法单独使用一块没有被使用的GPU，导致报错。
查看此时服务器上GPU的使用情况：可以看出我自己的程序报错正是这个原因，服务器上的jupyter已经在运行其他程序，占用了一块GPU，而我的程序并没有对GPU进行设置，而是使用的是默认的配置。

文章图片

解决方法：在程序里指定其他的GPU，比如‘1’