用2GPU可以跑,但是4GPU或8GPU会报下面的错误

cke_343.png

cke_726.png

上图分别是报错提示和运行训练的指令

****************************************************解答*****************************************************

从你的截图里只知道你在第三张卡(rank2)上的程序被killed了,signal 9 是linux scheduler杀死进程而非进程自己退出(stackoverflow 参考)。你的程序内的错误信息被隐藏了

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐