Ubuntu使用nohup命令训练神经网络
Ubuntu使用nohup命令训练神经网络
·
简介
为了防止在使用终端训练模型时因为网络原因造成终端连接中断而导致训练终止
方法/步骤:
-
运行命令 nohup 自己要运行的命令 &,例如:
nohup python train.py &
注意:一定要有&符号的,nohup &的意思是已经后台运行了,且打印的log文件不会显示在命令行了,默认放在运行命令文件夹下的nohup.out
-
查看运行结果
cat nohup.out # 或者 tail -f nohup.out
-
终止运行
kill -9 [PID]
这个PID进程号可以在首次运行nohup时查看,或者使用如下命令来查看显卡信息:
nvidia-smi # 或者 watch -n 0.5 nvidia-smi
上述第二个命令是动态查看显卡信息,-n的参数是0.5,代表0.5秒刷新一次,可以根据自己的实际情况设置
更多推荐
已为社区贡献1条内容
所有评论(0)