Ubuntu使用nohup命令训练神经网络

简介

为了防止在使用终端训练模型时因为网络原因造成终端连接中断而导致训练终止

方法/步骤:

  1. 运行命令 nohup 自己要运行的命令 &,例如:

    nohup python train.py &
    

    注意:一定要有&符号的,nohup &的意思是已经后台运行了,且打印的log文件不会显示在命令行了,默认放在运行命令文件夹下的nohup.out

  2. 查看运行结果

    cat nohup.out 
    # 或者 
    tail -f nohup.out
    
  3. 终止运行

     kill -9 [PID]
    

    这个PID进程号可以在首次运行nohup时查看,或者使用如下命令来查看显卡信息:

    nvidia-smi
    # 或者
    watch -n 0.5 nvidia-smi 
    

    上述第二个命令是动态查看显卡信息,-n的参数是0.5,代表0.5秒刷新一次,可以根据自己的实际情况设置

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐