1,下载软件登录

在这里插入图片描述

2 使用winscp 将自己的程序导入最好是压缩包,导入后

在这里插入图片描述
在这里插入图片描述
从左边拖拽到右边即可
改代码双击右边想改的文件即可

3 加载安装环境

module load anaconda/2020.11
source activate torch

激活环境后可以使用pip 安装依赖包

4 创建运行脚本

如下代码例子

#!/bin/bash
#加载环境,此处加载 anaconda 环境以及通过 anaconda 创建的名为 pytorch 的环境
module load anaconda/2020.11
source activate torch
module load cuda/10.1
#python 程序运行,需在.py 文件指定调用 GPU,并设置合适的线程数,batch_size大小等
python Train_Fnet.py

5 运行程序

sbatch --gpus=1 ./run.sh

这个是使用和申请一个gpu 运行程序

6 查看运行状态

parajobs

查看当前程序运行状态如下

             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)
             30350       gpu   run.sh  scv1274  R      17:52      1 g0002
    30350 作业GPU利用率为:
index, utilization.gpu [%], utilization.memory [%], memory.total [MiB], memory.free [MiB], memory.used [MiB]
0, 23 %, 0 %, 32510 MiB, 31152 MiB, 1358 MiB

7 终止程序

30350是jobsid
使用id可以停止此程序

scancel 30350

8 查看输出

使用ls可以看到 运行目录下有一个.out为结尾的log文件

cat  slurm-30344.out
Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐