《告别断线噩梦:tmux & Screen 终极指南——SSH 会话持久化+分屏+Conda/Docker 全流程实战,让深度学习训练永不停歇》
网络一断、电脑一关,远程训练就白跑?本文用一篇吃透 tmux/Screen 的安装、新建、挂起、恢复、分屏、杀会话全套操作,并给出 Conda 与 Docker 容器内持久化训练的最佳实践,100 行命令复制即用,从此长任务稳挂后台,换机重连零丢失。
·
计算机SSH 登录访问远程服务器时,打开一个远程窗口执行命令。网络延迟和电脑远端串口一直打开影响我们办公,再次登录的时候,是找不回上一次执行的命令的。因为上一次 SSH 会话已经终止了,里面的进程也随之消失了。尤其 在深度学习跑模型时,训练需要很长时间,不可能一致盯着电脑。为了解决这个问题,会话与窗口可以"解绑":窗口关闭时,会话并不终止,而是继续运行,等到以后需要的时候,再让会话"绑定"其他窗口。
在一个终端窗口(terminal window,以下简称"窗口"),在里面输入命令。 打开一个终端窗口(terminal window)即图形界面,即为窗口,我们可以在里边进行操作,terminal中输入命令用户与计算机的这种临时的交互,称为一次"会话"(session)
一、tmux安装和Screen安装
1.tmux安装
# Ubuntu系统
sudo apt install tmux
2.Screen安装
# Ubuntu系统
apt-get update
apt-get install screen
# 输入 y 继续安装
二、tmux使用和Screen使用
1.tmux使用
(1)新建会话同时进入会话
:~$ tmux new -s test1
%%会话名为test1
%%然后自动进入会话
[detached (from session test1)]
(2)退出当前会话
%%会话里退出当前会话
%%ctal+B再按D
(3)查看当前有哪些会话
%%主环境下查看有哪些会话
tmux ls
(4)进入已建的会话
%%进入当前已创会话
tmux attach -t 会话名
(5)关闭已建的会话,并演示
%%关闭tmux建立的会话并关闭会话里申请资源
%%格式tmux kill-session -t 会话名
%%演示
wlc:~$ tmux ls%%查看当前有几个会话,以下两个
test: 1 windows (created Sat Nov 5 16:55:37 2022)
test1: 1 windows (created Sun Nov 6 22:14:49 2022)
wlc:~$ tmux kill-session -t test1%%关闭test1会话
wlc:~$ tmux ls%%查看当前有几个会话,以下一个
test: 1 windows (created Sat Nov 5 16:55:37 2022)
wlc:~$ tmux kill-session -t test%%继续关闭test会话
wlc:~$ tmux ls%%查看当前有几个会话,当前无会话
no server running on /tmp/tmux-1008/default
(6)其他操作
一个会话或多个会话分屏,在后面说明.
Ctrl+b s:列出所有会话。
Ctrl+b $:重命名当前会话。
Ctrl+b %:划分左右两个窗格。
Ctrl+b ":划分上下两个窗格。
Ctrl+b <arrow key>:光标切换到其他窗格。<arrow key>是指向要切换到的窗格的方向键,比如切换到下方窗格,就按方向键↓。
Ctrl+b ;:光标切换到上一个窗格。
Ctrl+b o:光标切换到下一个窗格。
Ctrl+b {:当前窗格与上一个窗格交换位置。
Ctrl+b }:当前窗格与下一个窗格交换位置。
Ctrl+b Ctrl+o:所有窗格向前移动一个位置,第一个窗格变成最后一个窗格。
Ctrl+b Alt+o:所有窗格向后移动一个位置,最后一个窗格变成第一个窗格。
Ctrl+b x:关闭当前窗格。
Ctrl+b !:将当前窗格拆分为一个独立窗口。
Ctrl+b z:当前窗格全屏显示,再使用一次会变回原来大小。
Ctrl+b Ctrl+<arrow key>:按箭头方向调整窗格大小。
Ctrl+b q:显示窗格编号。
2.Screen使用
(1)新建会话同时进入会话,新建一个叫test的session
:~$ screen -S test
%%会话名为test
%%然后自动进入会话
(2)退出当前会话
%%会话里退出当前会话
%%ctal+a再按D
(3)查看当前有哪些会话,列出当前所有的session
%%主环境下查看有哪些会话
screen -ls
1@hz40:~$ screen -ls
There are screens on:
3409115.Hello (2023年07月13日 18时31分08秒) (Detached)
3322432.name1 (2023年07月13日 16时53分40秒) (Detached)
(4)进入已建的会话,回到之前已建的session
%%进入当前已创会话
screen -r 会话名
(5)关闭已建的会话,前提已在会话里面
三种
Ctril+a+k %%会话里面,还要输入Y确认,然后关闭退出回到主环境
或者
输入 : exit %%会话里面,释放资源意思
或者
kill ScreenID %%主环境,可以先查看当前会话,screen -ls,会显示会话进程号,再通过kill 进程号,结束会话
(6)其他操作
Ctrl+a+n %%下一个Screen会话
Ctrl+a+p %%下一个Screen会话
Ctrl+a+c %%创建新的Screen会话
三、在conda环境和docker里使用会话
1.Conda 环境(宿主机或容器内都通用)
- 创建并进入独立环境
conda create -n det python=3.8 -y
conda activate det
- 把环境「暂挂」到后台(detach)
先装 tmux(宿主机)
sudo apt-get install -y tmux
tmux new -s det # 新建会话
conda activate det
python train.py # 任意长任务
# 然后按 Ctrl+b d detach;任务继续在后台跑
- 重新连回
tmux a -t det
- 一键查看/杀掉
tmux ls
tmux kill-session -t det
2.Docker 容器内部(推荐在「容器里」用 tmux,而不是宿主机)
- 启动容器后,先进容器再开会话
docker exec -it DL-GPU bash # 进入容器
tmux new -s work
conda activate det # 如果容器里还有 conda
python train.py
# Ctrl+b d detach
- 换电脑 / 掉线后重新连
docker exec -it <container> bash
tmux a -t work
- 一个容器开多个「窗口」
tmux new -s work
Ctrl+b c # 新建窗口
Ctrl+b 0/1/2 # 切换窗口
Ctrl+b , # 给窗口改名
- 容器外想「一条命令」直接 attach
docker exec -it <container> tmux a -t work
四、一个会话或多个会话分屏,在后面说明
1.一个会话里直接分屏
- 新建或进入会话
tmux new -s work # 或 tmux a -s work
- 默认竖直分屏
Ctrl+b %
- 再水平分屏
Ctrl+b "
- 现在左/右上下的 pane 都同属 work 这一个会话,随便跑不同命令/进不同容器。
#在 pane 间跳
Ctrl+b <arrow> # 方向键
#关闭当前 pane
Ctrl+b x
2.已经存在两个独立会话,想“并排看”
- 方法 1(tmux 内置 link-panes)
# 在 session A 里先把目标 window 改成允许 link
tmux set-window-option allow-panes on
# 把 session B 的 window 0 拉进当前窗口,生成一个新 pane
tmux link-window -s B:0 -t A:0
此时两个不同会话的窗口被合成一个,左右/上下都能看。
- 方法 2(更直观:join-pane)
# 在 session A 当前窗口
tmux join-pane -s B:0.0 # 把 session B 的第 0 个 window 的第 0 个 pane 拉过来
或
# 在会话 A 里执行
tmux link-window -s B:0 -t A:1 # 把 B:0 作为 A 的新窗口 1
# 或者只拉一个 pane
tmux join-pane -s B:0.0 -h # -h 左右并排,-v 上下并排
更多推荐
所有评论(0)