docker和Nvidia-docker安装教程
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v4pOI7oL-1681262319034)(/home/zhr/.config/Typora/typora-user-images/image-20210814140407145.png)]pycharm远程使用docker环境,调试。解决办法:https://stackoverflow.com/questions/5
channels:
- https://mirrors.ustc.edu.cn/anaconda/pkgs/main/
- https://mirrors.ustc.edu.cn/anaconda/cloud/conda-forge/
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- defaults
show_channel_urls: true
docker和Nvidia-docker安装
-
先关闭ubuntu内核自动更新 https://www.cnblogs.com/yangzhaon/p/12911751.html
禁止内核更新,防止系统进不去。
-
不执行
sudo apt-get update直接选择跳过这个命令 -
更换源:选择下载服务器,更换为aliyun
-
docker安装步骤:https://www.cnblogs.com/songxi/p/12788249.html
-
nvidia-docker安装步骤:https://zhuanlan.zhihu.com/p/139484230
-
typora安装:https://www.typora.io/#linux 用命令安装的,binary File安装的挺奇怪的
-
搜狗输入法安装:https://pinyin.sogou.com/linux/help.php
1️⃣fcitx安装:
sudo apt-get install fcitx2️⃣
sudo dpkg -i sogoupinyin_版本号_amd64.deb缺少以来3️⃣
sudo apt -f install安装依赖 最后重启计算机
-
安装nvidia-docker时出现的问题:
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo gedit /etc/apt/sources.list.d/nvidia-docker.list进去把60行给注释掉了。
-
安装git 以及配置账号https://blog.csdn.net/qq_42690368/article/details/82319238
本来就有git,不用安装git了
-
拉取https://github.com/avanetten/yoltv4 的代码下来:然后
sudo nvidia-docker build -t yoltv4_image ./yoltv4/docker
-
https://github.com/getlantern/lantern lantern
安装
sudo dpkg -i lantern-installer-64-bit.deb -
https://xtremedownloadmanager.com/ 下载xdm
1️⃣
tar xvf **.tar.gz解压 2️⃣ 使用终端进入该目录:输入./install.sh -
猎豹浏览器扩展插件商店:https://addons.mozilla.org/zh-CN/firefox/?utm_source=firefox-browser&utm_medium=firefox-browser&utm_content=find-more-link-bottom
-
宿主机和容器交换数据:https://blog.csdn.net/weixin_45111741/article/details/104370933
⭕️ 宿主机到容器:
docker cp 需要拷贝的文件或者目录 容器名称:容器目录 -
linux vscode安装
docker相关
-
https://www.cnblogs.com/rosebud7/p/14844844.html Linux通过手机USB网络共享上网
-
https://blog.csdn.net/iw1210/article/details/84674936 创建新docker容器时出现了 container name already in use by container问题的解决办法
# 列出本地镜像: $ docker images # 创建新容器,容器名被占用,须移除或重命名后才能使用这个容器名 $ docker run --name tomacat8080 -d -p 8080:8080 tomca # 查看所有的容器,包括停止的。 $ docker ps -a # 补充一下,如果想重新启动之前的,可以 docker ps -a 找到对应的容器然后 $ docker start containerId zhr@zhr-Lenovo-Legion-Y7000P2020H:~$ docker images REPOSITORY TAG IMAGE ID CREATED SIZE yoltv4_image latest 686ad47a3332 5 days ago 14GB nvidia/cuda 11.3.1-devel-ubuntu16.04 0c1a2cf083a5 5 weeks ago 4GB zhr@zhr-Lenovo-Legion-Y7000P2020H:~$ docker ps -a CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 2e112b744a44 yoltv4_image "/bin/bash" 5 days ago Exited (1) 5 days ago yoltv4_gpu0 # 重新启动之前的镜像 $ docker start 2e112b744a44 # nvidia-docker run 启动镜像,将镜像转换为实例运行起来 # -it docker将创建一个交互式的容器,可以实现应答模式。 # -v # -ti NV_GPU=0 nvidia-docker run -it -v /local_data:/local_data -v /yoltv4:/yoltv4 -ti --ipc=host --name yoltv4_gpu0 yoltv4_image-
dokcer run https://www.twle.cn/l/yufei/docker/docker-basic-run.html
docker镜像只有运行起来,才会创建一个容器,对外提供服务。
docker—腾讯服务器上的QQ程序;
容器------安装在用户电脑上的QQ软件
将镜像转换成容器,把镜像run起来,才能对外提供服务。所以使用docker run
-
https://www.cnblogs.com/wuchangsoft/p/9767170.html nvidia-docker
-
https://blog.csdn.net/u013355826/article/details/89633619 docker命令
$ docker run [OPTIONS] IMAGE[:TAG] [COMMAND] [ARG....] Options -- name: 容器名字 --d: 后台运行容器 --rm: 容器退出后删除容器 -v: 数据卷挂载 -p: 端口映射 -P: 映射所有暴露的端口 -e: 设置容器中的环境变量 -t: 开启终端 -i: 打开标准输入 -u: 设置用户的UID -w: 设置容器中的工作目录 -m: 内存限制 --cpuset-cpus: 设置容器具体使用的CPU --add-host: 增加hosts到容器的/etc/hosts --privileged: 打开特权模式 # nvidia-docker使用 NV_GPU使能GPU卡 $ nvidia-docker run --rm nvidia/caffe nvidia-smi- 从一个容器中退出来后,怎么再进入这个容器
-
finally
# 启动一个docker 重新启动之前的镜像
$ docker start 2e112b744a44
# 进入容器
$ sudo nvidia-docker attach 2e112b744a446f9c3d64bce37484a62e77fce3356b794227e863665db814067# 退出容器
exit
# 容器终止
进入了曾经的容器中!
'argon2:$argon2id$v=19$m=10240,t=10,p=8$YpnL7YLI51AaCfMTM3JjgA$6y+vUEFeiPXVG4kZdsbBlQ'
sudo not found
https://blog.csdn.net/qq_28822933/article/details/83930147
apt-get update
# 只使用下一条指令,没用。需要更新源才行
apt-get install sudo
docker中使用jupyter notebook
https://blog.csdn.net/weixin_40008349/article/details/81135847
服务器没有可视化的工具,python的jupyter notebook时实时调试工具
-
docker建立container时,用-p指令为container指定映射端口
docker run -p 7777:8888 [] -
修改运行中的容器的端口映射
argon2: a r g o n 2 i d argon2id argon2idv=19$m=10240,t=10,p=8$1uln5M42rFGKdlI4tWxbAg$4ouewYPaDeqd8rSIaZ1qMg
install
-
2021年8月11日 install pycharm 百度云盘,pycharm同意破解成功。
-
pycharm远程使用docker环境,调试。https://www.jetbrains.com/pycharm/download/other.html 下载pycharm 3.5版本
-
安装linux信使与windows内网通通信,修改编码方式为gb,可以实现通信,否则通信不了。
# https://blog.csdn.net/ambm29/article/details/96483086
sudo apt-get update 更新源
# 安装ssh-server
apt-get install openssh-server
# 检查是否安装成功
service ssh start
# 设置ssh自启动
echo 'service ssh start'>>~/.bashrc
# ssh登录设置一个密码
passwd
# 使用命令vim /etc/ssh/sshd_config 修改下面两个配置
# https://www.cnblogs.com/famine/p/13332023.html docker目录映射命令
https://cloud.tencent.com/developer/article/1750909 修改docker容器的目录映射
# 1. 暂停docker服务
systemctl stop docker
# 2. 进入docker容器配置文件目录下
cd /var/lib/docker/containers/
ls
# 3.
# 重新启动docker服务
systemctl stop docker
docker start ***contanier-ID
# 下面这个命令的含义:①需要sudo ② NV_GPU表明使用的哪个GPU ③-it交互式 ④ -v docker目录映射,在local_data映射到local_data ⑤name 容器名称 yoltv4_gpu0
NV_GPU=0 nvidia-docker run -it -v /local_data:/local_data -v /yoltv4:/yoltv4 -ti --ipc=host --name yoltv4_gpu0 yoltv4_image
# 这里面没有映射端口号呢 -p [宿主机端口号]:[要映射的docker容器端口号] [IMAGE]:[TAG]
# -it 改为 -id,d让容器以守护进程的方式在后台运行。不启动docker的命令行。
docker rm contanier # 删除容器
# 重新创建一个有目录映射的容器,后台守护,有端口映射的容器
# 1.
sudo NV_GPU=0 nvidia-docker run -it -v /local_data:/local_data -v /yoltv4:/yoltv4 -ti --ipc=host -p 10001:22 --name yoltv4_gpu0 yoltv4_image
# 2. 配置ssh
apt-get update
apt-get install ssh-server
# 3.
service ssh start
# 自启动
echo 'service ssh start'>>~/.bashrc
# 4.passwd
passwd
vim /etc/ssh/sshd_config # 修改配置
# !!!!!! 一定要执行这一步
service ssh restart
https://stackoverflow.com/questions/60490921/connecting-by-sftp-to-a-deployment-server-in-pycharm-does-not-work 卡在conneting的部分
https://blog.csdn.net/weixin_42548893/article/details/112452997 vsCode教程
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FYJuaIlq-1681262319031)(/home/zhr/桌面/image-20210812110116583.png)]
yolov3环境配置
安装Pytorch
nvidia-smi # 查看cuda版本nvcc -Vnvcc -version # 查看cuDNN版本cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2# yoltv4环境中,cudnn=8.2.0.53; cuda 11.3.1 python环境环境为3.7.5https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/ # 相关镜像为:https://blog.csdn.net/kate_mj/article/details/105751631conda install pytorch torchvision cudatoolkit=11.1
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jpsKk52h-1681262319032)(/home/zhr/.config/Typora/typora-user-images/image-20210814112323636.png)]
# 官方推荐安装方式如下:# NOTE: 'nvidia' channel is required for cudatoolkit 11.1conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c nvidia
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-etUvhYB8-1681262319032)(/home/zhr/.config/Typora/typora-user-images/image-20210814133209323.png)]
# 查看cudnn版本cat /usr/local/cuda/version.txt
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pZHDQkJK-1681262319033)(/home/zhr/.config/Typora/typora-user-images/image-20210814113002133.png)]
我在安装的时候总是中断,解决办法:
https://blog.csdn.net/gz153016/article/details/104545121
注意:官网上的命令行要把末尾-c pytorch删掉才会用清华源。
例如:conda install pytorch==1.2.0 torchvision == 0.4.0
配置清华源:
https://blog.csdn.net/hktxt/article/details/82111203
配置:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
————————————————
版权声明:本文为CSDN博主「qq_34872636」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_34872636/article/details/110531462
# 安装的太慢了 而且设置了清华源的conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/# 设置搜索时显示通道地址conda config --set show_channel_urls yes# 安装pytorchconda install pytorch torchvision cudatoolkit=11.1# https://blog.csdn.net/qq_18620653/article/details/105420158 离线安装pytorch# 需要torch包,torchvisionhttps://www.cnblogs.com/darkknightzh/p/12000809.html # 离线安装需要:① pytorch # pytorch-1.9.0-py3.7_cuda11.1_cudnn8.0.5_0.tar.bz2②torchvison # torchvision-0.9.1-py37_cu111.tar.bz2③cudatoolkit # linux-64/cudatoolkit-11.3.1-h2bc3f7f_2.tar.bz2https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/ # 清华下载地址# https://blog.csdn.net/caiguanhong/article/details/112184290# pytorch GPU cuda和torchvision对应版本
-
https://www.cnblogs.com/darkknightzh/p/12000809.html 下载下来离线安装
-
离线安装需要版本对应
# 1. 查nvidia版本 2.查cuda版本 3.查cudnn版本$ nvidia-smi # cuda 11.4 cudnn版本 $ nvcc --version # cuda 11.3# 离线安装需要:① pytorch # pytorch-1.9.0-py3.7_cuda11.1_cudnn8.0.5_0.tar.bz2②torchvison # torchvision-0.9.1-py37_cu111.tar.bz2③cudatoolkit # cudatoolkit-11.3.1-h2bc3f7f_2.tar.bz2# conda离线安装各个安装包conda install --offline pytorch-1.9.0-py3.7_cuda11.1_cudnn8.0.5_0.tar.bz2 # 报了个错 在使用conda安装软件时,报错如下“appears to be corrupted. The path ‘lib/mkl_msg.cat’ specified in the package manifest cannot be found”。可以通过下面的命令,删除缓存包重新下载:conda clean --packages --tarballs # https://blog.csdn.net/oppo62258801/article/details/105181079conda install --offline torchvision-0.9.1-py37_cu111.tar.bz2conda install --offline cudatoolkit-11.3.1-h2bc3f7f_2.tar.bz2# 使用conda命令在线安装一次,对相关的包进行在线匹配。但是要删掉最后的-c pytorch,,因为它代表直接从官网去下载,不会与本地的匹配,还会重新下载,命令如下:$ conda install pytorch torchvision cudatoolkit=11.1# 执行这个后,又遇到了许多错!没办法,只有按照命令重新装了Pytorch1.0.0# 但是Python import torch又遇到错误了 Undefined symbol: cblas_sgemm_alloc参考:https://blog.csdn.net/Lstar_/article/details/118658610# .bashrc 在主目录里面 home里面。但是我没法找到容器的内容,所以 https://blog.csdn.net/Lstar_/article/details/118658610 参考里面的重新安装Mkl就成功了! conda install -c anaconda mkl # 神奇的成功了 # 还需要安装tensorflow,哎,继续安装配置环境。 $ conda install tensorflow-gpu[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iHUDoUYd-1681262319033)(/home/zhr/.config/Typora/typora-user-images/image-20210814141215322.png)]
安装torch包的时候,有点慢!需要等待,如果停止,就会报上面的删除缓存包重新下载的错
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PejSaKf3-1681262319033)(/home/zhr/.config/Typora/typora-user-images/image-20210814143355150.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v4pOI7oL-1681262319034)(/home/zhr/.config/Typora/typora-user-images/image-20210814140407145.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SL5n0G1I-1681262319034)(/home/zhr/.config/Typora/typora-user-images/image-20210814140425615.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KZOpiLMx-1681262319034)(/home/zhr/.config/Typora/typora-user-images/image-20210814140441432.png)]
YOLO v3 源码debug
- cfg中时配置文件,configuration。里面是网络如何配置的
- args,命令行参数。①data_config 数据配置文件路径:config/coco.data
里面是 train valid 的 读入文件名称的txt的路径。train.txt valid.txt
coco.names是类别代号。backup。eval=coco
args2 --pretrained_weights 预训练权重 迁移训练 vs code中加入命令行参数,配置
# 改了很多相对路径为绝对路径 才成功的# !!! 最主要的原因在于文件路径映射 才能把 移动硬盘成功挂载上去了!
路线:①加载配置参数 train.py中 ② 构建模型 model darknet怎么做的 ③ 训练
coco数据集 18G input。 每次读入一个batch的数据!训练的时候才读入数据。
先讲数据是怎么读取的?
for epoch in range(opt.epochs): # 从这里进去 model.train() start_time = time.time() # 读入dataloader中的数据,每次读batch_size个数据 for batch_i, (_, imgs, targets) in enumerate(dataloader): batches_done = len(dataloader) * epoch + batch_i# 从pytorch的dataloader载入一直到调用datasets.py的__getitem__# 读取每一张图:
https://blog.csdn.net/ajiujiujiu/article/details/115980001 yolov3中train.py运行报错解决方案
需要升级tensorflow
# 卸载原来的版本pip uninstall tensorflow # 不是tensorflow-gpu# 安装新版本pip install tensorflow==2.0.0# 安装AsciiTablepip install terminaltables
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OOuU4OUy-1681262319034)(/home/zhr/.config/Typora/typora-user-images/image-20210819093248819.png)]
Metric阅读理解
https://blog.csdn.net/weixin_37718439/article/details/104246146
vs code快捷键
| 功能 | 快捷键 | 备注 |
|---|---|---|
| 左右括号之间跳转 | ctrl + shift + \ |
|
跳转到定义 相当于F12 |
Ctrl + 鼠标左键 |
|
| 后退 Go back | Ctrl + ALT + - |
|
| 前进 Go Forward | Ctrl + Shift + - |
|
易学智能上面的教程文件
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LGTUDLMI-1681262319035)(/home/zhr/.config/Typora/typora-user-images/image-20210815065828307.png)]
机器学习教程、Python教程、pytorch教程、fastai教程
多读论文
解决VScode不能输入中文
https://blog.csdn.net/zhangwenhou/article/details/108994084
这个原因是在 ubuntu software里下载的应用,它缺少一个插件。
解决方案就是去官网下一个deb的文件,然后安装就可以了。
https://code.visualstudio.com/docs/setup/linux 重新安装
$ sudo apt install code****.deb # 安装完毕 之前的配置也还在的# 卸载:因为实在商店安装的。直接在商店里面卸载就可以了。一般无法使用的都是在商店安装的,比如微信。
参考:https://www.zhihu.com/question/275664463/answer/406127910
linux卸载软件
https://blog.csdn.net/Hyaloidz/article/details/80144555
dpkg --list # 查看已安装的软件sudo apt-get remove –-purge 要卸载的软件的名字 #卸载软件同时删除配置文件sudo apt-get remove 要卸载的软件的名字 #卸载该软件
linux fastai 环境配置
这样我就综合了诸多环境了。docker nvidia-docker cudnn cuda tensorflow pytorch fastai
conda install -c fastchan fastai
增加文件目录映射
关键的,先要docker stop 容器ID
# 1. 先要 docker stop 容器ID$ systemctl stop docker # 这个也很关键,要停止docker服务# 2. 修改配置文件# 3. 重启
zhr@zhr-Lenovo-Legion-Y7000P2020H:~$ docker ps -aCONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMESfc3f5069d570 yoltv4_image "/bin/bash" 8 days ago Up 58 seconds 8888/tcp, 0.0.0.0:10001->22/tcp, :::10001->22/tcp yoltv4_gpu0_zhr18e5ff897b529 yoltv4_image "/bin/bash" 9 days ago Exited (0) 8 days ago yoltv4_gpu0_zhrzhr@zhr-Lenovo-Legion-Y7000P2020H:~$ $ docker stop fc3f5069d570$ sudo systemctl stop docker# 配置文件所在目录:var/lib/docker/containers/fc3f5069d570 目录下面的config.v2.json和hostconfig.json# 配置文件是成功的,为啥没映射上去?$ sudo systemctl start docker $ docker start fc3f5069d570
YOLOv5 镜像
https://docs.ultralytics.com/environments/Docker-Quickstart/ 是可以直接拉去镜像的
# 运行yolov5的容器 ① 需要把目录映射写进去 -v 本地目录 镜像 ② gpu访问 --gpus all$ sudo docker run --ipc=host --gpus all -it ultralytics/yolov5:latest -p 10002:22 -v "$(pwd)"/local_data ultraylytics/yolov5:latest# 在docker容器里面配置ssh和端口号,供vscode访问# https://blog.csdn.net/ambm29/article/details/96483086 sudo docker run --ipc=host --gpus all -it -p 10002:22 -v /local_data:/usr/var/src/coco --name yolov5 ultralytics/yolov5:latest# 查看python安装路径 linux$ which python # 查看python的安装路径python --version # python的版本$ which pip# 打开终端Ctrl + Alt + T
两个镜像可用
- yoltv4的image,yoltv4-zhr的容器,后者容器里面的环境有:
① yoltv4的yolov4环境,cudnn和cuda ②yolov3的环境,Pytorch1.0.1, tensorflow ③fastai的环境也是有的 - yolov5的环境,要求pytorch>1.6所以需要额外重新弄一个环境,直接拉去镜像。
开启docker的指令
sudo NV_GPU=0 nvidia-docker run -it -v /local_data:/local_data -p 10002:22 --name fastai fastdotai/fastai:latest# -v目录映射 -p 端口映射sudo docker run --ipc=host --gpus all -it -p 10002:22 -v /local_data:/usr/var/src/coco --name yolov5 ultralytics/yolov5:latest# 第二步:开启ssh# 安装ssh-serverapt-get install openssh-server# 检查是否安装成功service ssh start# 设置ssh自启动echo 'service ssh start'>>~/.bashrc# ssh登录设置一个密码passwdvim /etc/ssh/sshd_config # 修改配置 为了去进行目录映射# !!!!!! 一定要执行这一步service ssh restart
linux vscode ssh连接远程主机
一直显示连接不成功
解决办法:https://stackoverflow.com/questions/59978826/why-ssh-connection-timed-out-in-vscode
"remote.SSH.useLocalServer": false
windows安装fastai1
# 1.创建一个3.6的python环境fastaiconda create -n fastai python=3.6# 2.豆瓣安装:直接可以用的,就先用了pip install fastai==1.0.0 -i https://pypi.douban.com/simple
- 遇到的数据加载的问题
https://forums.fast.ai/t/brokenpipeerror-using-jupyter-notebook-lesson-1/41090/16
在databunch的函数里面写好databunch(num_workers=0)即可
无线网卡驱动安装
https://www.cnblogs.com/idorax/p/12369624.html
https://blog.csdn.net/hongszh/article/details/104354239
vscode jupyter内核无法和python绑定在一起
https://blog.csdn.net/qq_32651847/article/details/119283014
https://www.cnblogs.com/gitwow/p/10348675.html setting就可以设置脚本
要在fastai的环境下,使用下面两条命令
https://zhuanlan.zhihu.com/p/370024835
# 1. 在docker中 source activate fastai# 2. 执行下面两条命令pip install ipykernel -i https://pypi.tuna.tsinghua.edu.cn/simplepython -m ipykernel install --user --name py36 --display-name py36# 在root中python -m ipykernel install --user --name fastai --display-name fastai# 3. 然后在选择kernel# 主要原因是 jupyter无法使用python解释器的kernel
jupyter中使用fastai需要安装依赖
conda install jupyter notebook conda install -c conda-forge jupyter_contrib_nbextensions
https://fastai1.fast.ai/install.html
最终解决
在fastai的环境下面,重新安装了Jupyter notebook。莫名其妙的
似乎 远程vscode连接docker就是有Jupyter的问题
vscode
https://github.com/Microsoft/vscode-python/releases 下载python以前的扩展,扩展插件版本回退
https://www.jianshu.com/p/aac4baa7e8cf
code --install-extension m.vsix
从扩展安装第三方扩展,但是要关闭自动更新
给训练器踩油门
https://zhuanlan.zhihu.com/p/80695364
设置flameshot快捷键
- 系统设置 setting
- 键盘快捷键 拉到底,添加
- 名称:flameshot
- 命令:/usr/bin/flameshot gui
- 快捷键:F1
给pytorch数据加载加速
docker run -d -it --name tmptest --mount type=tmpfs, destination=/app nginx:latest# destination:需要挂载到tmpfs的容器文件/目录的路径# tmpfs-size:tmpfs的容量,以字节为单位,默认情况下没有限制# tmpfs-mode:tmpfs的文件权限docker run -d -it --name tmptest --mount type=tmpfs, destination=/app, tmpfs-mode=1770 nginx:latestdocker run
docker打包容器成镜像
https://blog.csdn.net/qq_14945437/article/details/106135369
docker commit [-m="提交的描述信息"] [-a="创建者"] 容器名称|或者容器ID 生成的镜像名[:标签名]docker commit -m "fastai_zhr" container_name|或者containerID fastai_yolov5_zhr:1.0docker commit -m "fastai_zhr" yolov5 fastai_yolov5:1.0# 红色为描述信息 yolov5为当前容器名称 生成的镜像名称:tag
然后把镜像导出到其它地方使用
docker export ID > xx.tar# 导入docker import - xxxname < xx.tar
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-x3Ystn1o-1681262319035)(/home/zhr/.config/Typora/typora-user-images/image-20211107183853246.png)]
从自己的镜像创建容器
sudo docker run --ipc=host --gpus all -it -p 10001:22 -v /data_zhr:/data_zhr --mount type=tmpfs, destination=/data_zhr --name yolov5_zhr fastai_yolov5:1.0# make host directorymkdir -p /data # create docker volume from host directorysudo docker volume create --driver local --opt type=none --opt device=/data --opt o=bind --name=test# mount volume within containersudo docker run -it --mount source=test,target=/mymount alpine:latest /bin/df -h /mymount
docker中
RuntimeError: DataLoader worker (pid 79654) is killed by signal: Bus error. It is possible that dataloader's workers are out of shared memory. Please try to raise your shared memory limit.# 解决办法:增大docker的shm sizesudo NV_GPU=0 nvidia-docker run -it -v /local_data:/local_data -p 10002:22 --name fastai fastdotai/fastai:latest# -v目录映射 -p 端口映射sudo docker run --ipc=host --gpus all -it -p 10002:22 -v /local_data:/usr/var/src/coco --name yolov5 ultralytics/yolov5:latestsudo NV_GPU=0 nvidia-docker run -it -v /data_zhr:/data_zhr -p 10000:22 --shm-size 8G --name zhr fastai_yolov5:1.0
https://blog.csdn.net/lgh0824/article/details/111031681
https://majing.io/posts/10000059191228
docker run --runtime=nvidia -e NVIDIA_VISIBLE_DEVICES=2,3 --shm-size 8G -it --rm dev:v1 /bin/bash
wheel安装
pip install XX.whl
linux下切换源
vim ~/.condarcchannels: - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/ - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/ssl_verify: true
# 临时使用清华源pip install spacy==2.2.4 -i https://pypi.tuna.tsinghua.edu.cn/simple
fastai环境安装
conda install -c pytorch -c fastai fastai=1.0.61
apt-get updateapt-get install vim-gtk# 安装vimvim ~/.condarc#换国内conda源channels: - https://mirrors.ustc.edu.cn/anaconda/pkgs/main/ - https://mirrors.ustc.edu.cn/anaconda/cloud/conda-forge/ - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ - defaultsshow_channel_urls: true# 更换kernel# 先更新pippip install ipykernel -i https://pypi.tuna.tsinghua.edu.cn/simple
Error loading preloads:
- Could not find renderer
# pip uninstall fastai==1.0.61pip install fastai==1.0.60# 解决问题。不需要装notebook
sudo NV_GPU=0 nvidia-docker run -it -v /local_data:/local_data -p 10000:22 --shm-size 20G --name zhr aae2ce9d180b# ① GPU使用 ②映射盘 ③端口 ④shm 否则num_workers=0,训练慢的要死!!! 切记切记sudo docker run --ipc=host --gpus all -it -v /local_data:/local_data -p 10002:22 --shm-size 20G --name zhr aae2ce9d180b
失败的原因:因为没有Nvidia环境,fastai不能自己调用cuda。
所以使用yolov5的环境,且是conda的环境。然后才能python使用。
linux miniconda
https://blog.csdn.net/weixin_44159487/article/details/105620256
# 安装路线wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.shbash Miniconda3-latest-Linux-x86_64.sh# 修改源conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/conda config --set show_channel_urls yes pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple# 重启终端即可
pycharm linux打开方式
#安装目录/bin./pycharm.sh
https://blog.csdn.net/zxyhhjs2017/article/details/90205442 Linux—之conda换源
将以下配置文件写在~/.condarc中vim ~/.condarc
channels:- http://mirrors.ustc.edu.cn/anaconda/pkgs/main/- http://mirrors.ustc.edu.cn/anaconda/cloud/conda-forge/- http://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/- defaultsshow_channel_urls: true
windows中
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/ # 设置搜索时显示通道地址conda config --set show_channel_urls yes# pytoch源conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/# 中科大源conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/main/conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/conda-forge/conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/msys2/conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/bioconda/conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/menpo/conda config --set show_channel_urls yes
更多推荐
所有评论(0)