浙大博士整理的计算机视觉学习路线（含时间建议分配）

关注公众号，发现CV技术之美AI 显然是最近几年非常火的一个新技术方向，从几年前大家认识到 AI 的能力，到现在产业里已经在普遍的探讨 AI 如何落地了。我们可以预言未来在很多的领域，很多的行业，AI 都会在里边起到重要的作用。目前在商业中有所应用，而且能够创收的只有搜索推荐和计算机视觉，因此，这两个方向的人力缺口很大。目前入门CV的常用套路就是：看吴恩达《机器学习》《深...

我爱计算机视觉

391人浏览 · 2022-04-20 14:15:00

我爱计算机视觉 · 2022-04-20 14:15:00 发布

关注公众号，发现CV技术之美

AI 显然是最近几年非常火的一个新技术方向，从几年前大家认识到 AI 的能力，到现在产业里已经在普遍的探讨 AI 如何落地了。

我们可以预言未来在很多的领域，很多的行业，AI 都会在里边起到重要的作用。

目前在商业中有所应用，而且能够创收的只有搜索推荐和计算机视觉，因此，这两个方向的人力缺口很大。

目前入门CV的常用套路就是：

看吴恩达《机器学习》《深度学习》课程，学一点机器学习的知识。
读几篇CV模型的文章，了解一下经典的Alexnet、R-CNN系列、YOLO等。
在github上找几个tensorflow、pytorch实现上述模型的开源代码。
下载VOC、ImageNet、COCO、kaggle等数据集。
按照开源代码中的Readme准备一下数据集，跑一下结果。

但好多初学者学了两个月、跑了几次结果后就认为已经入行CV了，其实不然，这里面有一个需要注意的问题：计算机视觉属于图像处理的范畴，而很多人却把它当成机器学习来看待。

然而实际上几乎80%的CV的从业者都没有从头至尾深入的学习图像处理方面的知识。

现在有了深度学习，不需要人为提取特征了，所以很多人不再关注图像底层的信息，而是直接越过这个根基去搭建模型，我觉得这是一个误区。

不同领域的图像，例如OCT、MR、遥感、自然图像等等，有着巨大的特征差异，对这些特征差异性都不了解，怎么在搭建模型之后对精度进行提升和改进呢？怎么在原来模型的基础上做一些改变呢？

因此，我认为好好学习一下图像预处理、后处理的知识对CV有着至关重要的作用，例如图像去噪、分割、增强、增广等等。

学习心态：

日拱一卒，不期速成～

早就是优势，早学早受益！

然而网上很多教程也比较碎片，鉴于此，整理一条学习路线，跟着这个路线重新去梳理一下你的学习计划，相信计算机视觉水平一定会有质的提升。

资源已经整理好了，文末附下载方式！以下是详细内容介绍～

第一章：机器学习与计算机视觉

计算机视觉简介

技术背景

了解人工智能方向、热点

计算机视觉简介

cv简介
cv技能树构建
应用领域

机器学习的数学基础

线性与非线性变换
概率学基础
熵
kl散度
梯度下降法

计算机视觉与机器学习基础

图像和视频

图像的取样与量化
滤波
直方图
上采样
下采样
卷积
直方图均衡化算法
最近邻差值
单/双线性差值

特征选择与特征提取

特征选择方法
filter等
特征提取方法：PCA、LDA、SVD等

边缘提取

Canny
Roberts
Sobel
Prewitt
Hessian特征
Haar特征

相机模型

小孔成像模型
相机模型
镜头畸变
透视变换

计算机视觉与机器学习进阶

聚类算法

kmeans
层次聚类
密度聚类
谱聚类

坐标变换与视觉测量

左右手坐标系及转换
万向锁
旋转矩阵
四元数

三维计算机视觉

立体视觉
多视几何
SIFT算法

三维计算机视觉与点云模型

PCL点云模型
spin image
三维重构
SFM算法

图像滤波器

直通滤波
体素滤波
双边滤波器
条件滤波
半径滤波
图像增加噪声与降噪

OpenCV详解

OpenCV算法解析

线性拟合
最小二乘法
RANSAC算法
哈希算法
DCT算法
汉明距离
图像相似度

第二章：深度学习与计算机视觉

神经网络

深度学习与神经网络

深度学习简介
基本的深度学习架构
神经元
激活函数详解（sigmoid、tanh、relu等）
感性认识隐藏层
如何定义网络层
损失函数

推理和训练

神经网络的推理和训练
bp算法详解
归一化
Batch Normalization详解
解决过拟合
dropout
softmax
手推神经网络的训练过程

从零开始训练神经网络

使用python从零开始实现神经网络训练
构建神经网络的经验总结

深度学习开源框架

pytorch
tensorflow
caffe
mxnet
keras
优化器详解(GD,SGD,RMSprop等

该视频出品人是王小天，目前就职于BAT之一，AI算法高级技术专家，法国TOP3高校双硕（计算机科学和数学应用双硕士）毕业。

👇长按下方二维码 2 秒

立即领取

（添加小助理人数较多，请耐心等待）

他在人工智能和芯片领域发表10余篇论文，具有深厚的学术背景和丰富的项目及业务落地经验。

工作期间主要负责人工智能业务线CV与NLP相关算法工作，推进人机混合智能、语义分割、机器翻译、虹膜识别等模块的核心算法研究与优化。

对图像分类、物体检测、目标跟踪、自动驾驶、计算机体系结构等有深入的研究。

他兼具理论与实战落地经验，深知初学者学习痛点。说实话，这样资历的人，很难得。

这份教程是他8年人工领域实战经验的凝练，通过讲解和实战操作，让你能做到独立搭建和设计卷积神经网络（包括主流分类和检测网络），从检测模型教学逐步深入，帮你轻松掌握目标检测，并进行神经网络的训练和推理解决各种CV问题。

他对学习者的建议：计算机视觉的提升不在于搭建模型，而在于不断调优、改进过程中积累的经验。

我们该怎么针对不同领域的图像设置不同的参数？其中包括卷积核大小、网络架构、初始权重等等，不可能拿到一个模型，既适合医学图像，又适合人脸识别，这其中就需要n次从70%的精度调到95%以上中积累出经验。

而很多CV从业者觉得搭建出模型就告一段落，反反复复用不同的方式去搭建模型，先是tensorflow搭建完用pytorch搭，pytorch完事后用mxnet再来一遍，Python搭完用c/c++搭，但是至始至终没在精度和经验方面做出前进。

由于工作需要，这份教程我本人也在学习中，虽然已经从事这个行业多年，再看这份教程的时候，仍然能查漏补缺，收获满满，我相信不管是AI入门，还是已经具备了一定的工作经验，这份学习资料，都值得你去认真学习研究。

所有以上相关的的内容全部都已经打包好了，汇总成了一份百度云的链接，小贴心之处是怕有的兄弟没有买百度云会员的朋友，能用2MB+/S的速度下载，还特地给大家准备了下载工具。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git