浙大博士整理的计算机视觉学习路线(含时间建议分配)
关注公众号,发现CV技术之美AI 显然是最近几年非常火的一个新技术方向,从几年前大家认识到 AI 的能力,到现在产业里已经在普遍的探讨 AI 如何落地了。我们可以预言未来在很多的领域,很多的行业,AI 都会在里边起到重要的作用。目前在商业中有所应用,而且能够创收的只有搜索推荐和计算机视觉,因此,这两个方向的人力缺口很大。目前入门CV的常用套路就是:看吴恩达《机器学习》《深...
关注公众号,发现CV技术之美
AI 显然是最近几年非常火的一个新技术方向,从几年前大家认识到 AI 的能力,到现在产业里已经在普遍的探讨 AI 如何落地了。
我们可以预言未来在很多的领域,很多的行业,AI 都会在里边起到重要的作用。
目前在商业中有所应用,而且能够创收的只有搜索推荐和计算机视觉,因此,这两个方向的人力缺口很大。
目前入门CV的常用套路就是:
-
看吴恩达《机器学习》《深度学习》课程,学一点机器学习的知识。
-
读几篇CV模型的文章,了解一下经典的Alexnet、R-CNN系列、YOLO等。
-
在github上找几个tensorflow、pytorch实现上述模型的开源代码。
-
下载VOC、ImageNet、COCO、kaggle等数据集。
-
按照开源代码中的Readme准备一下数据集,跑一下结果。
但好多初学者学了两个月、跑了几次结果后就认为已经入行CV了,其实不然,这里面有一个需要注意的问题:计算机视觉属于图像处理的范畴,而很多人却把它当成机器学习来看待。
然而实际上几乎80%的CV的从业者都没有从头至尾深入的学习图像处理方面的知识。
现在有了深度学习,不需要人为提取特征了,所以很多人不再关注图像底层的信息,而是直接越过这个根基去搭建模型,我觉得这是一个误区。
不同领域的图像,例如OCT、MR、遥感、自然图像等等,有着巨大的特征差异,对这些特征差异性都不了解,怎么在搭建模型之后对精度进行提升和改进呢?怎么在原来模型的基础上做一些改变呢?
因此,我认为好好学习一下图像预处理、后处理的知识对CV有着至关重要的作用,例如图像去噪、分割、增强、增广等等。
学习心态:
日拱一卒,不期速成~
早就是优势,早学早受益!
然而网上很多教程也比较碎片,鉴于此,整理一条学习路线,跟着这个路线重新去梳理一下你的学习计划,相信计算机视觉水平一定会有质的提升。
资源已经整理好了,文末附下载方式!以下是详细内容介绍~
第一章:机器学习与计算机视觉
计算机视觉简介
技术背景
-
了解人工智能方向、热点
计算机视觉简介
-
cv简介
-
cv技能树构建
-
应用领域
机器学习的数学基础
-
线性与非线性变换
-
概率学基础
-
熵
-
kl散度
-
梯度下降法
计算机视觉与机器学习基础
图像和视频
-
图像的取样与量化
-
滤波
-
直方图
-
上采样
-
下采样
-
卷积
-
直方图均衡化算法
-
最近邻差值
-
单/双线性差值
特征选择与特征提取
-
特征选择方法
-
filter等
-
特征提取方法:PCA、LDA、SVD等
边缘提取
-
Canny
-
Roberts
-
Sobel
-
Prewitt
-
Hessian特征
-
Haar特征
相机模型
-
小孔成像模型
-
相机模型
-
镜头畸变
-
透视变换
计算机视觉与机器学习进阶
聚类算法
-
kmeans
-
层次聚类
-
密度聚类
-
谱聚类
坐标变换与视觉测量
-
左右手坐标系及转换
-
万向锁
-
旋转矩阵
-
四元数
三维计算机视觉
-
立体视觉
-
多视几何
-
SIFT算法
三维计算机视觉与点云模型
-
PCL点云模型
-
spin image
-
三维重构
-
SFM算法
图像滤波器
-
直通滤波
-
体素滤波
-
双边滤波器
-
条件滤波
-
半径滤波
-
图像增加噪声与降噪
OpenCV详解
OpenCV算法解析
-
线性拟合
-
最小二乘法
-
RANSAC算法
-
哈希算法
-
DCT算法
-
汉明距离
-
图像相似度
第二章:深度学习与计算机视觉
神经网络
深度学习与神经网络
-
深度学习简介
-
基本的深度学习架构
-
神经元
-
激活函数详解(sigmoid、tanh、relu等)
-
感性认识隐藏层
-
如何定义网络层
-
损失函数
推理和训练
-
神经网络的推理和训练
-
bp算法详解
-
归一化
-
Batch Normalization详解
-
解决过拟合
-
dropout
-
softmax
-
手推神经网络的训练过程
从零开始训练神经网络
-
使用python从零开始实现神经网络训练
-
构建神经网络的经验总结
深度学习开源框架
-
pytorch
-
tensorflow
-
caffe
-
mxnet
-
keras
-
优化器详解(GD,SGD,RMSprop等
该视频出品人是王小天,目前就职于BAT之一,AI算法高级技术专家,法国TOP3高校双硕(计算机科学和数学应用双硕士)毕业。
👇长按下方二维码 2 秒
立即领取

(添加小助理人数较多,请耐心等待)
他在人工智能和芯片领域发表10余篇论文,具有深厚的学术背景和丰富的项目及业务落地经验。
工作期间主要负责人工智能业务线CV与NLP相关算法工作,推进人机混合智能、语义分割、机器翻译、虹膜识别等模块的核心算法研究与优化。
对图像分类、物体检测、目标跟踪、自动驾驶、计算机体系结构等有深入的研究。
他兼具理论与实战落地经验,深知初学者学习痛点。说实话,这样资历的人,很难得。
这份教程是他8年人工领域实战经验的凝练,通过讲解和实战操作,让你能做到独立搭建和设计卷积神经网络(包括主流分类和检测网络),从检测模型教学逐步深入,帮你轻松掌握目标检测,并进行神经网络的训练和推理解决各种CV问题。
他对学习者的建议:计算机视觉的提升不在于搭建模型,而在于不断调优、改进过程中积累的经验。
我们该怎么针对不同领域的图像设置不同的参数?其中包括卷积核大小、网络架构、初始权重等等,不可能拿到一个模型,既适合医学图像,又适合人脸识别,这其中就需要n次从70%的精度调到95%以上中积累出经验。
而很多CV从业者觉得搭建出模型就告一段落,反反复复用不同的方式去搭建模型,先是tensorflow搭建完用pytorch搭,pytorch完事后用mxnet再来一遍,Python搭完用c/c++搭,但是至始至终没在精度和经验方面做出前进。
由于工作需要,这份教程我本人也在学习中,虽然已经从事这个行业多年,再看这份教程的时候,仍然能查漏补缺,收获满满,我相信不管是AI入门,还是已经具备了一定的工作经验,这份学习资料,都值得你去认真学习研究。
所有以上相关的的内容全部都已经打包好了,汇总成了一份百度云的链接,小贴心之处是怕有的兄弟没有买百度云会员的朋友,能用2MB+/S的速度下载,还特地给大家准备了下载工具。
更多推荐
所有评论(0)