一、引言

深度学习作为人工智能的核心技术之一,在近年来取得了巨大的发展。随着数据量的不断增长和计算能力的提升,深度学习在图像识别、自然语言处理、语音识别等领域取得了显著的成果。然而,深度学习模型的开发通常需要大量的编程工作和专业知识,这对于许多开发者来说是一个巨大的挑战。因此,深度学习模型快速开发平台的需求应运而生。

深度学习模型快速开发平台可以为开发者提供高效的工具和环境支持,简化模型构建、训练、部署等流程,提高开发效率。这些平台通常集成了各种深度学习框架和算法,提供了可视化的界面和丰富的文档,使得开发者可以更加轻松地进行深度学习模型的开发。

此外,深度学习模型快速开发平台还可以促进人工智能技术的普及和应用。通过降低开发门槛,更多的开发者可以参与到人工智能技术的研究和应用中,推动人工智能技术在各个领域的发展。

综上所述,深度学习模型快速开发平台对于推动深度学习技术的发展和应用具有重要的意义。

二、青云 QingCloud 深度学习平台

(一)产品优势

  1. 一键部署:即使是有经验的深度学习开发者,构建深度学习开发环境也需大量时间完成复杂配置工作。而 Deep Learning on QingCloud 通过 AppCenter 交付,可一键完成云端部署,并提供应用全生命周期管理能力,包括创建、扩容、监控、健康监测等,助力开发者极速搭建深度学习开发环境。
  1. 多部署模式:支持使用 GPU 或仅使用 CPU 进行深度学习开发与训练,同时可根据自身需求选择单节点或分布式部署模式。QingCloud 采用专为人工智能计算设计的 AMD / NVIDIA GPU,以直通方式与平台内的节点对接,避免虚拟化带来的损耗,全面释放 GPU 计算能力。虽然 GPU 性能强劲,但费用相对较高,若开发者希望以较低成本进行深度学习开发,可选择仅使用 CPU 资源进行单节点或分布式训练。目前,Tensorflow、PyTorch 及 Keras 支持使用 CPU 进行深度学习应用训练和测试,Caffe 需要重新编译才支持。
  1. 无缝对接对象存储:集成对象存储命令行工具,通过配置对象存储相关参数,可便捷地从对象存储中获取海量训练数据,完成模型的训练。
  1. 集成主流框架:集成 Caffe、TensorFlow、PyTorch 和 Keras 等主流深度学习框架和 Jupyter notebook 前端开发环境,助力用户快速部署深度学习开发环境。同时预置 CUDA8.0 和 cuDNN5 驱动,并安装有 numpy、scipy、pandas、matplotlib、nltk、scikit-learn 等众多数据科学工具包,加速深度学习开发与模型训练。

(二)产品类型

  1. 入门版:搭载第二代英特尔 ® 至强 ® 可扩展处理器,通过 DL Boosting 的 VNNI 技术及 Intel 优化的深度学习框架,在图像分类、图像目标检测、自然语言处理、推荐系统及强化学习等深度学习的性能大幅提升。预装英特尔针对 CPU 优化过的 Caffe、TensorFlow、Keras、PyTorch 最新深度学习框架。适合对性能要求不高的小型项目或初学者。
  1. 基础版:搭载 AMD GPU,在提供云主机灵活性的同时,提供优秀的性能体验和超高的性价比,在深度学习训练、推理等方面表现出优秀的计算优势。目前支持的深度学习框架有 TensorFlow、Pytorch、Caffe,并将支持 MXNet。预装了 TensorFlow 1.14.0、Keras 2.2.4,PyTorch 1.2.0 最新深度学习框架。适合中等规模的项目和对成本较为敏感的企业。
  1. 企业版:搭载 NVIDIA GPU,在提供云主机弹性特性的同时,提供优异的性能体验,能够为用户提供超高的计算能力,在深度学习训练、推理等方面表现出强大的计算优势。预装 Caffe、TensorFlow、Keras、PyTorch 最新深度学习框架。适合大型企业的复杂项目和对性能要求极高的场景。

(三)应用场景

在互联网时代,数据量呈爆炸式增长,面对海量的图像、语音和文本数据,训练模型需要极高的计算速度。青云 QingCloud 深度学习平台可以提供优异的计算性能,全力加速深度学习领域人工智能产品的开发。图像、语音和文本等数据源通过上传至海量数据存储服务 QingStor™ 对象存储进行持久化存储,同时也可直接通过云端 Kafka 将数据源传输到 Storm、Spark 等集群进行数据预处理,生成样本数据。经过 QingCloud 深度学习平台进行模型训练与验证,并根据最新样本数据不断更新模型。训练好的模型可用于图像、语音的智能识别以及自然语言理解等 AI 服务,广泛应用于安全、电商、智能交通等领域。例如在安全领域,可用于人脸识别、异常行为检测等;在电商领域,可进行商品推荐、图像搜索等;在智能交通领域,可实现车牌识别、交通流量预测等。

(四)产品定价

青云 QingCloud 深度学习平台支持按需付费、包月、包年计费模式。在离线训练、临时测试、算法验证以及 AI 框架学习等场景中较适于按需付费模式,而在生产环境稳定训练需求和在线训练等场景中使用包月、包年模式成本更低。按需付费模式更加灵活,用户可以根据实际使用情况支付费用;包月、包年模式则适合长期稳定的使用需求,成本相对较低。同时,平台还提供了不同的产品类型和配置选择,用户可以根据自己的需求和预算进行选择。

三、huggingface

(一)平台简介

Huggingface 是全球最大的模型托管平台,截至目前共有模型 76 万 +。该平台最大的特点是模型丰富,易于应用,通过模型卡片页的简介,简单几十行代码就能进行模型的推理。然而,在国内目前被墙了,不过可以通过国内镜像网站进行访问。例如,链接(此处可根据具体找到的镜像网站进行替换)。

(二)使用流程

  1. 配置环境:huggingface 的模型需要安装 transformers 库,这个库基于深度学习,因此需要安装相应的深度学习环境,比如 pytorch、tensorflow 等。
  1. 下载模型文件:自动下载,由于被墙代码自动下载可能会失效,可以通过镜像网站下载好模型文件,放在相应位置。在 Windows 位置在:C:\Users\username.cache\huggingface\hub 下,Linux 在当前用户文件夹下:/home/username/.cache/huggingface/hub,也可以通过自定义文件夹存放,模型读取时改为自定义文件夹。
  1. 进行推理:在模型卡片页找到相应的推理代码,进行推理。例如,可以使用以下代码进行文本分类的推理:
from transformers import pipeline

classifier = pipeline("sentiment-analysis", model="bert-base-uncased")

text = "I love using transformers library!"

result = classifier(text)

print(result)

Huggingface 平台为深度学习模型的开发和应用提供了极大的便利,尤其是对于那些需要快速尝试不同模型的开发者来说。通过镜像网站的使用,可以在国内环境下充分利用其丰富的模型资源,加速深度学习项目的开发进程。

四、modelscope

(一)平台简介

ModelScope 是国内最大的模型托管平台,与 Huggingface 类似,旨在为开发者提供灵活、易用、低成本的一站式模型服务产品。它汇集了行业领先的预训练模型,减少了开发者的重复研发成本,为泛 AI 开发者打造了一个开源的模型即服务共享平台。

ModelScope 由阿里巴巴集团推出,基于达摩院机器智能、大模型、xr 实验室等前沿技术诞生。它提供开源数据集、开源模型、模型工具等,用社区的方式免费开发给广大个人、企业用户使用。平台提供了模型管理检索、模型下载、模型调优和训练模型推理等功能。目前版本优先开放了模型调优训练和推理,后续会开放模型部署及模型应用服务。

(二)使用流程

  1. 配置环境:如果需要在本地运行模型,需要进行相应的环境安装准备。包括安装 python 环境,支持 python3(建议 3.7 版本及以上),可使用 Anaconda 进行安装;安装深度学习框架,ModelScope Library 目前支持 Tensorflow、Pytorch 两大深度学习框架进行模型训练、推理;安装 ModelScope Library,可以选择 pip 安装或使用源码安装。
  1. 下载模型文件:在 ModelScope 中,模型文件可以自动下载。用户可以通过两种方式进行模型下载,一是通过 ModelScope Library 安装下载,二是通过 git 拉取仓库。这两种方式可以在本地运行模型,但需要先安装 ModelScope Library 才能运行代码。同时,平台也提供了在线 Notebook,为用户准备了模型所需的运行环境,无需用户自行安装依赖环境,使用更加流畅。
  1. 进行推理:在 ModelScope 平台上,用户可以进行在线体验模型。首先访问平台网址 https://www.modelscope.cn/models,用户将看见平台上已有的所有公开模型,根据任务筛选或者关键词搜索可查找感兴趣的模型。若需要查找可在线体验或者可支持训练调优的模型,可通过搜索框右侧筛选框进行筛选。

以中文分词模型为例,用户通过筛选 “分词” 的任务,或者搜索关键词 “分词” 可以检索到对应的中文分词模型。在右侧模型卡片上,将展示该模型的基础信息包括中英文名称、任务类型标签和其他模型标签、模型使用的深度学习框架、模型提供者、下载数、点赞数和模型描述等信息,帮助用户快速了解模型。

点击模型,进入模型详情页,用户可以查看该模型具体的模型介绍。模型提供者将在此处介绍模型具体的应用场景、功能描述、技术方法、模型训练与使用还有效果评估,供用户参考。右侧有 “在线体验” 功能,用户可以通过切换默认示例来查看模型效果,或输入适合该模型的测试信息进行模型的效果测试。

在执行在线体验前,请用户仔细阅读并理解相关免责声明,并合法合规使用在线体验的模块功能。除了模型体验外,还可查看关于该模型具体的模型文件并进行下载。若用户对模型效果满意,想进一步了解并对该模型进行代码验证,可点击 “快速使用” 查看具体的代码示例方法。

平台提供了两种方式的模型下载:1)通过 ModelScope Library 安装下载;2)通过 git 拉取仓库。这两种方式可以在本地运行模型。但需要先安装 ModelScope Library 才能运行代码,具体参见第二步【环境准备】-【本地开发环境安装】。同时,我们也提供了在线 Notebook,为您准备了模型所需的运行环境,无需用户自行安装依赖环境,使用更加流畅,推荐使用此种方式进行模型的深度体验!具体参见第二步【环境安装】-【在 Notebook 中开发】。

五、OpenMMLab

(一)平台简介

OpenMMLab 是一个适用于学术研究和工业应用的开源算法体系,涵盖了计算机视觉的许多研究课题。它累计开源超过 30 个算法库、2400 个预训练模型,涵盖图像识别分类、目标检测、图像分割、姿态估计、视频理解、OCR、3D 目标检测、3D 人体姿态估计、模型轻量化、自监督、少样本、光流、预训练、多模态、AIGC、推理部署等等计算机视觉任务,在 Github 上累计获得十万颗 star,超过了 Pytorch。

OpenMMLab 由上海人工智能实验室推出,是深度学习时代全球领域最全面、最具影响力的视觉算法开源项目。它为学术和产业界提供一个可跨方向、结构精良、易复现的统一算法工具库,拥有超过 1500 名社区开发者参与项目贡献,用户遍及超过 110 个国家和地区,覆盖全国全球顶尖高校、研究机构和企业。

(二)使用流程

  1. 配置环境:OpenMMLab 系列项目的核心组件是 MMCV,它是用于计算机视觉研究的基础 Python 库,支持 OpenMMLab 旗下其他开源库。在使用之前,需要搭建环境,首先使用 Anaconda 搭建虚拟环境,进行相关库的安装。安装 GPU 版:conda install pytorch torchvision -c pytorch;安装 CPU 版:conda install pytorch torchvision cpuonly -c pytorch。接着安装 MMCV 库并编译:pip install -U openmimm和install mmcv-full。
  1. 进入 Github 找到相应库:例如进入mmdetection库,它是一款基于 PyTorch 的开源目标检测工具箱,包含目标检测、实例分割领域的基础框架数十种 sota 算法。也可以进入其他库,如MMDetection3D用于 3D 目标检测、MMOCR用于文字检测识别等。
  1. 按照教程部署模型:以MMDetection为例,从文档中找到快速开始教程,按照步骤进行部署模型。首先,实现新的算法或神经网络模块并注册进对应的 Registry,如实现 PAFPN 并将其注册进 NECKS。然后,导入这个模块,修改配置文件,使算法跑起来。最后进行训练与测试。对于其他库,也可以按照类似的步骤进行模型的部署和应用。

OpenMMLab 为深度学习模型的开发提供了强大的工具和丰富的资源,无论是学术研究还是工业应用,都能在其中找到适合的算法库和预训练模型,加速深度学习项目的开发进程。

六、常用开源框架总览

(一)TensorFlow

  1. 背景介绍:由 Google 开发并于 2015 年发布,是一个开源的机器学习框架,主要用于各种感知和语言理解任务的机器学习。
  1. 特点
    • 灵活的计算图:将计算表示为节点和边的图结构,可在不执行计算的情况下构建复杂的模型结构。
    • 自动微分:具备自动微分功能,能自动计算模型的梯度,为各种优化算法提供支持。
    • 跨平台支持:支持多种硬件和操作系统,包括 CPU、GPU 和 TPU,以及 Windows、Linux 和 macOS 等。
    • 丰富的工具和库:提供 TensorBoard 用于可视化训练过程,TensorFlow Hub 用于共享预训练模型,TensorFlow Lite 用于移动设备部署等。
    • 高性能计算:通过图优化、异步计算等方式提供高性能的计算能力,适用于大规模深度学习模型的训练和推断。
  1. 使用场景:广泛应用于图像识别、自然语言处理、语音识别、推荐系统、医疗图像分析等领域。

(二)Keras

  1. 背景介绍:一个高层次的神经网络 API,可以运行在顶层框架上,包括 TensorFlow、CNTK、Theano 等。提供了简单易用的接口,使得构建、训练和部署深度学习模型变得更加简单。
  1. 特点
    • 模型定义和构建简单:通过端到端的方式,用户只需要关注神经网络的结构设计,不需要编写复杂的代码。
    • 数据预处理方便:提供标准的数据预处理接口,可以方便地对输入数据进行统一的管理。
    • 支持多种参数配置:支持多种优化器、损失函数、评价指标等参数配置,以及实时监控训练过程。
    • 序列化模型:可将训练得到的模型保存为 HDF5 文件,便于部署和共享。
    • 可扩展性强:支持自定义层、回调函数、激活函数等各种扩展机制,能让用户自由定制模型。
    • 模型部署方便:可以直接加载已有的模型,并且可在不同的后端环境间迁移模型。
    • GPU 加速:支持在 GPU 上进行模型训练加速,通过 CuDNN、CUDA 等库实现。
    • 良好的社区生态:官方文档详细,很大一部分支持中文,学习成本较低。
  1. 使用场景:广泛应用于图像识别、自然语言处理、语音识别等领域。

(三)Caffe

  1. 背景介绍:2013 年由加州大学伯克利分校的贾扬清博士在 Github 上发布的一款深度学习开源框架。核心语言是 C++,支持 python 和 matlab 接口。既可以在 CPU 上运行,又可以在 GPU 上运行。
  1. 特点
    • 主要应用于计算机视觉领域:如图像识别,目标识别,人脸识别,图像风格转换等方面。
    • 由三个原子结构组成:Blobs、Layers 和 Nets。Blobs 是数据包装器,Layers 是网络结构单位,Nets 由 Layers 组成,定义了输入输出以及网络各层。
    • 支持多种数据来源:可以从 LevelDB、LMDB、内存读取、HDF5 文件、原始图片等获取数据。
    • 可扩展性有限:只能够使用卷积网络,所有框架都是在基于卷积神经网络的模型上进行的。
  1. 使用场景:在计算机视觉领域有广泛应用。

(四)PyTorch

  1. 背景介绍:由 Facebook 人工智能研究院开发的开源机器学习库,提供了一种灵活而高效的深度学习平台,能够更快地构建、训练和部署深度学习模型。
  1. 特点
    • 灵活性高:允许用户使用 Python 语言编写自定义操作和模型,在处理非标准问题时非常有用。
    • 动态计算图:计算图是在运行时构建的,更易于调试和修改模型。
    • 易于学习:API 非常简单,易于学习和使用。文档详细,有很多示例代码可供参考。
    • GPU 加速:支持 GPU 加速,可以利用 GPU 的并行计算能力来加速深度学习模型的训练和推理。
    • 大型社区:拥有一个庞大的社区,有很多开源项目和库可供使用。
    • 自动微分:支持自动微分,可以自动计算梯度。
    • 可扩展性强:是一个可扩展的框架,可以轻松地添加新的操作和模型。
  1. 使用场景:广泛应用于图像识别、自然语言处理、语音识别等领域。

七、总结

深度学习模型快速开发平台为开发者提供了极大的便利,不同的平台具有各自独特的特点和优势。

Huggingface 作为全球最大的模型托管平台,拥有丰富的模型资源,仅需几十行代码即可进行模型推理,但在国内需通过镜像网站访问。

ModelScope 是国内最大的模型托管平台,类似 Huggingface,提供灵活、易用、低成本的一站式模型服务,由阿里巴巴推出,涵盖多种功能,方便用户进行模型的下载和推理。

OpenMMLab 由上海人工智能实验室推出,累计开源超过 30 个算法库、2400 个预训练模型,涵盖众多计算机视觉任务,在 Github 上获得十万颗 star,超过了 Pytorch,为学术研究和工业应用提供强大支持。

常用开源框架中,TensorFlow 由 Google 开发,具有灵活的计算图、自动微分、跨平台支持等特点,广泛应用于多个领域;Keras 作为高层次神经网络 API,模型定义和构建简单,数据预处理方便,可扩展性强;Caffe 主要应用于计算机视觉领域,由三个原子结构组成,但可扩展性有限;PyTorch 由 Facebook 人工智能研究院开发,灵活性高,动态计算图易于调试和修改模型,拥有大型社区且可扩展性强。

开发者在选择深度学习模型快速开发平台时,可以根据自己的需求和项目特点进行选择。如果需要丰富的模型资源和快速的模型推理,可以考虑 Huggingface 和 ModelScope;如果专注于计算机视觉任务,OpenMMLab 是不错的选择;而对于不同的开发需求,TensorFlow、Keras、Caffe 和 PyTorch 等开源框架也能提供强大的支持。总之,这些平台和框架为深度学习模型的开发提供了多样化的选择,推动了深度学习技术的发展和应用。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐