[智能算法]DARTS-可微的神经网络结构搜索

ViperL1

480人浏览 · 2025-09-09 11:27:44

ViperL1 · 2025-09-09 11:27:44 发布

一、概述

相较于传统方法，DARTS(Differentiable Architecture Search)的结构表述是连续的，允许模型使用随机梯度下降(SGD)的方式高效的进行结构探索。DARTS能在丰富的搜索空间内学习具有复杂图形拓扑的高性能结构体系，其可以用于卷积网络或循环网络，不拘泥于具体的模型形式，同时可以用较少的计算资源来实现与最先进算法媲美的性能。

二、模型

2.1搜索空间

DARTS的搜索空间如下图所示，每个单元的计算过程可以被表述为一个有向无环图。假设一个单元有N个节点，每个节点记作 $x_{i}$ ，每条边表述为 $(i,j)$ ，每条边的操作记作 $o^{(i,j)}$ ，于是两个节点之间的传递关系可以被写作公式：

$x^{(j)}=\sum_{i<j}o^{(i,j)}(x^{(i)})$ ，另外这个递归式还包含了一个特殊的零操作。

上图为每个单元通路的可视化，图(a)表示单元内每个节点的通路都是位置的；(b)表示这些节点可能的通路，(c)和(d)则表示选择好之后的通路。

2.2连续松弛和优化

将候选运算组记作O(候选运算组包含卷积、池化等运算)，每个运算函数 $o(.)$ 表述为 $x^{(i)}$ 。为了使搜索空间连续，选择操作被设置为Softmax，于是操作(i,j)可以被描述为：

$O^{(i,j)}(x)=\sum \frac{exp(\alpha_o^{(i,j)})}{\sum exp(\alpha_{{o}'}^{(i,j)})}$

其中，对于节点(i,j)而言有向量 $\alpha^{(i,j)}$ ，于是可以将一个结构探索任务表述为 $\alpha=\{\alpha^{(i,j)}\}$ ，在搜索结束时，将每个混合计算 $\bar{o}^{(i,j)}$ 替换为可能计算 $o^{(i,j)}=argmax \alpha^{(i,j)}$ 。

模型的目标是联合学习结构 $\alpha$ 和权重 $\omega$ ，分别使用 $L_{train}$ 和 $L_{val}$ 来表示训练损失和验证损失，又由于网络中权重 $\omega$ 也是不确定的，这两个损失函数分别记作： $L_{train}(\omega^*,\alpha^*)$ 和 $L_{val}(\omega^*,\alpha^*)$ ，所以该问题便变为了一个双层优化问题：

$minL_{val}(\omega^*(\alpha),\alpha)$

$\omega^*(\alpha)=argmin_\omega L_{train}(\omega,\alpha)$

这个嵌套公式同样可以使用基于梯度下降的超参数优化中。其计算流程如下：

创建每条边(i,j)对应的操作o(i,j)和向量a(i,j)
while:
    1.通过让L_val下降，更新结构a
    2.通过让L_train下降，更新权重w

2.3近似梯度优化

由于存在一个嵌套的双层优化问题，模型内部梯度的复杂度极高，作为替代，本文提出了一个近似梯度优化方案。

$\triangledown_\alpha L_{val}(\omega^*(\alpha),\alpha)\approx \triangledown_\alpha L_{val}(\omega-\xi \triangledown_\omega L_{train}(\omega,\alpha)\alpha)$

在上式中， $\omega$ 表示当前模型权重， $\xi$ 为学习率；通过训练 $\omega$ 来逼近 $\omega^*(\alpha)$ 可以简化梯度下降的计算复杂度。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git