2023年SEVC SCI2区，基于邻域差分变异策略强化学习粒子群算法NRLPSO，深度解析+性能实测

粒子群算法（PSO）因其高效性被广泛应用于工程优化领域，但现有的许多PSO变体往往采用固定算子，限制了粒子自主学习和智能水平，导致在处理复杂适应度问题时性能受限。本文提出了一种融合强化学习与邻域差分变异策略粒子群算法（NRLPSO），该方法引入了动态振荡惯性权重（DOW）以增强粒子的动态调节能力，并利用基于强化学习的速度向量生成策略（VRL）实现粒子在每轮迭代中自主选择速度更新模型，从而在探索与开

Logiccccccccc

1137人浏览 · 2025-06-20 17:45:12

Logiccccccccc · 2025-06-20 17:45:12 发布

1.摘要

2.粒子群算法PSO原理

【智能算法】粒子群算法（PSO）原理及实现

3.基于邻域差分变异策略强化学习粒子群算法NRLPSO

在NRLPSO中，粒子被动态分为四种状态，并在强化学习机制下根据适应度提升与进化因子获得奖励，不断调整搜索行为。
$\begin{equation} R = \begin{cases} 2, & \text{if } f(x_{\text{new}}) < f(x_{\text{old}}) \;\; \text{and} \;\; E_f(x_{\text{new}}) > E_f(x_{\text{old}}) \\ 1, & \text{if } f(x_{\text{new}}) < f(x_{\text{old}}) \;\; \text{and} \;\; E_f(x_{\text{new}}) \leq E_f(x_{\text{old}}) \\ 0, & \text{if } f(x_{\text{new}}) \geq f(x_{\text{old}}) \;\; \text{and} \;\; E_f(x_{\text{new}}) > E_f(x_{\text{old}}) \\ -2, & \text{if } f(x_{\text{new}}) \geq f(x_{\text{old}}) \;\; \text{and} \;\; E_f(x_{\text{new}}) \leq E_f(x_{\text{old}}) \end{cases} \end{equation}$
其中， $E_f$ 为进化因子，代表种群多样性。
$\begin{equation} E_f(i) = \frac{d_i - d_{\min}}{d_{\max} - d_{\min}} \end{equation}$

其中， $d_i$ 并表示与其他粒子平均距离：
$\begin{equation} d_i = \frac{1}{N-1} \sum_{\substack{j=1 \\ j \neq i}}^{N} \sqrt{\sum_{k=1}^{D} \left(x_i^k - x_j^k\right)^2} \end{equation}$

非线性惯性权重机制：
$\begin{equation} \omega(t) = u - \left( \left( \frac{FEs}{MaxFEs} - \omega_{\max} \right) * r * \omega_{\min} + \upsilon * (\omega_{\max} - \omega_{\min}) * \left( \frac{FEs}{MaxFEs} \right) \right) \end{equation}$

在NRLPSO中，强化学习通过引入智能体、环境、状态、动作和奖励等基本要素，实现对粒子搜索行为的智能调控。粒子可根据自身状态在状态间进行转换，转移动作则由Q表指引以实现最优策略。Q值的更新机制能够动态调整各状态间的行为选择权重，学习率 $\alpha$ :
$\begin{equation} \alpha(t) = 1 - \left( 0.9 * \frac{FEs}{MaxFEs} \right) \end{equation}$
$\begin{equation} v_i(t+1) = \omega v_i(t) + c_1 * rand(1, D) .* (P_b - x_i(t)) + c_2 * rand(1, D) .* (P_a - x_i(t)) \end{equation}$

基于强化学习速度矢量生成策略

在PSO中，粒子通过学习个体最优 $P_{best}$ 与全局最优 $G_{best}$ 两个范式来指导搜索过程。优质的学习范式有助于粒子朝向更优解移动，而劣质的范式则可能导致粒子早熟收敛于局部最优。本文提出了基于余弦相似度调节的粒子速度更新机制，动态平衡粒子在不同范式之间的学习权重。

欧氏距离和余弦相似度判断相似度

基于邻域差分变异的局部更新策略通过在邻域内部引入差分变异算子，动态扰动邻域粒子的搜索行为，从而提高局部多样性：
$\begin{equation} VGbest(t) = Gbest(t) + rand(1, D) .* (G_1 - G_2) \end{equation}$

$\begin{equation} VPbest_i(t) = Pbest_i(t) + rand(1, D) .* (P_1 - P_2) \end{equation}$

4.结果展示

5.参考文献

[1] Li W, Liang P, Sun B, et al. Reinforcement learning-based particle swarm optimization with neighborhood differential mutation strategy[J]. Swarm and Evolutionary Computation, 2023, 78: 101274.

6.代码获取

7.算法辅导·应用定制·读者交流

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git