强化学习之SAC和DDPG内容大汇总

一、SAC

SAC相关博客汇总:

https://blog.csdn.net/qq_38587510/article/details/104970837

最前沿:深度解读Soft Actor-Critic 算法

https://zhuanlan.zhihu.com/p/70360272

pytorch 代码汇总:DDPG/AC/SAC/PPO

https://github.com/higgsfield/RL-Adventure-2

SAC_github中pytorch 代码:

https://github.com/Wen2chao/RL-Algorithm/blob/master/SAC2018/SAC.py

Soft Actor-Critic论文阅读及pytorch代码实现

https://zhuanlan.zhihu.com/p/75937178

信息熵:

https://www.zhihu.com/question/22178202

二、DDPG

深度强化学习-DDPG算法原理和实现
代码:

https://www.jianshu.com/p/6fe18d0d8822

DDPG解决Pendulum-v0问题

https://zhuanlan.zhihu.com/p/99406809

全网最详细的DDPG算法详解

https://blog.csdn.net/kenneth_yu/article/details/78478356

添加噪声

https://github.com/floodsung/DDPG

OpenAI 新研究:通过自适应参数噪声提升强化学习性能

https://baijiahao.baidu.com/s?id=1574147839272034&wfr=spider&for=pc

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐