强化学习之SAC和DDPG内容大汇总
强化学习之SAC和DDPG内容大汇总一、SACSAC相关博客汇总:https://blog.csdn.net/qq_38587510/article/details/104970837最前沿:深度解读Soft Actor-Critic 算法https://zhuanlan.zhihu.com/p/70360272pytorch 代码汇总:DDPG/AC/SAC/PPOhttps://github.
强化学习之SAC和DDPG内容大汇总
一、SAC
SAC相关博客汇总:
https://blog.csdn.net/qq_38587510/article/details/104970837
最前沿:深度解读Soft Actor-Critic 算法
https://zhuanlan.zhihu.com/p/70360272
pytorch 代码汇总:DDPG/AC/SAC/PPO
https://github.com/higgsfield/RL-Adventure-2
SAC_github中pytorch 代码:
https://github.com/Wen2chao/RL-Algorithm/blob/master/SAC2018/SAC.py
Soft Actor-Critic论文阅读及pytorch代码实现
https://zhuanlan.zhihu.com/p/75937178
信息熵:
https://www.zhihu.com/question/22178202
二、DDPG
深度强化学习-DDPG算法原理和实现
代码:
https://www.jianshu.com/p/6fe18d0d8822
DDPG解决Pendulum-v0问题
https://zhuanlan.zhihu.com/p/99406809
全网最详细的DDPG算法详解
https://blog.csdn.net/kenneth_yu/article/details/78478356
添加噪声
https://github.com/floodsung/DDPG
OpenAI 新研究:通过自适应参数噪声提升强化学习性能
https://baijiahao.baidu.com/s?id=1574147839272034&wfr=spider&for=pc
更多推荐
所有评论(0)