指数加权平均（吴恩达深度学习笔记）

m0_75273286

464人浏览 · 2025-12-04 13:04:14

m0_75273286 · 2025-12-04 13:04:14 发布

1.指数加权平均

在理解其他几个优化算法之前，你需要用到指数加权平均（exponentially weighted averages）

（1）公式

公式
例子
这是某年伦敦的每日温度，用数据作图，得到上面的散点图，起始日在1月份，结束日在12月末，这样的数据看起来有点杂乱，如果要计算趋势的话，即温度的局部平均值（移动平均值)。例如我们设V0 = 0，当成第0天的气温值，每天需要使用0.9的加权前一天的数值，再加上当天温度的0.1倍（公式如上图）。现在将0.9记为β，0.1记为（1-β），则
可以看成vt是1/（1-β）天的平均值,当β=0.9时，是这10天的平均值，就是上图的红线部分。当β=0.98时，是这50天的平均值，就是上图的绿线部分。
β值越大，你得到的曲线要平坦一些，原因在于你多平均了几天的温度，所以这个曲线，波动更小，更加平坦，缺点是曲线进一步右移，因为现在平均的温度值更多，要平均更多的值，指数加权平均公式在温度变化时，适应地更缓慢一些，所以会出现一定延迟。
如果β=0.5，则平均了2天的温度，得到黄线如下：

（2）指数加权平均理解

以上面温度为例，第100天的温度计算为：
展开后：
所以叫指数加权平均
指数加权平均数公式的好处之一在于，它占用极少内存，电脑内存中只占用一行数字而已，然后把最新数据代入公式，不断覆盖就可以了，正因为这个原因，其效率，它基本上只占用一行代码，计算指数加权平均数也只占用单行数字的存储和内存，当然它并不是最好的，也不是最精准的计算平均数的方法。

（3）偏差修正

指数加权平均的偏差修正，是指在初期的加权平均计算中使用公式计算的结果偏差太大，没有参考价值，所以计算结果用一个公式来减少偏差。在估测初期，vt = vt / (1-β^t)
在上面的β=0.98的例子中，其实曲线应该是紫色的，绿色时修正后的曲线。
初期vt的计算有用 vt = vt / (1-β^t) 。其中，t是现在的天数。刚开始时t比较小，这样修正的就更大一些，紫色曲线上移；随着t增大，紫色曲线和绿色曲线基本重合。
t = 1时，v1 = 0.02θ1 / (1-0.98) = θ1（完全修正）

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git