神经网络输出层设计之softmax函数

softmax函数的实现中要进行指数函数的运算，但是指数函数的值很容易变得非常大。如：e的10次方会超过2000，e的40次方会变成一个后面有40个0的超大值，如果这些超大值进行除法运算，结果会出现“不确定”的情况。在进行softmax函数时，加上或者减去某个常数并不会改变运算的结果，为了防止溢出问题，我们可以通过。图式公式可以理解为：假设输出层共有n个神经元，计算第k个神经元的输出y。其中，ex

川，英

392人浏览 · 2023-11-04 17:21:08

川，英 · 2023-11-04 17:21:08 发布

1.softmaxx函数数学表达式：
在这里插入图片描述
其中，exp(x)是指数函数。

图式公式可以理解为：假设输出层共有n个神经元，计算第k个神经元的输出y。

2.简单实现softmaxx函数：

import numpy as np

x = np.array([0.3,2.9,4.0])
exp_x = np.exp(x)
print(exp_x)
sum_x = np.sum(exp)
print(sum_x)
softmax = exp_x/sum_x
print(softmax)

>>> [ 1.34985881 18.17414537 54.59815003]
>>> 74.1221542101633
>>> [0.01821127 0.24519181 0.73659691]

3.建立softmaxx函数：

def softmax(x):

    exp_x = np.exp(x)
    sum_exp_a = np.sum(exp_x)
    softmax = exp_x/sum_exp_a

    return softmax
x = np.array([0.3,2.9,4.0])
softmax = softmax(x)
print(softmax)

>>> [0.01821127 0.24519181 0.73659691]

4.softmaxx函数的溢出问题：

问题：

softmax函数的实现中要进行指数函数的运算，但是指数函数的值很容易变得非常大。如：e的10次方会超过2000，e的40次方会变成一个后面有40个0的超大值，如果这些超大值进行除法运算，结果会出现“不确定”的情况。

import numpy as np

x = np.array([1010,1000,990])
exp_x = np.exp(x)
sum_exp_x = np.sum(exp_x)
softmax = exp_x

>>> [nan nan nan]

解决方法：
在进行softmax函数时，加上或者减去某个常数并不会改变运算的结果，为了防止溢出问题，我们可以通过减去输入信号中的最大值来解决这个问题。

import numpy as np

x = np.array([1010,1000,990])
c = np.max(x)    #求取最大值
print(c)
x = x-c
print(x)
exp_x = np.exp(x)
sum_exp_x = np.sum(exp_x)
softmax = exp_x/sum_exp_x
print(softmax)

>>> 1010
>>> [  0 -10 -20]
>>> [9.99954600e-01 4.53978686e-05 2.06106005e-09]

def softmax(X):
    exp_x = np.exp(x-np.max(x))
    sum_exp_x = np.sum(exp_x)
    y = exp_x/sum_exp_x

    return y

x = np.array([1010,1000,990])
softmax = softmax(x)
print(softmax)

>>> [9.99954600e-01 4.53978686e-05 2.06106005e-09]

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git