当前位置：首页 > article >正文

激活函数解析：神经网络背后的“驱动力”

article 2025/3/13 6:32:35

神经网络中的激活函数（Activation Function）是其运作的核心组件之一，它们决定了神经元如何根据输入信号进行“激活”，进而影响整个模型的表现。理解激活函数的工作原理对于设计和优化神经网络至关重要。本篇博客将深入浅出地介绍各种常见激活函数，帮助大家掌握这一基础概念。

什么是激活函数？

激活函数的作用：

常见的激活函数

1. Sigmoid 函数（S型函数）

编辑2. Tanh 函数（双曲正切函数）

编辑

3. ReLU（Rectified Linear Unit）函数

4. Leaky ReLU 函数

5. Softmax 函数

总结

什么是激活函数？

在神经网络中，每个神经元都会接收来自前一层神经元的输入信号，这些输入信号经过加权和求和后，需要通过激活函数进行处理。激活函数的作用是决定神经元是否应该被激活，从而影响输出值。简单来说，激活函数决定了一个神经元对其输入信号的反应程度。

激活函数的作用：

非线性化：神经网络中的激活函数通常是非线性的，这使得网络能够学习和表示复杂的关系。没有非线性的激活函数，无论网络有多少层，其等价于一个简单的线性模型。
引入阈值：激活函数决定了神经元的输出值是否激活，类似于生物神经元的工作方式。
限制输出范围：激活函数可以对输出进行一定的限制，使得模型更加稳定。

常见的激活函数

接下来，我们将介绍几种常见的激活函数，并分析它们的优缺点。

1. Sigmoid 函数（S型函数）

Sigmoid 函数是最经典的激活函数之一，其数学表达式为：

$\sigma (x) = \frac{1}{1+e^{-x}}$

特点：

输出范围：0 到 1，适用于二分类问题，输出可以被看作概率。
平滑和连续：Sigmoid 函数是平滑的，且具有单调性。

缺点：

梯度消失：当输入值过大或过小时，梯度几乎为 0，导致训练时梯度消失，难以进行有效学习。
输出不对称：Sigmoid 的输出范围是 [0, 1]，导致其在正负输入时表现不对称，可能影响模型表现。

图片示例如下：

2. Tanh 函数（双曲正切函数）

Tanh 函数是 Sigmoid 函数的改进版，其数学表达式为：

$Tanh(x) = \frac{e^{x}-e^{-x}}{e^{x}+e^{-x}}$

特点：

输出范围：-1 到 1，具有更强的对称性。
平滑和连续：Tanh 函数与 Sigmoid 函数类似，具有平滑的曲线。

优点：

对称性：Tanh 函数的输出范围是对称的，负数输出可以更好地表示负向激活。

缺点：

梯度消失：和 Sigmoid 类似，当输入值过大或过小时，梯度接近于零，训练时容易出现梯度消失问题。

3. ReLU（Rectified Linear Unit）函数

ReLU 是目前最常用的激活函数之一，其数学表达式为：

$ReLU(x)=max(0,x)$

特点：

输出范围：当输入大于 0 时，输出等于输入；否则输出为 0。
计算简单：ReLU 函数计算非常简单，仅需要比较输入值和 0，极大提高了训练效率。

优点：

避免梯度消失：由于其线性特性，当输入为正时，ReLU 的梯度为常数，避免了梯度消失问题。
收敛速度快：ReLU 可以加速神经网络的收敛速度，是深度学习中最常用的激活函数。

缺点：

死亡神经元问题：如果输入总是负数，神经元将“死亡”，导致其输出始终为 0，无法参与学习。

4. Leaky ReLU 函数

Leaky ReLU 是对标准 ReLU 的改进版本。其数学表达式为：

$LeakyReLU(x) = \begin{cases} x & \text{ if } x>0 \\ \alpha x & \text{ if } x\leq 0 \end{cases}$

其中， $\alpha$ 是一个小的常数，通常为 0.01。

特点：

输出范围：负输入不会被完全抑制，而是乘以一个小的系数 α\alphaα。
避免神经元死亡：即使输入值为负，Leaky ReLU 也能提供一个很小的梯度，避免神经元“死亡”。

优点：

避免死亡神经元问题：通过给负数输入提供一个小的斜率，Leaky ReLU 避免了 ReLU 中的死亡神经元问题。
收敛速度快：类似于 ReLU，Leaky ReLU 也能加速训练过程。

5. Softmax 函数

Softmax 函数常用于多分类问题，其数学表达式为：

$Softmax(x_i)=\frac{e^{x_i}}{\sum_j^k e^{x_j}}$

特点：

输出范围：Softmax 函数将输出转换为概率分布，每个输出值的范围是 (0, 1)，且所有输出值之和为 1。
多分类应用：常用于多分类任务的最后一层，将原始输出值转换为类别概率。

优点：

概率输出：Softmax 输出的每个值可以解释为某个类别的概率，非常适合多分类问题。

总结

激活函数是神经网络中不可或缺的组成部分，它们让网络能够学习复杂的非线性关系。不同的激活函数具有不同的特点，适用于不同的任务和数据集。在实际应用中，ReLU 和其变种（如 Leaky ReLU）因其简单高效而成为深度学习中最常用的激活函数。而在多分类问题中，Softmax 函数是经典的选择。

在选择激活函数时，需要根据问题的特性以及网络结构来进行选择。希望通过本篇博客，大家能对激活函数有更清晰的认识，并在实际应用中作出更合适的选择。

查看全文

http://www.kler.cn/a/392443.html

练习LabVIEW第四十三题

从0开始深度学习（26）——汇聚层/池化层

A. Turtle and Good Strings

富格林：可信预判交易安全契机

P2356 弹珠游戏

HarmonyOS NEXT应用元服务开发Intents Kit（意图框架服务）上架配置指导

STM32 4X4 键盘

Elasticsearch常用接口_添加数据

会议直击｜美格智能受邀出席第三届无锡智能网联汽车生态大会，共筑汽车产业新质生产力

一生一芯预学习阶段 NEMU代码学习（2）

C++总结

【AI大模型】ELMo模型介绍：深度理解语言模型的嵌入艺术

Git - 命令杂谈 - reset、revert和clean

容器docker的ulimit

设备接入到NVR管理平台EasyNVR多品牌NVR管理工具/设备的音视频配置参考

Redis相关技术内容

一条SQL查询语句的执行流程（MySQL）

微信小程序进行md5加密，base64 转码

nuxt3添加wowjs动效

mysql 实现分库分表之 --- 基于 MyCAT 的分片策略详解

什么是激活函数？

激活函数的作用：

常见的激活函数

1. Sigmoid 函数（S型函数）

2. Tanh 函数（双曲正切函数）

3. ReLU（Rectified Linear Unit）函数

4. Leaky ReLU 函数

5. Softmax 函数

总结

相关文章：