当前位置：首页 > article >正文

【漫话机器学习系列】047.指数型线性单元（Exponential Linear Units，ELU）

article 2025/2/28 23:50:14

指数型线性单元（Exponential Linear Units，ELU）

指数型线性单元（ELU） 是一种用于深度学习的激活函数，其目的是通过引入负输入的指数衰减特性，解决 ReLU 函数的一些缺点，比如死亡神经元问题。ELU 使得网络更易于训练且更稳健，尤其是在梯度消失和数据偏移问题上。

ELU 函数的定义

ELU 函数定义为：

$f(x) = \begin{cases} x & \text{if } x > 0 \\ \alpha (\exp(x) - 1) & \text{if } x \leq 0 \end{cases}$

其中：

$\alpha > 0$ 是超参数，控制负输入部分的平滑程度。典型值为 $\alpha = 1$ 。
对于 $x > 0$ ，ELU 等价于线性函数。
对于 $x \leq 0$ ，ELU 的输出是指数形式，逐渐趋于 $-\alpha$ 。

特性与优点

平滑性
ELU 是连续可微的，这对梯度计算非常友好，有助于优化算法的稳定性。
输出均值靠近零
ELU 的输出可以是正数或负数，负值的指数形式能使激活的均值更接近于零，从而减少了神经网络的偏移偏移现象（相比于 ReLU 和 Leaky ReLU）。
解决死亡神经元问题
ELU 的负值部分逐渐趋于一个有限值 $-\alpha$ ，不会像 ReLU 那样直接将负值置零，避免神经元完全不激活的问题。
增强网络的鲁棒性
ELU 的负值区间使得网络可以更好地学习复杂数据的非线性特征。

ELU 与其他激活函数的比较

激活函数	数学表达式	特性	缺点
ReLU	f(x)=max⁡(0,x)	简单高效；梯度计算快	死亡神经元问题
Leaky ReLU	f(x)=max⁡(ax,x) (a∈(0,1))	缓解死亡神经元问题	非零均值输出
ELU	定义如上	平滑；均值接近零；解决死亡问题	计算成本略高
Sigmoid	$f(x) = \frac{1}{1+\exp(-x)}$	适合概率输出	梯度消失问题
Tanh	$f(x) = \frac{\exp(x)-\exp(-x)}{\exp(x)+\exp(-x)}$	平滑；均值为零	梯度消失问题

超参数 α 的影响

α = 1：ELU 的负值部分呈现指数衰减，负输入越小，输出越接近于 −1。
α > 1：负值部分的衰减更陡峭，输出范围扩大。
α < 1：负值部分的衰减较缓慢，负输出范围减小。

在实际应用中，α = 1 是常用的默认值。

应用场景

深层网络的激活函数
ELU 适用于需要高鲁棒性和良好梯度传播的深层神经网络。
减少数据偏移问题
适用于输入数据非标准化或存在分布偏移的情况。
图像处理与生成
在图像生成任务（如 GAN 和 VAE）中，ELU 的平滑特性可以提高生成的稳定性和质量。

ELU 的实现（Python 示例）

以下代码演示了如何在深度学习框架中使用 ELU 激活函数：

Numpy 实现 ELU

import numpy as np

def elu(x, alpha=1.0):
    return np.where(x > 0, x, alpha * (np.exp(x) - 1))

# 示例数据
x = np.array([-2, -1, 0, 1, 2])
y = elu(x, alpha=1.0)
print("输入:", x)
print("ELU 激活:", y)

运行结果

输入: [-2 -1  0  1  2]
ELU 激活: [-0.86466472 -0.63212056  0.          1.          2.        ]

TensorFlow/PyTorch 中的 ELU

TensorFlow:

import tensorflow as tf

x = tf.constant([-2.0, -1.0, 0.0, 1.0, 2.0])
y = tf.nn.elu(x)
print("ELU 激活:", y.numpy())

运行结果

ELU 激活: [-0.86466473 -0.63212055  0.          1.          2.        ]

PyTorch:

import torch
import torch.nn as nn

x = torch.tensor([-2.0, -1.0, 0.0, 1.0, 2.0])
elu = nn.ELU(alpha=1.0)
y = elu(x)
print("ELU 激活:", y)

运行结果

ELU 激活: tensor([-0.8647, -0.6321,  0.0000,  1.0000,  2.0000])

总结

ELU 是一种改进的激活函数，通过指数形式的负值区间克服了 ReLU 的缺点，特别是死亡神经元问题。它在深度网络中表现出色，尤其是在需要减小数据偏移或提升稳定性时，是一个有效的选择。然而，计算成本略高于 ReLU，因此需要根据具体任务需求权衡选择。

查看全文

http://www.kler.cn/a/504099.html

1.4 给应用添加service，执行扩容和滚动更新

TDSQL 内存占用解析一例

Golang｜单机并发缓存

24. 【.NET 8 实战--孢子记账--从单体到微服务】--记账模块--预算扣除、退回、补充

华为2024嵌入式研发面试题

Adobe与MIT推出自回归实时视频生成技术CausVid。AI可以边生成视频边实时播放！

Oracle 终止正在执行的SQL

下载导出Tomcat上的excle文档，浏览器上显示下载

Web前端------HTML块级和行内标签之块级标签

kube-prometheus监控Linux主机

关于H5复制ios没有效果

JavaScript系列（25）--性能优化技术详解

如何通过NMudbus读取寄存器数据

Vue环境变量配置指南：如何在开发、生产和测试中设置环境变量

mysql 与Redis 数据强一致方案

Jenkins简单的安装运行

线程间通信

当生活低迷时，如何醒过走出迷境？

SQL从入门到实战-2

Scala语言的字符串处理