当前位置：首页 > article >正文

【深度学习】常见模型-自编码器（Autoencoder, AE）

article 2025/1/30 14:12:25

自编码器是一种无监督学习模型，通常用于数据降维、特征提取、去噪等任务。其核心思想是利用神经网络将输入数据压缩到低维表示（编码），再通过解码器将其还原为原始数据的近似值。自编码器的目标是最小化原始数据与重构数据之间的误差。

自编码器的基本结构

自编码器由两个主要部分组成：

编码器（Encoder）：
- 将高维输入数据映射到低维的潜在空间（Latent Space）。
- 主要目的是学习输入数据的压缩表示。
解码器（Decoder）：
- 将编码器的输出映射回原始输入空间，重构出接近输入的数据。
- 主要目的是恢复原始数据。

网络的输入和输出维度通常相同，而中间的编码层（潜在空间）具有更少的神经元。

数学公式

设输入数据为 x，目标是通过编码器 $f_{\text{encoder}}(x)$ 和解码器 $f_{\text{decoder}}(z)$ 恢复输入。模型的目标是最小化重构误差，通常表示为以下损失函数：

$\mathcal{L}(x, \hat{x}) = \|x - \hat{x}\|^2 = \|x - f_{\text{decoder}}(f_{\text{encoder}}(x))\|^2$

其中：

$z = f_{\text{encoder}}(x)$ ：编码器的输出（潜在表示）。
$\hat{x} = f_{\text{decoder}}(z)$ ：解码器的输出（重构数据）。

自编码器的主要变体

去噪自编码器（Denoising Autoencoder, DAE）：
- 在输入数据上加入噪声，训练模型去除噪声并重构干净数据。
- 适用于图像和信号的去噪任务。
稀疏自编码器（Sparse Autoencoder）：
- 通过在潜在空间添加稀疏性约束，让编码器学到更具判别性的特征。
- 适用于特征提取。
变分自编码器（Variational Autoencoder, VAE）：
- 生成模型，学习数据的概率分布。
- 适用于生成任务，如图像生成、数据填充。
卷积自编码器（Convolutional Autoencoder, CAE）：
- 使用卷积层替代全连接层，适合处理图像数据。
对抗自编码器（Adversarial Autoencoder, AAE）：
- 结合 GAN 的思想，增强生成能力。

代码实现

以下是一个使用 Keras 构建和训练简单自编码器的示例：

import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Dense

# 构建自编码器
input_dim = 784  # 输入维度（例如MNIST图像展平后的维度）
encoding_dim = 32  # 潜在表示的维度

# 编码器
input_img = Input(shape=(input_dim,))
encoded = Dense(encoding_dim, activation='relu')(input_img)

# 解码器
decoded = Dense(input_dim, activation='sigmoid')(encoded)

# 自编码器模型
autoencoder = Model(input_img, decoded)

# 编码器模型
encoder = Model(input_img, encoded)

# 解码器模型
encoded_input = Input(shape=(encoding_dim,))
decoder_layer = autoencoder.layers[-1](encoded_input)
decoder = Model(encoded_input, decoder_layer)

# 编译模型
autoencoder.compile(optimizer='adam', loss='binary_crossentropy')

# 加载数据（MNIST）
from tensorflow.keras.datasets import mnist
(x_train, _), (x_test, _) = mnist.load_data()
x_train = x_train.astype('float32') / 255.
x_test = x_test.astype('float32') / 255.
x_train = x_train.reshape((len(x_train), np.prod(x_train.shape[1:])))
x_test = x_test.reshape((len(x_test), np.prod(x_test.shape[1:])))

# 训练模型
autoencoder.fit(x_train, x_train,
                epochs=50,
                batch_size=256,
                shuffle=True,
                validation_data=(x_test, x_test))

# 可视化结果
encoded_imgs = encoder.predict(x_test)
decoded_imgs = autoencoder.predict(x_test)

# 显示原始图像和重构图像
n = 10  # 显示10张图像
plt.figure(figsize=(20, 4))
for i in range(n):
    # 原始图像
    ax = plt.subplot(2, n, i + 1)
    plt.imshow(x_test[i].reshape(28, 28), cmap='gray')
    plt.title("Original")
    plt.axis('off')

    # 重构图像
    ax = plt.subplot(2, n, i + 1 + n)
    plt.imshow(decoded_imgs[i].reshape(28, 28), cmap='gray')
    plt.title("Reconstructed")
    plt.axis('off')
plt.show()

运行结果

Epoch 1/50
235/235 [==============================] - 2s 5ms/step - loss: 0.2770 - val_loss: 0.1903
Epoch 2/50
235/235 [==============================] - 1s 4ms/step - loss: 0.1710 - val_loss: 0.1545
Epoch 3/50
235/235 [==============================] - 1s 5ms/step - loss: 0.1447 - val_loss: 0.1338
Epoch 4/50
235/235 [==============================] - 1s 4ms/step - loss: 0.1286 - val_loss: 0.1216
Epoch 5/50
235/235 [==============================] - 1s 4ms/step - loss: 0.1185 - val_loss: 0.1131
Epoch 6/50
235/235 [==============================] - 1s 5ms/step - loss: 0.1116 - val_loss: 0.1074
Epoch 7/50
235/235 [==============================] - 1s 6ms/step - loss: 0.1066 - val_loss: 0.1032
Epoch 8/50
235/235 [==============================] - 1s 5ms/step - loss: 0.1028 - val_loss: 0.1000
Epoch 9/50
235/235 [==============================] - 1s 5ms/step - loss: 0.1000 - val_loss: 0.0976
Epoch 10/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0979 - val_loss: 0.0959
Epoch 11/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0966 - val_loss: 0.0948
Epoch 12/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0956 - val_loss: 0.0940
Epoch 13/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0950 - val_loss: 0.0935
Epoch 14/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0946 - val_loss: 0.0931
Epoch 15/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0942 - val_loss: 0.0928
Epoch 16/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0940 - val_loss: 0.0927
Epoch 17/50
235/235 [==============================] - 1s 6ms/step - loss: 0.0938 - val_loss: 0.0925
Epoch 18/50
235/235 [==============================] - 1s 6ms/step - loss: 0.0937 - val_loss: 0.0923
Epoch 19/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0935 - val_loss: 0.0922
Epoch 20/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0934 - val_loss: 0.0922
Epoch 21/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0933 - val_loss: 0.0920
Epoch 22/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0933 - val_loss: 0.0920
Epoch 23/50
235/235 [==============================] - 1s 6ms/step - loss: 0.0932 - val_loss: 0.0922
Epoch 24/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0931 - val_loss: 0.0919
Epoch 25/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0931 - val_loss: 0.0919
Epoch 26/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0930 - val_loss: 0.0918
Epoch 27/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0930 - val_loss: 0.0917
Epoch 28/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0929 - val_loss: 0.0917
Epoch 29/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0929 - val_loss: 0.0917
Epoch 30/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0929 - val_loss: 0.0917
Epoch 31/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0928 - val_loss: 0.0917
Epoch 32/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0928 - val_loss: 0.0917
Epoch 33/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0928 - val_loss: 0.0916
Epoch 34/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0928 - val_loss: 0.0916
Epoch 35/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0927 - val_loss: 0.0916
Epoch 36/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0927 - val_loss: 0.0916
Epoch 37/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0927 - val_loss: 0.0916
Epoch 38/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0927 - val_loss: 0.0916
Epoch 39/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0927 - val_loss: 0.0916
Epoch 40/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0927 - val_loss: 0.0916
Epoch 41/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0926 - val_loss: 0.0916
Epoch 42/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0926 - val_loss: 0.0915
Epoch 43/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0926 - val_loss: 0.0915
Epoch 44/50
235/235 [==============================] - 1s 5ms/step - loss: 0.0926 - val_loss: 0.0914
Epoch 45/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0926 - val_loss: 0.0916
Epoch 46/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0926 - val_loss: 0.0914
Epoch 47/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0925 - val_loss: 0.0914
Epoch 48/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0925 - val_loss: 0.0914
Epoch 49/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0925 - val_loss: 0.0915
Epoch 50/50
235/235 [==============================] - 1s 4ms/step - loss: 0.0925 - val_loss: 0.0914
313/313 [==============================] - 0s 851us/step
313/313 [==============================] - 0s 930us/step