当前位置：首页 > article >正文

用 TensorFlow和Keras 搭建CNN的经典案例解析~

article 2025/3/25 7:03:43

使用 TensorFlow 和 Keras 搭建 卷积神经网络（CNN） 进行 MNIST 手写数字分类 的示例

一、代码示例

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

# 1. 加载 MNIST 数据集
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

# 2. 预处理数据：归一化 & 维度扩展 (28x28 -> 28x28x1)
x_train = x_train.astype("float32") / 255.0
x_test = x_test.astype("float32") / 255.0
x_train = x_train[..., tf.newaxis]  # 添加通道维度
x_test = x_test[..., tf.newaxis]

# 3. 构建 CNN 模型
model = keras.Sequential([
    layers.Conv2D(32, kernel_size=(3, 3), activation="relu", input_shape=(28, 28, 1)),
    layers.MaxPooling2D(pool_size=(2, 2)),
    layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
    layers.MaxPooling2D(pool_size=(2, 2)),
    layers.Flatten(),
    layers.Dense(128, activation="relu"),
    layers.Dense(10, activation="softmax")  # 10 个类别（0-9）
])

# 4. 编译模型
model.compile(optimizer="adam",
              loss="sparse_categorical_crossentropy",
              metrics=["accuracy"])

# 5. 训练模型
model.fit(x_train, y_train, epochs=5, batch_size=64, validation_split=0.1)

# 6. 评估模型
test_loss, test_acc = model.evaluate(x_test, y_test)
print(f"测试集准确率: {test_acc:.4f}")

二、代码解析

步骤	作用
1. 加载数据集	从 `keras.datasets.mnist` 下载 MNIST 数据，分成训练集和测试集
2. 预处理数据	归一化（0-255 -> 0-1），并调整形状，使其符合 CNN 输入格式（28x28x1）
3. 构建 CNN 模型	- 第一层： 32 个 3x3 卷积核 + ReLU 激活 + 最大池化（2x2） - 第二层： 64 个 3x3 卷积核 + ReLU + 最大池化（2x2） - 展平（Flatten）：将特征图变为一维向量 - 全连接层（Dense）：128 个神经元 + ReLU - 输出层：10 个类别（0-9），使用 Softmax 归一化概率
4. 编译模型	使用 `Adam` 优化器，`sparse_categorical_crossentropy` 作为损失函数
5. 训练模型	用 90% 训练数据训练 5 轮，每次 64 个样本
6. 评估模型	在测试集上计算准确率

三、运行结果

如果一切顺利，你会看到类似这样的输出：

Epoch 1/5
844/844 [==============================] - 5s 6ms/step - loss: 0.1403 - accuracy: 0.9583 - val_loss: 0.0478 - val_accuracy: 0.9853
Epoch 2/5
844/844 [==============================] - 4s 5ms/step - loss: 0.0474 - accuracy: 0.9853 - val_loss: 0.0371 - val_accuracy: 0.9883
...
测试集准确率: 0.9871

四、你可以尝试改进...

增加卷积层数：提高模型复杂度，可能提升识别率。
加入 Dropout 层：防止过拟合，例如：
```
layers.Dropout(0.5)
```
使用更多 Epoch 训练：epochs=10 可能会提高最终表现。
换更强的优化器：尝试 SGD 或 AdamW。

五、在这段代码中tensorflow起到了什么作用？

在这段代码中，TensorFlow 主要提供了 深度学习计算框架，负责神经网络的 构建、训练和推理。具体来说，它在以下几个方面发挥了作用：

1. 提供深度学习基础组件

TensorFlow 作为 深度学习框架，提供了 张量（Tensor）计算、自动求导、优化器、神经网络层 等基本工具，使得搭建和训练神经网络变得简单。例如：

tensorflow.keras.datasets.mnist.load_data() 👉 加载数据
tensorflow.keras.layers.Conv2D() 👉 卷积层
tensorflow.keras.layers.Dense() 👉 全连接层
tensorflow.keras.optimizers.Adam() 👉 优化器
model.fit() 👉 训练
model.evaluate() 👉 测试

2. 负责数据的处理和转换

TensorFlow 允许使用 张量（Tensor） 进行高效的 矩阵计算，加速数据预处理：

x_train = x_train.astype("float32") / 255.0  # 归一化
x_train = x_train[..., tf.newaxis]  # 添加通道维度 (28, 28) -> (28, 28, 1)

👉 这里用 TensorFlow 处理数据，使其适应 CNN 训练。

3. 提供神经网络构建工具

TensorFlow 的 Keras API 提供了丰富的神经网络层，例如：

layers.Conv2D(32, kernel_size=(3, 3), activation="relu", input_shape=(28, 28, 1))

👉 这行代码使用 TensorFlow 定义一个 CNN 卷积层，会自动进行 权重初始化 和 梯度计算。

4. 训练和优化神经网络

TensorFlow 负责：

前向传播（Forward Pass）：输入数据经过 CNN，计算损失值。
反向传播（Backpropagation）：自动计算梯度，更新参数。

优化器（Optimizer）：比如 Adam 负责调整网络参数，使其更快收敛：

model.compile(optimizer="adam", loss="sparse_categorical_crossentropy", metrics=["accuracy"])

批量训练（Mini-batch Training）：
```
model.fit(x_train, y_train, epochs=5, batch_size=64, validation_split=0.1)
```
这里 TensorFlow 负责 自动并行计算，加速训练过程。

5. 评估和推理

训练完成后，TensorFlow 还能 自动计算测试集的准确率：

test_loss, test_acc = model.evaluate(x_test, y_test)
print(f"测试集准确率: {test_acc:.4f}")

👉 这部分利用 TensorFlow 的计算图（Computational Graph）执行高效的矩阵运算。

总结

TensorFlow 主要起到 计算引擎 的作用，它提供：

数据处理能力（张量计算、归一化）
神经网络构建能力（卷积层、全连接层等）
自动求导和优化（反向传播、Adam 优化器）
高效计算能力（GPU 加速、大规模并行训练）
推理与评估（在测试集上运行模型）

没有 TensorFlow，手写这些梯度计算和矩阵运算会非常复杂......

查看全文

http://www.kler.cn/a/597207.html

【软件工程】08_结构化设计方法

优化 SQL 语句方向和提升性能技巧

V2使用中遇到的问题

图解AUTOSAR_CP_EEPROM_Driver

七、服务器远程桌面报错

【Docker系列一】Docker 简介

Web3 时代数据保护的关键挑战与应对策略

如何在PDF中嵌入数据

LeetCode LCR 033 字母异位词分组

DNS缓存使用中有什么问题?DNS缓存有哪些作用?

论文阅读笔记：Denoising Diffusion Probabilistic Models (2)

黑鲨外设2025春季新品发布会：全球首款“冷暖双控”鼠标亮相！

C++ 项目实战书店销售记录统计程序（十）

Redis 事件机制详解

Go语言反射机制在数据库同步中的实战应用 —— 动态赋值与类型转换详解

JVM 知识点梳理

Python Django入门(建立项目)

【数据分享】我国乡镇（街道）行政区划数据（免费获取/Shp格式）

C语言入门教程100讲（8）算术运算符

深度学习--概率