当前位置：首页 > article >正文

《Python深度学习》第一讲：深度学习基础

article 2025/3/15 22:52:00

1.1 人工智能、机器学习与深度学习

本讲我们来聊聊深度学习基础。
首先，你可能听说过人工智能（AI），它就像是让机器拥有像人类一样的智能。比如，你用语音助手问问题，它能回答你，这就是人工智能的一个应用。机器学习（ML）是人工智能的一个重要分支，它让机器通过数据学习规律。比如，你给机器很多猫和狗的图片，它就能学会区分猫和狗。而深度学习（DL）是机器学习的一个更高级的版本，它通过多层神经网络来学习数据的复杂特征。

深度学习的“深度”是什么意思呢？
想象一下，你有一堆积木，你可以用一层积木搭一个简单的房子，但如果用多层积木，就能搭出更复杂的城堡。深度学习的“深度”就是指神经网络有很多层，每一层都在学习数据的不同方面。比如，第一层可能学习简单的线条，第二层学习形状，第三层学习更复杂的物体。这种层层递进的学习方式，让深度学习能够处理非常复杂的问题。

具体来说，深度学习是怎么工作的呢？
我们来看一个例子。假设你有一个任务，需要识别手写数字。你可以用深度学习来解决这个问题。你给机器很多手写数字的图片，这些图片就是数据。机器通过这些数据学习每个数字的特征，然后就能识别新的手写数字。这就是深度学习的一个简单应用。

1.2 深度学习之前：机器学习简史

在深度学习出现之前，机器学习已经存在很久了。
比如，概率建模是一种很古老的机器学习方法。想象你有一个装满不同颜色球的袋子，你想知道摸到红球的概率。概率建模就是用数学公式来计算这种可能性。比如，朴素贝叶斯算法就是一种概率建模方法，它可以根据过去的事件来预测未来。比如，根据过去的邮件内容来判断一封新邮件是否是垃圾邮件。

早期的神经网络也很有趣。
早在20世纪50年代，科学家们就开始模仿大脑的神经元来设计计算机程序。就像大脑的神经元通过电信号相互连接一样，早期的神经网络也是通过简单的计算单元来处理信息。不过，这些早期的网络比较简单，只能解决一些很基础的问题。

核方法和SVM也很厉害。
核方法是一种很巧妙的数学技巧，它可以帮助计算机在复杂的高维空间中找到简单的规律。比如，支持向量机（SVM）就是一种核方法，它可以在数据中找到一条分界线，把不同的类别分开。想象你在纸上画了两个类别的点，SVM就像一把尺子，帮你找到一条最合适的线，把这两类点分开。

决策树和随机森林也很常用。
决策树就像是一张决策流程图，它通过一系列的问题来判断结果。比如，你想判断一个人是否适合运动，决策树可能会问：“他是否超过30岁？”“他是否有心脏病？”等等。随机森林则是很多决策树的集合，它通过综合多个决策树的结果来提高准确性。

那深度学习是怎么兴起的呢？
随着计算机硬件的发展，尤其是GPU的出现，深度学习开始崭露头角。GPU就像是一个超级计算器，能够快速处理大量的数据。这使得深度学习能够训练更大、更复杂的神经网络，从而解决更复杂的问题。

1.3 为什么是深度学习，为什么是现在

深度学习为什么这么火呢？
首先，硬件的进步是关键。想象你有一台超级计算机，它可以在短时间内完成复杂的计算。现代的GPU就像是这样的超级计算机，它们能够快速处理深度学习中的大量矩阵运算。比如，NVIDIA的GPU可以让深度学习模型的训练速度提高几十倍甚至上百倍。

数据的爆炸式增长也很重要。
现在，我们每天都在产生海量的数据，比如社交媒体上的图片、视频，还有各种传感器收集的数据。这些数据就像是深度学习的“燃料”，让模型能够学习到更多的规律。比如，通过分析大量的医疗影像数据，深度学习模型可以更准确地诊断疾病。

算法的改进也很关键。
科学家们不断改进深度学习的算法，让模型能够更好地学习和泛化。比如，反向传播算法就像是一个纠错器，它可以帮助模型调整自己的参数，从而更好地适应数据。还有各种优化算法，比如Adam和RMSprop，它们可以让模型更快地收敛。

最后，深度学习的大众化也很重要。
现在，深度学习已经变得非常容易上手。比如，Keras是一个非常友好的深度学习框架，它就像是一套乐高积木，你可以轻松地搭建出复杂的神经网络。而且，现在有很多开源的深度学习模型和教程，让任何人都可以快速上手。

2.1 初识神经网络

好，下面我们来动手实践一下。
我们用Keras框架来实现一个简单的神经网络，让它能够识别手写数字。首先，我们加载MNIST数据集，这是一个包含60,000张训练图片和10,000张测试图片的数据集，每张图片都是一个28×28的灰度图像。我们的目标是训练一个神经网络，让它能够识别这些数字。

from keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

我们来看看这些数据。
train_images是一个形状为(60000, 28, 28)的3D张量，train_labels是一个长度为60000的数组，包含0到9的数字。test_images和test_labels也是类似的，但只有10,000张图片。

接下来，我们构建一个简单的神经网络。
这个网络包含两个Dense层，第一层有512个神经元，第二层有10个神经元，对应10个数字类别。我们使用ReLU激活函数和softmax激活函数，让网络能够输出每个数字的概率。

from keras import models
from keras import layers

network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28 * 28,)))
network.add(layers.Dense(10, activation='softmax'))

然后，我们需要编译网络。
我们选择rmsprop作为优化器，categorical_crossentropy作为损失函数，accuracy作为评估指标。

network.compile(optimizer='rmsprop',
                loss='categorical_crossentropy',
                metrics=['accuracy'])

在训练之前，我们需要对数据进行预处理。
我们需要将图片数据从整数转换为浮点数，并且将它们的形状从(28, 28)变为(28 * 28)。我们还需要将标签数据进行分类编码。

train_images = train_images.reshape((60000, 28 * 28))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28 * 28))
test_images = test_images.astype('float32') / 255

from keras.utils import to_categorical

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

最后，我们开始训练网络。
我们用fit方法来训练网络，每次迭代都会计算损失值和准确率。我们训练5个epoch，每次处理128张图片。

network.fit(train_images, train_labels, epochs=5, batch_size=128)

训练完成后，我们在测试集上评估模型的性能。

test_loss, test_acc = network.evaluate(test_images, test_labels)
print('Test accuracy:', test_acc)

结果怎么样呢？
你会发现，这个简单的神经网络在测试集上的准确率可以达到98%左右。这说明深度学习真的很强大，它能够自动从数据中学习规律，然后在新数据上进行准确的预测。

总结
我们从人工智能、机器学习和深度学习的关系讲起，了解了深度学习的基本概念和优势。我们还回顾了机器学习的发展历程，从概率建模到早期神经网络，再到核方法和决策树。最后，我们用Keras框架实现了一个简单的神经网络，让它能够识别手写数字。

查看全文

http://www.kler.cn/a/586130.html

freeswitch（多台服务器级联）

Amazon RDS ProxySQL 探索(一)

Windows 发票闪印 PrintPDF-v3.6.10-第三方发票打印辅助工具，无需安装阅读器即可使用

idea 生成jpa的mvc三层

基于yolov8+streamlit实现目标检测系统带漂亮登录界面

雷池WAF 处理 HTTP 请求的流程

MySQL 8 主从同步安装与配置

【git】补丁文件

OpenHarmony体系架构深度解析

环路广播风暴演示图

C语言【数据结构】：时间复杂度和空间复杂度.详解

市面上常用的23种设计模式，分析实现方式以及实际使用场景案例

Flask实现分页的三种方法

面试之《前端常见的设计模式》

spring boot程序启动时读取覆盖配置文件中的变量

蓝桥杯备考：红黑树容器map应用---英语作文

React19源码系列之FiberRoot节点和Fiber节点

springboot validation 校验字段是否为空

Java开发之微服务架构设计：Spring Cloud Alibaba核心组

探索HTML5 Canvas：创造动态与交互性网页内容的强大工具

1.1 人工智能、机器学习与深度学习

1.2 深度学习之前：机器学习简史

1.3 为什么是深度学习，为什么是现在

2.1 初识神经网络

相关文章：