深度学习框架-Keras的常用内置数据集总结
Keras 是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow、Microsoft Cognitive Toolkit 或 Theano 作为后端运行。Keras 提供了一些内置的小型数据集,这些数据集对于学习和测试模型非常有用。以下是一些 Keras 内置的数据集:
- MNIST 数据集 - 手写数字的灰度图像数据集。
- Fashion-MNIST 数据集 - 与 MNIST 数据集格式相同,但包含的是衣物物品的图像。
- CIFAR-10 数据集 - 包含 60,000 张 32x32 彩色图像,共 10 个类别,每个类别有 6,000 张图像。
- CIFAR-100 数据集 - 类似于 CIFAR-10,但是有 100 个类别,每类包含 600 张图像。
- IMDB 电影评论数据集 - 用于二分类的情感分析任务,包括 50,000 条来自 IMDB 的高度极化的评论。
- 路透社新闻数据集 (Reuters newswire topic classification) - 用于文本分类任务,包含 11,228 条新闻,分为 46 个主题。
- 波士顿房价数据集 (Boston Housing Price dataset) - 回归问题的数据集,包含了影响房价的各种因素。
- 加州住房价格数据集 (California Housing Price dataset) - 另一个回归问题的数据集,包含了加利福尼亚州各个街区的房屋信息。
可以使用 keras.datasets
模块来加载这些数据集。例如,要加载 MNIST 数据集
from keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()