当前位置：首页 > article >正文

一文读懂大模型文件后缀名，解锁 AI 世界的密码

article 2025/2/23 7:49:10

在大模型的世界里，各种文件后缀名就像一把把钥匙，打开通往不同应用和功能的大门。今天，咱们就来聊聊那些常见又重要的大模型文件后缀名。

safetensors：安全与高效的守护者

safetensors 是一种基于 Python 的序列化格式，专为机器学习模型设计。它最大的特点就是安全，在保存和加载模型时，能够有效防止潜在的代码执行风险，保障数据安全。同时，其读写速度快，占用内存少，使得模型的存储和传输都更加高效。比如在一些对数据安全要求极高的金融领域大模型中，safetensors 格式就得到了广泛应用，既能保证模型数据安全，又能快速响应业务需求。

gguf：轻量化推理的利器

gguf 格式是专门为在 CPU 和移动设备上进行高效推理而设计的。它对模型进行了优化，使得模型在运行时占用更少的资源，却能保持相当不错的推理性能。像在一些移动端 AI 应用，如智能图像识别 APP 中，使用 gguf 格式的模型，就能在手机等设备上流畅运行，快速给出识别结果，让用户获得良好的体验。

ckpt：深度学习训练的关键

ckpt 是 Checkpoint 的缩写，常用于深度学习训练过程中。它保存了模型在训练过程中的参数、优化器状态等信息。这意味着，如果训练因为某些原因中断，我们可以从对应的 ckpt 文件中恢复训练，而无需从头开始，大大节省了时间和资源。在大规模图像分类模型训练中，ckpt 文件发挥着重要作用，帮助研究者不断优化模型。

pth：PyTorch 的专属

pth 是 PyTorch 框架常用的模型保存格式。PyTorch 凭借其动态图机制在深度学习领域备受青睐，而 pth 格式文件则很好地适配了 PyTorch 的特性。它可以方便地保存和加载模型，无论是模型的训练、验证还是部署，pth 文件都能顺畅完成任务，许多基于 PyTorch 开发的 NLP 模型都以 pth 格式保存。

新增文件格式介绍

bin：二进制的高效存储

bin 是一种二进制文件格式，不同的深度学习框架可能会有自己的 bin 文件格式用于保存模型参数或模型结构等信息。通常它是经过优化的二进制格式，被 Hugging Face Transformers 库广泛使用。其以二进制形式存储数据，读写效率高，文件体积较小，但可读性差，并且不同框架之间的 bin 文件格式可能不兼容，需要相应的框架或工具来解析和加载。在一些需要高效存储和传输模型的场景中，bin 格式就派上了用场。

h5：灵活的数据存储

HDF5（.h5）是一种灵活的数据存储格式，支持大量的数据和复杂的数据组织形式。在深度学习中，尤其是使用 Keras 框架时，模型经常以 HDF5 格式存储。它能很好地管理大规模的数据，比如在图像识别大模型中，大量的图像数据及其标注信息可以通过 h5 文件有序存储，方便模型训练时读取。

pb：跨平台的结构化数据

Protocol Buffers（.pb）是 Google 开发的一种语言无关、平台无关的可扩展机制，用于序列化结构化数据。TensorFlow 通常使用这种格式来保存和加载模型。凭借其跨平台特性，pb 格式的模型可以在不同的系统和设备上运行，在一些需要广泛部署模型的场景中较为常用。

onnx：模型移植的桥梁

Open Neural Network Exchange（ONNX，.onnx）是一个开放格式，用于表示深度学习模型。ONNX 旨在使模型可以在不同的深度学习框架之间轻松移植。比如，一个在 PyTorch 框架下训练好的模型，可以转换为 onnx 格式，然后在其他支持 ONNX 的框架中使用，为模型的跨框架应用提供了便利。

查看全文

http://www.kler.cn/a/557216.html