当前位置：首页 > article >正文

Hugging Face 模型格式全解析：从 PyTorch 到 GGUF

article 2025/3/21 23:39:30

Hugging Face 模型格式全解析：从 PyTorch 到 GGUF

Hugging Face 生态支持多种模型格式，以满足不同场景下的存储、部署和推理需求。以下是主流格式的技术解析与演进脉络：

1. PyTorch 原生格式（`.pt`/`.pth`）

特性：
- 直接保存 PyTorch 的 state_dict（模型参数）或完整模型（含结构）。
- 兼容性强，与 PyTorch 训练/推理流程深度集成。
- 文件体积较大，加载速度较慢，存在安全风险（依赖 pickle 反序列化，可能执行恶意代码）。
应用场景：
- 模型开发与调试阶段，需保留训练状态。
- 与 PyTorch 生态工具链（如 torch.save）协同使用。

2. 通用二进制格式（`.bin`）

特性：
- Hugging Face Transformers 库的标准格式，存储模型参数。
- 二进制编码，体积较小，读写效率高。
- 依赖框架解析（需 transformers 库加载）。
应用场景：
- 预训练模型的发布（如 BERT、GPT-2 等）。
- 跨框架转换的中间格式（如转 ONNX）。

3. 安全张量格式（`.safetensors`）

特性：
- 由 Hugging Face 开发，专为解决 pickle 安全漏洞设计。
- 仅存储权重数据，不包含可执行代码。
- 支持零拷贝加载、内存映射技术，提升大模型加载速度。
- 兼容多框架（PyTorch、TensorFlow 等）。
应用场景：
- 模型分享与部署，需保障安全性。
- 替代 .pt 文件，避免恶意代码风险。

4. 高效本地推理格式（`.gguf`）

特性：
- 专为大模型设计的二进制格式，基于 GGML 框架优化。
- 单文件集成所有信息（权重、元数据），无需外部依赖。
- 支持量化（如 4-bit/8-bit），显著降低内存占用。
- 兼容 CPU/GPU 混合推理，适合本地部署工具（如 Ollama、LM Studio）。
应用场景：
- 消费级硬件上的高效推理（如笔记本、边缘设备）。
- 量化模型的快速部署与跨平台共享。

格式演进与选择指南

格式	优势	劣势	推荐场景
`.pt`	原生支持，灵活性高	体积大，安全性低	PyTorch 训练/开发
`.bin`	轻量高效	依赖框架	Hugging Face 模型发布
`.safetensors`	安全、快速加载	不包含模型结构	安全敏感型部署
`.gguf`	量化支持，本地部署友好	需转换工具	边缘设备推理，Ollama 生态

格式转换工具

.pt ↔ .safetensors：
使用 Hugging Face 的 transformers 库直接加载转换。
.safetensors → .gguf：
通过 llama.cpp 的 convert.py 脚本量化并转换（需指定量化参数）。
其他格式：
ONNX、TensorFlow 模型可通过 transformers 或第三方工具链间接转换。

总结

Hugging Face 模型格式的演进体现了安全性、效率和兼容性的平衡：

早期：.pt/.pth 是主流，但存在安全隐患。
中期：.bin 提升效率，.safetensors 解决安全问题。
近期：.gguf 针对大模型本地化需求，通过量化和单文件部署成为趋势。

根据需求选择格式：追求安全用 .safetensors，本地部署用 .gguf，深度集成 PyTorch 则保留 .pt。

http://www.kler.cn/a/594603.html

相关文章：

springboot Actuator 指标分析

服务安全认证概述与基础认证方式

Buuctf [极客大挑战 2019]FinalSQL

计算机图形学学习日志4

CVPR2025 | 对抗样本智能安全方向论文汇总 | 持续更新中~

mysql之DATE_FORMAT迁移到gbase8s

MVC_Publish-Subscriber 模式中的事件处理程序

【虚幻引擎UE5】SpawnActor生成Character实例不执行AI Move To，未初始化AIController的原因和解决方法

微服务即时通信系统---（九）消息转发子服务

Sqlserver安全篇之_启用和禁用Named Pipes的案列介绍

基于 HT 2D3D 渲染引擎的新能源充电桩可视化运营系统技术剖析

网络安全证书培训机构有哪些

Godep是什么？？在GoLang中作用是什么

Unity 从零开始的框架搭建1-7 FSM有限状态机与其应用示例

自动生成树形目录结构：与 `el-tree` 和滚动定位结合的完整解决方案

WordPress系统获取webshell的攻略

请为下面的html添加一个修改按钮，以便对书名、价格进行修改

【FastGPT】利用知识库创建AI智能助手

C++动态库中的静态调用和动态调用，延迟加载

再学：ERC721扩展、ERC1155、SBT，OpenSeaNFT市场 NFT Market 习题讲解