当前位置：首页 > article >正文

protobuf为什么快

article 2025/3/26 5:47:36

前言

pb的优点

压缩率高

pb的数据类型

Protocol buffer时需要用户自定义自己的结构体，而且结构体中的定义规则要符合google制定的规则。结构体中每个字段都需要一个数据类型，protocol buffer支持的数据类型在源代码wire_format_lite.h中定义：

每类数据包含的具体数据类型如下表所示：

protobuf的编码

ProtocolBuffer的编码是尽其所能地将字段的元信息和字段的值压缩存储，并且字段的元信息中含有对这个字段描述的所有信息。

整个结构体序列化后抽象地看起来像下图这样：

可以看到，整个消息是以二进制流的方式存储，在这个二进制流中，逐个字段以定义的顺序紧紧相邻。每个字段中由元信息tag和字段的值value组成。

其中tag是这样编码的：

1）field_number << 3 | wire_type

2）对上面得到的无符号类型整数做variant编码

其中field_number是每个字段的标号，wire_type是该字段的数据类型。

variant编码

variant是一种紧凑型数字编码，将元数据跟数字保存在一起，如下图所示是数字131415的variant编码：

其中第一个字节的高位msb（Most Significant Bit ）为1表示下一个字节还有有效数据，msb为0表示该字节中的后7为是最后一组有效数字。踢掉最高位后的有效位组成真正的数字。

从上面可以看出，variant编码存储比较小的整数时很节省空间，小于等于127的数字可以用一个字节存储。但缺点是对于大于268,435,455（0xfffffff）的整数需要5个字节来存储。但是一般情况下（尤其在tag编码中）不会存储这么大的整数。

各类元素的序列化编码详解

int32/int64/uint32/uint64类型的编码

例如用户为int32传入值123，则该字段的存储如下：

第一个字节variant(1<<3|0) 第二个字节variant(123)

String类型的编码

例如用户为string传入值“hello”，则该字段的存储如下：

第一个字节variant(2<<3|2) ，第二个字节variant(5) ，剩余的字节 “hello”

float类型的编码

嵌套结构体编码

repeated类型字段编码

sint32, sint64类型字段编码

从int32编码中可以看出，当int32传入-1时所耗的空间很大，所以结构体定义中引入了sint32和sint64类型的数据，这种数据采用一种叫zigzag的编码方式，使绝对值比较小的整数也占用比较小的字节。

Zigzag编码规则如下：

如果数据是负数，那么套用2*|x|-1来编码表示
如果数据是正数，那么套用2*|x| 来编码表示

那么对于-1，就编成1，再二进制表示，就是00000001

上面的编码都是基于数字编码，那么如果传输字符串，就显得不太方便。

解析快

支持多语言

参考

Protobuf原理与序列化-CSDN博客

为什么protobuf这么快_protocolbuffer为什么效率高-CSDN博客

Why Protocol Buffer So Fast? ----protobuf编码详解 - CobbLiu - 博客园

查看全文

http://www.kler.cn/a/600553.html

ESP-SPARKBOT AI 智能机器人：v1.2 全流程复刻指南

网络基础-路由器和交换机工作配置

【测试报告】论坛系统

新书速览|OpenCV计算机视觉开发实践:基于Python

跨境选品利器：基于速卖通API实时监控爆款商品价格与库存波动

3.25-2request库

MATLAB 2024b深度学习，图神经网络（GNN）

正弦函数的连续傅里叶变换正弦序列的DTFT

HarmonyOS 之 @Require 装饰器自学指南

DeepSeek-V3-0324 模型发布：开源 AI 性能再攀高峰，推理与编码能力逼近顶级闭源模型

python康复日记-request库的使用，爬虫自动化测试

ToolsSet之：快捷键和速查表

VS Code连接远程服务遇到的问题

蓝之洋科技以AI智能制造引领变革，推动移动电源产业迈向高端智能化！

三分钟读懂微服务

蓝桥杯-符号变反操作（差分）

Weblogic

shopify跨境电商行业前景与规模

【Linux-驱动开发-pinctrl子系统】

SpringBoot-配置文件中敏感信息的加密保姆级教程

前言