当前位置：首页 > article >正文

SnowFlake

article 2025/2/6 11:00:11

SnowFlake

是一种用于生成全局唯一的ID（通常用于分布式系统中的标识符）的方法。它最初由Twitter提出，目的是在分布式系统中高效地生成不重复的ID。

那么为什么要生成不重复的id呢，使用自增主键不好吗。

现在的服务基本是分布式、微服务形式的，而且大数据量也导致分库分表的产生，对于水平分表就需要保证表中 id 的全局唯一性。对于 MySQL 而言，一个表中的主键 id 一般使用自增的方式，但是如果进行水平分表之后，多个表中会生成重复的 id 值。那么如何保证水平分表后的多张表中的 id 是全局唯一性的呢？

ok，那么就有了雪花算法，或许你还听过uuid，那么接下来我们来对比一下。

我们在之前了解过uuid，那么先来对比一下雪花算法和uuid

雪花算法：

雪花算法生成的ID是一个64位的整数，结构包括时间戳、数据中心ID、机器ID和序列号等部分。
生成的ID是基于当前时间戳、节点标识和序列号计算的，保证了ID的唯一性和有序性。
雪花算法的ID在同一时刻内不同节点生成的ID会有不同的序列号，确保每个节点、每毫秒生成的ID都是唯一的。
雪花算法适合分布式系统，它在设计时考虑了机器分布、数据中心分布等因素。

UUID：

UUID是一个128位的标识符，通常表示为一个32位十六进制数（加上4个分隔符）。
UUID的生成方式有几种（基于时间戳、随机数、哈希值等），最常见的是版本4（基于随机数），也有版本1（基于时间戳和节点信息）等。
UUID生成的标识符是完全随机或基于时间戳的，依赖于算法的设计，通常不考虑分布式机器的节点信息，因此它的生成是去中心化的，不依赖于其他系统。

2. 唯一性

雪花算法：

通过时间戳、数据中心ID、机器ID和序列号的组合保证ID的全局唯一性。每个机器在特定的时间内生成的ID是唯一的。
在分布式系统中，雪花算法确保多个机器生成的ID不会冲突，因此适合分布式环境下的ID生成。

UUID：

UUID的版本1通过节点信息（如MAC地址）和时间戳生成ID，因此通常也是唯一的。版本4则是通过随机数生成ID，理论上也能保证全局唯一性。
UUID生成的唯一性依赖于实现机制（例如使用随机数的UUID可能存在重复概率，尽管几乎不可能发生），但在高并发环境中，生成UUID时并没有明确的节点信息控制，因此可能会有极小的碰撞概率。