当前位置: 首页 > article >正文

雪花算法生成分布式唯一ID

雪花算法的结构是由时间戳、工作机器ID和序列号构成。要确保全局唯一,必须保证每个节点的机器ID唯一,并且同一毫秒内序列号不重复。在分库分表的环境下使用雪花算法,机器ID的分配是关键。常见的做法是通过分布式系统协调,比如使用ZooKeeper或者数据库来分配唯一的机器ID,在启动时从外部服务获取ID,并持久化存储,防止重启后ID变化。另外,时间戳部分需要保证各节点的时钟同步,否则可能出现时间不一致导致ID冲突。这时候可能需要NTP服务来同步时间,但NTP本身可能会引起时钟回拨的问题,尤其是在虚拟机环境中,时钟可能会被调整。这时候雪花算法默认实现会抛出异常,导致服务不可用。需要解决这个问题,可能的方法包括等待时钟追回、使用扩展位记录回拨次数,或者切换到其他ID生成方式。

一、雪花算法的核心结构与全局唯一性保证

雪花算法的ID结构通常为 64位,分为以下三部分(具体位数可调整):

  1. 时间戳(41位):记录生成ID的时间(毫秒级),可支持约69年的时间跨度。
  2. 机器ID(10位):区分不同节点,最多支持1024台机器。
  3. 序列号(12位):同一毫秒内的自增序号,支持每台机器每毫秒生成4096个ID。
全局唯一性的关键保障
  1. 机器ID唯一性

    • 静态配置:为每台机器分配唯一的ID(如通过配置文件或环境变量)。
    • 动态分配:通过分布式协调服务(如ZooKeeper、Etcd)动态分配机器ID,避免手动维护。
    • 容器化环境:在Kubernetes中可通过StatefulSet的Pod序号作为机器ID的一部分。
  2. 时间戳单调递增

    • 依赖机器的本地时钟,需确保时钟同步(如使用NTP服务)。
    • 若发生时钟回拨,需有容错机制。
  3. 序列号不重复

    • 同一毫秒内,序列号从0开始自增,达到最大值后等待下一毫秒再生成。

二、时钟回拨问题及解决方案

1. 时钟回拨的原因
  • NTP同步:网络时间协议(NTP)自动校准时钟时可能导致时间回退。
  • 人工误操作:手动调整机器时间。
  • 虚拟机挂起/恢复:虚拟机暂停后恢复可能导致时钟跳变。
2. 时钟回拨的影响
  • 若当前时间小于上一次生成ID的时间,直接使用雪花算法会生成重复ID,破坏唯一性。
3. 解决方案
(1) 容忍短暂回拨(毫秒级)
  • 等待时钟追平:若回拨时间较短(如≤100ms),暂停ID生成,等待本地时钟追平历史最大时间戳。
  • 代码示例
    public synchronized long nextId() {
        long currentTime = timeGen();
        if (currentTime < lastTimestamp) {
            long offset = lastTimestamp - currentTime;
            if (offset <= MAX_BACKWARD_MS) {
                Thread.sleep(offset);  // 等待时钟追平
            } else {
                throw new RuntimeException("Clock moved backwards!");
            }
        }
        // 正常生成ID...
    }
    
(2) 扩展时间戳位(解决长时回拨)
  • 记录时钟回拨次数:在ID中增加几位表示时钟回拨的偏移量(需牺牲部分序列号或机器ID的位数)。
  • 示例:使用42位时间戳 + 2位回拨计数器 + 8位机器ID + 12位序列号。
(3) 降级方案
  • 切到备用ID生成器:如UUID或数据库自增ID,但会牺牲部分特性(如有序性)。
(4) 优化时钟源
  • 使用物理时钟:避免依赖虚拟机的时钟(如AWS的Nitro实例使用物理时钟源)。
  • 闰秒处理:配置NTP服务忽略闰秒调整(如使用ntpd -x)。

三、实际项目中的最佳实践

1. 机器ID分配
  • 静态配置:适用于机器数量固定的场景(如10台机器,ID为0-9)。
  • 动态注册:通过数据库或配置中心注册机器ID,启动时申请,下线时释放。
2. 时钟同步
  • 强制NTP服务:所有机器绑定到同一NTP服务器,限制时钟漂移。
  • 监控告警:部署时钟偏移监控(如Prometheus + node_timex_offset_seconds)。
3. 容错设计
  • 时钟回拨日志:记录回拨事件,便于事后排查。
  • 熔断机制:若回拨时间过长,触发熔断并告警。

四、案例:开源框架的解决方案

1. 百度UidGenerator
  • 扩展了雪花算法,通过借用未来时间解决时钟回拨问题。
  • 使用RingBuffer预生成ID,降低实时生成的延迟。
2. 美团Leaf
  • 基于雪花算法,增加ZooKeeper协调机器ID分配。
  • 提供“Leaf-snowflake”模式,解决时钟回拨问题。

五、总结

  • 全局唯一性:依赖机器ID唯一性、时间戳单调性、序列号不重复。
  • 时钟回拨:通过等待追平、扩展时间戳位或降级方案解决。
  • 生产建议:优先使用成熟的分布式ID生成框架(如UidGenerator、Leaf),避免重复造轮子。

最终结论:雪花算法的全局唯一性可通过合理设计保障,时钟回拨需结合业务容忍度选择解决方案。


http://www.kler.cn/a/598659.html

相关文章:

  • 从零构建大语言模型全栈开发指南:第一部分:数学与理论基础-1.2.3层归一化(LayerNorm)与残差连接的原理与代码实现
  • 用selenium+ChromeDriver豆瓣电影 肖申克的救赎 短评爬取(pycharm 爬虫)
  • 通过Typora + PicGo + 阿里云对象存储(OSS)实现图床
  • JAVA中数组(Array)‌ 和 ‌链表(LinkedList)‌ 是两种基础的数据结构
  • 详解如何通过Python的BeautifulSoup爬虫+NLP标签提取+Dijkstra规划路径和KMeans聚类分析帮助用户规划旅行路线
  • 进程状态与PV操作
  • Java安全-类的动态加载
  • 本地部署Dify 添加Ollama模型DeepSeek
  • matlab的meshgrid
  • Mysql架构理论部分
  • QT二 QT使用generate form 生成常用UI,各种UI控件
  • 关于Docker是否被淘汰虚拟机实现连接虚拟专用网络Ubuntu 22.04 LTS部署Harbor仓库全流程
  • STM32滴答定时器(SysTick)原理及延时函数实现
  • redisson 使用与分析
  • 【微前端】使用微前端解决碎片化的用户界面问题实践
  • Android开发layer-list
  • Blender导出fbx到Unity找不到贴图的问题
  • Linux NFS、自动挂载与系统启动管理指南
  • 【深度学习】【目标检测】【Ultralytics-YOLO系列】Windows11下YOLOV3人脸检测
  • spring-security原理与应用系列:建造者