当前位置：首页 > news >正文

雪花算法(SnowFlake)

news 2026/2/8 12:27:05

简介

现在的服务基本是分布式、微服务形式的，而且大数据量也导致分库分表的产生，对于水平分表就需要保证表中 id 的全局唯一性。

对于 MySQL 而言，一个表中的主键 id 一般使用自增的方式，但是如果进行水平分表之后，多个表中会生成重复的 id 值。那么如何保证水平分表后的多张表中的 id 是全局唯一性的呢？

如果还是借助数据库主键自增的形式，那么可以让不同表初始化一个不同的初始值，然后按指定的步长进行自增。例如有3张拆分表，初始主键值为1，2，3，自增步长为3。

当然也有人使用 UUID 来作为主键，但是 UUID 生成的是一个无序的字符串，对于 MySQL 推荐使用增长的数值类型值作为主键来说不适合。

也可以使用 Redis 的自增原子性来生成唯一 id，但是这种方式业内比较少用。

当然还有其他解决方案，不同互联网公司也有自己内部的实现方案。雪花算法是其中一个用于解决分布式 id 的高效方案，也是许多互联网公司在推荐使用的。

SnowFlake 雪花算法

SnowFlake 中文意思为雪花，故称为雪花算法。最早是 Twitter 公司在其内部用于分布式环境下生成唯一 ID。在2014年开源 scala 语言版本。

雪花算法的原理就是生成一个的 64 位比特位的 long 类型的唯一 id。

最高 1 位固定值 0，因为生成的 id 是正整数，如果是 1 就是负数了。

接下来 41 位存储毫秒级时间戳，2^41/(1000*60*60*24*365)=69，大概可以使用 69 年。

再接下 10 位存储机器码，包括 5 位 datacenterId 和 5 位 workerId。最多可以部署 2^10=1024 台机器。

最后 12 位存储序列号。同一毫秒时间戳时，通过这个递增的序列号来区分。即对于同一台机器而言，同一毫秒时间戳下，可以生成 2^12=4096 个不重复 id。

可以将雪花算法作为一个单独的服务进行部署，然后需要全局唯一 id 的系统，请求雪花算法服务获取 id 即可。

对于每一个雪花算法服务，需要先指定 10 位的机器码，这个根据自身业务进行设定即可。例如机房号+机器号，机器号+服务号，或者是其他可区别标识的 10 位比特位的整数值都行。

算法实现

package com.ruoyi.common.utils;import java.util.Date;/*** @ClassName: SnowFlakeUtil* 雪花算法*/
public class SnowFlakeUtil {private static SnowFlakeUtil snowFlakeUtil;static {snowFlakeUtil = new SnowFlakeUtil();}// 初始时间戳(纪年)，可用雪花算法服务上线时间戳的值// 1650789964886：2022-04-24 16:45:59private static final long INIT_EPOCH = 1650789964886L;// 时间位取&private static final long TIME_BIT = 0b1111111111111111111111111111111111111111110000000000000000000000L;// 记录最后使用的毫秒时间戳，主要用于判断是否同一毫秒，以及用于服务器时钟回拨判断private long lastTimeMillis = -1L;// dataCenterId占用的位数private static final long DATA_CENTER_ID_BITS = 5L;// dataCenterId占用5个比特位，最大值31// 0000000000000000000000000000000000000000000000000000000000011111private static final long MAX_DATA_CENTER_ID = ~(-1L << DATA_CENTER_ID_BITS);// dataCenterIdprivate long dataCenterId;// workId占用的位数private static final long WORKER_ID_BITS = 5L;// workId占用5个比特位，最大值31// 0000000000000000000000000000000000000000000000000000000000011111private static final long MAX_WORKER_ID = ~(-1L << WORKER_ID_BITS);// workIdprivate long workerId;// 最后12位，代表每毫秒内可产生最大序列号，即 2^12 - 1 = 4095private static final long SEQUENCE_BITS = 12L;// 掩码（最低12位为1，高位都为0），主要用于与自增后的序列号进行位与，如果值为0，则代表自增后的序列号超过了4095// 0000000000000000000000000000000000000000000000000000111111111111private static final long SEQUENCE_MASK = ~(-1L << SEQUENCE_BITS);// 同一毫秒内的最新序号，最大值可为 2^12 - 1 = 4095private long sequence;// workId位需要左移的位数 12private static final long WORK_ID_SHIFT = SEQUENCE_BITS;// dataCenterId位需要左移的位数 12+5private static final long DATA_CENTER_ID_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS;// 时间戳需要左移的位数 12+5+5private static final long TIMESTAMP_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS + DATA_CENTER_ID_BITS;/*** 无参构造*/public SnowFlakeUtil() {//实际分布式系统中，一种参考方案是dataCenterId为mac地址，workerId为pid相关this(1, 1);}/*** 有参构造* @param dataCenterId* @param workerId*/public SnowFlakeUtil(long dataCenterId, long workerId) {// 检查dataCenterId的合法值if (dataCenterId < 0 || dataCenterId > MAX_DATA_CENTER_ID) {throw new IllegalArgumentException(String.format("dataCenterId 值必须大于 0 并且小于 %d", MAX_DATA_CENTER_ID));}// 检查workId的合法值if (workerId < 0 || workerId > MAX_WORKER_ID) {throw new IllegalArgumentException(String.format("workId 值必须大于 0 并且小于 %d", MAX_WORKER_ID));}this.workerId = workerId;this.dataCenterId = dataCenterId;}/*** 获取唯一ID* @return*/public static Long getSnowFlakeId() {return snowFlakeUtil.nextId();}/*** 通过雪花算法生成下一个id，注意这里使用synchronized同步* @return 唯一id*/public synchronized long nextId() {long currentTimeMillis = System.currentTimeMillis();System.out.println(currentTimeMillis);// 当前时间小于上一次生成id使用的时间，可能出现服务器时钟回拨问题if (currentTimeMillis < lastTimeMillis) {throw new RuntimeException(String.format("可能出现服务器时钟回拨问题，请检查服务器时间。当前服务器时间戳：%d，上一次使用时间戳：%d", currentTimeMillis,lastTimeMillis));}if (currentTimeMillis == lastTimeMillis) {// 还是在同一毫秒内，则将序列号递增1，序列号最大值为4095// 序列号的最大值是4095，使用掩码（最低12位为1，高位都为0）进行位与运行后如果值为0，则自增后的序列号超过了4095// 那么就使用新的时间戳sequence = (sequence + 1) & SEQUENCE_MASK;if (sequence == 0) {currentTimeMillis = getNextMillis(lastTimeMillis);}} else { // 不在同一毫秒内，则序列号重新从0开始，序列号最大值为4095sequence = 0;}// 记录最后一次使用的毫秒时间戳lastTimeMillis = currentTimeMillis;// 核心算法，将不同部分的数值移动到指定的位置，然后进行或运行// <<：左移运算符, 1 << 2 即将二进制的 1 扩大 2^2 倍// |：位或运算符, 是把某两个数中, 只要其中一个的某一位为1, 则结果的该位就为1// 优先级：<< > |return// 时间戳部分((currentTimeMillis - INIT_EPOCH) << TIMESTAMP_SHIFT)// 数据中心部分| (dataCenterId << DATA_CENTER_ID_SHIFT)// 机器表示部分| (workerId << WORK_ID_SHIFT)// 序列号部分| sequence;}/*** 获取指定时间戳的接下来的时间戳，也可以说是下一毫秒* @param lastTimeMillis 指定毫秒时间戳* @return 时间戳*/private long getNextMillis(long lastTimeMillis) {long currentTimeMillis = System.currentTimeMillis();while (currentTimeMillis <= lastTimeMillis) {currentTimeMillis = System.currentTimeMillis();}return currentTimeMillis;}/*** 获取随机字符串,length=13* @return*/public static String getRandomStr() {return Long.toString(getSnowFlakeId(), Character.MAX_RADIX);}/*** 从ID中获取时间* @param id 由此类生成的ID* @return*/public static Date getTimeBySnowFlakeId(long id) {return new Date(((TIME_BIT & id) >> 22) + INIT_EPOCH);}public static void main(String[] args) {SnowFlakeUtil snowFlakeUtil = new SnowFlakeUtil();long id = snowFlakeUtil.nextId();System.out.println("id:" + id);Date date = SnowFlakeUtil.getTimeBySnowFlakeId(id);System.out.println(date);long time = date.getTime();System.out.println("time:" + time);System.out.println(getRandomStr());}}

算法优缺点

雪花算法有以下几个优点：

高并发分布式环境下生成不重复 id，每秒可生成百万个不重复 id。

基于时间戳，以及同一时间戳下序列号自增，基本保证 id 有序递增。

不依赖第三方库或者中间件。

算法简单，在内存中进行，效率高。

雪花算法有如下缺点：

依赖服务器时间，服务器时钟回拨时可能会生成重复 id。算法中可通过记录最后一个生成 id 时的时间戳来解决，每次生成 id 之前比较当前服务器时钟是否被回拨，避免生成重复 id。

注意事项

其实雪花算法每一部分占用的比特位数量并不是固定死的。例如你的业务可能达不到 69 年之久，那么可用减少时间戳占用的位数，雪花算法服务需要部署的节点超过1024 台，那么可将减少的位数补充给机器码用。

注意，雪花算法中 41 位比特位不是直接用来存储当前服务器毫秒时间戳的，而是需要当前服务器时间戳减去某一个初始时间戳值，一般可以使用服务上线时间作为初始时间戳值。

对于机器码，可根据自身情况做调整，例如机房号，服务器号，业务号，机器 IP 等都是可使用的。对于部署的不同雪花算法服务中，最后计算出来的机器码能区分开来即可。

雪花算法(SnowFlake)

简介现在的服务基本是分布式、微服务形式的，而且大数据量也导致分库分表的产生，对于水平分表就需要保证表中 id 的全局唯一性。对于 MySQL 而言，一个表中的主键 id 一般使用自增的方式，但是如果进行水平分表之后，多个表…...

编程日记 2023/3/13 0:10:50

Linux防火墙

一、Linux防火墙Linux的防火墙体系主要在网络层，针对TCP/IP数据包实施过滤和限制，属于典型的包过滤防火墙（或称为网络层防火墙）。Linux系统的防火墙体系基于内核编码实现，具有非常稳定的性能和极高的效率，因…...

编程日记 2023/3/13 0:05:37

网络安全系列-四十七: IP协议号大全

IP协议号列表这是用在IPv4头部和IPv6头部的下一首部域的IP协议号列表。十进制十六进制关键字协议引用00x00HOPOPTIPv6逐跳选项RFC 246010x01ICMP互联网控制消息协议（ICMP）RFC 79220x02IGMP...

编程日记 2023/3/13 0:00:19

HTTP协议格式以及Fiddler用法

目录今日良言:焦虑和恐惧改变不了明天,唯一能做的就是把握今天一、HTTP协议的基本格式二、Fiddler的用法 1.Fidder的下载 2.Fidder的使用今日良言:焦虑和恐惧改变不了明天,唯一能做的就是把握今天一、HTTP协议的基本格式先来介绍一下http协议: http 协议(全称为 &q…...

编程日记 2023/3/12 23:49:32

自动写代码？别闹了！

大家好，我是良许。这几天，GitHub 上有个很火的插件在抖音刷屏了——Copilot。这个神器有啥用呢？简单来讲，它就是一款由人工智能打造的编程辅助工具。我们来看看它有啥用。首先就是代码补全功能，你只要给出函数…...

编程日记 2023/3/12 23:44:30

项目心得--网约车

一、RESTFULPost：新增Put：全量修改Patch：修改某个值Delete: 删除Get：查询删除接口也可以用POST请求url注意：url中不要带有敏感词（用户id等）url中的名词用复数形式url设计：api.xxx.co…...

编程日记 2023/3/12 23:39:28

【二叉树广度优先遍历和深度优先遍历】

文章目录一、二叉树的深度优先遍历0.建立一棵树1. 前序遍历2.中序遍历3. 后序遍历二、二叉树的广度优先遍历层序遍历三、有关二叉树练习一、二叉树的深度优先遍历学习二叉树结构，最简单的方式就是遍历。所谓二叉树遍历(Traversal)是按照某种特定的规则&#xff…...

编程日记 2023/3/12 23:34:26

Spring Cloud微服务架构必备技术

单体架构单体架构，也叫单体应用架构，是一个传统的软件架构模式。单体架构是指将应用程序的所有组件部署到一个单一的应用程序中，并统一进行部署、维护和扩展。在单体架构中，应用程序的所有功能都在同一个进程中运行，…...

编程日记 2023/3/12 23:29:22

TCP三次握手与四次挥手(一次明白)

TCP基本信息默认端口号:80 LINUX中TIME_WAIT的默认时间是30s TCP三次握手三次握手过程:每行代表发起握手到另一方刚刚收到数据包时的状态客户端服务端客户端状态服务端状态握手前CLOSELISTEN客户端发送带有SYN标志的数据包到服务端一次握手SYN_SENDLISTEN二次握手服务端发送…...

编程日记 2023/3/12 23:24:19

pyside6@Mouse events实例@QApplication重叠导致的报错@keyboardInterrupt

文章目录报错内容鼠标事件演示报错内容在pyside图形界面应用程序开发过程中,通常只允许运行一个实例假设您重复执行程序A,那么可能会导致一些意向不到的错误并且,从python反馈的信息不容易判断错误的真正来源鼠标事件演示下面是一段演示pyside6的鼠标事件mouseEvent对象…...

编程日记 2023/3/12 23:19:17

订单30分钟未支付自动取消怎么实现？

目录了解需求方案 1：数据库轮询方案 2：JDK 的延迟队列方案 3：时间轮算法方案 4：redis 缓存方案 5：使用消息队列了解需求在开发中，往往会遇到一些关于延时任务的需求。例如生成订单 30 分钟未支付&#xff0…...

编程日记 2023/3/12 23:14:13

＜开源项目框架：推荐几个开箱即用的开源管理系统 - 让开发不再复杂＞

文章目录👉 SCUI Admin 中后台前端解决方案👉 Vue .NetCore 前后端分离的快速发开框架👉 next-admin 适配移动端、pc的后台模板👉 django-vue-admin-pro 快速开发平台👉 Admin.NET 通用管理平台👉 RuoYi 若…...

编程日记 2023/3/12 23:09:12

内网渗透-基础环境

解决依赖，scope安装打开要给cmd powershell 打开远程 Set-ExecutionPolicy RemoteSigned -scope CurrentUser; 我试了好多装这东西还是得科学上网，不然不好用 iwr -useb get.scoop.sh | iex 查看下载过的软件安装sudo 安装git 这里一定要配置bu…...

编程日记 2023/3/12 23:04:10

Go语言学习的第一天（对于Go学习的认识和工具选择及环境搭建）

首先学习一门新的语言，我们要知道这门语言可以帮助我们做些什么？为什么我们要学习这门语言？就小wei而言学习这门语言是为了区块链，因为自身是php出身，因为php的一些特性只能通过一些算法模拟的做一个虚拟链&#xff0c…...

编程日记 2023/3/12 22:59:07

C和C++到底有什么关系

C++ 读作”C加加“，是”C Plus Plus“的简称。顾名思义，C++是在C的基础上增加新特性，玩出了新花样，所以叫”C Plus Plus“，就像 iPhone 6S 和 iPhone 6、Win10 和 Win7 的关系。 C语言是1972年由美国贝尔实验室研制成功的，在当时算是高级语言，它的很多新特性都让汇编程序…...

编程日记 2023/3/12 22:54:05

14个Python处理Excel的常用操作，非常好用

自从学了Python后就逼迫用Python来处理Excel，所有操作用Python实现。目的是巩固Python，与增强数据处理能力。这也是我写这篇文章的初衷。废话不说了，直接进入正题。数据是网上找到的销售数据，长这样： 一、关联公式:…...

编程日记 2023/3/12 22:49:03

async/await 用法

1. 什么是 async/await async/await 是 ES8（ECMAScript 2017）引入的新语法，用来简化 Promise 异步操作。在 async/await 出现之前，开发者只能通过链式 .then() 的方式处理 Promise 异步操作。示例代码如下： import …...

编程日记 2023/3/12 22:44:02

好意外，发现永久免费使用的云服务器

原因就不说了，说一下过程，在百度搜pythonIDE的时候，发现了一个网站 https://lightly.teamcode.com/https://lightly.teamcode.com/ 就是这个网站，看见这个免费试用，一开始觉得没什么，在尝试使用的过程中发…...

编程日记 2023/3/12 22:39:01

VSCode使用技巧，代码编写效率提升2倍以上！

VSCode是一款开源免费的跨平台文本编辑器，它的可扩展性和丰富的功能使得它成为了许多程序员的首选编辑器。在本文中，我将分享一些VSCode的使用技巧，帮助您更高效地使用它。 1. 插件 VSCode具有非常丰富的插件生态系统，通过安装插…...

编程日记 2023/3/12 22:33:59

SQL执行过程详解

1 、用户在客户端执行 SQL 语句时，客户端把这条 SQL 语句发送给服务端，服务端的进程，会处理这条客户端的SQL语句。 2 、服务端进程收集到SQL信息后，会在进程全局区PGA 中分配所需内存，存储相关的登录信息等。 3 、客…...

编程日记 2023/3/12 22:28:57

挑战杯推荐项目

“人工智能”创意赛 - 智能艺术创作助手：借助大模型技术，开发能根据用户输入的主题、风格等要求，生成绘画、音乐、文学作品等多种形式艺术创作灵感或初稿的应用，帮助艺术家和创意爱好者激发创意、提高创作效率。 - 个性化梦境…...

编程新知 2025/11/6 5:46:16

SkyWalking 10.2.0 SWCK 配置过程

SkyWalking 10.2.0 & SWCK 配置过程 skywalking oap-server & ui 使用Docker安装在K8S集群以外，K8S集群中的微服务使用initContainer按命名空间将skywalking-java-agent注入到业务容器中。 SWCK有整套的解决方案，全安装在K8S群集中。具体可参…...

编程新知 2025/8/23 5:51:08

React Native 开发环境搭建（全平台详解）

React Native 开发环境搭建（全平台详解） 在开始使用 React Native 开发移动应用之前，正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南，涵盖 macOS 和 Windows 平台的配置步骤，如何在 Android 和 iOS…...

编程新知 2025/10/7 2:47:54

基于Flask实现的医疗保险欺诈识别监测模型

基于Flask实现的医疗保险欺诈识别监测模型项目截图项目简介社会医疗保险是国家通过立法形式强制实施，由雇主和个人按一定比例缴纳保险费，建立社会医疗保险基金，支付雇员医疗费用的一种医疗保险制度， 它是促进社会文明和进步的…...

编程新知 2026/1/24 14:59:08

浅谈不同二分算法的查找情况

二分算法原理比较简单，但是实际的算法模板却有很多，这一切都源于二分查找问题中的复杂情况和二分算法的边界处理，以下是博主对一些二分算法查找的情况分析。需要说明的是，以下二分算法都是基于有序序列为升序有序的情况&#xf…...

编程新知 2025/9/14 7:37:32

python报错No module named ‘tensorflow.keras‘

是由于不同版本的tensorflow下的keras所在的路径不同，结合所安装的tensorflow的目录结构修改from语句即可。原语句： from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense 修改后： from tensorflow.python.keras.lay…...

编程新知 2025/9/24 7:39:50

IP如何挑？2025年海外专线IP如何购买？

你花了时间和预算买了IP，结果IP质量不佳，项目效率低下不说，还可能带来莫名的网络问题，是不是太闹心了？尤其是在面对海外专线IP时，到底怎么才能买到适合自己的呢？所以，挑IP绝对是个技…...

编程新知 2026/1/28 3:04:35

文章目录 1. 基础HTML辅助方法1.1 Html.ActionLink()1.2 Html.RouteLink()1.3 Html.Display() / Html.DisplayFor()1.4 Html.Editor() / Html.EditorFor()1.5 Html.Label() / Html.LabelFor()1.6 Html.TextBox() / Html.TextBoxFor() 2. 表单相关辅助方法2.1 Html.BeginForm() …...

编程新知 2026/1/28 4:50:33

uniapp 集成腾讯云 IM 富媒体消息（地理位置/文件）

UniApp 集成腾讯云 IM 富媒体消息全攻略（地理位置/文件） 一、功能实现原理腾讯云 IM 通过消息扩展机制支持富媒体类型，核心实现方式： 标准消息类型：直接使用 SDK 内置类型（文件、图片等）自…...

编程新知 2025/10/25 5:53:05

解析两阶段提交与三阶段提交的核心差异及MySQL实现方案

引言在分布式系统的事务处理中，如何保障跨节点数据操作的一致性始终是核心挑战。经典的两阶段提交协议（2PC）通过准备阶段与提交阶段的协调机制，以同步决策模式确保事务原子性。其改进版本三阶段提交协议（3PC&#xf…...

编程新知 2026/2/7 9:17:02

雪花算法(SnowFlake)

相关文章：

雪花算法(SnowFlake)

Linux防火墙

网络安全系列-四十七: IP协议号大全

HTTP协议格式以及Fiddler用法

自动写代码？别闹了！

项目心得--网约车

【二叉树广度优先遍历和深度优先遍历】

Spring Cloud微服务架构必备技术

TCP三次握手与四次挥手(一次明白)

pyside6@Mouse events实例@QApplication重叠导致的报错@keyboardInterrupt

订单30分钟未支付自动取消怎么实现？

＜开源项目框架：推荐几个开箱即用的开源管理系统 - 让开发不再复杂＞

内网渗透-基础环境

Go语言学习的第一天（对于Go学习的认识和工具选择及环境搭建）

C和C++到底有什么关系

14个Python处理Excel的常用操作，非常好用

async/await 用法

好意外，发现永久免费使用的云服务器

VSCode使用技巧，代码编写效率提升2倍以上！

SQL执行过程详解

挑战杯推荐项目

SkyWalking 10.2.0 SWCK 配置过程

React Native 开发环境搭建（全平台详解）

基于Flask实现的医疗保险欺诈识别监测模型

浅谈不同二分算法的查找情况

python报错No module named ‘tensorflow.keras‘

IP如何挑？2025年海外专线IP如何购买？

Razor编程中@Html的方法使用大全

uniapp 集成腾讯云 IM 富媒体消息（地理位置/文件）

解析两阶段提交与三阶段提交的核心差异及MySQL实现方案