为什么用雪花ID替代自增ID？

数据库2025-11-05 12:59:3246

今天咱们来看一道数据库中比较经典的用雪面试问题：为什么要使用雪花 ID 替代数据库自增 ID？同时这道题也出现在了浩鲸科技的 Java 面试中，下面我们一起来看吧。代自

1.什么是用雪雪花 ID？

雪花 ID（Snowflake ID）是一个用于分布式系统中生成唯一 ID 的算法，由 Twitter 公司提出。代自它的用雪设计目标是在分布式环境下高效地生成全局唯一的 ID，具有一定的代自有序性。

雪花 ID 的用雪结构如下所示：

这四部分代表的含义

符号位：最高位是符号位，始终为 0，代自1 表示负数，用雪0 表示正数，代自ID 都是用雪正整数，所以固定为 0。代自时间戳部分：由 41 位组成，用雪精确到毫秒级。代自可以使用该 41 位表示的用雪时间戳来表示的时间可以使用 69 年。节点 ID 部分：由 10 位组成，用于表示机器节点的唯一标识符。在同一毫秒内，云服务器提供商不同的节点生成的 ID 会有所不同。序列号部分：由 12 位组成，用于标识同一毫秒内生成的不同 ID 序列。在同一毫秒内，可以生成 4096 个不同的 ID。

2.Java 版雪花算法实现

接下来，我们来实现一个 Java 版的雪花算法：

复制public class SnowflakeIdGenerator { // 定义雪花 ID 的各部分位数 private static final long TIMESTAMP_BITS = 41L; private static final long NODE_ID_BITS = 10L; private static final long SEQUENCE_BITS = 12L; // 定义起始时间戳（可根据实际情况调整） private static final long EPOCH = 1609459200000L; // 定义最大取值范围 private static final long MAX_NODE_ID = (1L << NODE_ID_BITS) - 1; private static final long MAX_SEQUENCE = (1L << SEQUENCE_BITS) - 1; // 定义偏移量 private static final long TIMESTAMP_SHIFT = NODE_ID_BITS + SEQUENCE_BITS; private static final long NODE_ID_SHIFT = SEQUENCE_BITS; private final long nodeId; private long lastTimestamp = -1L; private long sequence = 0L; public SnowflakeIdGenerator(long nodeId) { if (nodeId < 0 || nodeId > MAX_NODE_ID) { throw new IllegalArgumentException("Invalid node ID"); } this.nodeId = nodeId; } public synchronized long generateId() { long currentTimestamp = timestamp(); if (currentTimestamp < lastTimestamp) { throw new IllegalStateException("Clock moved backwards"); } if (currentTimestamp == lastTimestamp) { sequence = (sequence + 1) & MAX_SEQUENCE; if (sequence == 0) { currentTimestamp = untilNextMillis(lastTimestamp); } } else { sequence = 0L; } lastTimestamp = currentTimestamp; return ((currentTimestamp - EPOCH) << TIMESTAMP_SHIFT) | (nodeId << NODE_ID_SHIFT) | sequence; } private long timestamp() { return System.currentTimeMillis(); } private long untilNextMillis(long lastTimestamp) { long currentTimestamp = timestamp(); while (currentTimestamp <= lastTimestamp) { currentTimestamp = timestamp(); } return currentTimestamp; } }1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.31.32.33.34.35.36.37.38.39.40.41.42.43.44.45.46.47.48.49.50.51.52.53.54.55.56.57.58.59.60.

调用代码如下：

复制public class Main { public static void main(String[] args) { // 创建一个雪花 ID 生成器实例，传入节点 ID SnowflakeIdGenerator idGenerator = new SnowflakeIdGenerator(1); // 生成 ID long id = idGenerator.generateId(); System.out.println(id); } }1.2.3.4.5.6.7.8.9.

其中，nodeId 表示当前节点的唯一标识，可以根据实际情况进行设置。generateId 方法用于生成雪花 ID，采用同步方式确保线程安全。具体的生成逻辑遵循雪花 ID 的位运算规则，结合当前时间戳、节点 ID 和序列号生成唯一的 ID。

“

需要注意的是，示例中的时间戳获取方法使用了 System.currentTimeMillis()，根据实际需要可以替换为其他更精确的时间戳获取方式。同时，高防服务器需要确保节点 ID 的唯一性，避免不同节点生成的 ID 重复。

”

3.雪花算法问题

虽然雪花算法是一种被广泛采用的分布式唯一 ID 生成算法，但它也存在以下几个问题：

时间回拨问题：雪花算法生成的 ID 依赖于系统的时间戳，要求系统的时钟必须是单调递增的。如果系统的时钟发生回拨，可能导致生成的 ID 重复。时间回拨是指系统的时钟在某个时间点之后突然往回走（人为设置），即出现了时间上的逆流情况。时钟回拨带来的可用性和性能问题：由于时间依赖性，当系统时钟发生回拨时，雪花算法需要进行额外的处理，如等待系统时钟追上上一次生成 ID 的时间戳或抛出异常。这种处理会对算法的可用性和性能产生一定影响。节点 ID 依赖问题：雪花算法需要为每个节点分配唯一的b2b供应网节点 ID 来保证生成的 ID 的全局唯一性。节点 ID 的分配需要有一定的管理和调度，特别是在动态扩容或缩容时，节点 ID 的管理可能较为复杂。

4.如何解决时间回拨问题？

百度 UidGenerator 框架中解决了时间回拨的问题，并且解决方案比较经典，所以咱们这里就来给大家分享一下百度 UidGenerator 是怎么解决时间回拨问题的？

“

UidGenerator 介绍：UidGenerator 是百度开源的一个分布式唯一 ID 生成器，它是基于 Snowflake 算法的改进版本。与传统的 Snowflake 算法相比，UidGenerator 在高并发场景下具有更好的性能和可用性。它的实现源码在：https://github.com/baidu/uid-generator

”

UidGenerator 是这样解决时间回拨问题的：UidGenerator 的每个实例中，都维护一个本地时钟缓存，用于记录当前时间戳。这个本地时钟会定期与系统时钟进行同步，如果检测到系统时钟往前走了（出现了时钟回拨），则将本地时钟调整为系统时钟。

5.为什么要使用雪花 ID 替代数据库自增 ID？

数据库自增 ID 只适用于单机环境，但如果是分布式环境，是将数据库进行分库、分表或数据库分片等操作时，那么数据库自增 ID 就有问题了。

例如，数据库分片之后，会在同一张业务表的分片数据库中产生相同 ID（数据库自增 ID 是由每个数据库单独记录和增加的），这样就会导致，同一个业务表的竟然有相同的 ID，而且相同 ID 背后存储的数据又完全不同，这样业务查询的时候就出问题了。

所以为了解决这个问题，就必须使用分布式中能保证唯一性的雪花 ID 来替代数据库的自增 ID。

6.扩展：使用 UUID 替代雪花 ID 行不行？

如果单从唯一性来考虑的话，那么 UUID 和雪花 ID 的效果是一致的，二者都能保证分布式系统下的数据唯一性，但是即使这样，也不建议使用 UUID 替代雪花 ID，因为这样做的问题有以下两个：

可读性问题：UUID 内容很长，但没有业务含义，就是一堆看不懂的“字母”。性能问题：UUID 是字符串类型，而字符串类型在数据库的查询中效率很低。

所以，基于以上两个原因，不建议使用 UUID 来替代雪花 ID。

小结

数据库自增 ID 只适用于单机数据库环境，而对于分库、分表、数据分片来说，自增 ID 不具备唯一性，所以要要使用雪花 ID 来替代数据库自增 ID。但雪花算法依然存在一些问题，例如时间回拨问题、节点过度依赖问题等，所以此时，可以使用雪花算法的改进框架，如百度的 UidGenerator 来作为数据库的 ID 生成方案会比较好。

本文地址：http://www.bhae.cn/html/243a7799679.html

版权声明

本文仅代表作者观点，不代表本站立场。
本文系作者授权发表，未经许可，不得转载。

全站热门

揭秘卖假耳机的黑幕（假耳机泛滥，市场乱象丛生，消费者陷入困境）

域名到期后一般可以保留多久？新手要知道哪些？

新手域名安全该怎么维护呢？域名安全有哪些方面？

面试突击：了解 HTTP 协议吗？

假如你想要使用多个Linux发行版，你没有那么多的选择。你要么安装到你的物理机或虚拟机中，要么以live模式从ISO文件启动。第二个选择，对硬盘空间需求较小，只是有点麻烦，因为你需要将ISO文件写入到U盘或CD/DVD中来启动。不过，这里还有另外一个可选的折中方案：把ISO镜像放在硬盘中，然后以live模式来启动。该方案比完全安装更省空间，而且功能也完备，这对于缓慢的虚拟机而言是个不错的替代方案。下面我将介绍怎样使用流行的Grub启动加载器来实现该方案。很明显，你将需要使用到Grub，这是几乎所有现代Linux发行版都使用的。你也需要你所想用的Linux版本的ISO文件，将它下载到本地磁盘。最后，你需要知道启动分区在哪里，并怎样在Grub中描述。对于此，请使用以下命令：复制代码代码如下:# fdisk -l 带有‘*’的就是启动分区。对于我，就是/dev/sda1，用Grub语言描述就是（hd0,1)。作为参考，sda2就是(hd0,2)，sdb1就是(hd1,1)，以此类推。（你明白了吧。）我们需要编辑什么？首先，打开/etc/default/grub并检查以下行：复制代码代码如下:#GRUB_HIDDEN_TIMEOUT=0需要在此行前添加‘#’进行注释。保存，然后打开/etc/grub.d/40_custom。在该文件中，你将添加启动到ISO的参数。结构如下：复制代码代码如下: menuentry [Entrys title in the grub screen] { set isofile=[path to ISO file] loopback loop [boot partition in Grub language]$isofile [some specific] arguments }例如，假如你想要从ISO文件启动Ubuntu，那么你就是想要添加如下行到40_custom文件：复制代码代码如下:menuentry Ubuntu 14.04 (LTS) Live Desktop amd64 { set isofile=/boot/ubuntu-14.04-desktop-amd64.iso loopback loop (hd0,1)$isofile linux (loop)/casper/vmlinuz.efi boot=casper iso-scan/filename=${isofile} quiet splash initrd (loop)/casper/initrd.lz } 假如你想要启动Gparted：复制代码代码如下:menuentry GParted Live amd64 { set isofile=/boot/gparted-live-0.18.0-2-amd64.iso loopback loop (hd0,1)$isofile loopback loop $isofile linux (loop)/live/vmlinuz boot=live config union=aufs noswap noprompt ip=frommedia toram=filesystem.squashfs findiso=${isofile} initrd (loop)/live/initrd.img }或者甚至是Fedora：复制代码代码如下:menuentry Fedora 20 Live Desktop x86_64 { set isofile=/boot/Fedora-Live-Desktop-x86_64-20-1.iso loopback loop (hd0,1)$isofile loopback loop $isofile linux (loop)/isolinux/vmlinuz0 root=live:CDLABEL=Fedora-Live-Desktop-x86_64-20-1 rootfstype=auto ro rd.live.image quiet rhgb rd.luks=0 rd.md=0 rd.dm=0 iso-scan/filename=${isofile} initrd (loop)/isolinux/initrd0.img }注意，参数可根据发行版进行修改。幸运的是，有许多地方你可以查阅到。我喜欢这个发行版，但是还有很多其它的发行版你可以启动。同时，请注意你放置ISO文件的地方。假如你的家目录被加密或者无法被访问到，你可能更喜欢将这些文件放到像例子中的启动分区。但是，请首先确保启动分区有足够的空间。最后，不要忘了保存40_custom文件并使用以下命令来更新grub：复制代码代码如下: # sudo update-grub 以便在下次启动时看到修改。接下来做什么？想要更多东西？好吧，那就修改下参数来玩玩。你可以启动一个ISO文件，并让它持续做一些事情。例如，假如你是个彻头彻尾的妄想症患者，想要有个可以快速清除硬盘的选项，那么可以使用DBAN来进行一些设置。现在，真的要当心啊，因为此设置会清除你的硬盘，而且在启动时也没有恢复选项：复制代码代码如下: menuentry Dariks Boot and Nuke { set isofile=/boot/dban.iso loopback loop (hd0,1)$isofile linux (loop)/dban.bzi nuke=dwipe silent }另外一个选择复制代码代码如下:menuentry Dariks Boot and Nuke { set isofile=/boot/dban.iso loopback loop (hd0,1)$isofile linux (loop)/dban.bzi }可以显示DBAN选项，让你选择清除驱动器。当心，因为它仍然十分危险。小结一下，对于ISO文件和Grub有很多事情可做：从快速live会话到一键毁灭，都可以满足你。之后，你也可以试试启动一些针对隐私方面的发行版，如Tails。

如何使用Cypress执行视觉回归测试

各位程序猿/媛们，来用代码算一算在这个世界上活了多少天吧

七款优秀的Java测试框架

为什么用雪花ID替代自增ID？

1.什么是用雪雪花 ID？

2.Java 版雪花算法实现

3.雪花算法问题

4.如何解决时间回拨问题？

5.为什么要使用雪花 ID 替代数据库自增 ID？

6.扩展：使用 UUID 替代雪花 ID 行不行？

小结

本文地址：http://www.bhae.cn/html/243a7799679.html

版权声明

热门文章

热门标签

全站热门

热门文章

为什么用雪花ID替代自增ID？

1.什么是用雪雪花 ID？

2.Java 版雪花算法实现

3.雪花算法问题

4.如何解决时间回拨问题？

5.为什么要使用雪花 ID 替代数据库自增 ID？

6.扩展：使用 UUID 替代雪花 ID 行不行？

小结

本文地址：http://www.bhae.cn/html/243a7799679.html

版权声明

相关文章

热门文章

热门标签

全站热门

热门文章