摘要:使用生成很多都是在分布式场景下使用,我看了下网上有其中有几篇实现的都没有考虑到线程安全。现在有了的锁和协程的加持,对于我们开发线程安全和高并发模拟还是很方便的,这里用结合来学习下实现最简单的好久没写,感觉没有真写不了了。
Twitter 的 snowflake 在分布式生成唯一 UUID 应用还是蛮广泛的,基于 snowflake 的一些变种的算法网上也有不少。使用 snowflake 生成 UUID 很多都是在分布式场景下使用,我看了下网上有其中有几篇 PHP 实现的都没有考虑到线程安全。现在 PHP 有了 Swoole 的锁和协程的加持,对于我们开发线程安全和高并发模拟还是很方便的,这里用 PHP 结合 Swoole 来学习下实现最简单的 snowflake(好久没写 PHP,感觉没有 IDE 真写不了 PHP 了)。
先来看以下 snowflake 的结构:
生成的数值是 64 位,分成 4 个部分:
第一个 bit 为符号位,最高位为 0 表示正数
第二部分 41 个 bit 用于记录生成 ID 时候的时间戳,单位为毫秒,所以该部分表示的数值范围为 2^41 - 1(69 年),它是相对于某一时间的偏移量
第三部分的 10 个 bit 表示工作节点的 ID,表示数值范围为 2^10 - 1,相当于支持 1024 个节点
第四部分 12 个 bit 表示每个工作节点没毫秒生成的循环自增 id,最多可以生成 2^12 -1 个 id,超出归零等待下一毫秒重新自增
先贴下代码:
self::WORKER_MAX) { trigger_error("Worker ID 超出范围"); exit(0); } $this->timestamp = 0; $this->workerId = $workerId; $this->sequence = 0; $this->lock = new swoole_lock(SWOOLE_MUTEX); } /** * 生成ID * @return int */ public function getId() { $this->lock->lock(); // 这里一定要记得加锁 $now = $this->now(); if ($this->timestamp == $now) { $this->sequence++; if ($this->sequence > self::SEQUENCE_MAX) { // 当前毫秒内生成的序号已经超出最大范围,等待下一毫秒重新生成 while ($now <= $this->timestamp) { $now = $this->now(); } } } else { $this->sequence = 0; } $this->timestamp = $now; // 更新ID生时间戳 $id = (($now - self::EPOCH) << self::TIME_SHIFT) | ($this->workerId << self::WORKER_SHIFT) | $this->sequence; $this->lock->unlock(); //解锁 return $id; } /** * 获取当前毫秒 * @return string */ public function now() { return sprintf("%.0f", microtime(true) * 1000); } }
其实逻辑并不复杂,解释一下代码中的位运算:
-1 ^ (-1 << self::SEQUENCE_BITS) 就是-1的二进制表示为1的补码,其实等同于 : 2**self::SEQUENCE_BITS - 1
最后部分左移后或运算:
(($now - self::EPOCH) << self::TIME_SHIFT) | ($this->workerId << self::WORKER_SHIFT) | $this->sequence;
这里主要是对除了第一位符号位以外的三个部分进行左移相应的偏移量使其归位,并通过或运算重新整合成上面 snowflake 的结构,比如我们用 3 部分 4 位来演示一下该归并操作:
0000 0000 0010 --左移0位--> 0000 0000 0010 0000 0000 0100 --左移4位--> 0000 0100 0000 --或操作-->1000 0100 0010 0000 0000 1000 --左移8位--> 1000 0000 0000
下面借助 Swoole 的协程和 channel 来暴力测试一下,看看生成的 ID 是否会出现重复的状况:
$snowflake = new Snowflake(1); $chan = new chan(100000); $n = 100000; for ($i = 0; $i < $n; $i++) { go(function () use ($snowflake, $chan) { $id = $snowflake->getId(); $chan->push($id); }); } go(function () use ($chan, $n) { $arr = []; for ($i = 0; $i < $n; $i++) { $id = $chan->pop(); if (in_array($id, $arr)) { exit("ID 已存在"); } array_push($arr, $id); } }); $chan->close(); echo "ok";
跑了一下,确实不会出现重复的 ID,对了,我用 Golang 同样实现了 snowflake 并协程序方式跑了同样的测试,PHP 的执行时间是大约 12 秒左右,Golang 只需要 1 秒。文章有什么错误还请指正,谢谢。
转载请注明: 转载自Ryan 是菜鸟 | LNMP 技术栈笔记
如果觉得本篇文章对您十分有益,何不 打赏一下
本文链接地址: PHP 实现 Snowflake 生成分布式唯一 ID
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/29702.html
摘要:所以就诞生了这个项目,以下为线程安全版本和非线程安全版本差别。非线程安全版本线程安全版本安装示例注意区间在超出范围将会报告一个致命错误协议版权归属于请遵守协议 php_snowflake 项目地址 什么是 php_snowflake? 推特分布式id生成算法SnowFlake PHP 的实现 需求 PHP >= 5.6 (5.5以下的自行测试) 不支持windows 说明 纯PH...
摘要:原文地址唯一的生成并不是一件小事想说爱它也并不是像简单来一个这样一件容易的事为什么要唯一数据库的自增在分库的时候会是一场灾难假设分两个库因为每个库都会开始从开始自增届时系统中将会出现两个为的用户自增会暴露用户量或者其他业务量自增会让有心者 [原文地址:https://blog.ti-node.com/blog...] 唯一ID的生成并不是一件小事 , 想说爱它 , 也并不是像简单来一个...
摘要:出于以上两个原因,我们需要自己的发号器来产生。与此同时,为了保证执行,具有原子性,我们使用来进行实现。由于能力和水平有限,难免会有纰漏,希望及时指出。参考文章分布式生成器实现上实现原理 1、为什么要实现发号器 很多地方我们都需要一个全局唯一的编号,也就是uuid。举一个常见的场景,电商系统产生订单的时候,需要有一个对应的订单编号。在composer上我们也可以看到有很多可以产生uuid...
阅读 1127·2021-10-15 09:39
阅读 3005·2021-09-10 10:50
阅读 3418·2019-08-30 15:53
阅读 1849·2019-08-30 15:52
阅读 2506·2019-08-29 15:31
阅读 1944·2019-08-26 13:43
阅读 2562·2019-08-26 13:37
阅读 1411·2019-08-23 18:31