摘要:数据库自增机制原理介绍在分布式里面,数据库的自增机制的主要原理是数据库自增和数据库的函数实现的。
数据库自增ID机制原理介绍
在分布式里面,数据库的自增ID机制的主要原理是:数据库自增ID和mysql数据库的replace_into()函数实现的。这里的replace数据库自增ID和mysql数据库的replace_into()函数实现的。这里的replace into跟insert功能类似,不同点在于:replace into首先尝试插入数据列表中,如果发现表中已经有此行数据(根据主键或唯一索引判断)则先删除,再插入。否则直接插入新数据。
单机mysql数据库的自增id实现如下所示 :首先表结构如下所示
create table t_test( id bigint(20) unsigned not null auto_increment PRIMARY KEY, stub char(1) not null default "", unique key stub (stub) )
然后我们插入的sql语句和查询的语句如下所示
replace into t_test (stub) values("b"); select last_insert_id();
此时可以看到看到我们刚刚插入的id值是1
以上就是单机版mysql的自增id的实现过程,但是这里讲的是分布式id,所以我们要分析一下数据库的自增ID机制在分布式里面是怎么实现的。
既然是分布式id,那么最少要使用两个数据库,这里我们使用3台来讲解,为了保证每一台数据库里面的id自增的时候不会重复,那么我们就要给每一台数据库设置auto-increment-increment和auto-increment-offset这两个属性值(auto-increment-increment表示每一台数据库的起始id值,然后auto-increment-offset表示每一台数据库每一次的增加数字),设置值如下所示
Server1: auto-increment-increment = 1 auto-increment-offset = 3 Server2: auto-increment-increment = 2 auto-increment-offset = 3 Server2: auto-increment-increment = 3 auto-increment-offset = 3
那么如果我们有n台数据库的话,那么上面的auto-increment-increment和auto-increment-offset这两个属性值应该怎么设计呢,我们给每一台数据库设置初始值分别为1,2,3...N,然后每一台数据库自增步长为机器的台数N,如下图所示
那数据库自增ID机制适合作分布式ID吗?答案是不太适合,为什么呢,我总结了下面两个原因:
1:系统水平扩展比较困难,比如定义好了步长和机器台数之后,如果要添加机器该怎么做?假设现在只有一台机器发号是1,2,3,4,5(步长是1),这个时候需要扩容机器一台。可以这样做:把第二台机器的初始值设置得比第一台超过很多,比如14(注意这里设置14的前提是:在扩容期间第一台机器的ID不可能增加到14),同时设置步长为2,那么这台机器下发的号码都是14以后的偶数。然后把第一台机器的ID值保留为奇数,比如7,然后修改第一台的步长为2。让它符合我们定义的号段标准。扩容方案看起来复杂吗?貌似还好,现在想象一下如果我们线上有100台机器,这个时候要扩容该怎么做?简直是噩梦。所以系统水平扩展方案复杂难以实现。
2:数据库压力还是很大,每次获取ID都得读写一次数据库,非常影响性能,不符合分布式ID里面的延迟低和要高QPS的规则(在高并发下,如果都去数据库里面获取id,那是非常影响性能的)
原文链接
其他分布式ID系列快捷键:
分布式ID系列(1)——为什么需要分布式ID以及分布式ID的业务需求
分布式ID系列(2)——UUID适合做分布式ID吗
分布式ID系列(3)——数据库自增ID机制适合做分布式ID吗
分布式ID系列(4)——Redis集群实现的分布式ID适合做分布式ID吗
分布式ID系列(5)——Twitter的雪法算法Snowflake适合做分布式ID吗
大佬网址
https://www.itqiankun.com/art...
https://blog.csdn.net/hengyun...
https://tech.meituan.com/2017...
https://segmentfault.com/a/11...
https://www.jianshu.com/p/9d7...
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/76149.html
摘要:同时除了对号码自身的要求,业务还对号生成系统的可用性要求极高,想象一下,如果生成系统瘫痪,整个美团点评支付优惠券发券骑手派单等关键动作都无法执行,这就会带来一场灾难。 分布式id主要用到哪些地方 在复杂分布式系统中,往往需要对大量的数据和消息进行唯一标识。如在美团点评的金融、支付、餐饮、酒店、猫眼电影等产品的系统中,数据日渐增长,对数据分库分表后需要有一个唯一ID来标识一条数据或消息,...
摘要:用户指定一个名字空间和一个字符串,通过散列,生成。字符串本身需要是唯一的。。虽然是基于随机数,但是重复的可能性可以忽略不计,因此该版本也是被经常使用的版本。。当前正在使用的。。 UUID的生成策略: UUID的方式能生成一串唯一随机32位长度数据,它是无序的一串数据,按照开放软件基金会(OSF)制定的标准计算,UUID的生成用到了以太网卡地址、纳秒级时间、芯片ID码和许多可能的数字。U...
摘要:原文链接其他分布式系列快捷键分布式系列为什么需要分布式以及分布式的业务需求分布式系列适合做分布式吗分布式系列数据库自增机制适合做分布式吗分布式系列集群实现的分布式适合做分布式吗分布式系列的雪法算法适合做分布式吗大佬网址 今天我们来讲一下Redis集群实现的分布式ID的过程,总结一下Redis集群是否适合做分布式ID? 首先是项目地址: https://github.com/maqian...
摘要:结合对做如下调整的毫秒时间戳的数据逻辑分区以及的自增序列。为了解决这个问题,便引入了逻辑分区。参考文章批量插入返回自增的问题美团点评分布式生成系统 这里的博客版本都不会被更新维护。查看最新的版本请移步:http://neojos.com 全称Universally Unique Identifier,UUID占128bit,也就是16个英文字符的长度(16byte),需要强调的是,它...
阅读 3526·2021-11-22 11:59
阅读 943·2021-09-27 13:36
阅读 3602·2021-09-24 09:47
阅读 2250·2021-09-01 11:39
阅读 969·2021-08-31 09:37
阅读 2302·2021-08-05 10:01
阅读 1664·2019-08-30 15:55
阅读 691·2019-08-30 15:54