你确定不来了解下 Redis 跳跃表的原理吗

BigTomato 发布于2019-08-16 18:29 / 2474人阅读

摘要：前言本章将介绍中和的基本使用和内部原理因为这两种数据结构有很多相似的地方所以把他们放到一章中介绍并且重点介绍内部一个很重要的数据结构跳跃表基本介绍先来看看中集合很像中键值对无序唯一不为空值重复无序是中最特别的基础数据结构其他几个都能和大致对

前言

本章将介绍 Redis中 set 和 zset的基本使用和内部原理.因为这两种数据结构有很多相似的地方所以把他们放到一章中介绍.并且重点介绍zset 内部一个很重要的数据结构:跳跃表.

基本介绍 set

先来看看 set

Redis 中 set 集合很像Java 中 HashSet,键值对无序、唯一、不为空.

> sadd books Java
(integer 1)
> sadd books Java
(integer 0)            # value 值重复
> sadd books Go
(integer 1)
> smembers books        # 无序
1) "Go"
2) "Java"

zset

zset 是 Redis 中最特别的基础数据结构,其他几个都能和 Java 大致对应上.它基本上还是一个 set 但是添加了一个 score 属性去保证有序性.其内部实现为跳跃表稍后将会着重介绍.

> zadd books 1 Java
(integer) 1
> zadd books 2 Go
(integer) 1
> zadd books 3 Python
(integer) 1
> zrange books 0 -1     #按 score 有序取出
1) "Java"
2) "Go"
3) "Python"

在 zset 中 score 的类型为 double 所以有时会出现小数点精度问题.

当 zset 中最后一个 value 被删除后,这个和 zset 就会被自动删除,内存被回收.

内部原理

Redis 的 zset 是个复合结构,是由一个 hash 和 skiplist 组成的,其中 hash 用来保存 value 和 score 对应关系.skiplist 用来给 score 排序.关于hash 的内部实现请参阅之前的一篇文章:《你确定不来了解一下Redis中 Hash的原理吗》,在这里我们着重介绍 skiplist 的实现.

skiplist 跳跃表

因为zset需要高效的插入和删除,所以底层不适合使用数组实现,需要使用链表的结构.当插入新元素时需要根据 score插入到链表合适的位置,保证链表的有序性.高效的办法是通过二分查找去找到插入点.

那么问题就来了,二分查找的对象必须是有序数组,只有数组支持快速定位,链表做不到该怎么办呢?这时,就该跳跃表出场了.

如图所示,跳跃表在链表的基础上加入了层级L0~L3的概念,Redis 的跳跃表共有 64 层,可容纳 $2^{64}$ 个元素.每个元素的层级是随机分配的,分配 L0 的概率是 100%,就是说每个元素至少会有一层.分配L1 的概率是 50%,分配 L2 的概率是 25%,往上以此类推.

每个 kv 对应的结构为zslnode.kv 之间使用指针形成有序的双向链表.同一层的 kv 会使用指针串起来.每层元素的遍历都是从跳跃表的头指针 kv header 出发.

header 的结构也是 zslnode,当中 value 为 null,score 为 Double.MIN_VALUE排在最前面.

struct zslnode{
    string value;
    double score;
    zslnode*[] forwards;    //多层连接的指针
    zslnode* backward;        //回溯指针
}

struct zsl{
    zslnode* header;            //跳跃表头指针
    int maxLevel;                //当前节点的最高层
    map ht;    //hash 中的键值对
}

查找

介绍完 skiplist的数据结构后,我们来具体看下skiplist 是怎样快速定位元素的.

在上图中,假设我们要查找 3 这个节点.skiplist 会从 header 的顶层出发遍历搜索找到第一个比目标元素小的开始降一层,直到降到最底层找到 3这个节点,搜索路径为:

L3:header -> 4 -> header

L2:header -> 2 -> 4 -> 2

L1: 2 -> 4 ->2

L0: 2 -> 3

说明:

L3 层header找到 4比 3大,回退到 header 同时降一层

L2层header 找到 2比 3 小,继续遍历找到 4,回退到 2 同时降一层

L1 层 2 找到 4 比 3 大,回退到 2 降一层

L0 层 2 找到 3 期望节点

整个查找过程算法的时间复杂度为$O(lg(n))$.

云内存存储UMem Redis 说说你所了解的人工智能外呼系统阿里云服务器你了解了吗 linux 下 redis linux下redis使用

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/75198.html

你确定不来了解一下Redis列表的原理吗

摘要：前言在上一章中我们介绍了的一些内部原理在这一章中我们再来讨论在五种数据结构中的基本使用和一些内部实现基本介绍的呢相当于中的也是双向链表具有一些和同样的特征比如插入和删除一条很快时间复杂度为获取头结点和尾节点也很快时间复杂度也为随机读取则相对前言在上一章中我们介绍了 String 的一些内部原理,在这一章中我们再来讨论在五种数据结构中 List 的基本使用和一些内部实现. 基本介绍 ...

elliott_hu 2019-08-16 18:03 评论0 收藏0
你确定不来了解一下Redis中 Hash的原理吗

摘要：前言本章接着上一节继续介绍的基础数据结构中的字典基本介绍也可以用来存储用户信息和不同的是可以对用户信息的每个字段单独存储则需要序列化用户的所有字段后存储并且需要以整个字符串的形式获取用户而可以只获取部分数据从而节约网络流量不过内存占用要大于前言本章接着上一节继续介绍 Redis 的基础数据结构中的Hash字典. 基本介绍 Hash 也可以用来存储用户信息,和 String 不同的是...

Thanatos 2019-08-16 18:30 评论0 收藏0