Redis中的List,底层采用了什么数据结构?
wptr33 2025-01-31 15:36 18 浏览
这篇文章,我们将从 Redis List 的基本原理出发,深入分析其内部实现机制、源码层面的细节,并结合实际示例,全面解析 Redis List 的工作原理。
1. Redis List 概述
Redis 的 List 是一个简单的字符串列表,按照插入顺序排序。它支持在列表的两端插入或删除元素,具有以下特点:
- 有序:元素按照插入顺序排列,可以通过索引访问。
- 双端操作:支持从左端(头部)和右端(尾部)进行插入和删除操作。
- 高效:在两端插入和删除的时间复杂度为 O(1)。
常用的 List 命令包括 LPUSH、RPUSH、LPOP、RPOP、LINDEX、LRANGE 等。
2. Redis List 的内部实现
Redis 的 List 数据结构内部实现主要依赖于两个数据结构:压缩列表(ziplist)和双端链表(quicklist)。根据 List 的大小和元素的长度,Redis 会自动选择合适的数据结构,以优化存储空间和操作效率。
2.1 压缩列表
压缩列表 是一种为节省内存而设计的紧凑数据结构。它将多个元素紧密存储在一个连续的内存块中,适用于小型的 List。
- 结构:压缩列表由三个部分组成:ziplist header、entry list 和 ziplist end。
- 性能:适用于含有少量元素且每个元素较短的 List,节省内存但在频繁插入和删除时性能较低。
2.2 双端链表
从 Redis 3.2 版本开始,List 的内部实现改为使用 quicklist,它结合了压缩列表和双向链表的优点。
- 结构:quicklist 是由多个压缩列表(ziplist)组成的双向链表,每个压缩列表称为一个节点(node)。
- 优势:
- 高效插入与删除:在两端插入和删除元素时,只需要操作链表的头部或尾部节点,时间复杂度为 O(1)。
- 节省空间:每个节点内部仍然使用压缩列表存储元素,节省内存。
- 灵活性:适用于包含大量元素的 List。
3. 源码分析
下面将通过源码分析 Redis List 的实现机制,重点关注 quicklist 相关的代码部分。
3.1 数据结构定义
Redis 在 src/quicklist.h 文件中定义了 quicklist 相关的数据结构。
// quicklist.h
typedefstruct quicklistEntry {
unsignedchar *value; /* value of the entry */
unsignedint sz; /* length of the value */
longlong longval; /* long representation, if applicable */
unsignedint encoding:4;
unsignedint attempted_float_conversion:1;
} quicklistEntry;
typedefstruct quicklistNode {
struct quicklistNode *prev;
struct quicklistNode *next;
unsignedchar *zl; /* ziplist containing some entries */
unsignedint sz; /* byte size of ziplist */
unsignedint count:16;
unsignedint encoding:4;
unsignedint container:4;
unsignedint recompress:1;
} quicklistNode;
typedefstruct quicklist {
quicklistNode *head;
quicklistNode *tail;
const quicklistCompress *compress;
unsignedint count; /* total count of all entries in all the nodes */
unsignedlong len; /* count of all elements */
unsignedlong maxlevel;
unsignedint fill:16;
unsignedint compress_depth:4;
unsignedint mem_compressed:1;
} quicklist;
主要的数据结构包括:
- quicklistEntry:表示 quicklist 中的一个条目(entry)。
- quicklistNode:表示 quicklist 中的一个节点,包含一个 ziplist。
- quicklist:整个 quicklist 结构,包含头尾节点、统计信息等。
3.2 常用命令的实现
以下将以 LPUSH、RPUSH、LPOP、RPOP、LINDEX、LRANGE 等命令为例,分析它们在源码中的实现。
3.3 LPUSH 和 RPUSH
LPUSH 和 RPUSH 用于在 List 的左端和右端插入元素。它们在 quicklist 中的实现主要涉及调用 quicklistPush 函数。
// listOp.c
void quicklistPush(quicklist *quicklist, void *value, size_t sz, int where) {
// 省略参数检查和类型转换
if (where == QUICKLIST_HEAD) {
// 插入到链表头部
// 如果头节点已满,创建新节点
} else {
// 插入到链表尾部
// 如果尾节点已满,创建新节点
}
// 使用 ziplist 插入元素
// 更新统计信息
}
核心逻辑:
- 判断插入的位置(头部或尾部)。
- 检查对应位置的节点是否有足够空间插入新元素。
- 如果节点已满,创建一个新的节点并插入。
- 在对应节点的 ziplist 中插入新元素。
- 更新 quicklist 的统计信息。
3.4 LPOP 和 RPOP
LPOP 和 RPOP 用于从 List 的左端和右端弹出元素。它们主要调用 quicklistPopCustom 函数。
// listPop.c
int quicklistPopCustom(quicklist *quicklist, int where, long long *v, unsigned char **sval, unsigned int *slen) {
if (where == QUICKLIST_HEAD) {
// 从头部节点的 ziplist 弹出元素
// 如果节点为空,删除节点并移动到下一个节点
} else {
// 从尾部节点的 ziplist 弹出元素
// 如果节点为空,删除节点并移动到前一个节点
}
// 更新统计信息和 quicklist 结构
}
核心逻辑:
- 根据弹出的位置,选择头部或尾部节点。
- 从对应节点的 ziplist 中弹出元素。
- 如果节点为空,删除节点并更新链表指针。
- 更新 quicklist 的统计信息。
3.5 LINDEX
LINDEX 用于获取 List 中指定索引的元素。它调用 quicklistIndex 函数。
// listIndex.c
quicklistEntry *quicklistIndex(quicklist *quicklist, long index) {
// 处理负索引
// 遍历 quicklist 中的节点,累加节点中元素的数量
// 找到包含目标索引的节点
// 在节点的 ziplist 中查找具体的元素
}
核心逻辑:
- 处理负索引(从尾部开始计数)。
- 遍历 quicklist 的节点,累加每个节点的元素数量。
- 确定目标索引所在的节点。
- 在该节点的 ziplist 中查找目标元素。
3.6 LRANGE
LRANGE 用于获取 List 中指定范围的元素。它调用 quicklistGetRange 函数。
// listRange.c
quicklistIter *quicklistGetIterator(quicklist *quicklist, int direction) {
// 创建一个迭代器,从头部或尾部开始遍历 quicklist
}
int quicklistNext(quicklistIter *i, quicklistEntry *entry) {
// 通过迭代器遍历 quicklist 中的元素
}
核心逻辑:
- 创建一个迭代器,指定遍历方向(从头到尾或从尾到头)。
- 遍历 quicklist 的节点和节点内的 ziplist,收集指定范围的元素。
- 返回结果集合。
4. 性能优化与选择
Redis 在 List 的内部实现中,通过 quicklist 结构在节省内存和提高操作效率之间取得了平衡。以下是一些性能优化的考虑:
- 节点大小(fill factor):quicklist 中每个节点的 ziplist 有一个填充因子(默认是 4),决定了多少元素被存储在一个节点中。适当的填充因子可以减少节点数量,提高遍历效率。
- 压缩算法:quicklist 支持多种压缩算法,通过配置可以进一步优化内存使用。
- 迭代器机制:通过迭代器遍历 quicklist,提高了操作的灵活性和效率。
在选择使用 List 时,应根据实际需求和数据规模合理设计,避免在极大的 List 上进行频繁的中间位置插入和删除操作,因为这可能导致性能下降。
5. 为什么List底层有两种实现
List 数据结构的底层采用了 压缩列表(ziplist) 和 双端链表(quicklist) ,其实是 内存效率 与 操作性能 之间取得最佳平衡。主要原因如下:
1. 压缩列表
内存节省:压缩列表是一种为节省内存而设计的紧凑数据结构。它将多个元素紧密存储在一个连续的内存块中,避免了传统链表中每个节点需要额外指针(如前驱和后继指针)带来的内存开销。对于包含少量元素且每个元素较短的小型列表,压缩列表能够显著减少内存使用量。
缓存友好性:由于压缩列表将所有元素存储在一个连续的内存区域中,这种布局有助于提升缓存命中率。CPU 在访问数据时,能够更高效地预取和缓存数据,从而提高访问速度。
简单数据结构:压缩列表的实现相对简单,适用于不需要频繁插入和删除操作的场景。对于静态或变化不大的小型列表,压缩列表提供了足够的性能和内存效率。
2. 双端链表
高效的两端操作:双端链表允许在列表的头部和尾部进行高效的插入和删除操作,时间复杂度为 O(1)。这对于需要频繁在两端进行操作的应用场景(如队列和栈)尤为重要。
动态扩展能力:与压缩列表相比,双端链表更适合处理动态变化较大的列表。它能够灵活地在任意位置插入和删除元素,而不会像压缩列表那样需要整体移动内存块。
分段存储与性能优化:Quicklist 通过将列表分段存储,每个段使用压缩列表(ziplist)作为节点,实现了分块管理。这种设计兼具了压缩列表的内存效率和双端链表的操作性能。具体来说,每个 quicklist 节点内部是一个压缩列表,多个节点通过双端链表连接起来。这样,在需要进行插入或删除操作时,仅需操作相关的节点,而不影响整个列表结构。
Redis 会根据列表的长度和元素的大小,自动决定使用压缩列表还是双端链表。这种智能选择机制确保了在不同场景下都能获得最佳的性能和内存使用率。例如:
- 小型列表:当列表较小且元素较短时,Redis 会选择压缩列表,最大化内存节省和缓存效率。
- 大型列表:当列表变得较大或元素较长时,Redis 会转而使用 quicklist,以提升操作性能和扩展能力。
6. 总结
本文,我们从源码角度分析了 Redis 的 List 数据结构,它是一个高效、灵活的数据结构,适用于多种应用场景,如消息队列、任务管理等。通过内部的 quicklist 结构,Redis 在节省内存和优化操作效率方面做出了平衡。通过学习本文,我们也可以发现 Redis 对性能的追求。
相关推荐
- Python自动化脚本应用与示例(python办公自动化脚本)
-
Python是编写自动化脚本的绝佳选择,因其语法简洁、库丰富且跨平台兼容性强。以下是Python自动化脚本的常见应用场景及示例,帮助你快速上手:一、常见自动化场景文件与目录操作...
- Python文件操作常用库高级应用教程
-
本文是在前面《Python文件操作常用库使用教程》的基础上,进一步学习Python文件操作库的高级应用。一、高级文件系统监控1.1watchdog库-实时文件系统监控安装与基本使用:...
- Python办公自动化系列篇之六:文件系统与操作系统任务
-
作为高效办公自动化领域的主流编程语言,Python凭借其优雅的语法结构、完善的技术生态及成熟的第三方工具库集合,已成为企业数字化转型过程中提升运营效率的理想选择。该语言在结构化数据处理、自动化文档生成...
- 14《Python 办公自动化教程》os 模块操作文件与文件夹
-
在日常工作中,我们经常会和文件、文件夹打交道,比如将服务器上指定目录下文件进行归档,或将爬虫爬取的数据根据时间创建对应的文件夹/文件,如果这些还依靠手动来进行操作,无疑是费时费力的,这时候Pyt...
- python中os模块详解(python os.path模块)
-
os模块是Python标准库中的一个模块,它提供了与操作系统交互的方法。使用os模块可以方便地执行许多常见的系统任务,如文件和目录操作、进程管理、环境变量管理等。下面是os模块中一些常用的函数和方法:...
- 21-Python-文件操作(python文件的操作步骤)
-
在Python中,文件操作是非常重要的一部分,它允许我们读取、写入和修改文件。下面将详细讲解Python文件操作的各个方面,并给出相应的示例。1-打开文件...
- 轻松玩转Python文件操作:移动、删除
-
哈喽,大家好,我是木头左!Python文件操作基础在处理计算机文件时,经常需要执行如移动和删除等基本操作。Python提供了一些内置的库来帮助完成这些任务,其中最常用的就是os模块和shutil模块。...
- Python 初学者练习:删除文件和文件夹
-
在本教程中,你将学习如何在Python中删除文件和文件夹。使用os.remove()函数删除文件...
- 引人遐想,用 Python 获取你想要的“某个人”摄像头照片
-
仅用来学习,希望给你们有提供到学习上的作用。1.安装库需要安装python3.5以上版本,在官网下载即可。然后安装库opencv-python,安装方式为打开终端输入命令行。...
- Python如何使用临时文件和目录(python目录下文件)
-
在某些项目中,有时候会有大量的临时数据,比如各种日志,这时候我们要做数据分析,并把最后的结果储存起来,这些大量的临时数据如果常驻内存,将消耗大量内存资源,我们可以使用临时文件,存储这些临时数据。使用标...
- Linux 下海量文件删除方法效率对比,最慢的竟然是 rm
-
Linux下海量文件删除方法效率对比,本次参赛选手一共6位,分别是:rm、find、findwithdelete、rsync、Python、Perl.首先建立50万个文件$testfor...
- Python 开发工程师必会的 5 个系统命令操作库
-
当我们需要编写自动化脚本、部署工具、监控程序时,熟练操作系统命令几乎是必备技能。今天就来聊聊我在实际项目中高频使用的5个系统命令操作库,这些可都是能让你效率翻倍的"瑞士军刀"。一...
- Python常用文件操作库使用详解(python文件操作选项)
-
Python生态系统提供了丰富的文件操作库,可以处理各种复杂的文件操作需求。本教程将介绍Python中最常用的文件操作库及其实际应用。一、标准库核心模块1.1os模块-操作系统接口主要功能...
- 11. 文件与IO操作(文件io和网络io)
-
本章深入探讨Go语言文件处理与IO操作的核心技术,结合高性能实践与安全规范,提供企业级解决方案。11.1文件读写11.1.1基础操作...
- Python os模块的20个应用实例(python中 import os模块用法)
-
在Python中,...
- 一周热门
-
-
C# 13 和 .NET 9 全知道 :13 使用 ASP.NET Core 构建网站 (1)
-
因果推断Matching方式实现代码 因果推断模型
-
git pull命令使用实例 git pull--rebase
-
面试官:git pull是哪两个指令的组合?
-
git 执行pull错误如何撤销 git pull fail
-
git pull 和git fetch 命令分别有什么作用?二者有什么区别?
-
git fetch 和git pull 的异同 git中fetch和pull的区别
-
git pull 之后本地代码被覆盖 解决方案
-
还可以这样玩?Git基本原理及各种骚操作,涨知识了
-
git命令之pull git.pull
-
- 最近发表
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)