当前位置：首页 > article >正文

Redis：常见数据类型和单线程模型

article 2025/3/15 7:53:38

常见数据类型

不同数据类型的编码方式

单线程模型

常见数据类型

在前面学习的 type 命令实际返回的就是当前键的数据结构类型，它们分别是:string(字符串)、list(列表)、hash(哈希)、set(集合)、zset(有序集合)，但这些只是Redis对外的数据结构，如下图所示：

前四种：

string类似于C++的 std::string
list 类似于C++的 std::deque
hash 类似于C++的 std::unordered_map
set 类似于C++的 std::set

zset 有序集合，C++ 并没有类似的概念
相当于是除了存储 member 之外还需要存储一个 score (权重,分数)

Redis 底层在实现上述数据结构的时候，会在源码层面，针对上述实现进行特定的优化，来达到 节省时间/节省空间 效果

内部的具体实现的数据结构，还会有变数
redis 承诺，现在我这有个 hash 表，你进行查询、插入、删除操作, 都保证 O(1)
但是这个背后的实现，不一定就是一个标准的 hash 表，可能再特定场景下，使用别的数据结构实现，但是仍然保证时间复杂度符合承诺

不同数据类型的编码方式

同一个数据类型，背后可能的编码实现方式是不同的，会根据特定场景优化

redis 会自动适应，程序猿在使用 redis 的时候一般感知不到

对于 list 数据类型来说，从 redis 3.2 开始，引入了新的实现方式 quicklist，它同时兼顾了 linkedlist 和 ziplist 的优点
quicklist 就是一个链表, 每个元素又是一个 ziplist，把空间和效率都折衷的兼顾到
quicklist 比较类似于 C++ 中的 std::deque

单线程模型

单线程模型的工作过程

redis 只使用一个线程，处理所有的命令请求，不是说一个 redis 服务器进程内部真的就只有一个线程其实也有多个线程，多个线程是在处理网络 IO

如果两个客户端同时向 Redis 发送 incr(自增请求)，此时就意味着是否服务器这边也会存在类似的线程安全问题呢
当前这两个客户端，也相当于"并发"的发起了上述的请求，但幸运的是并不会有线程安全问题，redis 服务器实际上是单线程模型，保证了当前收到的这多个请求是串行执行的
多个请求同时到达 redis 服务器，也是要先在队列中排队，再等待 redis 服务器一个一个的取出里面的命令，再执行
微观上讲，redis 服务器是串行/顺序执行这多个命令的

redis 能够使用单线程模型很好的工作
原因主要在于 redis 的核心业务逻辑，都是短平快的，不太消耗 cpu 资源也就不太吃多核了

弊端：
redis 必须要特别小心，某个操作占用时间长，就会阻塞其他命令的执行

单线程为什么效率高、速度快

效率高、速度快的参照物，是数据库(mysql、oracle、sql server)

1. redis 访问内存，而数据库则是访问硬盘

2. redis 核心功能，比数据库的核心功能更简单
数据库对于数据的插入删除査询，都有更复杂的功能支持，这样的功能势必要花费更多的开销
比如，针对插入删除，数据库中的各种约束，都会使数据库做额外的工作
redis 干的活少，提供的功能相比于 mysql 也是少了不少

3.单线程模型，避免了一些不必要的线程竞争开销
redis 每个基本操作，都是短平快的，就是简单操作一下内存数据，不是什么特别消耗 cpu 的操作就算搞多个线程，也提升不大

4. 处理网络 IO 的时候，使用了 epoll 这样的 IO 多路复用机制
一个线程，就可以管理多个 socket
针对 TCP 来说，服务器这边每次要服务一个客户端，都需要给这个客户端安排一个 socket
一个服务器服务多个客户端，同时就有很多个 socket，这些 socket 上并不是无时无刻的在传输数据，很多情况下，每个客户端和服务器之间的通信也没那么频繁，此时这么多 socket 大部分时间都是静默的，上面是没有数据需要传输的
也就是同一时刻，只有少数 socket 是活跃的

基于上述原因，我们就使用了 IO 多路复用，一个线程来处理多个 socket
IO 多路复用(操作系统给程序猿提供的机制. 提供了一套 API,内部的功能都是操作系统内核实现的)

Linux 上提供的 IO 多路复用, 主要是三套 API：