Redis总结(官方文档解读)
定义
Redis是一个开源的,基于内存的数据结构存储系统,可以用作数据库、缓存和消息中间件。
特征
-
高性能
-
支持丰富的数据类型
-
丰富的操作类型,操作是原子性的
-
支持周期性持久化
-
支持分布式
-
开源免费,社区活跃
数据类型
过期策略
-
惰性删除。查询key 的时候才对key进行检测。若key已经过期则删除,若key没有过期则返回。缺点是如果过期的key 一直没有被访问,则会一直无法被删除,存在于内存中。
-
定期删除。redis 每隔一段时间对数据库做一次检查,删除里面过期的key。由于不可能对所有key 做轮询,所以redis 会每次随机选取一些key 做检查和删除。
-
内存淘汰机制
-
volatile-lru:针对设置了过期时间的key,使用lru(最近很少使用)算法进行淘汰
-
allkeys-lru:针对所有key 使用lru算法进行淘汰
-
volatile-lfu:针对设置了过期时间的key,使用lfu(最近不经常使用)算法进行淘汰
-
allkeys-lfu:针对所有key 使用lfu 算法进行淘汰
-
volatile-random:从所有设置了过期时间的key 中使用随机淘汰方式进行淘汰
-
allkeys-random:针对所有的key 使用随机淘汰机制进行淘汰
-
volatile-ttl:针对设置了过期时间的key,越早过期的越先被淘汰
-
noeviction:不会淘汰任何数据,当使用的内存空间超过maxmemory是时,再有写请求来时返回错误
-
持久化方案
Redis 提供了一系列持久性选项包括:
-
RDB(Redis 数据库):RDB 持久性会按照指定的时间间隔对数据集执行时间点快照。
-
AOF(仅追加文件):AOF 持久性记录服务器收到的每个写入操作。然后可以在服务器启动时再次重放这些操作,重建原始数据集。命令使用与Redis 协议本身相同的格式进行记录。
-
无持久性:您可以完全禁用持久性。这有时在缓存时使用。
-
RDB + AOF:您还可以在同一实例中结合使用AOF 和RDB
RDB
-
优点
-
RDB 是 Redis 数据的一个非常紧凑的单文件时间点表示。RDB 文件非常适合备份。例如,您可能希望每小时存档最近 24 小时内的 RDB 文件,并每天保存 30 天的 RDB 快照。这样,您就可以在发生灾难时轻松恢复数据集的不同版本。
-
RDB 非常适合灾难恢复,它是一个单一的紧凑文件,可以传输到远程数据中心,或者传输到 Amazon S3(可能加密)。
-
RDB 可最大程度地提高 Redis 的性能,因为 Redis 父进程为了持久化所需要做的唯一工作就是派生一个子进程,然后由子进程来完成其余所有工作。父进程永远不会执行磁盘 I/O 或类似操作。
-
与 AOF 相比,RDB 允许使用大数据集更快地重启。
-
在副本上,RDB 支持重启和故障转移后的部分重新同步。
-
-
缺点
-
如果您需要尽量减少 Redis 停止工作(例如断电后)时数据丢失的可能性,那么 RDB 并不是一个好选择。您可以配置生成 RDB 的不同保存点(例如,在至少五分钟后对数据集进行 100 次写入后,您可以有多个保存点)。但是,您通常每五分钟或更长时间创建一个 RDB 快照,因此,如果 Redis 因任何原因而未正确关闭而停止工作,您应该准备好丢失最近几分钟的数据。
-
RDB 需要经常使用子进程 fork() 才能将其持久保存在磁盘上。如果数据集很大,fork() 可能会很耗时,如果数据集很大且 CPU 性能不佳,可能会导致 Redis 停止为客户端提供服务几毫秒甚至一秒钟。AOF 也需要 fork(),但频率较低,您可以调整重写日志的频率,而无需牺牲持久性。
-
AOF
-
优点
-
使用 AOF Redis 的持久性更强:您可以采用不同的 fsync 策略:完全不进行 fsync、每秒进行 fsync、每次查询时进行 fsync。使用每秒进行 fsync 的默认策略,写入性能仍然很好。fsync 使用后台线程执行,主线程会在没有 fsync 进行时尽力执行写入,因此您只会丢失一秒钟的写入。
-
AOF 日志是仅附加日志,因此不会出现寻道,也不会在断电时出现损坏问题。即使日志因某种原因(磁盘已满或其他原因)以半写命令结束,redis-check-aof 工具也能够轻松修复它。
-
当 AOF 太大时,Redis 能够在后台自动重写。重写是完全安全的,因为 Redis 在继续向旧文件追加内容的同时,会使用创建当前数据集所需的最少操作集生成一个全新的文件,并且一旦第二个文件准备就绪,Redis 就会切换这两个文件并开始向新文件追加内容。
-
AOF 以易于理解和解析的格式逐一记录所有操作的日志。您甚至可以轻松导出 AOF 文件。例如,即使您不小心使用该FLUSHALL命令刷新了所有内容,只要在此期间没有执行日志重写,您仍然可以通过停止服务器、删除最新命令并重新启动 Redis 来保存数据集。
-
-
缺点
-
对于同一数据集,AOF 文件通常比等效的 RDB 文件更大
-
根据确切的 fsync 策略,AOF 可能比 RDB 慢。一般来说,将 fsync 设置为每秒一次时,性能仍然非常高,而禁用 fsync 时,即使在高负载下,它也应该与 RDB 一样快。即使在写入负载巨大的情况下,RDB 仍能够提供更多关于最大延迟的保证。
-
RDB/AOF 对比
- | AOF | |
把当前内存中的数据集快照写入磁盘。恢复时是将快照文件直接读到内存里。 | 通过持续不断的保存Redis 服务器所执行的更新命令来记录数据库状态,类似mysql 的 binlog。恢复数据时要从头开始回放更新命令 | |
磁盘刷新频率 | 低 | |
文件大小 | 小 | |
数据恢复效率 | 高 | |
数据安全 | 低 |
分布式方案
分片方案
客户端分片 | |
代理分片 | 将分片工作交给专门的代理程序来做,运维方案。代表:Twemproxy,Codis |
Redis Cluster 将所有key映射到16384个slot 中,集群中每个redis 实例负责一部分,业务程序通过集成的redis cluster 客户端进行操作 |
主从复制
主从复制是redis 最基本、最常用的同步方式。它的原理是将主节点的数据复制到从节点,使得从节点的数据与主节点保持一致。主从复制是异步的,从节点与主节点的数据不是实时同步的。如果主节点发生故障,从节点可能会因为数据延迟而出现数据丢失的情况。
集群模式
Redis集群是Redis提供的分布式数据库方案,它将数据分散在多个节点上,每个节点都包含整个数据集的一部分。Redis集群通过分片来分布数据,每个节点负责数据集的一个片段。集群中的每个分片都可以有一个或多个从节点,用于故障转移和高可用性。
哨兵模式
除了主从复制外,Redis 还提供了哨兵模式作为高可用性解决方案。哨兵模式可以自动检测主节点的状态。当主节点发生故障时,会自动将一个从节点切换为主节点。切换过程中,从节点会先将自己的数据与主节点保持一致,然后才能成为新的主节点。因此,在哨兵模式下,数据同步的过程与主从复制类似,但是其实现方式更加自动化。
缓存方案
redis 用作缓存组件时,其基于内存的读写特性,比基于磁盘读写的数据库性能要高很多,适合缓存高频热点的数据,来提高读性能。这样可以降低对数据库服务器的查询请求,提高系统性能。
数据一致性
读写步骤
在使用缓存与数据库保持一致性的场景中,通常遵循以下读写步骤来确保数据的一致性。
-
读取操作:
-
检查缓存:客户端发起读取请求时,首先在缓存中查找所需数据。
-
缓存命中:如果缓存中有数据(缓存命中),则直接返回缓存中的数据给客户端。
-
缓存未命中:
-
如果缓存中没有数据(缓存未命中),则从数据库中读取数据。
-
将从数据库中读取的数据写入缓存,以便下次可以直接从缓存中读取。
-
返回数据库中的数据给客户端。
-
-
写入操作:
-
更新数据库:客户端发起写入请求时,首先更新数据库中的数据。
-
失效缓存:在数据库更新成功后,立即使缓存中的相关数据失效或更新缓存中的数据。这样可以确保下次读取操作时,客户端能够从数据库中获取最新的数据。
分布式锁
- 使用分布式锁来保证在更新数据库和失效缓存的过程中,不会有其他并发操作干扰。
读写串行化
- 通过队列等机制,确保对同一数据的读写操作不会并发执行。
订阅数据库变更
- 通过订阅数据库的变更日志(如 MySQL 的 Binlog),在数据变更时自动更新或失效缓存。
缓存异常
缓存穿透
-
定义
-
缓存穿透是指查询一个一定不存在的数据,由于缓存中不存在该数据,每次请求都会落到数据库上,从而可能导致数据库压力过大甚至崩溃。
-
-
造成原因
-
恶意攻击,造成大量访问不存在的key
-
-
解决方案
-
缓存空对象:对于查询结果为空的键,也将其存入缓存,并设置一个较短的过期时间。这样,即使是不存在的数据也会被缓存,从而避免频繁查询数据库。
-
布隆过滤器:在访问缓存之前,使用布隆过滤器检查数据是否可能存在。如果布隆过滤器判断数据不存在,则直接返回,不查询缓存和数据库。
-
接口限流:对于访问频率极高的请求,可以使用接口限流来防止恶意攻击。
-
安全性检查:应用程序检查key的合法性,提前拒绝不合法请求;检查请求来源IP,限制访问次数,或设置黑名单。
-
缓存雪崩
-
定义
-
缓存雪崩是指缓存中大量数据同时过期或者缓存服务突然宕机,导致大量请求直接落到数据库上,引起数据库压力骤增,甚至导致数据库崩溃。
-
-
造成原因
-
redis故障、比如redis 宕机
-
网络出现抖动
-
-
解决方案:
-
设置不同的过期时间:为缓存数据设置不同的过期时间,避免大量数据同时过期。
-
使用持久化缓存:比如Redis的RDB或AOF持久化功能,即使服务重启,也能快速恢复缓存数据。
-
服务熔断和限流:在缓存失效或者服务故障时,通过服务熔断和限流来保护后端系统。
-
多级缓存:构建多级缓存架构,例如本地缓存+分布式缓存,即使分布式缓存出现问题,本地缓存仍能提供一定的保护。
-
缓存击穿
-
定义
-
缓存击穿是指某个热点数据在缓存中过期,而此时大量并发请求访问该数据,导致这些请求都落到数据库上,从而可能引起数据库压力过大。
-
-
造成原因
-
热点key 设置了太短的过期时间
-
-
解决方案
-
热点数据永不过期:对于热点数据,可以设置永不过期或者过期时间非常长。
-
互斥锁:在缓存失效时,通过互斥锁来保证同一时间只有一个请求去查询数据库,并更新缓存,其他请求等待缓存更新完成后再返回数据。
-
数据热加载:使用后台线程或者定时任务,预先加载热点数据至缓存中。
-
Redis 使用Lua 脚本
Redis 允许用户在服务器上上传和执行 Lua 脚本。脚本可以使用编程控制结构,并在执行时使用大多数命令来访问数据库。由于脚本在服务器中执行,因此从脚本读取和写入数据非常高效。
-
-
提高执行效率:减少网络开销、原子性操作和减少解析时间。
-
原子性保证:脚本的执行是原子操作,避免了在多线程环境下的竞态条件问题。
-
-
-
原子性操作:通过使用Lua脚本,可以实现事务处理、乐观锁、排他锁等原子性操作。
-
批量操作:通过Lua脚本可以实现批量操作,如批量插入、批量删除等。
-
-
-
Redis 使用一个脚本缓存,这意味着相同的 Lua 脚本不需要每次执行时都重新发送。一旦脚本被缓存,它就可以通过 EVALSHA 命令通过脚本的 SHA1 校验和来调用。
-
EVALSHA sha1 numkeys key [key ...] arg [arg ...]
-
-
要获取脚本的 SHA1 校验和,可以使用 SCRIPT LOAD 命令:
-
SCRIPT LOAD "your lua script here"
-
Redis 事务
Redis 中的事务处理是通过 MULTI、EXEC、DISCARD 和 WATCH 命令来实现的。Redis 的事务允许一组命令在单个步骤中按顺序执行,确保这些命令作为一个单独的操作被处理。
-
以下是 Redis 事务处理的关键点
-
事务中的所有命令都是序列化的,并按顺序执行
-
在 Redis 事务执行过程中,其他客户端发送的请求永远不会得到处理。这保证了命令作为单个隔离操作执行。
-
-
命令
-
MULTI
-
MULTI 命令用于开始一个事务。在发出 MULTI 命令后,客户端可以发出多个命令,这些命令不会立即被执行,而是被放入一个队列中。
-
-
EXEC
-
在 MULTI 命令之后,你可以发送多个命令到队列中。当所有的命令都添加到事务队列后,使用 EXEC 命令来执行所有队列中的命令。
-
-
DISCARD
-
如果你在执行事务之前改变主意,可以使用 DISCARD 命令来取消事务,并丢弃事务队列中的所有命令。
-
-
WATCH
-
在事务开始之前,你可以使用 WATCH 命令来监控一个或多个键。如果在事务执行前这些键被修改(通过其他客户端),则 EXEC 命令将不会执行事务中的任何命令,而是返回一个空回复。这种机制可以用作乐观锁。
-
-
-
注意事项
Redis 事务不支持回滚,如果事务中的某个命令执行失败,那么事务中的其他命令仍然会执行。
Redis 发布/订阅
Redis 的发布/订阅(Publish/Subscribe)模式是一种消息传递范式,允许客户端订阅一个或多个频道(channel),并接收来自这些频道的消息。在这种模式中,发送者(发布者)发布消息到一个频道,而接收者(订阅者)监听这个频道以接收消息。
-
基本概念
-
发布者(Publisher):发布消息到频道。
-
订阅者(Subscriber):订阅一个或多个频道,以接收来自这些频道的消息。
-
频道(Channel):消息传递的通道,发布者和订阅者通过频道进行消息的发送和接收。
-
-
常用命令
-
SUBSCRIBE:订阅一个或多个频道。
-
SUBSCRIBE channel [channel ...]
-
-
UNSUBSCRIBE: 退订一个或多个频道。
-
UNSUBSCRIBE [channel [channel ...]]
-
-
PUBLISH:向指定频道发送消息。
-
PUBLISH channel message
-
-
PSUBSCRIBE:订阅一个或多个符合给定模式的频道。
-
PSUBSCRIBE pattern [pattern ...]
-
-
PUNSUBSCRIBE:退订一个或多个符合给定模式的频道。
-
PUNSUBSCRIBE [pattern [pattern ...]]
-
-
-
注意事项
-
发布/订阅消息是异步的,发布者不会知道消息是否被成功接收。
-
如果没有订阅者监听某个频道,那么向该频道发布的消息将不会被任何人接收。
-
订阅者在订阅频道时处于阻塞状态,只能接收消息或通过退订来退出阻塞状态。
-
发布/订阅模式不支持消息持久化,如果 Redis 服务重启,所有订阅信息和发布过的消息都会丢失。
-
比较
Redis 与 Mysql 的区别
- redis 是No-SQL 数据库,Mysql 是关系型数据库
- Mysql 用于持久化的存储到硬盘,功能强大,速度稍慢,基于磁盘,读写速度没有Redis 快,但是不受空间容量限制,性价比高。redis 用于存储使用较为频繁的数据到缓存中,读取速度快,基于内存,读写速度快,也可做持久化,但是内存空间有限,当数据超过内存空间时,需扩充内存
- redis 是 key-value 数据库,不是传统的关系型数据库,数据主要存储在内存中。Mysql 是关系型数据库,具有事务的基本特征,数据存储在文件中;redis 作为中间件服务,主要作用于缓存,存储重要的及时数据;Mysql 数据库更偏向于数据库服务,类似一种中心仓库,负责数据的管理。
Redis 与 Memcache 的区别
- redis 数据类型多于 Memcache
- redis 可周期性做持久化,Memcache 不能持久化
- redis 支持 master-slave 模式的数据备份,Memcache 不支持数据持久化,无法进行数据备份
- Memcache 是多线程的,Redis 是单线程的;CPU 利用率 Memcache 优于 redis
- 批量读取性能 Memcache 优于 Redis
参考文献
Redis 官方文档:Develop with Redis | Docs