【Redis6快速深入学习04】Redis字符串(String)的使用和原理
Redis字符串(String)
4.1 Redis 中 String 的简介
String 是Redis五种最基本的类型之一,在使用时可以理解成与Memcached一模一样的类型,一个key对应一个value。
String 类型是二进制安全的。意味着 Redis 的 string 可以包含任何数据。比如 jpg 图片或者序列化的对象。
String 类型是 Redis 最基本的数据类型,一个 Redis 中字符串 value 最多可以是 512M。
4.2 常用命令
-
set <key> <value>
: 添加键值对 -
get <key>
:查询对应键值
127.0.0.1:6379> set k1 v1
OK
127.0.0.1:6379> get k1
"v1"
append <key> <value>
将给定的<value>
追加到原值的末尾
127.0.0.1:6379> append k1 100
(integer) 5
127.0.0.1:6379> get k1
"v1100"
strlen <key>
:获得值的长度
127.0.0.1:6379> strlen k1
(integer) 5
setnx <key> <value>
:只有在 key 不存在时,设置 key 的值,而key存在时,不对key对应的value值作修改,之前的 set 命令则会覆盖原来的值
127.0.0.1:6379> set k1 v1
OK
127.0.0.1:6379> set k2 v2
OK
127.0.0.1:6379> keys *
1) "k2"
2) "k1"
127.0.0.1:6379> set k1 v110
OK
127.0.0.1:6379> get k1
"v110"
127.0.0.1:6379> get k2
"v2"
127.0.0.1:6379> setnx k2 v210
(integer) 0
127.0.0.1:6379> get k2
"v2"
incr <key>
:将 key 中储存的数字值增1,只能对数字值操作,如果为空,新增值为1
127.0.0.1:6379> set k3 1
OK
127.0.0.1:6379> incr k3
(integer) 2
127.0.0.1:6379> get k3
"2"
127.0.0.1:6379> incr k3
(integer) 3
127.0.0.1:6379> incr k3
(integer) 4
127.0.0.1:6379> get k3
"4"
decr <key>
:将 key 中储存的数字值减1,只能对数字值操作,如果为空,新增值为-1
127.0.0.1:6379> decr k3
(integer) 3
127.0.0.1:6379> get k3
"3"
127.0.0.1:6379> decr k3
(integer) 2
127.0.0.1:6379> decr k3
(integer) 1
127.0.0.1:6379> get k3
"1"
incrby/decrby <key> <步长>
将 key 中储存的数字值增减。自定义步长。
127.0.0.1:6379> incrby k3 5
(integer) 6
127.0.0.1:6379> incrby k3 5
(integer) 11
127.0.0.1:6379> incrby k3 5
(integer) 16
127.0.0.1:6379> get k3
"16"
127.0.0.1:6379> decrby k3 3
(integer) 13
127.0.0.1:6379> decrby k3 3
(integer) 10
127.0.0.1:6379> get k3
"10"
注意:incr key
是一种原子操作,所谓原子操作是指不会被线程调度机制打断的操作;这种操作一旦开始,就一直运行到结束,中间不会有任何 context switch (切换到另一个线程)。
(1)在单线程中, 能够在单条指令中完成的操作都可以认为是"原子操作",因为中断只能发生于指令之间。
(2)在多线程中,不能被其它进程(线程)打断的操作就叫原子操作。
Redis单命令的原子性主要得益于Redis的单线程。
案例:
java中的i++是否是原子操作?不是,java是多线程的
i = 0;两个线程分别对i进行++100次,值是多少? 2~200
i++ 的步骤(1)取值,(2)++,(3)赋值
Thread-0 | Thread-1 |
---|---|
i=0 …… i++ i=99 | |
i++ i=1 | |
i=1 | |
i++ i=100 | |
i++ i=2 |
mset <key1> <value1> <key2> <value2> .....
:连续设置多个键值对
mget <key1> <key2> <key3> .....
:同时获取一个或多个 value
127.0.0.1:6379> flushdb
OK
127.0.0.1:6379> mset k1 v1 k2 v2 k3 v3
OK
127.0.0.1:6379> mget k1 k2 k3
1) "v1"
2) "v2"
3) "v3"
msetnx <key1> <value1> <key2> <value2> .....
:同时设置一个或多个 key-value 对,当且仅当所有给定 key 都不存在。且 msetnx 有一个失败其他都是注入无效的
127.0.0.1:6379> msetnx k1 v110 k4 v110
(integer) 0
127.0.0.1:6379> mget k1 k2 k3 k4
1) "v1"
2) "v2"
3) "v3"
4) (nil)
127.0.0.1:6379> msetnx k1 v110
(integer) 0
127.0.0.1:6379> mget k1 k2 k3 k4
1) "v1"
2) "v2"
3) "v3"
4) (nil)
127.0.0.1:6379> msetnx k4 v110
(integer) 1
127.0.0.1:6379> mget k1 k2 k3 k4
1) "v1"
2) "v2"
3) "v3"
4) "v110"
getrange <key> <起始位置> <结束位置>
:获得值的范围,类似java中的substring,前包,后包
127.0.0.1:6379> getrange k4 0 -1
"v110"
127.0.0.1:6379> getrange k4 0 2
"v11"
setrange <key> <起始位置> <value>
:用 覆写所储存的字符串值,从<起始位置>开始(索引从0开始)。
127.0.0.1:6379> getrange k4 0 -1
"v110"
127.0.0.1:6379> setrange k4 1 000
(integer) 4
127.0.0.1:6379> get k4
"v000"
setex <key> <过期时间> <value>
:设置键值的同时,设置过期时间,单位秒。
127.0.0.1:6379> setex k5 40 v5
OK
127.0.0.1:6379> ttl k5
(integer) 35
127.0.0.1:6379> ttl k5
(integer) 32
127.0.0.1:6379> ttl k5
(integer) 1
127.0.0.1:6379> ttl k5
(integer) -2
getset <key> <value>
:以新换旧,设置了新值同时获得旧值。
127.0.0.1:6379> get k1
"v1"
127.0.0.1:6379> getset k1 v111
"v1"
127.0.0.1:6379> get k1
"v111"
4.3 底层逻辑
String类型的数据结构存储方式有三种int、raw、embstr
。那么这三种存储方式有什么区别呢?
4.3.1 int
Redis中规定假如存储的是 整数型值,比如 set k1 1
这样的类型,就会使用 int的存储方式进行存储,在redisObject的ptr属性中就会保存该值。
4.3.2 SDS
结论先行:假如存储的字符串是一个字符串值并且长度大于44个字节就会使用 SDS(simple dynamic string)
方式进行存储,并且encoding设置为raw;若是字符串长度小于等于44个字节就会将encoding改为emdstr来保存字符串。
127.0.0.1:6379> set k1 qwertyuiopqwertyuiopqwertyuiopqwertyuiopqwert
OK
127.0.0.1:6379> debug object k1
Value at:0x7f70b1ca0dc0 refcount:1 encoding:raw serializedlength:21 lru:16311423 lru_seconds_idle:4
127.0.0.1:6379> set k2 qwertyuiopqwertyuiopqwertyuiopqwertyuiopqwer
OK
127.0.0.1:6379> debug object k2
Value at:0x7f70b1c22d80 refcount:1 encoding:embstr serializedlength:21 lru:16311924 lru_seconds_idle:2
k1 和 k2 只差了一个字符,存储形式 encoding 就发生了变化。对于较长的k1,其 encoding 为 raw ;对于较短的 k2,其 encoding 为 embstr。
在了解存储格式的区别之前,首先了解下RedisObject结构体。也对上面的结构体做解释。
所有的 Redis 对象都有一个 Redis 对象头结构体
struct RedisObject {
int4 type; // 4bits 类型
int4 encoding; // 4bits 存储格式
int24 lru; // 24bits 记录LRU信息
int32 refcount; // 4bytes
void *ptr; // 8bytes,64-bit system
} robj;
不同的对象具有不同的类型 type ,占4个bit。
同一个类型的 type 会有不同的存储形式 encoding,也占4个bit。
为了记录对象的 LRU 信息,使用了 24 个 bit 的 lru 来记录 LRU 信息。
每个对象都有个引用计数 refcount,当引用计数为零时,对象就会被销毁,内存被回收。
ptr 指针将指向对象内容 (body) 的具体存储位置。
所以,一个 RedisObject 对象头共需要占据 16 字节的存储空间。
再看一下RedisObject的10种存储格式——encoding
//这两个宏定义申明是在server.h文件中
#define OBJ_ENCODING_RAW 0 /* Raw representation */
#define OBJ_ENCODING_INT 1 /* Encoded as integer */
#define OBJ_ENCODING_HT 2 /* Encoded as hash table */
#define OBJ_ENCODING_ZIPMAP 3 /* Encoded as zipmap */
#define OBJ_ENCODING_LINKEDLIST 4 /* No longer used: old list encoding. */
#define OBJ_ENCODING_ZIPLIST 5 /* Encoded as ziplist */
#define OBJ_ENCODING_INTSET 6 /* Encoded as intset */
#define OBJ_ENCODING_SKIPLIST 7 /* Encoded as skiplist */
#define OBJ_ENCODING_EMBSTR 8 /* Embedded sds string encoding */
#define OBJ_ENCODING_QUICKLIST 9 /* Encoded as linked list of ziplists */
而Redis 的字符串共有两种存储方式,在长度特别短时,使用 emb 形式存储 (embedded),当长度超过 44 时,使用 raw 形式存储。那么为什么是 44 字节呢?
embstr 存储形式是这样一种存储形式,它将 RedisObject 对象头和 SDS 对象连续存在一起,使用 malloc 方法一次分配。
而 raw 存储形式不一样,它需要两次 malloc,两个对象头在内存地址上一般是不连续的。
在字符串比较小时,SDS 对象头的大小是capacity+3——SDS结构体的内存大小至少是 3。意味着分配一个字符串的最小空间占用为 19 字节 (16+3)。
如果总体超出了 64 字节,Redis 认为它是一个大字符串,不再使用 emdstr 形式存储,而该用 raw 形式。而64-19-结尾的**\0**,所以empstr只能容纳44字节。
4.3.3 SDS的扩容策略和扩容
SDS_MAX_PREALLOC的容量大小定义在sds.h文件中,默认是 1024 * 1024,也就是1MB。
//扩容分配策略
newlen = (len+addlen);
// 如果新长度小于最大预分配长度则分配扩容为2倍
// 如果新长度大于最大预分配长度则仅追加SDS_MAX_PREALLOC长度
if (newlen < SDS_MAX_PREALLOC)
newlen *= 2;
else
newlen += SDS_MAX_PREALLOC;
通过源代码可以看出,扩容策略是字符串在长度小于 SDS_MAX_PREALLOC 之前,扩容空间采用加倍策略,也就是保留 100% 的冗余空间。当长度超过 SDS_MAX_PREALLOC 之后,为了避免加倍后的冗余空间过大而导致浪费,每次扩容只会多分配 SDS_MAX_PREALLOC大小的冗余空间。
4.5 String类型应用(存储图片)
(1)首先要把上传得图片进行编码,这里写了一个工具类把图片处理成了Base64得编码形式,具体得实现代码如下:
/**
* 将图片内容处理成Base64编码格式
* @param file
* @return
*/
public static String encodeImg(MultipartFile file) {
byte[] imgBytes = null;
try {
imgBytes = file.getBytes();
} catch (IOException e) {
e.printStackTrace();
}
BASE64Encoder encoder = new BASE64Encoder();
return imgBytes==null?null:encoder.encode(imgBytes );
}
(2)第二步就是把处理后的图片字符串格式存储进Redis中,实现得代码如下所示:
/**
* Redis存储图片
* @param file
* @return
*/
public void uploadImageServiceImpl(MultipartFile image) {
String imgId = UUID.randomUUID().toString();
String imgStr= ImageUtils.encodeImg(image);
redisUtils.set(imgId , imgStr);
// 后续操作可以把imgId存进数据库对应的字段,如果需要从redis中取出,只要获取到这个字段后从redis中取出即可。
}