redis中的数据类型(Set与ZSet)
(一)set
set在我们目前有两个意思,首先就是这里使用的集合,第二个是我们的set和get方法
因为set是一个集合,所以他具有集合的一些特点:
1.集合中的元素无序 2.集合中的元素是不可重复的 3.集合间是可以取交集,并集,差集
1.set的一些命令
1)sadd
将一个或者多个元素添加到set中,如果元素重复虽然不会报错,但是没有添加到set中(会影响返回值)
时间复杂度O(1),返回值为添加的元素个数
2)smembers
用来获取一个set中的所有元素,元素的顺序是无序的
时间复杂度为O(N),返回值为所有元素的列表
3)sismember
用来判断一个元素在不在set中
时间复杂度是O(1),返回值如果为1就表示在集合中,如果为0就表示不在集合中或者key不存在
4)scard
获取一个set中的元素个数
时间复杂度O(1),返回值为set内元素个数
5)spop
从set中删除并且返回一个或者多个随机元素(是因为set是无序的,所以才是随机元素)
时间复杂度为O(N),n为count,count表示要删除多少个元素
返回值为取出元素
6)smove
将一个元素从一个set移动到另一个set中
时间复杂度为O(1),返回值1表示移动成功,0表示失败
当我们想移动的元素不存在时就会返回0
7)srem
将指定元素从set中删除,可以删除一个也可以删除多个
返回值为删除成功的元素个数
时间复杂度O(N),N为要删除的元素个数
8)sinter&sinterstore
sinter
获取给定的set的交集
时间复杂度为O(N*M),n为最小的集合元素个数,m为最大的集合元素个数
返回值为交集的元素
sinterstore
获取给定set的交集中的元素并保存到目标set中
时间复杂度与sinter一样
返回值为交集的个数
9)sunion&sunionstore
sunion
获取给定set的并集中元素
时间复杂度为O(N),N为给定的所有集合的总的元素个数
返回值为并集的元素
sunionstore
把给定的set的并集放到另一个set中
时间复杂度与sunion一样
返回值为并集的元素个数
10)sdiff&sdiffstore
sdiff
获取给定set的差集中的元素
时间复杂度O(N),N为给定的所有集合的总元素个数
返回值为差集中的元素
sdiffstore
获取给定set的差集中的元素并保存到⽬标set中
时间复杂度O(N),N给定的所有集合的总的元素个数
返回值为差集的元素个数
2.内部编码
1)intset(整数集合)
当集合中的元素都是整数,并且元素的个数不多时。redis会使用intset来作为集合的内部实现,来减少内存的使用。
2)hashtable(哈希表)
当集合元素比较多或者不全为整数不满足intset时,redis会使用hashtable来实现内部编码
3.使用场景
1)作为标签
我们可以向用户的集合中添加标签,也可以向标签集合中添加用户
我们就可以通过这些来统计一些用户的共同特点,来进行一些推送
2)使用set计算共同好友
我们可以通过set的集合特点,通过求交集的方式,来求出共同好友,并且可以通过并集和差集再做一些好友推送的功能
3)使用Set统计UV
这里用到set的去重的特点
我们来理解下什么是UV
一个互联网通常使用PV和UV来衡量用户量
PV:用户每次访问服务器都会产生一个PV
UV:每个用户,访问服务器都会有一个UV,但是同一个用户多次访问UV不会变化
这就是PV与UV的区别,使用set的去重功能可以很好的实现UV
(二)zset
zset叫做有序集合,我们说set里的元素是不可以重复的且是无序的,而zset保留了我们元素不可以重复,但是元素间是有序的了,那既然有序就一定会根据一个标准来判断大小,那这个判断的标准就是每个元素带着的唯一的浮点类型的分数(score)
那这个有序,我们默认是升序
列表.集合.有序集合三者的异同点
1.zset的一些命令
1)zadd
用来向有序集合中添加或者更新元素的方法,注意我们是有序集合,所以要在后面再填上关联的分数,分数要符合double类型(inf和-inf作为最大值和最小值)
我们zadd命令有很多参数
xx:我们之前说过,用于更新已经存在的元素,更新后我们仍要保持有序
nx:与xx相对,用于添加元素,不会更新存在的元素
ch:zadd默认的返回值是这次新添加的元素,并不会返回更新的元素,而使用这个参数后,这次的返回值就会包含更新元素的个数
incr:我们说元素会携带一个自己的分数,这个会使我们的分数+1
同时这里我们阅读redis官方文档还会发现有两个参数这里没有写
时间复杂度为O(logN),返回值为本次成功添加的元素个数
2)zcard
获取一个zset的基数,也就是zset的元素个数
时间复杂度是O(1),返回值为zset的元素个数
3)zcount
我们说每个元素都携带一个自己的分数,这个命令可以根据分数区间来查询元素个数
之前在查询给定区间的数目时我们就说,redis默认查询是闭区间,那么我们怎么查询给定区间的开区间呢?这里redis还是比较独特的,我们一般会认为是使用()来括起来,但是实际上,redis只使用(
时间复杂度O(logN),返回值为满足的元素列表个数
4)zrange&zrevrange
zrange
返回指定区间里的元素,我们可以通过加上withscores这个参数来把分数也一起返回
我们要注意,这里跟zcount有一个很大的区别,zcount是通过分数来查询,而zrange是根据下标来查询
时间复杂度为O(log(N)+M),返回值为区间内的元素列表
zrevrange
返回指定区间里的元素,分数按找降序来排序其余和zrange是一样的
时间复杂度为O(log(N)+M),返回值为区间内的元素列表
5)zrangebyscore
从名字可看出,这个是根据元素携带的分数来进行返回
这里跟zcount一样,都可以使用( 来使用开区间
时间复杂度为O(log(N)+M),返回值为区间内的元素列表
6)zpopmax&bzpopmax
用来删除并且返回分数最高的count个元素,如果分数相同就会按照字典序来进行删除
时间复杂度为O(log(N)*M)而之所以是这个时间复杂度,是因为我们在zset中查找一个元素的时间复杂度是logN,然后我们要删除count个就需要*M
但是我个人认为,redis源码中记录了zset中的最后一个元素,为什么不直接进行删除?可能是因为redis的设计者图方便直接调用了一个通用的删除函数。给定一个member值,查找到位置后进行删除,所以这里是可以进行优化的。
返回值为分数和元素列表
bzpopmax(我们这里有关的阻塞时间单位都是S)
zpopmax的阻塞版本,也是用来删除最大的元素,可以用多个有序集合中删除
时间复杂度为O(logN),返回值是从那个有序集合删除,和删除的元素及其分数
7)zpopmin&bzpopmin
zpopmin
删除并返回分数最低的count个元素
时间复杂度O(log(N)*M),返回值为分数和元素列表
bzpopmin
时间复杂度为O(logN),返回值为元素列表
8)zrank&zrevrank
zrank
返回指定元素的排名(升序返回)
这里是根据member来返回,返回的排名其实就是他的下标
时间复杂度为O(logN),返回值为排名的下标
zrevrank
返回指定元素的排名(降序返回)
时间复杂度为O(logN),返回值为排名的下标
9)zscore
返回指定元素的分数,通过member来查询
时间复杂度为O(1),这里之所以是O(1),是因为redis做了一些特殊优化,通过舍弃一些空间,来把时间复杂度进行优化,返回值就是对应member的score
10)zrem
删除指定的元素
时间复杂度为O(log(N)*M),返回值为操作删除的元素个数
11)zremrangebyrank&zremrangebyscore
zremrangebyrank
按照顺序删除一个范围内的所有元素
时间复杂度为O(logN+M),返回值就是删除元素的个数
zremrangebyscore
时间复杂度为O(logN+M),返回值就是删除元素的个数
12)zincrby
给指定的member对应的score加上一个值
时间复杂度:O(log(N)) 返回值:增加后元素的分数
集合间的一些操作
zinterstore,zunionstore,与set类似,都是求交集或者并集后放到另一个有序集合中
这里的numkeys是指定后面有多少个key,为了防止类似粘包问题
2.zset的内部编码
ziplist:这个我们在list和hash中都有这样的内部编码,当有序集合的元素个数少于一定数目,就会使用ziplist来作为有序集合的内部实现,用来减少内存的使用,但是元素过多就会导致元素操作变慢。
skiplist:当ziplist条件不满足时,就会使用skiplist作为内部实现,skiplist就相当于是一个复杂链表,链表指向的下一个元素是跳跃性的,通过一定计算也可以保证访问元素的时间复杂度为O(logN)
3.使用场景
有序集合因为内置了score所以最合适的使用场景就是排行榜系统
因为排行榜用zset来实现是非常简单的,如果我们要统计排名,只需要把他的分数当作score,zset会自动给我们进行排序,然后形成排行榜,然后按照下标来进行范围查询,如果我们分数改变,也可以使用zincrby来修改分数,排行的顺序也可以自动调整
上述只根据一个score来排序是很容易的,但是我们大多数情况下,单一一个分数是不可以得出排行的,比如微博的热度榜,我们要综合一条微博的浏览量,点赞量,转发量等,根据不同的比例来计算,得到综合得分,通过这个得分来排序得到排行榜
这时我们可以使用zinterstore和zunionstore的方式处理,把每个值放到对应的有序集合中,然后使用这两条指令,来进行运算并且放到一个新有序集合的,这时得到的新集合就是排行榜