当前位置: 首页 > article >正文

如何实现亿级用户在线状态统计?

亿级用户在线场景分析与解决方案

在这里插入图片描述

目录

  1. 亿级用户在线场景分析
  2. 解决方案
    • 2.1 基于总数的统计方案
    • 2.2 基于具体用户详情的统计方案
  3. 具体实现
    • 3.1 基于总数的统计方案
    • 3.2 基于用户标识的统计实现
    • 3.3 Spring Boot 中的实现
  4. 总结

1. 亿级用户在线场景分析

以 QQ 在线状态统计为例,其典型特征包括:数据量大、内存占用高、实时性要求高。传统的解决方案(如在数据库中为每个用户添加一个在线状态字段,上线设为 1,下线设为 0)在这种场景下显得力不从心。原因如下:

  • 数据库压力大:频繁的上、下线操作会导致数据库 IO 压力剧增。
  • 实时统计困难:频繁刷新查询会拖垮数据库性能,难以满足实时性要求。

因此,我们需要寻找更高效、更适合大规模场景的解决方案。


2. 解决方案

针对亿级用户在线状态统计,常见的解决方案可分为两类:

2.1 基于总数的统计方案

通过维护一个总在线人数计数器,用户上线时计数器加 1,下线时减 1,从而实现在线人数的统计。

优点
  • 实现简单,效率高。
  • 内存占用少。
缺点
  • 无法精确查询某个用户在某个时刻的在线状态。
  • 在异常退出应用的情况下,难以实现基于在线监测机制的重复下线判断。

2.2 基于具体用户详情的统计方案

将用户的标识(如 QQ 号)和在线状态存储在集合中,通过集合操作实现统计。

优点
  • 统计精准,可以查询某个用户在某个时刻的在线状态。
  • 在异常退出应用的情况下,可以精准地实现下线用户的去重功能。
缺点
  • 内存占用大。
  • 效率较低。

3. 具体实现

以下是两种方案的具体实现方式:

3.1 基于总数的统计方案

基于总数的统计可以通过以下两种方式实现:

3.1.1 基于 Redis 的 incrdecr 操作

使用 Redis 的 incr(加 1)和 decr(减 1)操作来维护在线人数计数器。用户上线时调用 incr,下线时调用 decr

3.1.2 基于 Redis 的 HyperLogLog

Redis 的 HyperLogLog(HLL)是一种高性能的基数(去重)统计数据结构,适用于大规模数据的去重统计。其优点是空间占用率极低(仅需 12KB 空间即可统计约 18 亿数据),但缺点是存在极低的误差率(约 0.81%)。HLL 的特点如下:

  • 无法移除元素。
  • 适合对误差容忍度较高的场景。

3.2 基于用户标识的统计实现

基于用户标识(如 QQ 号),可以使用 Redis 的 Bitmap(位数组) 来实现。Bitmap 的结构如下:

  • 每个下标表示一个具体的数字,值为 1 表示在线,值为 0 表示离线。
  • 例如,10 亿个数字占用的位数组空间为 10 亿 bit = 0.116 GB,空间占用量极小。
具体操作命令
  • 用户上线:使用 SETBIT 命令将对应位置设为 1。
  • 用户下线:使用 SETBIT 命令将对应位置设为 0。
  • 判断用户是否在线:使用 GETBIT 命令。
  • 统计在线用户数:使用 BITCOUNT 命令。

3.3 Spring Boot 中的实现

在 Spring Boot 项目中,可以使用 RedisTemplate 实现用户的上、下线设置以及在线人数统计。具体代码如下:

import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.data.redis.core.RedisTemplate;
import org.springframework.stereotype.Service;

@Service
public class BitmapService {

    @Autowired
    private RedisTemplate<String, Object> redisTemplate;

    /**
     * 设置 Bitmap 中的位
     * @param key 键
     * @param offset 偏移量
     * @param value 值(0 或 1)
     */
    public void setBit(String key, long offset, boolean value) {
        redisTemplate.opsForValue().setBit(key, offset, value);
    }

    /**
     * 获取 Bitmap 中的位
     * @param key 键
     * @param offset 偏移量
     * @return 位的值(0 或 1)
     */
    public boolean getBit(String key, long offset) {
        return redisTemplate.opsForValue().getBit(key, offset);
    }

    /**
     * 计算 Bitmap 中值为 1 的位的数量
     * @param key 键
     * @return 值为 1 的位的数量
     */
    public Long bitCount(String key) {
        return redisTemplate.opsForValue().bitCount(key);
    }
}

4. 总结

在处理亿级用户在线状态统计时,选择合适的方案至关重要。基于总数的统计方案虽然简单高效,但缺乏精准性;而基于用户标识的统计方案虽然精准,但内存占用较大。结合实际需求,可以选择以下路径:
如果对实时性和性能要求极高,且可以容忍少量误差,可以选择基于 Redis 的 HyperLogLog 或 Bitmap 方案。
如果需要精准查询用户的在线状态,且对内存占用和效率要求较低,可以选择基于用户标识的集合方案。


http://www.kler.cn/a/515029.html

相关文章:

  • KNN的调参方法
  • 快速入门Flink
  • qml Timer详解
  • WebSocket实现私聊私信功能
  • 总结 uniapp 上不适配iphone的:new Date 时间、border线条、渐变
  • 2. CSS 中的单位
  • .NET MAUI进行UDP通信(二)
  • 吴恩达深度学习——如何实现神经网络
  • 【2024年华为OD机试】 (E卷,100分) - 预订酒店(JavaScriptJava PythonC/C++)
  • Ubuntu20彻底删除MySQL8
  • WPS计算机二级•幻灯片的基础操作
  • Qt调用ffmpeg库实时播放rtmp或rtsp视频流
  • 【玩转全栈】----Django模板的继承
  • 使用Chrome和Selenium实现对Superset等私域网站的截图
  • 【学习笔记】计算机网络(一)
  • Ubuntu20.04 安装 cartographer
  • 深度学习笔记31_ResNet与DenseNet结合探索
  • Java数据结构 (从0构建链表(LinkedList))
  • 自动扣webpack框架演示 | 某书 x-xray-traceid 签名算法分析记录
  • 低代码系统-氚云、宜搭控件对比
  • hive 自动检测、自动重启、记录检测日志、自动清理日志
  • 《Java核心技术 卷II》获取Web数据提交表单数据
  • PIC单片机HEX文件格式分析
  • 人工智能学习(三)之机器学习基本概念
  • Oracle 深入学习 Part 13: Maintaining Data Integrity(数据完整性维护)
  • 如何使用 findIndex() 方法查找数组中的第一个匹配元素的索引?