当前位置: 首页 > article >正文

经典sql题(一)求连续登录不少于三天用户

示例数据

假设我们的 test 表有以下数据:

iddate
12023-10-01 08:00:00
12023-10-01 09:00:00
12023-10-02 10:00:00
12023-10-03 11:00:00
22023-10-01 10:00:00
22023-10-02 12:00:00
22023-10-03 14:00:00
22023-10-04 15:00:00
32023-10-01 16:00:00
第一步:去重并提取日期
SELECT 
    id,
    SUBSTR(date, 1, 10) AS date1
FROM 
    test
GROUP BY 
    id, SUBSTR(date, 1, 10);

结果(表 table1):

iddate1
12023-10-01
12023-10-02
12023-10-03
22023-10-01
22023-10-02
22023-10-03
22023-10-04
32023-10-01
第二步:为每个用户和日期生成序列号
SELECT 
    id,
    date1,
    DATE_SUB(date1, INTERVAL ROW_NUMBER() OVER (PARTITION BY id ORDER BY date1) DAY) AS date2
FROM (
    SELECT 
        id,
        SUBSTR(date, 1, 10) AS date1
    FROM 
        test
    GROUP BY 
        id, SUBSTR(date, 1, 10)
) AS table1;  -- 使用 'table1' 作为别名

结果(表 table2):

iddate1date2
12023-10-012023-10-01
12023-10-022023-10-01
12023-10-032023-10-01
22023-10-012023-10-01
22023-10-022023-10-01
22023-10-032023-10-01
22023-10-042023-10-01
32023-10-012023-10-01
第三步:统计连续的登录天数
SELECT 
    id,
    date2,
    COUNT(*) AS day_cnt
FROM (
    SELECT 
        id,
        date1,
        DATE_SUB(date1, INTERVAL ROW_NUMBER() OVER (PARTITION BY id ORDER BY date1) DAY) AS date2
    FROM (
        SELECT 
            id,
            SUBSTR(date, 1, 10) AS date1
        FROM 
            test
        GROUP BY 
            id, SUBSTR(date, 1, 10)
    ) AS table1  -- 保持一致,使用 'table1'
) AS table2  -- 使用 'table2' 作为新的别名
GROUP BY 
    id, date2
HAVING 
    COUNT(*) >= 3;

结果(最终结果):

iddate2day_cnt
12023-09-303
22023-09-304

完整步骤解析

  1. 去重提取日期

    • 查询:提取每个用户的唯一登录日期。
    • 结果表 table1:显示每个用户的唯一日期。
  2. 为每个用户生成序列号

    • 查询:为每个用户的日期生成序号,并计算 date2
    • 结果表 table2:显示用户的日期和对应的 date2
  • 步骤
    • 使用 ROW_NUMBER() 函数,按照日期顺序为每个用户的登录日期分配一个序号。

    • 例如,对于用户 ID = 1,假设他们的日期是 2023-10-012023-10-022023-10-03ROW_NUMBER() 将为它们生成序号 1、2 和 3。

    • date2 是通过将每个日期减去它的序号得到的。这个操作的目的是为了检测连续的日期。

    • 例如:

      • 对于 2023-10-01,序号是 1,计算为 2023-10-01 - 1,得到 2023-09-30
      • 对于 2023-10-02,序号是 2,计算为 2023-10-02 - 2,得到 2023-09-30
      • 对于 2023-10-03,序号是 3,计算为 2023-10-03 - 3,得到 2023-09-30

通过这样的计算,我们可以将连续的日期归类到同一个组中。因为给定的 date2 值会相同(如上例中都是 2023-09-30),这使得后续的统计操作(如计算连续登录天数)变得简单。具体来说:

  • 连续性检测:当两个日期的 date2 相同,说明它们是连续的。因此,进行统计时可以通过分组 date2 来确定每个用户连续登录的天数。

以用户 ID = 1 为例:

iddate1ROW_NUMBERdate2
12023-10-0112023-09-30
12023-10-0222023-09-30
12023-10-0332023-09-30
  1. 统计连续的登录天数
    • 查询:根据 date2 统计每个用户的连续登录天数,筛选出连续登录天数大于等于3天的用户。
    • 最终结果:显示符合条件的用户 ID 和连续登录天数。

http://www.kler.cn/news/309833.html

相关文章:

  • Android 源码多个Launcher设置默认Launcher
  • 栈和队列OJ题C语言版
  • GDPU Vue前端框架开发 计数器
  • 机器学习实战—天猫用户重复购买预测
  • 论文不会写?分享6款AI论文写作免费一键生成网站!
  • 老友记台词 第二季 第一集 Friends 201(全英版)
  • Java 21的Enhanced Deprecation的笔记
  • 【小鹏汽车用户平台-注册安全分析报告-无验证方式导致安全隐患】
  • mac电脑命令行获取电量
  • PHP仓库物资出入库管理系统小程序源码
  • OTA升级
  • Python urllib
  • 智能化大数据平台引领企业迈向精准决策时代
  • java中的集合之List
  • 828华为云征文|华为Flexus云服务器搭建OnlyOffice私有化在线办公套件
  • 镀金引线---
  • SQL数据库(MySQL)
  • 软件测试笔试面试汇总(二)(附答案)
  • 通信工程学习:什么是EPON以太网无源光网络
  • 大模型持续影响劳动力市场,普通人如何抢占风口?
  • Redis网络模型、通信协议、内存回收
  • 2023 hnust 湖科大 毕业实习 报告+实习鉴定表
  • Leetcode—合并两个有序数组
  • 二叉搜索树(Java实现)
  • fastjson2 解决long类型带L尾缀的value
  • 【web前端】数组array、集合set、字典map、对象object、字符串string常见方法合集
  • 文件操作
  • OrionX GPU算力池助力AI OCR场景应用
  • git 更换远程地址的方法
  • [产品管理-15]:NPDP新产品开发 - 13 - 产品创新流程 - 具体产品的创新流程:精益生产与敏捷开发