当前位置: 首页 > article >正文

1.每日SQL----2024/11/7

题目:

计算用户次日留存率,即用户第二天继续登录的概率

表:

iddevice_iddate
121382024-05-03
232142024-05-09
332142024-06-15
465432024-08-13
523152024-08-13
623152024-08-14
723152024-08-15
832142024-05-09
932142024-08-15
1065432024-08-13
1123152024-08-13
1223152024-08-14
1323152024-08-15
1432142024-08-16
1532142024-08-18
1665432024-08-13
  • id 用户唯一标识符
  • device_id 用户登录使用的设备标识符
  • date 用户登录日期

你应该返回的结果:

avg_ret
0.3000

请认真思考后作答


解题思路

  1. 去重数据:首先,我们需要从原始数据中选择每个设备ID (device_id) 和对应的登录日期 (date),并去除重复项。这一步是为了确保每个设备在每个日期只有一条记录。

  2. 查找下一个登录日期:使用窗口函数 LEAD(),我们可以找到每个设备的下一个登录日期。LEAD() 函数会返回当前行之后的指定偏移量的行的值。这里我们将 LEAD() 应用在 date 列上,按 device_id 分区,并按 date 排序。

  3. 计算日期差:对于每一对连续的登录日期(当前日期 date1 和下一个日期 date2),我们使用 DATEDIFF() 函数计算它们之间的天数差。如果天数差为1,则表示用户在次日登录了。

  4. 计算次日留存率:使用 IF 语句,如果 DATEDIFF(date2, date1) = 1,则返回1,否则返回0。然后,对所有的这些0和1取平均值,得到次日留存率。

代码如下

select avg(if(datediff(date2, date1)=1, 1, 0)) as avg_ret
from (
    select
        distinct device_id,
        date as date1,
        lead(date) over (partition by device_id order by date) as date2
    from (
        select distinct device_id, date
        from user_detail
    ) as uniq_id_date
) as id_last_next_date

运行结果如下

在这里插入图片描述

本题的重点是lead开窗函数的使用,你学会了吗?下期见~

后附建表语句

drop table if  exists `user_detail`;
CREATE TABLE `user_detail` (
`id` int NOT NULL,
`device_id` int NOT NULL,
`date` date NOT NULL
);

INSERT INTO user_detail VALUES(1,2138,'2024-05-03');
INSERT INTO user_detail VALUES(2,3214,'2024-05-09');
INSERT INTO user_detail VALUES(3,3214,'2024-06-15');
INSERT INTO user_detail VALUES(4,6543,'2024-08-13');
INSERT INTO user_detail VALUES(5,2315,'2024-08-13');
INSERT INTO user_detail VALUES(6,2315,'2024-08-14');
INSERT INTO user_detail VALUES(7,2315,'2024-08-15');
INSERT INTO user_detail VALUES(8,3214,'2024-05-09');
INSERT INTO user_detail VALUES(9,3214,'2024-08-15');
INSERT INTO user_detail VALUES(10,6543,'2024-08-13');
INSERT INTO user_detail VALUES(11,2315,'2024-08-13');
INSERT INTO user_detail VALUES(12,2315,'2024-08-14');
INSERT INTO user_detail VALUES(13,2315,'2024-08-15');
INSERT INTO user_detail VALUES(14,3214,'2024-08-16');
INSERT INTO user_detail VALUES(15,3214,'2024-08-18');
INSERT INTO user_detail VALUES(16,6543,'2024-08-13');

http://www.kler.cn/a/385238.html

相关文章:

  • Windows下mysql数据库备份策略
  • 『大模型笔记』IBM技术团队:什么是智能体型RAG!
  • Vue Element-UI 选择隐藏表格中的局部字段信息
  • 关于在VS中使用Qt不同版本报错的问题
  • Hive 查询(详细实操版)
  • 后台管理系统窗体程序:评论管理
  • 计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-30
  • 为什么人工智能增强的威胁和法律不确定性成为风险主管最关心的问题
  • 5G智能对讲终端|北斗有源终端|北斗手持机|单兵|单北斗
  • Java | Leetcode Java题解之第543题二叉树的直径
  • 关于遥感影像BIL、BIP、BSQ你知道多少?给一个二进制文件你会读取嘛~
  • uniapp使用腾讯即时通讯IM(复制即可使用)
  • 小白初入Android_studio所遇到的坑以及怎么解决
  • Java I/O流面试之道
  • 【JavaScript】网络请求之Promise fetch Axios及异步处理
  • C++【string类,模拟实现string类】
  • [zotero]Ubuntu搭建WebDAV网盘
  • 二十三、Mysql8.0高可用集群架构实战
  • c++ 多态性
  • qt QErrorMessage详解
  • 利用API返回值实现商品信息自动化更新:技术与实践
  • 数据库(MySQL)核心知识点(持续更新)
  • pdf加水印(python学习)(11.4)
  • 【物联网技术】ESP8266 WIFI模块在STA模式下实现UDP与电脑/手机网络助手通信——UDP数据透传
  • 数据分析:宏基因组DESeq2差异分析筛选差异物种
  • 1: java练习专题1(关于if/while/for/do-while/switch)