当前位置: 首页 > article >正文

做题笔记:SQL Sever 方式做牛客SQL的题目--SQL156

----SQL156 各个视频的平均完播率
问题:计算2021年里有播放记录的每个视频的完播率(结果保留三位小数),并按完播率降序排序
注:视频完播率是指完成播放次数占总播放次数的比例。
简单起见,结束观看时间与开始播放时间的差>=视频时长时,视为完成播放。
输出顺序:video_id | avg_comp_play_rate

表的创建及数据的插入:

DROP TABLE IF EXISTS tb_user_video_log, tb_video_info;
CREATE TABLE tb_user_video_log
(
    id         INT PRIMARY KEY identity,-- '自增ID',
    uid        INT NOT NULL,-- '用户ID',
    video_id   INT NOT NULL,-- '视频ID',
    start_time datetime,-- '开始观看时间',
    end_time   datetime,-- '结束观看时间',
    if_follow  TINYINT,-- '是否关注',
    if_like    TINYINT,-- '是否点赞',
    if_retweet TINYINT,-- '是否转发',
    comment_id INT,--'评论ID'
);

CREATE TABLE tb_video_info
(
    id           INT PRIMARY KEY identity,-- '自增ID',
    video_id     INT UNIQUE  NOT NULL,-- '视频ID',
    author       INT         NOT NULL,-- '创作者ID',
    tag          VARCHAR(16) NOT NULL,-- '类别标签',
    duration     INT         NOT NULL,-- '视频时长(秒数)',
    release_time datetime    NOT NULL,-- '发布时间'
);

INSERT INTO tb_user_video_log(uid, video_id, start_time, end_time, if_follow, if_like, if_retweet, comment_id)
VALUES (101, 2001, '2021-10-01 10:00:00', '2021-10-01 10:00:30', 0, 1, 1, null),
       (102, 2001, '2021-10-01 10:00:00', '2021-10-01 10:00:24', 0, 0, 1, null),
       (103, 2001, '2021-10-01 11:00:00', '2021-10-01 11:00:34', 0, 1, 0, 1732526),
       (101, 2002, '2021-09-01 10:00:00', '2021-09-01 10:00:42', 1, 0, 1, null),
       (102, 2002, '2021-10-01 11:00:00', '2021-10-01 11:00:30', 1, 0, 1, null),
		
		(103, 2002, '2021-10-01 10:59:05', '2021-10-01 11:00:05', 1, 0, 1, null),
		(101, 2003, '2020-09-01 10:00:00', '2020-09-01 10:01:42', 1, 0, 1, null),
		(102, 2003, '2021-09-01 10:00:00', '2021-09-01 10:00:42', 1, 0, 1, null);

INSERT INTO tb_video_info(video_id, author, tag, duration, release_time)
VALUES (2001, 901, '影视', 30, '2021-01-01 7:00:00'),
       (2002, 901, '美食', 60, '2021-01-01 7:00:00'),
       (2003, 902, '旅游', 90, '2021-01-01 7:00:00');

解题思路:
① 所查信息涉及两表,所以需要多表查询 - join
② 视频每次播放的实际时间 = 结束时间 - 开始时间

datediff(second,start_time,end_time)		--时间差,以秒为单位

③ 以视频分组,比较实际播放时间>= 视频时长(秒数) 的并统计个数 / 视频播放总次数
④ 筛选2021年的数据

查询如下:

 select video_id,
		Convert(decimal(18,3),count(iif(watch_time >= duration,1,null))* 1.0 / count(video_id)) avg_comp_play_rate
 from (
		 select tu.video_id,year(start_time) as year_v,datediff(second,start_time,end_time)  as watch_time,tv.duration
		 from tb_user_video_log tu
		 join tb_video_info tv
		 on tu.video_id = tv.video_id
		)t
 where year_v = '2021'
 group by video_id

上述查询用了一层嵌套,有利于在写查询时候理清思路,可以优化简洁代码如下:

 select tu.video_id,
		Convert(decimal(18,3),count(iif(datediff(second,start_time,end_time) >= duration,1,null))* 1.0 / count(tu.video_id)) avg_comp_play_rate
 from tb_user_video_log tu
 join tb_video_info tv
 on tu.video_id = tv.video_id
 where year(start_time) = '2021'
 group by tu.video_id

做题总结:
① 需要注意count(iif(watch_time >= duration,1,null))的使用,在开始null处写的0是错误的,count统计返回的元素个数1或0都会被统计,所以导致最后完播率都是100%,如果返回是null则不会被count统计,可筛选出符合要求的数据。如果想反回0,可以用sum函数替换count函数:sum(iif(watch_time >= duration,1,0))
DATEDIFF 函数
DATEDIFF函数用于计算两个日期之间的差异,可以以天、小时、分钟、秒等不同的单位来返回结果。
DATEDIFF的基本语法如下:

DATEDIFF(datepart, startdate, enddate)

在次语法中:
datepart 表示需要计算的时间单位,可以是以下值之一:
“year”(年);“quarter”(季度);“month”(月)
“day”(天);“hour”(小时);“minute”(分钟)
“second”(秒)
startdate 表示起始日期;enddate 表示结束日期。
Convert 函数

Convert(decimal(18,3), x * 1.0 / y)

Convert 函数将x/y的结果转化为decimal(18,3)数据类型:decimal(18,3)是一种数据类型,用于存储具有总共18位数值的数字,其中包括3位小数,即保留三位小数


http://www.kler.cn/news/163308.html

相关文章:

  • 什么是Nginx反向代理?Nginx反向代理配置指南
  • Centos图形化界面封装OpenStack Centos镜像
  • Kubernetes(K8s)数据存储-09
  • c/c++中一些不常用但有用的知识
  • 【数据结构】插入排序,希尔排序,选择排序,堆排序,冒泡排序
  • 限流算法,基于go的gRPC 实现的
  • 阿里云磁盘在线扩容
  • 生信技能30 - 获取CNV开始位置和结束位置所在的染色体区带
  • L1-028:判断素数
  • JavaScript常用技巧专题一
  • Flink流批一体计算(23):Flink SQL之多流kafka写入多个mysql sink
  • 达梦数据库dm8守护集群部署手册
  • 浅谈Elastic Stack组件集成和应用
  • (时域和频域)控制系统响应速度和稳定性分析
  • 三种定时任务总结
  • C# .NET平台提取PDF表格数据,并转换为txt、CSV和Excel表格文件
  • 【51单片机系列】74HC595实现对LED点阵的控制
  • JS中的闭包
  • 做数据分析为何要学统计学(5)——什么问题适合使用t检验?
  • C语言 - 字符函数和字符串函数
  • 【vSphere | VM】虚拟机自定义规范Ⅲ —— 创建 Linux 虚拟机自定义规范
  • mongdb配置ssl
  • 用Python实现十大经典排序算法(附动图)
  • 周赛374(枚举、思维题、分组循环+枚举、组合数学)
  • Docker网络原理及Cgroup硬件资源占用控制
  • Apollo新版本Beta自动驾驶技术沙龙参会体验有感—百度自动驾驶开源框架
  • 电脑软件:TileIconifier开始菜单美化工具介绍
  • 大电流H桥电机驱动电路的设计与解析(包括自举电路的讲解,以IR2104+LR7843为例)
  • linux常用命令-yum命令详解(超详细)
  • 视频处理关键知识