当前位置: 首页 > article >正文

【力扣白嫖日记】SQL

前言

练习sql语句,所有题目来自于力扣(https://leetcode.cn/problemset/database/)的免费数据库练习题。

今日题目:

1661.每台机器的进程平均运行时间
表:Activity

列名类型
machine_idint
process_idint
activity_typeenum
timestampfloat

该表展示了一家工厂网站的用户活动。

  • (machine_id, process_id, activity_type) 是当前表的主键(具有唯一值的列的组合)。machine_id 是一台机器的ID号。process_id 是运行在各机器上的进程ID号。
  • activity_type 是枚举类型 (‘start’, ‘end’)。
  • timestamp 是浮点类型,代表当前时间(以秒为单位)。
  • ‘start’ 代表该进程在这台机器上的开始运行时间戳 , ‘end’ 代表该进程在这台机器上的终止运行时间戳。同一台机器,同一个进程都有一对开始时间戳和结束时间戳,而且开始时间戳永远在结束时间戳前面。

现在有一个工厂网站由几台机器运行,每台机器上运行着 相同数量的进程 。编写解决方案,计算每台机器各自完成一个进程任务的平均耗时。

完成一个进程任务的时间指进程的’end’ 时间戳 减去 ‘start’ 时间戳。平均耗时通过计算每台机器上所有进程任务的总耗费时间除以机器上的总进程数量获得。

结果表必须包含machine_id(机器ID) 和对应的 average time(平均耗时) 别名 processing_time,且四舍五入保留3位小数。

以 任意顺序 返回表。


我那不值一提的想法:

  • 首先梳理表内容,题干给了一张活动表,记录了一台机器的id,进程id,活动类型有开始和结束,时间戳。
  • 其次分析需求,需要得到每台机器上完成一个任务的平均耗时。
  • 我认为,首先要确定这个平均耗时的定义,也就是如何计算。也就是每台机器,每个进程从开始到结束状态,之间的时间戳的差,再除以进程数量。基本公式就是(结束时间戳-开始时间戳)/进程数量。
  • 那么我们该如何表示每台机器的每个进程的平均用时呢,每台机器也就是group by machine_id,每个进程也就是group by process_id,每台机器,每个进程也就是group by machine_id,process_id
  • 每台机器的每个进程的问题解决了,那结束和开始怎么表示呢,我的第一个想法就是max和min,既然分开始和结束那么结束的时间一定最大,开始的时间一定最小,直接用(max(timestamp)-min(timestamp))那么代码如下:
select machine_id,max(timestamp)-min(timestamp)/count(distinct process_id)as processing_time
from Activity
group by machine_id,process_id

在这里插入图片描述

结果出现差错,但可以看到我们的结果只和答案差了一个求和然后取小数点后三位。于是我就想当然的直接加sum,也就是这样:sum(max(timestamp)-min(timestamp)/count(distinct process_id)),但是这样的语法是错误的,数据库识别不到timestamp,因为在group by 里面没有timestamp。所以这样不行。于是到这里我就卡住了,后来我想,既然数据库不行,那么我可以直接把我这个的搜索结果当成一个临时表a,从临时表a里面聚合然后求和得到我们的结果,也就是这样:

select a.machine_id,round(sum(a.processing_time)/count(a.processing_time),3) as processing_time
from 
    (select machine_id,max(timestamp)-min(timestamp)/count(distinct process_id) as processing_time
    from Activity
    group by machine_id,process_id
    ) as a 
group by machine_id

这样就能得出我们的正确结果了。


结果:

在这里插入图片描述


总结:

能运行就行。



http://www.kler.cn/news/232529.html

相关文章:

  • 【GAMES101】Lecture 19 透镜
  • Vue3编写简单的App组件(二)
  • Linux系统安全之iptables防火墙
  • MATLAB实现LSTM时间序列预测
  • 7机器人位姿的数学描述与坐标变
  • windowsserver 2016 PostgreSQL9.6.3-2升级解决其安全漏洞问题
  • 后端的技术设计文档
  • 实例分割论文阅读之:FCN:《Fully Convolutional Networks for Semantica Segmentation》
  • impala与kudu进行集成
  • 【linux温故】linux调度机制
  • Ubuntu22.04 gnome-builder gnome C 应用程序习练笔记(二)
  • ArcGISPro中Python相关命令总结
  • 【RPA】智能自动化的未来:AI + RPA
  • 转融通业务是什么?好处和弊端是什么?
  • 全栈笔记_插件篇(用Volar替换Vuter)
  • Redis之基础篇
  • 【算法练习】leetcode算法题合集之其他篇
  • QT基础教程(全系列教程目录)
  • Java学习笔记------API
  • Flink Checkpoint过程
  • 一周学会Django5 Python Web开发-Django5创建项目(用命令方式)
  • Python数据分析 可视化数据Seaborn图表 这篇就够了
  • 【lesson47】进程通信之system V(共享内存)补充知识
  • PgSQL技术内幕 - case when表达式实现机制
  • 【Linux系统学习】3.Linux用户和权限
  • C++2024寒假J312实战班2.6
  • C语言冒泡排序介绍
  • 面试复盘——10
  • C++三剑客之std::any(一) : 使用
  • 【MySQL进阶之路】BufferPool底层设计(下)