当前位置: 首页 > article >正文

SQL偏移类窗口函数—— LAG()、LEAD()用法详解

SQL偏移类窗口函数:LAG()LEAD() 用法详解

在这里插入图片描述

在 SQL 中,偏移类窗口函数 LAG()LEAD() 用于访问当前行的前几行或后几行的值。

1. LAG() 函数

在这里插入图片描述

LAG() 函数返回当前行的前几行的数据。

LAG(Expression, OffSetValue, DefaultVar) OVER (
    PARTITION BY [Expression]
    ORDER BY Expression [ASC|DESC]
);
  • expression🍔: 你想要获取的列或表达式。
  • offset🍟 (可选): 你希望向前偏移的行数。默认是 1,表示获取前一行的数据。
  • default_value🍿 (可选): 如果当前行之前没有足够的行,返回的默认值。默认是 NULL,如果没有设置 default_value,且当前行是窗口的第一行或没有前几行数据时,返回 NULL
  • PARTITION BY🥓 (可选): 按某列分组计算窗口函数,类似于 GROUP BY。如果没有此项,整个数据集视为一个窗口。
  • ORDER BY🥩: 按照某列排序,确定偏移的顺序。

Demo🍕🍕🍕🍕🍕🍕:

表格数据😎

sales 表,表结构和数据如下:

idmonthrevenue
1Jan100
2Feb150
3Mar200

Demo🍕🍕:基础用法

使用 LAG() 函数来获取按月排序后的“revenue”列的前一行的值

SELECT  id, 
		month, 
		revenue, 
		LAG(revenue) OVER (ORDER BY month) AS prev_revenue
FROM sales;
idmonthrevenueprev_revenue
1Jan100NULL
2Feb150100
3Mar200150

Tips🍬🍬:

  • 第一行没有前一行,所以 prev_revenueNULL
  • 第二行的 prev_revenue 为第一行的 revenue 值(100)。
  • 第三行的 prev_revenue 为第二行的 revenue 值(150)。

Demo🍕🍕:带偏移量的 LAG() 函数

使用 LAG() 函数,并指定偏移量为 2,获取两行之前的“revenue”值。

SELECT  id, 
		month, 
		revenue, 
		LAG(revenue, 2) OVER (ORDER BY month) AS prev_revenue
FROM sales;
idmonthrevenueprev_revenue
1Jan100NULL
2Feb150NULL
3Mar200100

Tips🍬🍬:

  • 第一行和第二行都没有两行之前的记录,所以 prev_revenueNULL
  • 第三行的 prev_revenue 为第一行的 revenue 值(100)。

Demo🍕🍕:带默认值的 LAG() 函数

使用 LAG() 函数,并指定默认值为 0,当无法获取前一行的值时返回默认值。

SELECT  id, 
		month, 
		revenue, 
		LAG(revenue, 1, 0) OVER (ORDER BY month) AS prev_revenue
FROM sales;
idmonthrevenueprev_revenue
1Jan1000
2Feb150100
3Mar200150

Tips🍬🍬:

  • 使用 LAG(revenue, 1, 0) 来获取前一行的“revenue”值,如果没有前一行则返回默认值 0
  • 第一行没有前一行,所以 prev_revenue0
  • 第二行的 prev_revenue 为第一行的 revenue 值(100)。
  • 第三行的 prev_revenue 为第二行的 revenue 值(150)。

Demo🍕🍕: LAG() 函数,比较每一天的销售额与前一天的销售额的差异。

SELECT
    sale_date,
    amount,
    LAG(amount, 1, 0) OVER (ORDER BY sale_date) AS previous_day_amount,
    amount - LAG(amount, 1, 0) OVER (ORDER BY sale_date) AS difference
FROM sales;
  • LAG(amount, 1, 0):这行的 LAG 函数表示获取前一天(前一行)的 amount 列的值,如果前一天没有数据(例如第一行),则返回 0
  • 通过 ORDER BY sale_date,确保按日期顺序排列数据。
sale_dateamountprevious_day_amountdifference
2025-01-011000100
2025-01-0215010050
2025-01-0320015050
2025-01-04180200-20

2. LEAD() 函数

在这里插入图片描述

LEAD() 函数与 LAG() 类似,但它返回的是当前行的后几行的数据。

LEAD(Expression, OffSetValue, DefaultVar) OVER (
    PARTITION BY [Expression]
    ORDER BY Expression [ASC|DESC]
);

  • expression🍔: 你想要获取的列或表达式。
  • offset🍟 (可选): 你希望向前偏移的行数。默认是 1,表示获取前一行的数据。
  • default_value🍿 (可选): 如果当前行之前没有足够的行,返回的默认值。默认是 NULL,如果没有设置 default_value,且当前行是窗口的第一行或没有前几行数据时,返回 NULL
  • PARTITION BY🥓 (可选): 按某列分组计算窗口函数,类似于 GROUP BY。如果没有此项,整个数据集视为一个窗口。
  • ORDER BY🥩: 按照某列排序,确定偏移的顺序。

Demo🍕🍕:基础用法

使用 LEAD() 函数来获取按月排序后的“revenue”列的后一行的值。

SELECT  id, 
		month, 
		revenue, 
		LEAD(revenue) OVER (ORDER BY month) AS next_revenue
FROM sales;
idmonthrevenuenext_revenue
1Jan100150
2Feb150200
3Mar200NULL

Tips🍬🍬:

  • 第一行的 next_revenue 为第二行的 revenue 值(150)。
  • 第二行的 next_revenue 为第三行的 revenue 值(200)。
  • 第三行没有后续行,所以 next_revenueNULL

Demo🍕🍕:带偏移量的 LEAD() 函数

使用 LEAD() 函数,并指定偏移量为 2,获取两行之后的“revenue”值。

SELECT  id, 
		month,
		revenue, 
		LEAD(revenue, 2) OVER (ORDER BY month) AS next_revenue
FROM sales;
idmonthrevenuenext_revenue
1Jan100200
2Feb150NULL
3Mar200NULL

Tips🍬🍬:

  • 使用 LEAD(revenue, 2) 来获取两行之后的“revenue”值。
  • 第一行的 next_revenue 为第三行的 revenue 值(200)。
  • 第二行和第三行都没有两行之后的记录,所以 next_revenueNULL

Demo🍕🍕:带默认值的 LEAD() 函数

使用 LEAD() 函数,并指定默认值为 0,当无法获取后一行的值时返回默认值。

SELECT id, month, revenue, LEAD(revenue, 1, 0) OVER (ORDER BY month) AS next_revenue
FROM sales;
idmonthrevenuenext_revenue
1Jan100150
2Feb150200
3Mar2000

Tips🍬🍬:

  • 使用 LEAD(revenue, 1, 0) 来获取后一行的“revenue”值,如果没有后一行则返回默认值 0
  • 第一行的 next_revenue 为第二行的 revenue 值(150)。
  • 第二行的 next_revenue 为第三行的 revenue 值(200)。
  • 第三行没有后一行,所以 next_revenue0

Demo🍕🍕:LEAD() 函数,比较每一天的销售额与下一天的销售额的差异。

SELECT
    sale_date,
    amount,
    LEAD(amount, 1, 0) OVER (ORDER BY sale_date) AS next_day_amount,
    LEAD(amount, 1, 0) OVER (ORDER BY sale_date) - amount AS difference
FROM sales;
  • LEAD(amount, 1, 0):这行的 LEAD 函数表示获取下一天(下一行)的 amount 列的值。如果下一天没有数据(例如最后一行),则返回 0
  • 通过 ORDER BY sale_date,确保按日期顺序排列数据。
sale_dateamountnext_day_amountdifference
2025-01-0110015050
2025-01-0215020050
2025-01-03200180-20
2025-01-041800-180

最后再来一个小练习(lc会员题):查找电影院所有连续可用的座位。

在这里插入图片描述
在这里插入图片描述

WITH t1 AS (
    SELECT
        seat_id,  -- 选择座位ID
        free,  -- 选择当前座位的空闲状态
        lag(free, 1, 999) OVER() AS pre,  -- 获取当前座位前一个座位的空闲状态,默认值为 999
        lead(free, 1, 999) OVER() AS next  -- 获取当前座位后一个座位的空闲状态,默认值为 999
    FROM Cinema  -- 从 Cinema 表中选择数据
)

SELECT
    seat_id  -- 返回座位ID
FROM t1  -- 从 t1 子查询中选择数据
WHERE 
    free = 1  -- 当前座位为空闲
    AND (pre = 1 OR next = 1)  -- 前一个座位或后一个座位为空闲
ORDER BY seat_id;  -- 按座位ID升序排序

思路:

  1. lag(free, 1, 999)lead(free, 1, 999):

    • lag(free, 1, 999) 用于获取当前座位前一个座位的 free 值(默认为 999,表示没有前一个座位)。
    • lead(free, 1, 999) 用于获取当前座位后一个座位的 free 值(默认为 999,表示没有后一个座位)。
  2. free = 1(pre = 1 OR next = 1):

    • 只选择当前座位是空闲的 (free = 1)。
    • 选择那些前一个或后一个座位也是空闲的 (pre = 1 OR next = 1),表示这些座位是连续空闲的。
  3. ORDER BY seat_id:

    • 确保最终返回的结果按座位 ID 升序排序。

seat_idfree
11
20
31
41
51

通过执行查询,得到的 t1 子查询结果:

seat_idfreeprenext
119990
2011
3101
4111
511999

t1 中筛选出满足 free = 1(pre = 1 OR next = 1) 的行,得到的结果:

seat_id
3
4
5

整理不易,一键三连呀列位🤣


http://www.kler.cn/a/464986.html

相关文章:

  • 深入理解 pytest Fixture 方法及其应用
  • Framebuffer 驱动
  • GitHub Fork 和 Clone 的深度指南:操作解析与 Pull Request 完整流程20241231
  • zookeeper+kafka
  • golang 编程规范 - 项目目录结构
  • 深入解析爬虫中的算法设计:提升效率与准确度
  • Leetcode 从前序与中序遍历序列构造二叉树
  • B端UI设计规范是什么?
  • 汽车驾校转型做无人机执照培训详解, “驾” 起无人机培训新未来?
  • 大模型LLM-MMOE
  • leetcode 2658. 网格图中鱼的最大数目
  • 【20250101】Nature正刊:纯仿真强化学习得到外骨骼机器人的自适应控制策略
  • 深入浅出:Spring Boot 自定义消息转换器的实现与应用
  • 【单片机】NPN+PNP组成的高边开关无法完全关断
  • SpringBoot与Vue实现WebSocket心跳机制
  • 华为数通考试模拟真题(附带答案解析)题库领取
  • GAN对抗生成网络(二)——算法及Python实现
  • 多输入多输出 | Matlab实现WOA-CNN鲸鱼算法优化卷积神经网络多输入多输出预测
  • C# 设计模式(行为型模式):责任链模式
  • 分布式微服务项目___某污水处理项目
  • Cornerstone3D:快速搭建可以读取本地文件且四视图显示的Nifti Viewer
  • golang后台框架总结
  • 计算机网络 (19)扩展的以太网
  • Centos 7.6 安装mysql 5.7
  • 静态库封装之ComDir类
  • 数据仓库建设方案和经验总结