当前位置: 首页 > article >正文

hive之LEAD 函数详解

1. 函数概述

LEAD 是 Hive 中的窗口函数,用于获取当前行之后指定偏移量处的行的值。常用于分析时间序列数据、计算相邻记录的差异或预测趋势。

2. 语法

LEAD(column, offset, default) OVER (
    [PARTITION BY partition_column] 
    [ORDER BY order_column [ASC|DESC]]
)
  • column: 要获取后续值的列。

  • offset (可选): 向后查找的行数,默认为 1。

  • default (可选): 无后续行时的默认值,默认为 NULL。

  • PARTITION BY: 将数据划分为多个窗口(类似分组)。

  • ORDER BY: 定义窗口内的排序方式。

3.代码示例 

CREATE TABLE sales_lead (
    sale_date STRING,
    salesperson STRING,
    amount INT
);

INSERT INTO sales_lead VALUES
('2023-01-01', 'Alice', 100),
('2023-01-02', 'Alice', 150),
('2023-01-03', 'Alice', 200),
('2023-01-01', 'Bob', 80),
('2023-01-02', 'Bob', 120);
---示例 1:获取下次销售额
SELECT 
    salesperson,
    sale_date,
    amount AS current_amount,
    LEAD(amount, 1, 0) OVER (
        PARTITION BY salesperson 
        ORDER BY sale_date
    ) AS next_amount
FROM sales_lead;

 

--示例 2:计算与下次销售的时间间隔
SELECT 
    salesperson,
    sale_date,
    LEAD(sale_date, 1) OVER (
        PARTITION BY salesperson 
        ORDER BY sale_date
    ) AS next_sale_date,
    DATEDIFF(
        LEAD(sale_date, 1) OVER (
            PARTITION BY salesperson 
            ORDER BY sale_date
        ), 
        sale_date
    ) AS days_diff
FROM sales_lead;


http://www.kler.cn/a/568478.html

相关文章:

  • 【重构小程序】升级JDK1.8、SpringBoot2.x 到JDK17、Springboot 3.x(一)
  • 算法刷题-2025年02月26日
  • JMeter 实战项目脚本录制最佳实践(含 BadBoy 录制方式)
  • 【Maven】基于IDEA进行Maven工程的创建、构建
  • 【前端场景面试】登录鉴权实现方式详解
  • 《论软件测试中缺陷管理及其应用》审题技巧 - 系统架构设计师
  • 【C++/数据结构】队列
  • uni-app 全局请求封装:支持 Promise,自动刷新 Token,解决 401 过期问题
  • 【数据结构】堆与二叉树
  • 基于SpringBoot和Leaflet的行政区划地图掩膜效果实战
  • 人工智能领域顶级期刊
  • 【经验帖】退出MobaXterm后桌面生成两个配置文件
  • Apifox 后置操作中发送请求
  • 【ISP】AF自动对焦
  • C++错误Call to implicitly-deleted default constructor of ‘SerialPortConfig‘
  • 图数据库Neo4j面试内容整理-水平扩展
  • 基因型—环境两向表数据分析——基因型评价
  • JS逆向-233网校sid参数和sign参数
  • 【Java计算机毕业设计】基于SSM+VUE保险公司管理系统数据库源代码+LW文档+开题报告+答辩稿+部署教程+代码讲解
  • 大语言模型的评测