当前位置: 首页 > article >正文

SQL 分析函数与聚合函数的组合应用

目标:掌握 SQL 中分析函数(窗口函数)与聚合函数的组合使用,通过实际案例实现复杂业务需求,如同比、环比和趋势分析。


1. 分析函数与聚合函数的区别

  • 聚合函数(Aggregate Functions):对多行数据进行汇总,返回一个结果。常见的有 SUMAVGCOUNTMAX 等。
  • 分析函数(Analytic/Window Functions):在不缩减行数的前提下,基于某个窗口执行计算。常见的有 SUM() OVERRANK()LEAD()LAG() 等。

2. 核心函数介绍

  • SUM() OVER:在特定窗口内累加数据,返回每一行对应窗口的累积值。
  • AVG() OVER:在窗口内计算平均值,常用于移动平均。
  • PERCENT_RANK():计算当前行在窗口内的百分比排名。

3. 案例:计算用户每月销售额及同比、环比增长率

需求描述
  1. 计算每个用户在每个月的总销售额。
  2. 计算每个月的环比增长率(本月与上月相比)。
  3. 计算每个月的同比增长率(本月与去年同月相比)。

示例数据

sales 表结构:

sale_iduser_idsale_amountsale_date
11015002023-01-15
21016002023-02-10
31017002024-01-20
41024002023-01-18
51024502024-01-25

SQL 实现
WITH monthly_sales AS (
    SELECT 
        user_id,
        DATE_FORMAT(sale_date, '%Y-%m') AS sale_month,
        SUM(sale_amount) AS total_sales
    FROM sales
    GROUP BY user_id, DATE_FORMAT(sale_date, '%Y-%m')
),
sales_with_trends AS (
    SELECT 
        user_id,
        sale_month,
        total_sales,
        LAG(total_sales, 1) OVER (PARTITION BY user_id ORDER BY sale_month) AS previous_month_sales,
        LAG(total_sales, 12) OVER (PARTITION BY user_id ORDER BY sale_month) AS last_year_sales
    FROM monthly_sales
)
SELECT 
    user_id,
    sale_month,
    total_sales,
    ROUND(
        (total_sales - previous_month_sales) / NULLIF(previous_month_sales, 0) * 100, 2
    ) AS month_over_month_growth,
    ROUND(
        (total_sales - last_year_sales) / NULLIF(last_year_sales, 0) * 100, 2
    ) AS year_over_year_growth
FROM sales_with_trends
ORDER BY user_id, sale_month;

代码解析

  1. 第一步monthly_sales):按用户和月份汇总销售数据,计算每月销售总额。
  2. 第二步sales_with_trends):
    • 使用 LAG() 计算前一个月的销售额,计算环比。
    • 使用 LAG() 结合 12 个月偏移量计算去年的同月销售额,实现同比。
  3. 最终结果:计算环比、同比增长率,NULLIF 防止除零错误。

结果示例

user_idsale_monthtotal_salesmonth_over_month_growthyear_over_year_growth
1012023-01500NULLNULL
1012023-0260020.00NULL
1012024-0170016.6740.00

4. 亮点解读

  • 环比计算:通过 LAG() 直接获取上个月数据,无需自联表。
  • 同比计算:利用 LAG() 向前偏移12个月,直观且高效。
  • 窗口函数优势:保留所有行数据,且在不改变原始行的基础上计算额外指标。

5. 扩展思考

  • 可以使用 LEAD() 预测未来趋势或计算未来一个月的数据变化。
  • 结合 PERCENT_RANK() 分析各用户在销售额中的排名,实现销售精英筛选。
  • 使用 NTILE(4) 将用户按季度或销售额分组,分析不同等级用户的增长趋势。

这种 SQL 方案适合在业务系统中监控用户销售趋势,适用于电商、金融和 SaaS 产品的业务数据分析。


http://www.kler.cn/a/467417.html

相关文章:

  • 现代密码学期末重点(备考ing)
  • NoSQL简介
  • [python3]Excel解析库-XlsxWriter
  • 2025年Stable Diffusion安装教程(超详细)
  • 代码段中使用数据、栈
  • GESP真题 | 2024年12月1级-编程题4《美丽数字》及答案(C++版)
  • Spring Boot - 日志功能深度解析与实践指南
  • 代理IP助力VR行业革新,小派科技引领技术潮流
  • C语言(自定义)函数
  • LeetCode 力扣 热题 100道(二十八)矩阵置零(C++)
  • ImportError: /lib/x86_64-linux-gnu/libc.so.6: version `GLIBC_2.32‘ not found
  • L27.【LeetCode笔记】2 的幂(五种解法)
  • 1.C语言教程:历史、特点、版本与入门示例
  • Tableau数据可视化与仪表盘搭建-安装教程
  • 探寻AI Agent:开启知识图谱自动生成新篇章(17/30)
  • SpringBoot入门之创建一个Hello World项目
  • Tesseract5.4.0自定义LSTM训练
  • 互联网直播点播平台EasyDSS无人机视频推拉流技术实现工地远程监控巡检直播
  • CAN201 Introduction to Networking(计算机网络)Pt.4 链路层
  • Nginx:负载均衡
  • Qt6.8.1 Mingw13.1 编译opencv4.10时cannot convert ‘char*‘ to ‘LPWSTR
  • Day27:for-in语句
  • Maven 入门指南:从零开始掌握 Maven
  • 电子电气架构 --- 中央HPC架构
  • 结合梯度信息来改进爬山算法
  • Fabric部署-docker-compose安装