当前位置: 首页 > article >正文

从 MySQL 5.7 到 8.0:理解 GROUP BY 的新规则与实战优化20241112

🎯 从 MySQL 5.7 到 8.0:理解 GROUP BY 的新规则与实战优化

🔎 引言

随着 MySQL 的不断升级,从 5.7 到 8.0,不仅性能得到提升,其对 SQL 标准的严格执行也显著提高。GROUP BY 的行为变化就是一个典型例子。对开发者而言,MySQL 8.0 强制遵守 ONLY_FULL_GROUP_BY 规则,虽然提高了数据一致性,但也为老代码迁移带来了不小的挑战。

本文将从 问题背景 出发,通过 报错分析 和 案例复盘,探讨如何应对 MySQL 升级带来的挑战,同时总结出一套高效的解决方案。

🌟 一、问题背景:MySQL 升级带来的挑战

1. 什么是 GROUP BY?

GROUP BY 是一种将数据按字段分组的 SQL 操作,通常用于统计、聚合和分析场景。示例如下:

SELECT department, COUNT(*) AS employee_count
FROM employees
GROUP BY department;

2. MySQL 5.7 的行为

  • 默认启用了 ONLY_FULL_GROUP_BY 模式,但执行较为宽松。
  • 某些情况下,未完全符合规则的查询也能隐式运行。

3. MySQL 8.0 的行为

  • 严格执行 ONLY_FULL_GROUP_BY 模式。
  • 未分组字段或未使用聚合函数的字段会直接报错。
  • 示例:
SELECT column1, column2, MAX(column3)
FROM table_name
GROUP BY column1;

在 MySQL 8.0 中,若 column2 未出现在 GROUP BY 或未使用聚合函数,将报错:

Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'column2' which is not functionally dependent on columns in GROUP BY clause.

🚨 二、常见报错与原因

1. 报错示例 1

SELECT column1, column2
FROM table_name
GROUP BY column1;
  • 错误信息:
Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'column2'.

原因:column2 既未分组也未聚合,违反了 SQL 标准。

2. 报错示例 2

SELECT column1, MAX(column2), column3
FROM table_name
GROUP BY column1;
  • 错误信息:
Expression #3 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'column3'.

原因:column3 未分组或聚合,与 ONLY_FULL_GROUP_BY 规则冲突。

🔧 三、解决方案

方法 1:修改 SQL 查询 🛠️

调整查询以符合 GROUP BY 规则:
1. 所有未聚合字段必须出现在 GROUP BY 中。
2. 为未分组字段使用聚合函数。

示例改写:

-- 错误写法
SELECT column1, column2
FROM table_name
GROUP BY column1;

-- 正确写法
SELECT column1, MAX(column2) AS max_column2
FROM table_name
GROUP BY column1;
  • 优缺点:
    • ✅ 优点:符合标准,解决问题的长远之道。
    • ❌ 缺点:需要对旧代码进行大规模修改。

方法 2:调整 MySQL 配置 ⚙️

通过调整 MySQL 的 sql_mode 配置,禁用 ONLY_FULL_GROUP_BY:

步骤:

1. 检查当前 sql_mode:
SELECT @@GLOBAL.sql_mode;

输出示例:

STRICT_TRANS_TABLES,ONLY_FULL_GROUP_BY,NO_ENGINE_SUBSTITUTION
2. 移除 ONLY_FULL_GROUP_BY:
SET GLOBAL sql_mode=(SELECT REPLACE(@@sql_mode, 'ONLY_FULL_GROUP_BY', ''));
3. 修改配置文件,永久禁用:编辑 /etc/mysql/my.cnf:
[mysqld]
sql_mode=STRICT_TRANS_TABLES,ERROR_FOR_DIVISION_BY_ZERO,NO_ENGINE_SUBSTITUTION
4. 重启 MySQL 服务:
sudo systemctl restart mysql

验证:

SELECT @@GLOBAL.sql_mode;

输出中不应包含 ONLY_FULL_GROUP_BY。

优缺点:
• ✅ 优点:快速解决问题,无需修改 SQL。
• ❌ 缺点:可能导致聚合结果错误,需谨慎使用。

🔍 四、插曲:配置文件冲突与排查

1. 配置文件加载顺序

MySQL 加载配置文件的顺序如下:
1. /etc/my.cnf
2. /etc/mysql/my.cnf
3. /etc/mysql/conf.d/.cnf
4. /etc/mysql/mysql.conf.d/
.cnf

  • 问题:
    多个配置文件中定义了 sql_mode,后加载的文件会覆盖前面的设置。

2. 如何发现冲突?

  • 检查所有配置文件:
sudo grep -R "sql_mode" /etc/mysql/
  • 查看实际加载的配置文件:
mysql --help | grep "Default options"
  • 验证实际生效的 sql_mode:
SELECT @@GLOBAL.sql_mode;

3. 解决冲突的最佳实践

•	将主要的 sql_mode 定义放在 /etc/mysql/my.cnf。
•	针对工具(如 mysqldump)的特殊需求,单独在 /etc/mysql/conf.d/*.cnf 中配置。

📚 五、实际案例复盘

案例 1:查询菜单类型统计

表名:eb_system_menu
表结构:

+------------+--------------+
| Field      | Type         |
+------------+--------------+
| id         | int          |
| menu_type  | varchar(2)   |
| name       | varchar(100) |
+------------+--------------+

需求:统计每种菜单类型的数量。

SELECT menu_type, COUNT(*) AS count
FROM `ydkj-mall`.`eb_system_menu`
GROUP BY menu_type;

案例 2:用户状态分布统计

表名:eb_user
表结构:

+------------+--------------+
| Field      | Type         |
+------------+--------------+
| uid        | int          |
| status     | tinyint(1)   |
| nickname   | varchar(100) |
+------------+--------------+

需求:统计每种状态的用户数量。

SELECT status, COUNT(*) AS user_count
FROM `ydkj-mall`.`eb_user`
GROUP BY status;

🎯 六、总结与最佳实践

1. 理解 MySQL 的变化

MySQL 8.0 的严格模式符合标准化要求,虽然迁移成本较高,但能显著提高数据一致性。

2. 合理选择解决方案

  • 修改 SQL 查询是最推荐的长远方案。
  • 调整 sql_mode 可作为短期过渡,但需严格测试。

3. 配置管理的建议

  • 集中管理 sql_mode,避免多文件冲突。
  • 使用工具检查实际生效的配置,确保一致性。

🎉 附录:常用 SQL 验证命令

-- 查看当前模式
SELECT @@GLOBAL.sql_mode;

-- 查看表结构
DESCRIBE `table_name`;

-- 显示加载的配置文件
mysql --help | grep "Default options";

通过对 MySQL 的深入分析和实战操作,相信你已经掌握了解决 GROUP BY 规则冲突的技巧。希望这篇文章能帮助你在数据库升级中游刃有余,轻松应对变化! 😊


http://www.kler.cn/a/395155.html

相关文章:

  • SSE与WebSocket与MQTT
  • 企业如何提高招聘能力?
  • Vulnhub靶场案例渗透[8]- HackableII
  • 【JavaEE初阶 — 多线程】生产消费模型 阻塞队列
  • 《Django 5 By Example》阅读笔记:p76-p104
  • 量化交易系统开发-实时行情自动化交易-3.4.2.2.Okex交易数据
  • 3D 数组插值 MATLAB
  • vue2 动态路由的实现
  • Leetcode 整数转罗马数字
  • webpack5 + vue3 从零配置项目
  • 低代码集成多方API的简单实现
  • 力扣113:路径总和II
  • 蓝领招聘二期笔记
  • 标题:网络安全:数字时代的守护盾
  • Python基础学习-07不可重复的set集合
  • 10款音频剪辑工具的个人实践体验感受!!
  • PG实例CPU使用率高排查思路
  • pyflink datastream数据流ds经过一系列转换后转为table,t_env.from_data_stream(ds)
  • 【C++学习(35)】在Linux中基于ucontext实现C++实现协程(Coroutine),基于C++20的co_await 协程的关键字实现协程
  • 机器学习在网络安全中的应用
  • 问:SQL优化,七条实践总结?
  • Rust枚举之卧龙凤雏(Rust Option枚举、Rust Result枚举)(Rust Enum、Some(T)、Ok(T)、Err(E))链式操作
  • TKinter实现与Dash应用的同步启停控制
  • kubernetes简单入门实战
  • 【大语言模型】ACL2024论文-10 CSCD-IME: 纠正拼音输入法产生的拼写错误
  • MathGPT的原理介绍,在中小学数学教学的应用场景,以及代码样例实现