当前位置：首页 > article >正文

图文深入理解SQL语句的执行过程

article 2025/1/12 8:50:26

List item

本文将深入介绍SQL语句的执行过程。
一.在RDBMS（关系型DB）中，看似很简单的一条已写入DB内存的SQL语句执行过程却非常复杂，也就是说，你执行了一条诸如select count(*) where id = 001 from table_name的非常简单的语句，执行过程可能快的让你察觉不到耗时，但是就是这样一条简单的SQL语句，RDBMS在后台却为我们做了很多工作：过程如下两图所示

二。在Oracle DB中，执行一条已经写入DB内存的SQL的流程如下两图（网图，谢过）所示：

‌①，将SQL语句加载入数据库缓冲区‌：首先，SQL语句被加载到数据库的缓冲区中，这是为了提高数据访问的速度和效率。
②，将SQL语句要操作的数据文件副本加载入数据库缓冲区‌：接下来，将要被操作的数据文件的副本也被加载到数据库缓冲区中，以便进行后续的修改操作。
‌③，执行SQL语句，修改数据文件副本，形成“脏缓冲区”‌：SQL语句被执行，对数据文件副本进行修改，这些被修改的数据文件副本被称为“脏缓冲区”，因为它们还未被写入到原始的数据文件中。
‌④，CKPT检测到“脏缓冲区”，调用DBWn‌：CKPT（Checkpoint）进程检测到“脏缓冲区”后，会调用DBWn（Database Writer）进程。
⑤，在DBWn运行之前，先运行LGWR，将数据文件的原始状态和数据库的改变记录到Redo Log Files‌：在DBWn运行之前，LGWR（Log Writer）进程先将数据文件的原始状态和数据库的改变记录到Redo Log Files中，这是为了确保在系统崩溃时能够恢复数据。
‌⑥，运行DBWn，将“脏缓冲区的内容写入到数据文件”‌：DBWn进程将“脏缓冲区”的内容写入到原始的数据文件中，完成数据的持久化存储。
‌⑦，同时CKPT修改控制文件和数据文件头‌：CKPT进程同时修改控制文件和数据文件头，以确保数据库的一致性和完整性。
⑧，SMON回收不必要的空闲资源‌：最后，SMON（System Monitor）进程回收不必要的空闲资源，以优化数据库的性能和效率。
⑨，如有符合的结果，则返回给users.

三.SQL执行过程中的几个重要阶段：
1.SQL解析阶段，主要介绍硬解析、软解析和软软解析
硬解析（Hard Parse）
当数据库接收到一条新的 SQL 语句时，如果该语句之前从未被执行过，数据库需要进行硬解析。硬解析的过程较为复杂和耗时，主要包括以下步骤：
1.语法分析：检查 SQL 语句的语法是否正确，确保关键字、表名、列名等的使用符合 SQL 规范。
2.语义检查：验证语句中涉及的对象（如表、视图、列等）是否存在，数据类型是否匹配，以及用户是否具有执行该语句的权限。
3.查询优化：数据库根据各种因素（如表的大小、索引的存在、数据的分布等）确定执行该 SQL 语句的最佳执行计划。这是一个复杂的过程，可能需要尝试多种执行方案并评估其成本。
4.生成执行代码：根据选定的执行计划，数据库生成可执行的代码。
硬解析需要消耗较多的数据库资源，尤其是 CPU 和内存。频繁的硬解析会严重影响数据库的性能。
软解析（Soft Parse）
如果数据库接收到一条 SQL 语句，并且该语句之前已经被执行过，并且在共享池中可以找到完全匹配的执行计划，那么数据库可以进行软解析。软解析的过程相对简单，主要包括以下步骤：
1.语法检查：快速检查 SQL 语句的语法是否正确。
2.确认执行计划：在共享池中查找与该 SQL 语句完全匹配的执行计划，并确认其仍然有效。如果执行3.计划可用，数据库可以直接使用它，无需进行查询优化。
软解析比硬解析快得多，因为它避免了查询优化的过程。软解析可以提高数据库的性能，特别是对于频繁执行的 SQL 语句。
软软解析（Soft Soft Parse）
软软解析也称为 “超快软解析” 或 “无锁软软解析”，是一种比软解析更高效的解析方式。在某些情况下，数据库可以在不获取任何锁的情况下进行软软解析，进一步减少了解析的开销。
软软解析通常发生在以下情况：
1.共享池中已经存在与当前 SQL 语句完全匹配的执行计划，并且该执行计划没有被其他会话修改或删除。
2.数据库可以直接使用该执行计划，无需进行任何额外的检查或锁定。软软解析的速度非常快，可以极大地提高数据库的性能，特别是在高并发环境下。
为了减少硬解析的次数，提高数据库性能，可以采取以下措施：
1.使用绑定变量：绑定变量可以使不同的 SQL 语句在共享池中共享执行计划，减少硬解析的发生。
2.优化 SQL 语句：确保 SQL 语句的编写高效、简洁，避免复杂的查询和不必要的操作。
3.调整数据库参数：合理调整数据库的参数，如共享池大小、游标共享等，以优化解析过程。

2.执行计划阶段做什么？
SQL 执行计划是数据库为执行特定 SQL 语句而选择的一系列步骤的描述。它详细说明了数据库将如何访问数据、进行连接操作、应用条件筛选等，以返回查询结果或执行数据修改操作。
执行计划的组成部分
1.操作步骤
执行计划由一系列操作组成，每个操作代表数据库执行的一个具体任务。常见的操作包括：
表扫描（Table Scan）：数据库读取表中的数据行。可以是全表扫描（Full Table Scan），即读取表中的所有行，或者索引扫描（Index Scan），通过索引快速定位特定的行。
索引查找（Index Lookup）：使用索引来查找满足条件的行。可以是唯一索引查找（Unique Index Lookup）或范围索引查找（Range Index Lookup）等。
连接操作（Join）：将多个表中的数据行根据连接条件进行合并。常见的连接方式有嵌套循环连接（Nested Loops Join）、哈希连接（Hash Join）和排序合并连接（Sort Merge Join）等。
排序操作（Sort）：对数据进行排序，例如在使用 ORDER BY 子句时。
聚合操作（Aggregation）：执行聚合函数，如 SUM、AVG、COUNT 等。
2.操作顺序
执行计划中的操作按照特定的顺序执行。数据库根据查询的需求和数据的分布情况选择最佳的操作顺序，以最小化执行时间和资源消耗。例如，在连接操作中，数据库会选择合适的连接顺序，以减少中间结果集的大小。
3.操作成本
每个操作都有一个相关的成本估计。成本通常以数据库内部的单位（如 I/O 操作次数、CPU 时间等）来衡量。数据库在生成执行计划时，会尝试选择总成本最低的方案。成本估计基于数据库的统计信息，包括表的大小、索引的选择性、数据的分布等。
执行计划的生成过程
1.语法分析和语义检查
当数据库接收到 SQL 语句时，首先进行语法分析和语义检查，确保语句的正确性和合法性。
2.查询优化
数据库的查询优化器根据 SQL 语句和数据库的统计信息，生成多个可能的执行计划。优化器会考虑各种因素，如表的大小、索引的存在、数据的分布、连接方式等，以选择最优的执行计划。
3.成本评估
对于每个生成的执行计划，优化器会进行成本评估。成本评估基于数据库的统计信息和内部的成本模型。优化器会选择成本最低的执行计划作为最终的执行方案。
4.执行计划生成
一旦确定了最优的执行计划，数据库会生成相应的执行代码，并准备执行 SQL 语句。
查看执行计划的方法
1.EXPLAIN PLAN 语句
可以使用 EXPLAIN PLAN FOR 语句来查看 SQL 语句的执行计划。该语句会将执行计划存储在数据库的一个特定表中，可以通过查询该表来获取执行计划的详细信息。
2.SQL Developer 等工具
Oracle SQL Developer 等数据库开发工具提供了图形化的界面，可以方便地查看 SQL 语句的执行计划。这些工具通常会以树状图或表格的形式展示执行计划的各个步骤，以及相关的成本信息和统计数据。
了解 SQL 执行计划对于优化数据库性能非常重要。通过分析执行计划，可以确定 SQL 语句的执行效率，找出潜在的性能瓶颈，并采取相应的优化措施，如创建合适的索引、调整查询语句、优化数据库参数等。