力扣题目解析--正则表达式匹配
题目
给你一个字符串 s
和一个字符规律 p
,请你来实现一个支持 '.'
和 '*'
的正则表达式匹配。
'.'
匹配任意单个字符'*'
匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s
的,而不是部分字符串。
示例 1:
输入:s = "aa", p = "a" 输出:false 解释:"a" 无法匹配 "aa" 整个字符串。
示例 2:
输入:s = "aa", p = "a*" 输出:true 解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:
输入:s = "ab", p = ".*" 输出:true 解释:".*" 表示可匹配零个或多个('*')任意字符('.')。
提示:
1 <= s.length <= 20
1 <= p.length <= 20
s
只包含从a-z
的小写字母。p
只包含从a-z
的小写字母,以及字符.
和*
。- 保证每次出现字符
*
时,前面都匹配到有效的字符
代码展示
class Solution {
public:
bool isMatch(std::string s, std::string p) {
int m = s.length(); // 获取字符串 s 的长度
int n = p.length(); // 获取字符串 p 的长度
// dp[i][j] 表示 s 的前 i 个字符和 p 的前 j 个字符是否匹配
std::vector<std::vector<bool>> dp(m + 1, std::vector<bool>(n + 1, false));
// 空字符串和空模式匹配
dp[0][0] = true;
// 处理模式中的 '*' 字符
for (int j = 1; j <= n; ++j) {
if (p[j - 1] == '*') {
dp[0][j] = dp[0][j - 2];
}
}
// 填充 DP 表
for (int i = 1; i <= m; ++i) {
for (int j = 1; j <= n; ++j) {
if (p[j - 1] == '.' || p[j - 1] == s[i - 1]) {
dp[i][j] = dp[i - 1][j - 1];
} else if (p[j - 1] == '*') {
// * 匹配零个前面的字符
dp[i][j] = dp[i][j - 2];
// * 匹配一个或多个前面的字符
if (p[j - 2] == '.' || p[j - 2] == s[i - 1]) {
dp[i][j] = dp[i][j] || dp[i - 1][j];
}
}
}
}
return dp[m][n];
}
};
逐句解释
-
获取字符串长度:
int m = s.length(); // 获取字符串 s 的长度 int n = p.length(); // 获取字符串 p 的长度
m
存储字符串s
的长度。n
存储字符串p
的长度。
-
初始化 DP 表:
std::vector<std::vector<bool>> dp(m + 1, std::vector<bool>(n + 1, false));
- 创建一个二维布尔向量
dp
,大小为(m + 1) x (n + 1)
,所有元素初始化为false
。 dp[i][j]
表示s
的前i
个字符和p
的前j
个字符是否匹配。
- 创建一个二维布尔向量
-
处理空字符串和空模式:
dp[0][0] = true;
dp[0][0]
表示空字符串和空模式匹配。
-
处理模式中的
*
字符for (int j = 1; j <= n; ++j) { if (p[j - 1] == '*') { dp[0][j] = dp[0][j - 2]; } }
- 遍历模式
p
的每个字符(从 1 到n
)。 - 如果当前字符是
*
,则dp[0][j]
依赖于dp[0][j - 2]
,即*
可以匹配零个前面的字符。
- 遍历模式
-
填充 DP 表:
for (int i = 1; i <= m; ++i) { for (int j = 1; j <= n; ++j) { if (p[j - 1] == '.' || p[j - 1] == s[i - 1]) { dp[i][j] = dp[i - 1][j - 1]; } else if (p[j - 1] == '*') { // * 匹配零个前面的字符 dp[i][j] = dp[i][j - 2]; // * 匹配一个或多个前面的字符 if (p[j - 2] == '.' || p[j - 2] == s[i - 1]) { dp[i][j] = dp[i][j] || dp[i - 1][j]; } } } }
- 遍历字符串
s
的每个字符(从 1 到m
)。 - 遍历模式
p
的每个字符(从 1 到n
)。 - 如果
p[j - 1]
是.
或者与s[i - 1]
相同,则dp[i][j]
依赖于dp[i - 1][j - 1]
。 - 如果
p[j - 1]
是*
,则有两种情况:*
匹配零个前面的字符,dp[i][j]
依赖于dp[i][j - 2]
。*
匹配一个或多个前面的字符,如果p[j - 2]
是.
或者与s[i - 1]
相同,则dp[i][j]
依赖于dp[i - 1][j]
。
- 遍历字符串
-
返回结果:
return dp[m][n];
- 返回
dp[m][n]
,表示s
和p
是否匹配。
- 返回
总结
- 动态规划:使用动态规划方法来处理正则表达式的匹配问题,确保每个字符和模式的组合都被正确处理。
- 索引检查:确保在访问字符串索引时,索引在有效范围内,避免越界错误。
- 特殊情况处理:特别处理
*
和.
的匹配规则,确保*
可以匹配零个或多个前面的字符,.
可以匹配任意字符。