当前位置: 首页 > article >正文

正则表达式进阶(二)——零宽断言详解:\b \B \K \z \A

在正则表达式中,零宽断言是一种非常强大的工具,能够在不消费字符的情况下对匹配位置进行约束。除了环视(lookahead 和 lookbehind)以外,还有一些常用的零宽断言,它们用于处理边界、字符串的开头和结尾等特殊情况。本文将详细介绍这些常用的零宽断言:\b\B\K\z\A

1. \b - 单词边界 (Word Boundary)

\b 是一个零宽断言,用于匹配单词的边界。它会匹配单词字符与非单词字符之间的位置。单词字符包括字母、数字和下划线(_),而非单词字符则包括空格、标点符号等。

示例:

假设我们有以下文本:

hello world
hello123
word!

使用正则表达式 /\bhello\b/ 来匹配单词“hello”,只会匹配独立的“hello”,而不会匹配“hello123”或“word!”。

$ perl -nle 'print $& if /\bhello\b/' input.txt

输出:

hello

解释\b 匹配了“hello”前后的边界,确保它作为独立的单词出现。如果“hello”后面有数字或符号,它就不会被匹配。


2. \B - 非单词边界 (Non-word Boundary)

\B 是与 \b 相反的零宽断言,它用于匹配非单词边界,即匹配两个单词字符或两个非单词字符之间的位置。

示例:

假设我们有以下文本:

hello world
hello123
word!

使用正则表达式 /hello\B/,它将匹配“hello123”,而不会匹配“hello world”或“word!”。

$ perl -nle 'print $& if /hello\B/' input.txt

输出:

hello123

解释\B 匹配了“hello”与“123”之间的非单词边界,因此它能匹配“hello123”中的“hello”部分,而不匹配“hello world”。


3. \K - 忽略之前的匹配内容 (Keep)

\K 是一个非常有用的零宽断言,它允许你重置正则表达式的起始点,使其忽略\K之前的匹配内容,只返回\K之后的部分。

示例:

假设我们有以下文本:

foobar
foo123bar
foobar123

使用正则表达式 /foo\Kbar/,它只会匹配并返回 bar,而忽略之前的 foo

$ perl -nle 'print $& if /foo\Kbar/' input.txt

输出:

bar
bar
bar

解释\K 重置了匹配的起始点,使得正则表达式只返回 bar,而忽略了“foo”。


4. \z - 末尾匹配 (End of String)

\z 是一个零宽断言,用于确保正则表达式匹配整个字符串的结尾,而不受多行模式的影响。

示例:

假设我们有以下文本:

hello
world
hello world

在默认情况下,使用正则表达式 /world\z/ 将只匹配整个字符串的结尾

$ perl -nle 'print $& if /world\z/' input.txt

输出:

hello world

解释\z 确保匹配的是整个字符串的结尾,因此它匹配了“hello world”这行,因为它是字符串的结尾。

多行模式的对比:
如果我们启用多行模式(/m),$ 会匹配每行的结尾,而 \z 依然只会匹配整个字符串的末尾。
总结\z 的优势在于它不受多行模式(/m)的影响,始终确保匹配的是整个字符串的结尾,而不是每行的结尾。这在处理多行文本时非常有用,可以精确控制匹配的位置。


5. \A - 开头匹配 (Start of String)

\A 是另一个零宽断言,它用于匹配字符串的开头,类似于 ^,但是与 ^ 不同的是,\A 无论是否开启多行模式,始终匹配字符串的起始位置。

示例:

假设我们有以下文本:

hello
world
hello world

使用正则表达式 /\Ahello/,它只会匹配字符串的开始部分“hello”,无论后面是否有其他内容。

$ perl -nle 'print $& if /\Ahello/' input.txt

输出:

hello

解释\A 确保匹配从字符串的开头开始的“hello”,即使在多行模式下,它也不会受到行首的影响。


总结

这些零宽断言(\b\B\K\z\A)提供了强大的灵活性,帮助我们在不消费字符的情况下,精确地控制匹配的位置和边界。它们特别适用于匹配单词的边界、字符串的开始和结束、以及控制复杂的匹配场景。在处理复杂的文本匹配时,掌握这些零宽断言能够大大提高正则表达式的表达能力和匹配精度。

理解并合理使用这些零宽断言,可以帮助开发者解决很多实际问题,如精确匹配特定模式、处理字符串边界等。在实际应用中,这些技巧可以与环视等其他高级正则技术结合使用,进一步提升正则表达式的效果。


http://www.kler.cn/a/537415.html

相关文章:

  • 苹果公司宣布正式开源 Xcode 引擎 Swift Build145
  • ASP.NET Core对JWT的封装
  • 解决 ssh: connect to host github.com port 22: Connection timed out
  • GaussDB对象权限的注意事项
  • 【iOS自动化】Xcode配置WebDriverAgent
  • 在 Flownex 中创建自定义工作液
  • 半导体行业跨网文件交换系统
  • declare和less
  • IDEA - 一个启动类多次启动方法
  • 解决ModuleNotFoundError: No module named ‘tomli‘
  • 使用Feign代替RestTemplet
  • 【图片合并转换PDF】如何将每个文件夹下的图片转化成PDF并合并成一个文件?下面基于C++的方式教你实现
  • 存储异常导致的Oracle重大生产故障
  • java练习(12)
  • 网络安全:挑战、技术与未来发展
  • 青少年编程与数学 02-008 Pyhon语言编程基础 26课题、常见框架
  • MariaDB *MaxScale*实现mysql8读写分离
  • LLM学习笔记1——本地部署Meta-Llama-3.2-1B大模型
  • 【网络工程师软考版】局域网与城域网
  • 网络HTTP详细讲解
  • C++ CRTP:奇异递归模板模式的原理与应用
  • 详解Swift中 Sendable AnyActor Actor GlobalActor MainActor Task、await、async
  • TDengine 中如何部署集群
  • 京东 rpc调用h5st
  • Python用langchain、OpenAI大语言模型LLM情感分析苹果股票新闻数据及提示工程优化应用...
  • 【鸿蒙HarmonyOS Next实战开发】多媒体视频播放-ijkplayer