当前位置: 首页 > article >正文

正则表达式快速入门

正则表达式是由一系列元字符(Meta-characters)组成的模式,用于定义搜索或替换文本的规则。元字符具有特殊含义,用于指定搜索模式的结构。以下是一些常用的正则表达式元字符及其功能:

字符匹配符

符号含义
.匹配除 \r\n以外的任何单个字符
\d匹配数字字符
\D匹配非数字字符
\w匹配单词字符(英文、数字、下划线、汉字)
\W匹配非单词字符(#、@、_)
\s匹配空白符(包括换行和Tab)
\S匹配非空白符

案例:

  • a...b :匹配文本中以a开头,b结尾,中间包含三个字符的字符串 例如:aaaab、a123b
  • \W\d\d :匹配文本中以1个非字符开头,后跟两个数字的字符串 例如:#12、?00

限定符(Quantifier):
限定符用于指定符号前面的字符和组合项连续出现的次数,常用的限定字符如下:

符号含义
*指定字符重复0次或n次
+指定字符重复0次或n次
?指定字符重复0次或1次
{n}正好匹配n个字符或组合,n是非负数
{n,}匹配n个以上的字符或组合
{n,m}匹配n-m个字符或女组合,m大于n

案例:

  • [123]*:匹配文本中由123字符组成的字符串 例如:123、11123、33
  • \d+: 匹配文本中重复1次或多次数字
  • https?:匹配文本中的http或者https字符串
  • \d{10}:匹配文本中10个连续的数字
  • \d{4,}:匹配文本中连续4个或以上的数字
  • ^\d{1,6}$:匹配文本中连续1-6个的数字

字符类(Character Classes)
用于匹配特定的字符集合。

符号含义
[ ]可接收的字符列表
[^]不可接受的字符列表
-连字符

案例:

  • [abc]:匹配abc中任意一个字符
  • [^0123456789] :匹配文本中数字以外的任意单个字符,同[^\d]
  • [A-Z] :匹配任意单个大写字母
  • [0-9a-z]:匹配任意单个小写字母或数字
  • [\w\W]:匹配任意字符

转义符(Escape Character)
使特殊字符失去特殊意义,被视为普通字符。

符号含义
\随后的字符应该被解释为字面量字符

需要用到转义符的字符有:.*+()$/\?[]^{},当特殊字符是在[]中时,不需要使用转义符

案例:

  • 0\.\d*[1-9]:匹配一个小于0的小数

定位符(Anchors)
规定要匹配的字符串出现的位置,比如目标字符串是在文本的开始或者结束位置。

符号含义
\b匹配目标字符串的边界,这里边界指的是子串之间的空格,或者文本的前后边界
\B匹配目标字符串的非边界
^匹配输入字符开始的位置
$匹配输入字符结束的位置

案例:

  • \bHello\b :匹配文本位于开头和结尾位置的Hello 例如:在"Hello HelloWorld"文本中只能匹配到第一个Hello
  • ^[abc] : 匹配文本中以abc中的一个字符开头的字符串
  • ^\d\d\d\d\d\d$ :匹配文本是否是由六个数字组成的字符串 例如: 123456、000000

分组符(Grouping )
字符分组多用于将多个字符重复,主要通过使用小括号()来进行分组

符号含义
()用于分组

案例:

  • (\d{4})-(\d{2})-(\d{2}) :匹配一个日期格式(如 YYYY-MM-DD),并将年、月、日分别分组。

懒惰匹配符(Non-greedy Quantifiers)
正则表达式默认是采用贪婪匹配,当正则表达式中包含重复的限定符时,匹配尽可能多的字符。可以通过设置为懒惰匹配,匹配尽可能少的字符。

符号含义
?字符尽可能少地匹配

使用时与限定符号结合使用:比如*?{n,m}?,尽可能少的去匹配。
案例:

  • 1\d*?3,在匹配文本123123123时,通过懒惰匹配会匹配到三个123
  • \(.*?\),在匹配文本()()()()时,通过懒惰匹配会匹配到四个括号

选择匹配符(Choice Meta-characters)
匹配某种字符串的时候是选择性的,既可以匹配这个,又可以匹配那个。

符号含义
表示逻辑“或”,用于选择多个选项

案例:

  • (a|b):匹配字符a或者匹配字符b
  • (ab)|(cd):匹配字符ab或者匹配字符cd

http://www.kler.cn/news/364780.html

相关文章:

  • 算法剖析:二分查找
  • 初学者指南:软件测试
  • 开源限流组件分析(三):golang-time/rate
  • [linux]软件安装
  • Qt 学习第 天:线程与多线程
  • MATLAB基础应用精讲-【数模应用】负二项回归(附R语言和python代码实现)
  • 【Orange Pi 5 Linux 5.x 内核编程】-字符设备文件与创建
  • C++中extern的作用(面试)
  • 【网络安全】护网蓝队之应急响应
  • OracleT5-2 Solaris11安装
  • 使用JMeter进行Spring Boot接口的压力测试
  • Linux运维常见问题排查
  • wordcloud分词生成
  • c#————FieldInfo的基础使用
  • 鸿蒙网络编程系列33-TLS回声服务器示例
  • 音频编解码器音频文件格式
  • 数字图像处理的概念(二)
  • 基于SpringBoot+Vue+uniapp微信小程序的文玩销售小程序的详细设计和实现
  • 如何使用 Ngrok 将本地服务暴露到公网
  • 企业数字化转型战略深度解析与最佳实践路径:微服务架构与物联网的深度融合
  • python爬虫技术实现酷我付费破解下载
  • 搜维尔科技:Manus新品发布Metagloves Pro专业版,专为高精度需求的客户打造,尤其是人形机器人产业与人机工效研究使用
  • 免费开源!语音识别平台让医疗对话更高效,沟通更准确
  • 【卫星图像处理】卫星光照处理
  • docker 镜像详解
  • filebeat接入nginx和mysql获取日志