当前位置: 首页 > article >正文

正则表达式基础

正则表达式(Regular Expression,简称Regex或RegExp)是一种用于匹配和处理字符串的工具。它是一种特定的语法,通过字符和符号的组合来描述一种文本模式,用于匹配和查找符合该模式的字符串。正则表达式通常被用于文本编辑器、编程语言、数据库和操作系统等方面。

正则表达式可以用来实现以下功能:

  1. 1.匹配和查找字符串中的文本模式。
  2. 2.替换字符串中的指定文本。
  3. 3.过滤文本中的特定内容。
  4. 4.对文本进行校验和格式化。

正则表达式由普通字符和元字符组成。普通字符就是表示字面含义的字符,如字母、数字、标点符号等。元字符是一些具有特殊含义的字符,用于描述字符串的特定模式。

常见的元字符包括:

  1. 1.".":匹配任意单个字符。
  2. 2."*":匹配前面的字符零次或多次。
  3. 3."+":匹配前面的字符至少一次。
  4. 4."?":匹配前面的字符零次或一次。
  5. 5."|":匹配两个或多个选择项中的任意一个。
  6. 6."[]":匹配方括号中的任意一个字符。
  7. 7."{}":限定匹配次数。
  8. 8."^":匹配字符串的开头。
  9. 9."$":匹配字符串的结尾。

除了元字符外,正则表达式还有一些特殊的字符类别,用于匹配特定类型的字符,如\d匹配数字,\w匹配字母、数字和下划线

字符说明
.匹配除换行符(\n、\r)之外的任何单个字符。要匹配包括 '\n' 在内的任何字符,请使用像"(.|\n)"的模式。
*匹配前面的子表达式零次或多次。例如,ab* 能匹配 "a" 以及 "abb"。* 等价于{0,}。
+匹配前面的子表达式一次或多次。例如,'ab+' 能匹配 "ab" 以及 "abb",但不能匹配 "a"。+ 等价于 {1,}。
?匹配前面的子表达式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 。? 等价于 {0,1}。
|匹配 x 或 y。例如,'a|bcd' 能匹配 "a" 或 "bcd"。'(a|b)cd' 则匹配 "acd" 或 "bcd"。
[abc]字符集合。匹配所包含的任意一个字符。例如, '[abc]' 可以匹配 "ade" 中的 'a'。
[^abc]负值字符集合。匹配未包含的任意字符。例如, '[^abc]' 可以匹配 "ade" 中的'd'、'e'。
[a-z]字符范围。匹配指定范围内的任意字符。例如,'[a-z]' 可以匹配 'a' 到 'z' 范围内的任意小写字母字符。
[^a-z]负值字符范围。匹配任何不在指定范围内的任意字符。例如,'[^a-z]' 可以匹配任何不在 'a' 到 'z' 范围内的任意字符。
{n}n 是一个非负整数。匹配确定的 n 次。例如,'a{2}' 不能匹配 "abc" 中的 'a',但是能匹配 "aabc" 中的两个 a。
{n,}n 是一个非负整数。至少匹配n 次。例如,'a{2,}' 不能匹配 "abc" 中的 'o',但能匹配 "aaaaaabc" 中的所有 a。'a{1,}' 等价于 'a+'。'a{0,}' 则等价于 'a*'。
{n,m}m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"a{1,3}" 将匹配 "aaaaaaabc" 中的前三个 a。'a{0,1}' 等价于 'a?'。请注意在逗号和两个数之间不能有空格。
^匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置。
$匹配输入字符串的结束位置。如果设置了 RegExp 对象的 Multiline 属性,$ 也匹配 '\n' 或 '\r' 之前的位置。
\d匹配一个数字字符。等价于 [0-9]。
\D匹配一个非数字字符。等价于 [^0-9]。
\s匹配任何空白字符,包括空格、制表符、换页符等等。
\S匹配任何非空白字符。
\w匹配字母、数字、下划线。等价于'[A-Za-z0-9_]'。
\W匹配非字母、数字、下划线。等价于 '[^A-Za-z0-9_]'。

常见的正则表达式

手机号:^1[3-9]\d{9}$  该正则表达式表示手机号的格式必须以1开头,后面接着10个数字(总共11位数字),其中第二位数字可以是3-9的任意一个数字。

电子邮件地址:/^[a-zA-Z0-9._-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}$/  以用户名开始,后面跟着一个 @ 符号,然后是一个或多个由字母、数字、点、下划线和连字符组成的字符,紧接着是一个点号,然后是一个或多个由字母和点号组成的字符,最后以两个或更多字母组成的顶级域名结尾。

URL地址:/^https?:\/\/([a-z0-9\-]+\.)+[a-z]{2,6}$/i  这个正则表达式的含义是,以 httphttps 开头,后面跟着一个 ://,然后是一个或多个由字母、数字和连字符组成的子域名,最后跟着一个由两个到六个字母组成的顶级域名。

匹配 <img> 标签 /<img.?src="(.?)".*?>/i 这个正则表达式的含义是,在 <img 开头的标签中,匹配 src 属性和其对应的值,也就是图片的 URL。 i 表示不区分大小写。

PHP 正则匹配

preg_match($pattern, $subject, $matches);
`$pattern` 是正则表达式模式;
`$subject` 是要匹配的字符串;
`$matches` 是一个数组,用于存储匹配结果。
$str = 'apple banana cherry';
$pattern = '/\ba\w*\b/';
if (preg_match($pattern, $str, $matches)) {
    echo '匹配到的值:' . $matches[0];
} else {
    echo '未匹配到任何值';
}


http://www.kler.cn/a/15077.html

相关文章:

  • Postman之安装及汉化基本使用介绍
  • //结构体内存对齐
  • 使用Faiss构建音频特征索引并计算余弦相似度
  • 云原生周刊:Kubernetes v1.32 要来了
  • 【UGUI】背包的交互01(道具信息跟随鼠标+道具信息面板显示)
  • Python 人脸检测:使用 Dlib 和 OpenCV
  • 【Java】SpringBoot中实现多数据源切换
  • Vue-列表过滤
  • 题解,超星进程
  • 记录 docker linux部署jar
  • 三问 ThreadLocal —— 有什么用 ? 使用时有什么潜在风险?原理 ?
  • 【C++】模板进阶
  • mysql实现存在则保存,不存在则更新
  • Java线程池核心参数
  • CA(证书颁发机构)
  • 软件测试概念
  • MATLAB-Lingo求解线性规划问题-奶制品2
  • 车联网V2X通信技术及应用介绍
  • 备忘录设计模式解读
  • 实用的股票接口,股票api收藏(11)
  • 03.预处理
  • 轻量级网络EfficientNetB0,利用迁移学习中的微调技术进行小样本轴承故障诊断(Python代码,带有数据集,训练集集的每类只需10个样本)
  • 【接口自动化测试】selenium旗舰版Web测试理论篇
  • 听我一句劝,别去外包,干了三年,废了....
  • css中的background属性
  • BatchNormalization 介绍