【Python 语法】Python 正则表达式(regular expressions, regex)
- 1. 基本语法
-
- 1.1 字符匹配
- 1.2 元字符
- 1.3 特殊字符
- 1.4 分组和捕获
- 1.5 断言
- 2. 常用函数
-
- 2.1 `re.match()`
- 2.2 `re.search()`
- 2.3 `re.findall()`
- 2.4 `re.sub()`
- 2.5 `re.split()`
- 3. 进阶用法
-
- 3.1 捕获组
- 3.2 非捕获组
- 3.3 预查
Python 中的**正则表达式(regular expressions, regex)**是用来匹配和处理字符串的一种工具。正则表达式由一组字符和规则组成,通过模式来查找、替换、提取字符串中的内容。Python 提供了 re
模块来支持正则表达式的使用。
常见应用场景:
- 数据验证:用于检查输入是否符合特定的格式,如邮箱地址、电话号码、身份证号码等。
- 文本处理:如提取文本中的日期、时间、URL等信息。
- 查找替换:在文本中查找特定的模式并进行替换操作。
- 日志解析:提取和分析日志文件中的数据。
- 网页抓取:从网页内容中提取有用信息,如从 HTML 页面提取链接、图片等。
1. 基本语法
正则表达式的基本构成元素有字符、特殊字符、元字符等。以下是一些常见的正则表达式符号和它们的作用。