当前位置: 首页 > article >正文

python使用正则表达式re

被用来检索\替换那些符合某个模式(规则)的文本,对于文本过滤或规则匹配,最强大的就是正则表达式,是python爬虫里必不可少的神兵利器。

基本匹配规则:

[0-9] 任意一个数字,等价\d

[a-z] 任意一个小写字母

[A-Z]任意一个大写字母

[^0-9] 匹配非数字,等价\D

\w 等价[a-z0-9_],字母数字下划线

\W 等价对\w取非

. 任意字符

[] 匹配内部任意字符或子表达式

[^] 对字符集合取非

*匹配前面的字符或者子表达式0次或多次

+匹配前一个字符至少1次

? 匹配前一个字符0次或多次

^ 匹配字符串开头

$ 匹配字符串结束

Python使用正则表达式

Python的re模块

pattern 编译好的正则表达式

几个重要的方法:

match: 匹配一次从开头;

search: 匹配一次,从某位置;

findall: 匹配所有;

split: 分隔;

sub: 替换;

需要注意的两种模式:

贪婪模式:(.*)

懒惰模式:(.*?)


http://www.kler.cn/a/4248.html

相关文章:

  • 01.17周五F34-Day58打卡
  • 《Keras 3 在 TPU 上的肺炎分类》
  • 基于 K-Means 聚类分析实现人脸照片的快速分类
  • 新垂直电商的社交传播策略与AI智能名片2+1链动模式S2B2C商城小程序的应用探索
  • 你喜欢用什么编辑器?
  • Go语言中http.Transport的Keep-Alive配置与性能优化方法
  • Linux 多线程:多线程和多进程的对比
  • ChatGPT再掀AI资本狂潮,30位科技创新VC投资者齐聚“实在智能”
  • 2023年科睿唯安官方剔除的35本SCI清单
  • 【CSS】清除浮动 ③ ( 清除浮动 - 使用 after 伪元素 | 语法简介 | 兼容低版本浏览器 | 原理分析 )
  • 深度好文,无代码平台如何解决软件开发成本居高不下?
  • 【Python】大杀器:Photon超快速帮助你搜集信息
  • 大学生问AI
  • 2023年全国最新保安员精选真题及答案34
  • Nginx——Nginx优化方案设计
  • Day929.运用自动化工具诊断分析Sharing项目 -系统重构实战
  • LeetCode1207. 独一无二的出现次数(python)
  • C++ 多线程学习
  • 眨个眼就学会了Pixi.js
  • 软件测试练手项目,以及项目操作流程
  • .NET Core6.0环境下使用Autofac框架对webAPI进行依赖注入改造
  • Python 中 如何向函数传递列表?
  • 【第十一届“泰迪杯”数据挖掘挑战赛】B题产品订单的数据分析与需求预测“解题思路“”以及“代码分享”
  • 以太网 ethtool命令详解
  • 深入理解计算机系统(第三版)【阅读笔记】
  • Tomcat 内部运行原理(一)