当前位置: 首页 > article >正文

字符串及正则表达式

在这里插入图片描述

😀前言
字符串是编程中的基本数据类型之一,广泛用于文本处理和数据交换。Python 提供了丰富的字符串操作功能,包括长度计算、切片、分割、合并、格式化及编码解码等。掌握这些基本操作将帮助开发者更高效地处理字符串数据。同时,正则表达式(Regex)作为强大的文本匹配工具,能够让我们轻松地进行复杂的字符串搜索和替换。

🏠个人主页:晨犀主页
🧑个人简介:大家好,我是晨犀,希望我的文章可以帮助到大家,您的满意是我的动力😉😉

💕欢迎大家:这里是CSDN,我总结知识的地方,欢迎来到我的博客,感谢大家的观看🥰
如果文章有什么需要改进的地方还请大佬不吝赐教 先在此感谢啦😊

文章目录

  • 字符串及正则表达式
    • 1、len()函数
    • 2、切片法截取字符串
    • 3、分割字符串
    • 4、合并字符串
    • 5、常用的格式化字符
    • 6、format()方法中常用的格式化字符
    • 7、使用 encode()方法编码
    • 8、使用 decode()方法解码
    • 9、常用元字符
    • 10、常用限定符
    • 😄总结
    • 注意事项

字符串及正则表达式

1、len()函数

Len()函数的基本用法如下:

len(string)

其中,string用于指定要进行长度统计的字符串。

2、切片法截取字符串

切片法截取字符串的语法格式如下:

string[start :end :step]

参数说明:

  • string: 表示要截取的字符串。
  • start: 表示要截取的第一个字符的索引(包括该字符),如果不指定,则默认为 0。
  • end: 表示要截取的最后一个字符的索引(不包括该字符),如果不指定则默认为字符串的长度。
  • step: 表示切片的步长,如果省略,则默认为 1,当省略该步长时,最后一个冒号也可以省略。

3、分割字符串

split()方法的语法格式如下:

str.split(sep,maxsplit)

参数说明:

  • str: 表示要进行分割的字符串。
  • sep: 用于指定分隔符,可以包含多个字符,默认为 None,即所有空字符(包括空格、换行、制表符等)。
  • maxsplit: 可选参数,用于指定分割的次数,如果不指定或者为 -1,则分割次数没有限制。

返回值: 分隔后的字符串列表。

4、合并字符串

join()方法的语法格式如下:

strnew=string.join(iterable)

参数说明:

  • strnew: 表示合并后生成的新字符串。
  • string: 字符串类型,用于指定合并时的分隔符。
  • iterable: 可迭代对象,该迭代对象中的所有元素(字符串表示)将被合并为一个新的字符串。

示例:

fruits = ['apple', 'banana', 'cherry']
print(", ".join(fruits))  # 输出: apple, banana, cherry

5、常用的格式化字符

image-20241023202945872

6、format()方法中常用的格式化字符

format()方法提供了更灵活的字符串格式化方式。

示例:

name = "Alice"
age = 30
print("My name is {} and I am {} years old.".format(name, age))  # 输出: My name is 

image-20241023203016125

7、使用 encode()方法编码

encode0方法的语法格式如下:

str.encode([encoding="utf-8"], [errors="strict"])

参数说明:

  • str: 表示要进行转换的字符串。
  • encoding: 可选参数,用于指定进行转码时采用的字符编码,默认为 UTF-8,如果想使用简体中文,也可以设置为 gb2312。当只有这一个参数时,也可以省略前面的“encoding-”,直接写编码。
  • errors: 可选参数,用于指定错误处理方式,其可选择值可以是 strict(遇到非法字符就抛出异常)、ignore(忽略非法字符)、replace(用“?”替换非法字符)或 xmlcharrefreplace(使用 XML 的字符引用)等,默认值为 strict。

8、使用 decode()方法解码

decode()方法的语法格式如下:

bytes.decode([encoding="utf-8"], [errors="strict"])

参数说明:

  • bytes: 表示要进行转换的二进制数据,通常是 encode()方法转换的结果。
  • encoding: 可选参数,用于指定进行解码时采用的字符编码,默认为 UTF-8。

示例:

encoded_text = b'\xe4\xbd\xa0\xe5\xa5\xbd'
decoded_text = encoded_text.decode("utf-8")
print(decoded_text)  # 输出: 你好

9、常用元字符

image-20241023203924210

10、常用限定符

image-20241023204005955

😄总结

通过掌握字符串的基本操作和正则表达式的使用,开发者可以高效地处理各种文本数据。无论是数据清洗、格式化,还是信息提取和替换,字符串操作都是至关重要的技能。

注意事项

  1. 在使用split()时,注意分隔符的选择,以免造成意外的分割结果。
  2. 使用join()时,确保可迭代对象中的所有元素都是字符串类型,否则会引发 TypeError。
  3. 在进行编码和解码时,选择合适的编码格式,确保字符的正确显示,尤其是在处理中文等非ASCII字符时。
    lit()`时,注意分隔符的选择,以免造成意外的分割结果。
  4. 使用join()时,确保可迭代对象中的所有元素都是字符串类型,否则会引发 TypeError。
  5. 在进行编码和解码时,选择合适的编码格式,确保字符的正确显示,尤其是在处理中文等非ASCII字符时。
  6. 当处理较大的字符串数据时,注意内存管理,避免内存溢出的问题。

文章到这里就结束了,如果有什么疑问的地方请指出,诸大佬们一起来评论区一起讨论😁
希望能和诸大佬们一起努力,今后我们一起观看感谢您的阅读🍻
如果帮助到您不妨3连支持一下,创造不易您们的支持是我的动力🤞


http://www.kler.cn/a/370454.html

相关文章:

  • 1166 Summit (25)
  • 【数据分享】1929-2024年全球站点的逐日平均气温数据(Shp\Excel\免费获取)
  • JavaScript中提高效率的技巧一
  • 搭建一个基于Spring Boot的书籍学习平台
  • Mybatis面试题
  • Jenkins-基于Role的鉴权机制
  • vue 果蔬识别系统百度AI识别vue+springboot java开发、elementui+ echarts+ vant开发
  • 已经安装好Ubuntu,10分钟配好Anaconda3
  • Tomcat作为web的优缺点
  • 【前端基础】如何判断鼠标选中文本的方向
  • linux tracepoint
  • x3daudio17dll丢失是什么原因?如何重新安装
  • Centos7.9编译安装Python3.12
  • 如何在Linux下安装和配置Docker
  • 七,Linux基础环境搭建(CentOS7)- 安装Scala和Spark
  • Ubuntu 20.04 安装 OpenCV 和 OpenCV_contrib 教程
  • 计算机网络关键名词中英对照
  • WebGIS开发之编辑功能(分割、融合、捕捉、追踪)
  • 【QT】HTTP服务器
  • 数据挖掘:电商会员价值分析模型方案
  • txt数据转为pdf格式并使用base64解密输出
  • 【MATLAB源码-第194期】基于matlab的MB-OFDM仿真,超宽带(UWB)无线传输。对比LS/DFT及其改进算法。
  • Cmake Error:could not find any instance of Visual Studio.
  • 使用Git进行团队协作开发
  • (1)程序设计与数据结构连续剧
  • flex常用固定搭配