当前位置: 首页 > article >正文

scala的正则表达式的特殊规则

字面量规则

  • 在 Scala 中,正则表达式通常使用scala.util.matching.Regex类来表示。可以通过r方法将一个字符串字面量转换为正则表达式。例如,val pattern = "abc".r,这里pattern就是一个正则表达式对象,它可以用于匹配包含abc的字符串。
  • 当正则表达式中包含一些在 Scala 字符串中有特殊含义的字符(如反斜杠\)时,需要进行转义。例如,如果要匹配一个反斜杠字符,在正则表达式中应该写成"\\",在 Scala 代码中创建正则表达式对象时就应该是val backslashPattern = "\\\\".r。这是因为在 Scala 字符串中,一个反斜杠本身需要用另一个反斜杠来转义,然后在正则表达式中,反斜杠也有特殊用途(比如用于表示字符类等),所以总共需要两个反斜杠。

字符类规则

  • 可以使用方括号[]来定义字符类。例如,[abc]可以匹配字符ab或者c。在 Scala 中,val charClassPattern = "[abc]".r可以用来创建匹配abc的正则表达式对象。
  • 可以使用范围表示法,如[a - z]来匹配小写字母az之间的所有字符。在 Scala 代码中可以写成val lowerCasePattern = "[a - z]".r
  • 否定字符类可以通过在方括号内的第一个字符使用^来实现。例如,[^abc]将匹配除了abc之外的任何字符。对应的 Scala 代码是val notABCPattern = "[^abc]".r

量词规则

  • *量词表示匹配前面的元素零次或多次。例如,a*可以匹配空字符串、aaaaaa等。在 Scala 中,val starPattern = "a*".r可以用来匹配包含零个或多个a的字符串。
  • +量词表示匹配前面的元素一次或多次。比如a+将匹配aaaaaa等,但不匹配空字符串。Scala 代码可以写成val plusPattern = "a+".r
  • ?量词表示匹配前面的元素零次或一次。例如a?可以匹配空字符串或者a。在 Scala 中是val questionMarkPattern = "a?".r
  • 可以使用{n}来指定前面元素的精确匹配次数,其中n是一个整数。例如,a{3}将匹配aaa。Scala 代码为val exactCountPattern = "a{3}".r
  • {n,}表示匹配前面的元素至少n次。例如,a{2,}将匹配aaaaaaaaa等。在 Scala 中可以写成val atLeastCountPattern = "a{2,}".r
  • {n,m}表示匹配前面的元素至少n次但不超过m次。例如,a{1,3}将匹配aaaaaa。对应的 Scala 代码是val rangeCountPattern = "a{1,3}".r

分组规则

  • 可以使用圆括号()来进行分组。分组可以用于提取匹配的子串,也可以用于应用量词到一组字符上。例如,(ab)+将匹配abababababab等。在 Scala 中,val groupPattern = "(ab)+".r可以用来创建这样的正则表达式对象。
  • 当进行匹配后,可以通过match语句或者findFirstMatchIn等方法来获取匹配的组。

 边界匹配规则

  • ^用于匹配字符串的开头。例如,^abc将只匹配以abc开头的字符串。在 Scala 中,val startPattern = "^abc".r可以用于此目的。
  • $用于匹配字符串的结尾。例如,abc$将只匹配以abc结尾的字符串。Scala 代码可以是val endPattern = "abc$".r
  • \b用于匹配单词边界。单词边界是指单词字符(字母、数字、下划线)和非单词字符之间的位置。例如,\babc\b将匹配独立的abc单词,而不是作为其他单词一部分的abc。在 Scala 中,val wordBoundaryPattern = "\\babc\\b".r可以用来匹配这样的边界情况。

特殊字符转义规则

  • 正则表达式中的一些字符有特殊含义,如^(在字符类外表示字符串开头)、$(表示字符串结尾)、*(量词)等。如果要匹配这些字符本身,需要进行转义。在 Scala 中,转义字符也是反斜杠\。例如,要匹配一个*字符,正则表达式应该是\*,在 Scala 代码中创建正则表达式对象时就是val asteriskPattern = "\\*".r

模式匹配中的特殊规则

  • 在 Scala 的模式匹配中使用正则表达式时,有一些方便的语法。例如,可以在match语句中直接使用正则表达式来匹配字符串。
  • package test37
    //任务:把字符串中的手机号打码:类似:138****5678
    object test2 {
      def main(args: Array[String]): Unit = {
        var str= "张先生,手机号:13812345678  你买的 xxx 到了"
        //开始你的代码
    //    val reg = "1[3-9\\d{9}]".r
        //()是分组,不会影响正则表达式的查询结果,但是,他会把分组找到的内容单独保存在group中
        val reg = "(1[3-9]\\d)(\\d{4})(\\d{4})".r
        //reg.replaceAllIn的功能:在目标字符串str中,用正则表达式reg去查找,找到之后,用箭头函数的返回值
        //来替换
        //m就是正则表达式找到的内容
        //如果正则表达式中有(),则可以通过m.group来找到对应的分组
        val newStr = reg.replaceAllIn(str,(m)=>{
          println(s"第一组:${m.group(1)}")
          println(s"第二组:${m.group(2)}")
          println(s"第三组:${m.group(3)}")
          println("-"*48)
          m.group(1)+"****"+m.group(3)
        })
        println(newStr)
        //“张先生,手机号:13812345678  你买的 xxx 到了”
    
        //var str = "张先生,ID:429005200001231156"
        //var str = "张先生,ID:4290052000------56"
      }
    
    }
    


http://www.kler.cn/a/429917.html

相关文章:

  • 【redis】ubuntu18安装redis7
  • 二进制编码 和 Base64编码
  • 深入探索Redis:数据结构解析与Spring Boot实战应用
  • 介绍8款开源网络安全产品
  • python数据分析之爬虫基础:requests详解
  • 消息队列(MQ):系统解耦与异步通信的利器
  • C#中LinkedList与List的对比及应用实例
  • Swagger四种定义UI界面
  • LoViT: 用于手术阶段识别的长视频Transformer|文献速递-生成式模型与transformer在医学影像中的应用
  • canny算子解析
  • python+docx+docx2python:多文件合并,提取docx文件文本、表格及图片数据
  • AI开发: 知识图谱的初识,学会制作知识图谱- Python 机器学习
  • 基于python的自动化的sql延时注入脚本
  • 高级排序算法(一):快速排序详解
  • vue-resizable插件运用
  • vite+vue3 配置ip和端口以及自动打开浏览器
  • 【Linux】开机进入grub/怎么办?
  • 【Python】无法将“pip”项识别为 cmdlet、函数、脚本文件或可运行程序的名称解决方案
  • java中的数组(2)
  • unity3d—demo(2d人物左右移动发射子弹)
  • 如何使用LEADTOOLS创建.NET Core跨平台OCR应用程序
  • Scala 的正则表达式