scala的正则表达式的特殊规则
字面量规则
- 在 Scala 中,正则表达式通常使用
scala.util.matching.Regex
类来表示。可以通过r
方法将一个字符串字面量转换为正则表达式。例如,val pattern = "abc".r
,这里pattern
就是一个正则表达式对象,它可以用于匹配包含abc
的字符串。 - 当正则表达式中包含一些在 Scala 字符串中有特殊含义的字符(如反斜杠
\
)时,需要进行转义。例如,如果要匹配一个反斜杠字符,在正则表达式中应该写成"\\"
,在 Scala 代码中创建正则表达式对象时就应该是val backslashPattern = "\\\\".r
。这是因为在 Scala 字符串中,一个反斜杠本身需要用另一个反斜杠来转义,然后在正则表达式中,反斜杠也有特殊用途(比如用于表示字符类等),所以总共需要两个反斜杠。
字符类规则
- 可以使用方括号
[]
来定义字符类。例如,[abc]
可以匹配字符a
、b
或者c
。在 Scala 中,val charClassPattern = "[abc]".r
可以用来创建匹配a
、b
或c
的正则表达式对象。 - 可以使用范围表示法,如
[a - z]
来匹配小写字母a
到z
之间的所有字符。在 Scala 代码中可以写成val lowerCasePattern = "[a - z]".r
。 - 否定字符类可以通过在方括号内的第一个字符使用
^
来实现。例如,[^abc]
将匹配除了a
、b
和c
之外的任何字符。对应的 Scala 代码是val notABCPattern = "[^abc]".r
。
量词规则
*
量词表示匹配前面的元素零次或多次。例如,a*
可以匹配空字符串、a
、aa
、aaa
等。在 Scala 中,val starPattern = "a*".r
可以用来匹配包含零个或多个a
的字符串。+
量词表示匹配前面的元素一次或多次。比如a+
将匹配a
、aa
、aaa
等,但不匹配空字符串。Scala 代码可以写成val plusPattern = "a+".r
。?
量词表示匹配前面的元素零次或一次。例如a?
可以匹配空字符串或者a
。在 Scala 中是val questionMarkPattern = "a?".r
。- 可以使用
{n}
来指定前面元素的精确匹配次数,其中n
是一个整数。例如,a{3}
将匹配aaa
。Scala 代码为val exactCountPattern = "a{3}".r
。 {n,}
表示匹配前面的元素至少n
次。例如,a{2,}
将匹配aa
、aaa
、aaaa
等。在 Scala 中可以写成val atLeastCountPattern = "a{2,}".r
。{n,m}
表示匹配前面的元素至少n
次但不超过m
次。例如,a{1,3}
将匹配a
、aa
、aaa
。对应的 Scala 代码是val rangeCountPattern = "a{1,3}".r
。
分组规则
- 可以使用圆括号
()
来进行分组。分组可以用于提取匹配的子串,也可以用于应用量词到一组字符上。例如,(ab)+
将匹配ab
、abab
、ababab
等。在 Scala 中,val groupPattern = "(ab)+".r
可以用来创建这样的正则表达式对象。 - 当进行匹配后,可以通过
match
语句或者findFirstMatchIn
等方法来获取匹配的组。
边界匹配规则
^
用于匹配字符串的开头。例如,^abc
将只匹配以abc
开头的字符串。在 Scala 中,val startPattern = "^abc".r
可以用于此目的。$
用于匹配字符串的结尾。例如,abc$
将只匹配以abc
结尾的字符串。Scala 代码可以是val endPattern = "abc$".r
。\b
用于匹配单词边界。单词边界是指单词字符(字母、数字、下划线)和非单词字符之间的位置。例如,\babc\b
将匹配独立的abc
单词,而不是作为其他单词一部分的abc
。在 Scala 中,val wordBoundaryPattern = "\\babc\\b".r
可以用来匹配这样的边界情况。
特殊字符转义规则
- 正则表达式中的一些字符有特殊含义,如
^
(在字符类外表示字符串开头)、$
(表示字符串结尾)、*
(量词)等。如果要匹配这些字符本身,需要进行转义。在 Scala 中,转义字符也是反斜杠\
。例如,要匹配一个*
字符,正则表达式应该是\*
,在 Scala 代码中创建正则表达式对象时就是val asteriskPattern = "\\*".r
。
模式匹配中的特殊规则
- 在 Scala 的模式匹配中使用正则表达式时,有一些方便的语法。例如,可以在
match
语句中直接使用正则表达式来匹配字符串。 -
package test37 //任务:把字符串中的手机号打码:类似:138****5678 object test2 { def main(args: Array[String]): Unit = { var str= "张先生,手机号:13812345678 你买的 xxx 到了" //开始你的代码 // val reg = "1[3-9\\d{9}]".r //()是分组,不会影响正则表达式的查询结果,但是,他会把分组找到的内容单独保存在group中 val reg = "(1[3-9]\\d)(\\d{4})(\\d{4})".r //reg.replaceAllIn的功能:在目标字符串str中,用正则表达式reg去查找,找到之后,用箭头函数的返回值 //来替换 //m就是正则表达式找到的内容 //如果正则表达式中有(),则可以通过m.group来找到对应的分组 val newStr = reg.replaceAllIn(str,(m)=>{ println(s"第一组:${m.group(1)}") println(s"第二组:${m.group(2)}") println(s"第三组:${m.group(3)}") println("-"*48) m.group(1)+"****"+m.group(3) }) println(newStr) //“张先生,手机号:13812345678 你买的 xxx 到了” //var str = "张先生,ID:429005200001231156" //var str = "张先生,ID:4290052000------56" } }