shell中正则表达式
在
Linux
中,
grep
, sed,
awk
等文本处理工具都支持通过正则表达式进行模式匹配
示例1:匹配passwd中所有包含 atguigu 的行。
[atguigu@hadoop101 shells]$ cat /etc/passwd | grep atguigu
1.常用特殊字符 ^ $ . * [ ] \
^ :匹配一行的开头
$ :匹配一行的结束
. :匹配一个任意的字符
* :不单独使用,他和上一个字符连用,表示匹配上一个字符 0 次或多次
[ ] :表示匹配某个范围内的一个字符
\ :表示转义,并不会单独使用。由于所有特殊字符都有其特定匹配模式,当我们想匹配
某一特殊字符本身时(例如,我想找出所有包含 '$' 的行),就会碰到困难。此时我们就要将转义字符和特殊字符连用,来表示特殊字符本身
以下都是在passwd中匹配
会匹配出所有以 a 开头的行
[atguigu@hadoop101 shells]$ cat /etc/passwd | grep ^a
匹配出所有以 t 结尾的行
[atguigu@hadoop101 shells]$ cat /etc/passwd | grep t$
会匹配包含 rabt,rbbt,rxdt,root 等的所有行,两个点代表两个字符
[atguigu@hadoop101 shells]$ cat /etc/passwd | grep r..t
会匹配 rt, rot, root, rooot, roooot 等所有行
[atguigu@hadoop101 shells]$ cat /etc/passwd | grep ro*t
匹配 rt,rat, rbt, rabt, rbact,rabccbaaacbt 等等所有行
[6,8]------匹配 6 或者 8
[0-9]------匹配一个 0-9 的数字
[0-9]*------匹配任意长度的数字字符串
[a-z]------匹配一个 a-z 之间的字符
[a-z]* ------匹配任意长度的字母字符串
[a-c, e-f]-匹配 a-c 或者 e-f 之间的任意字符
[atguigu@hadoop101 shells]$ cat /etc/passwd | grep r[a,b,c]*t
就会匹配所有包含 /$b 的行。注意需要使用单引号将表达式引起来
[atguigu@hadoop101 shells]$ cat /etc/passwd | grep ‘/\$b’