linux-28 文本管理(一)文本查看,cat,tac,more,less,head,tail
之前提到过linux的几个重要哲学思想,使用纯文本文件保存软件的配置信息是其中之一,所以大多数情况下,我们对整个系统的操作,都是通过编辑它的配置文件来完成,那也就意味着,处理文本文件是我们作为系统管理员一个重要的基本要求,那因此,我们必须要掌握常见的文本处理工具来实现对于配置文件的管理或者对文本文件的管理。文件文本管理来讲,大多数只包含这样几个操作查看,编辑,这样两种操作,主要就是查看和编辑,因为删除那些之前已经讲过了,那我们先来看看怎么去查看文本的,我们linux提供了众多工具来查看文本,比方说,cat,比方说more,cat还可以反过来写,叫tac,完全反过来,然后有less,head,tail,这几个主要是用来也是用的最多的,用于实现文本查看类的命令。一定要记得他们是用来查看文本的,千万不要试图用它来打开一个二进制格式的文件,要记得这一点,先看第一个命令叫做cat,cat其实也是个简写concatenate,意思就是叫连接并显示的意思,那所以cat的主要作用,它能够实现,将通过参数给的几个文本文件的内容,一个一个的完全显示出来,所以这叫连接并显示,就这意思,连接并显示,当然,如果我们只给了一个文本文件,它就直接显示了,各位来看,举个简单例子,比如我们看一下/etc/issue,注意这些文件,经常给些路径,不是随便给的,因为这些路径,这些文件的内容,将来可能需要去操作它的,cat /etc/issue,有这样三行内容,再 cat /etc/fstab,有这样几行内容,如下图,
就是两个文件,我把这两个文件顺便都给出来,cat /etc/issue /etc/fstab,如下图,
会发现逐个显示完全倾倒到屏幕上来,所以叫连接并显示,就这么简单,那我们man一下cat过来看,man cat ,如下图,
叫做concatenate并显示出来的,显示到标准输出上来,开头用法也很简单,使用选项,可以接多个文件,常见选项,有这样几个,第一个-n,-n在显示的时候,它可以显示行号的,比如cat /etc/issue,显示没有第几行,但加上杠n选项,自动给你编号一二三四,cat -n /etc/issue,如下图,
要记得这个行号不是文件的内容,只是显示的号码而已,跟文件内容分行没有关系,要记得,这是-n显示行号,或者就是在显示的时候对每一行进行编号,这样可能更容易更容易理解,第二个选项-E, --show-ends
display $ at end of each line,尾行结束的意思,所以-E就是叫show ends,显示每一行的行结束符的,再来看使用-E,cat -E /etc/issue,如下图,
每一行里面有个$符,就连空白行它也有个$,这个$是表示LF,LF的ASCII值是10,所以用$来代替表示LF,但因为Windows的行结束符是回车符CR加上换行符LF,也就是\r\n,所以你会发现把文本文件从linux复制到Windows里面,用记事本打开,统统显示为一行,为什么呢?因为它的每一行行结束后,只有LF没有换行,明白这意思吧,没有回车,所以对Windows而言,它理解这就是一行而已,那因此要明白,这一行一行为什么会显示成不同的行,后面就算还有空格,这些内容都没有显示,为什么会自动换一行来显示呢?它是一个控制符号来定义的,只不过这个控制符号在Windows中和linux中是不一样的。所以我们在Windows中编辑的文本拿到linux里边来,你会发现linux可能识别不了,或者识别的时候总是会报错,那是因为它多了个回车符,但是有些专业级的文本编辑器在Windows当中,它可以实现仅使用LF,比如像我用这个工具,notepad++,如下图,
为什么要各位用这个工具,就是这个道理,我们有很多在linux里边编辑的脚本,下载到本地直接使用的时候,你会发现如果使用文本文件打开,那绝对都是一行,使用记事本打开是一行,只有使用这种工具,打开的时候它才能识别这些不同的接束符,当然我们后面会讲到一些文本处理工具,我们也可以手动使用命令来处理这些符号,这是-E这个选项。
事实上,对于我们linux而言,或者对于文本文件而言,它有很多其他的控制符,你比如说-T,可以显示什么?可以显示制表符的,制表符是一种控制符,它会显示控制符号的。而使用-v则可以显示其他的非打印字符,比方说回车符,托字符,就是行首控制符等等,这些对我们都不是特别关键,知道使用-E就行了,而要想显示所有内容,无论是非显示符就是控制符或者其他的符号,使用-A,show all,所有都能显示出来。cat的命令对我们而言,大多数时候的用法都很简单,
我们常用的无非就是-E和-n,我们使用命令显示内容的时候,它的内容是从首部向尾部进行显示的,而cat反过来,这就是tac,tac /etc/issue,如下图,
有些时候,当我们特殊处理文本的时候,是有这种需要的,当然,有时候可能遇到过这样的困境,尝试使用cat命令的时候,一不小心,忘了加参数了,回车了,一回车退不出来了,你输入ls,输入cd,你看输入什么abcd,它都得再显示一遍,如下图,
就是cat的默认作用,它从标准输入读取内容,并显示到标准输出上来,这时候我们要想退出,就必须要终止当前命令,对于大多数命令而言,我们都有一个终止服务叫做ctrl+c键,这实际上就是我发起了一个控制命令,或者向我们进程发出了一个控制符号或者是发起了一个控制信号,它称为叫做interrupt,叫打断、中断的信号,或叫终止信号。注意,你不是输入ctrl+c,是按着ctrl键再摁c键,这要注意,按照ctrl键,再用c键,就结束了,如下图,
其实不但可以这样ctrl+c,很多时候我们可能都有这种需要,比如说我们输入一个命令,比如说,我输入命令输入到一半了,我突然间想起来,唉,我还有个别的命令没执行,于是开始按着删除键,按着删除键往前删删删到头,然后再继续重新写另外一个命令,注意,这种情况下是完全没有必要的,命令我写了一半了,或者甚至写完了,我不想执行,ctrl+c即可,如下图,
这时候ctrl+c就取消了,直接给你打一个新的命令提示符,继续输入别的命令即可,这就是我们的常用技巧。这是我们ctrl+c,这样一个控制组合键,同时,我们讲了cat和tac这个命令。
有没有发现开了命令有个坏处?比如说如果这个文件非常长的话,会有什么结果呢?举个例子,cat -n /etc/rc.d/rc.sysinit,如下图,
翻屏而过,很多行,想看到前面内容怎么办?往前翻,这是可以翻的,如果在终端上呢?就看不到了,所以需要注意,其实这些闪过去的内容,在我的内存当中,它会有一个缓存区域给我们保存下来的,真正想往前看的话,是可以翻回去的,但是那个内存区域有限,所以你翻过去的是五十屏,内存只能给你缓存20屏,就算可以往前翻,也只能翻20屏而已,前面30都没了,怎么翻屏,很简单,按着shift+PageUp和shift+PageDown键就可以实现了,但是你能翻的是有限的,未必能翻到文件首部,那所以对于这种情况来讲就比较难受了,cat整个的把所有内容直接倾倒到屏幕上来,倾倒完了它就退出了,它也不管你接下来能不能看到,那因此有些时候我们可能需要能够分屏查看文件内容,我们一页一页去看,那接下来我们就讲两个分页查看命令,或者叫分屏查看命令,就是more和less的作用了,more它的用法跟cat几乎是类似的,但是它可以让我们去从前向后一页一页的手动去翻屏查看文件内容,比如,还以刚才这个文件为例,more /etc/rc.d/rc.sysinit,如下图,
这是第一屏,它说2%,我们一共才显示2%,此时,我们要想向后看,它的用法跟那个man差不多,敲空格键,向后翻一屏,敲b键,往前翻一屏,敲回车键,一行一行向后翻,敲k键不支持,因为它不支持,其实more默认情况下只支持向后翻,不支持向前翻的,你要翻到文件尾部就退出了,所以它是这意思,翻到文件尾部以后就退出,不再等待你可以往前翻了。所以一般来讲more向后翻,支持向后翻不支持向前翻的。当然,前提是要想向前翻,前提是你没有翻到文件尾部的前提下,直接翻翻到最后退出了,再向前翻怎么翻?没有了,明白了吗?如下图,
这就是冒命令,很简单,当然冒也有很多选项,man more,如下图,
有很多选项,当然这个大多数选项对我们而言用处都不大,它还有很多内部的控制命令,像space怎么翻屏的什么之类的,这对我们来讲,用的都不是特别多,所以你甭管它了,只需要知道more怎么用,简单的用法就可以,事实上,对我们而言,最长用的反而是另外一个东西叫做less,less的用法说白了就是man,因为man本身就是使用less命令打开文件并查看的,所以在man里边,我们所能够用的这些都支持,比方说space向后翻,k能够一行一行向前翻,还够使用斜线问号查找文本,等等等都支持,那我们没必要再讲一遍了,而且less翻到最后,它是不会退出的,只有我们敲q命令它才会退出,那因此,我们向前翻,始终支持。less /etc/rc.d/rc.sysinit,如下图,
就算我们翻到最后,它也不会退出,只是告诉你到了END,结束了再敲空格键,它也不会退出的,这时候敲b键继续往前翻,无论在什么地方,敲q键就可以退出。这就我们的less命令。
在很多时候我们可能还有这样一种需求,我们只想查看一个文件的前几行或者后几行就够了,不是查看整个文件的全部内容,所以这有了另外两个命令的意义,一个叫head,从名字能看得出来什么意思,那tail就是尾巴尾部的意思,那因此head命令这是查看文件的前n行,tail命令是查看后n行,默认n是10,n默认是十,他们都支持一个选项,叫做-n,可以指定显示多少行?比如都来看,head /etc/inittab,如下图,
一共显示前十行,看到了吗?我要显示第一行,那怎么办?-n 1是不是即可?head -n 1 /etc/inittab,如下图,
就显示第一行,-n 2不是第二行是前两行,如下图,
很简单,当然事实上,我们head在linux中还支持这样的用法,在unix中可能不支持,在linux中还支持这样的用法,直接-2就行,前两行,不用写-n 2了,直接-2即可,如下图,
tail的用法是一样的,比如我们要想看后五行,就-5,tail -5 /etc/inittab 即可,如下图,
这是后五行,不加任何选项,默认是十,刚才说过,注意空白行也是一行,我们的tail命令还有一个特殊的选项,tail命令还有一个专用选项叫-f,f表示follow的意思,它查看一个文件之后并不退出,而是等待其他进程向里边儿继续输入新内容,并且立即运行显示的,什么意思呢?我先举例子,你先看到效果就明白了,比如,我现在找一个文件,我大家一定要记得,不要在etc下直接编辑文件,我复制一个文件,复制etc下的inittab到tmp下去,cp /etc/inittab /tmp/ ,然后我们使用tail -f看tmp下这个inittab,tail -f /tmp/inittab,然后看完以后,注意,发现它把这个整个文件翻过去,翻后十行,注意啊,默认值是后十行,显示完之后没退出,如下图,
发现了吗?要想退出怎么办?ctrl+c是吧?注意这里又没退出,那没退出有什么意义呢?你使用nano,再打开一个终端,使用 nano /tmp/initab,然后切换到最后一行,把它新增一行,保存一下,如下图,
你看这边显示出来没有?如下图,
看到了吗?所以这就是-f的意义,其他任何进程,只要向我们打开这个文件的尾部写了新内容,它都会立即予以显示的,这有用吗?对我们来讲不但有用而且相当有用,将来我们需要监控一个服务运行的时候,每一个服务在运行当中都会生成日志文件的,而一般情况下,比如说我的web服务器,一个用户登录进来,一个用户访问一下我的web,可能都会生成很多访问日志,明白这意思吗?使用tail就可以监控这个日志,随时看到有多少个用户正在访问哪个网页,随时可以查看,所以这个命令是非常有用的,要记得tail -f,查看文件尾部,然后不退出,而是随后等着显示新增进来的追加进来的后续内容,注意,我这里用的追加这个词儿,附加进来的东西。这就是我们的tail命令,所以其实每一个命令,选项都有很多,而对我们来讲,常用的并不是特别多,所以对于这些基本的大家一定要记住。