IC脚本之perl
Perl 是一种功能丰富的计算机程序语言,运行在超过100种计算机平台上。IC flow 的 流传的古老版本大多是也是使用这种语言,这里会对Perl的常用知识点进行总结。
Note: 所有的语句必须以 “ ;”结尾;所有的数据必须先定义才可以使用;
Getopt::Long获取命令行参数用法
1. 变量
Perl中的数据类型分为变量,数组(类似于python的list),hash(类似于python中的字典)。可以分别通过 my $var; my @array; my %hash; 定义数据结构。
变量包含数字变量以及字符串变量;如果变量未被赋值,它是一个undef 变量, 可以通过define($var) 判断其结构。
1. if (defined($a)) #判断a变量是否被使用赋值。
2. 字符串拼接
$a."hello" 通过" . "拼接
join($a,"hello" 通过join函数拼接。
$a.="hello" 通过" .="将字符串拼接到另一个字符串,但是改变了字符串内容。
使用Perl 5.10及以上版本的say函数(需要在脚本开头加入use feature 'say';或者use 5.010;):
say $a."hello" ; 会把拼接的字符串打印到命令行,并自动换行。
数组结构
push @array data # 将data存储在数组array的最后一个位置,这里的data可以是任意数据结构。
pop @array out_data # 从array数组弹出最后一个位置的元素,并赋值给out_data.
unshift @array data 函数会在数组的开头添加一个或多个元素。
shift @array out_data 函数会从数组的开头移除一个元素,并返回这个被移除的元素
hash结构
哈希是Perl中的第三种基本数据类型。与数组一样,哈希包含了许多个标量。数组与哈希的差别是:哈希是按照名字来访问它们的标量的,而不是像数组那样使用数字标号进行访问。
哈希元素包含两个部分,即一个关键字和一个值。
my %hash_test;
$hash_test{"a"}="APPLE" #通过$hash_name{"key"}读写变量
keys %hash_test #返回hash_test的所有键。
values %hash_test #返回hash_tes的所有values
delete $hash_test{"a"} #删除a 的元素
2. 分支结构
主要是if-else结构
if-else 结构
if (condition) {
commands1;
} else {
commands2;
}
if-elsif- else 结构
if (condition1) {
commands1;
} elsif (condition2) {
commands2;
} else {
commands3;
}
3. 循环结构
只要表达式为True,while循环就会重复执行该代码段
while (condtion) {
expression;
}
for 循环
for (var; condition; incr or decrease) {
commands;
}
eg
@boy=qw(Greg Peter Bobby);
for($index=0;$index<@boy;$index++){
print "My favorite is $boy[$index]\n"
}
foreach 经常用于数组的遍历
#!/usr/bin/perl -w
my $b ;
@boy=qw(Greg Peter Bobby);
foreach $b (@boy) {
print $b."\n";
}
针对循环结构还存在 last , next语句控制循环进程。last 则是满足某一条件后退出本次循环loop等价于C语言的break; next 则是满足某一条件事,不在执行本次循环的循环体而跳回循环体,等价于C语言continue。
4. 函数
在 Perl中,用户定义的函数称为子例程。与 Perl的内置函数一样,用户定义的函数也可以拥有参数,并且可以将值返回给调用者。
#这里的arg默认输入参数也可以没有,直接使用函数体外的全局遍历
subn fun_name (arg1, arg2, arg3) {
expression;
}
#调用函数体
&subname (arg1, arg2, arg3);
subname arg1, arg2, arg3;
5. 文件操作
open(filehandle,pathname) open函数将文件句柄作为它的第一个参数,将路径名作为第二个参数。路径名用于指明要打开哪个文件。
#通过 "<” 设定read模式, ">"设定写模式。
open(MYFILE, "</home/liuye/Scripts/perl/file1.txt") || die "$!";
my $line;
#通过while获取文件内容
while ($line = <MYFILE>) {
chomp($line);
print ("$line");
}
#通过foreach获取文件内容
my @lines=<MYFILE>
foreach $line ( @lines) {
chomp($line);
print ("$line");
}
close (MYFILE);
6. 正则表达式
元字符
元字符
. 圆点用于匹配除了换行符外的任何单个字符
\ 在字符前面加上一个反斜杠,使它失去“元”的含义
+ 用于使前面的字符与后面的字符至少匹配一次
* 前面的字符可以进行 0次或多次匹配
? 用于使前面的字符进行 0次或一次匹配
.* 用来匹配任何东西
{n,m} 根据需要的具体次数进行匹配,n是匹配的最小次数,m是匹配的最大次数
位置锚定符
"^"代表起始位置,“$"代表结束位置。
\b 字符边界
\B 非字符边界
或
| : hell|HELL 表示匹配hell或者HELL。
捕获
(?:pattern) 匹配 pattern 但不获取匹配结果
(?=pattern) 正向肯定预查,标注pattern前面
(?!pattern) 正向否定预查
(?<=pattern) 反向肯定预查
(?<!pattern) 反向否定预查
(?<var_name>pattern) 命名匹配,这种就可以将pattern匹配的内容存放到var_name变量
=~ 绑定操作符,它用于将正则匹配操作与哪个变量匹配起来。
Example
if ($a =~ m/pattern/ ) #判断 a变量是否匹配设定的pattern。
$a =~ s/old/new/ ;#将 a变量字符串中old字符变成new字符。
常用代码
1. 文件读取
use strict ;
use warnings;
use Getopt::Long;
GetOptions (
'log=s' => \my $log,
'opt=s' => \my $opt
) or usage();
my $name;
my $age;
my $birthday;
if (defined($log)) { #判断log变量是否存在
print($log."\n");
}
open $FILE "<filename" or die "Failed to open filename"
#此时文件的每一行内容存储在内部变量 $_, 循环体内默认对这个变量操作
while (<FILE>) {
chomp; #用于移除字符串末尾的换行符(通常是 \n)或其他指定的字符
next if(/$\s*(#|\/\/) or /^\s*$/); #跳过注释行和空白行
if (/(?<name>\d+)\s+(/(?<name>\w+)\s+(?<birthday>) {
print("match \n"); 此时匹配的内容存储到三个字段中
$name=$+{name}; 通过$+{字段} 来引用匹配的变量
$age=$+{age};
$birthday=$+{birthday};
}
}
close(FILE);
sub usage {
print("usate is now \n");
}
2. 对于一些死循环或者缓缓比较久的函数使用键盘终止,可通过异常信号捕捉的形式来处理。
1 linux系统的异常事件信号存储在SIG环境变量,perl通过仿真这些变量来执行
相应的异常处理函数。
$SIG{'INT'}= \&func;
$SIG{'TERM'}= \&func;
$SIG{'QUIT'}= \&func;
这里通过 \& 传递func函数的引用。