Perl命令行应用介绍

注意, LINE: 标签可以让我们直接跳到下一个输入记录,而不管你进入了多少层循环。使用 next LINE。

$ Perl -n -e 'next LINE unless /pattern/; print $_'
当然,也可以这样写:
$ Perl -n -e 'print unless /pattern/'
在更复杂的情况里, next LINE 可以让你的代码更容易理解。

如果想在循环的前后做些处理,可以使用 BEGIN 或 END block. 下面的这一行代码可以计算 text 文件里的字数。

$ Perl -ne 'END { print $t } @w = /(\w+)/g; $t += @w' file.txt
每一行所有匹配的字放入数组 @w,然后把 @w 的元素数目递加到 $t。END block 里的 print 最后输出文件总字数。

还有两个参数可以让这个程序变得更简单。-a 打开自动分离 (split) 模式。空格是缺省的分离号。输入根据分离号被分离然后放入缺省数组 @F。由此,我们可以把上面的程序改写为

$ Perl -ane 'END {print $x} $x += @F' file.txt
你也可以通过 -F 把缺省的分离号改为你想要的.例如把分离号定为非字符:
$ Perl -F'\W' -ane 'END {print $x} $x += @F' file.txt
下面通过 unix password 文件来介绍一个复杂的例子。unix password 是文本文件,每一行是一个用户记录,由冒号 :分离。 第?行是用户的登录 shell 路径。我们可以得出每一个不同 shell 路径被多少个用户使用:
$ Perl -F':' -ane '$s{$F[6]}++;' \
> -e 'END { print "$_ : $s{$_}" for keys %s }' /etc/passwd
虽然现在不是一行,但是你可以看出使用参数可以解决什么问题。

数据分隔符

我以前的文章里提到过 $/ 和 $\—输入,输出分隔号。$/ 用来分隔从文件句柄里读出的数据,缺省 $/ 分隔号是 \n,这样每次从文件句柄里就会一行行的读取。 $\ 缺省是空字符,用来自动加到要 print 的数据尾端。这就是为什么很多时候 print 都要在末尾加上 \n。

$/ 和 $\ 可与 -n -p 一起使用。在命令行上相对应为 -0 (零) 和 -l ( 这是 L )。-0 后面可以跟一个16 进制或8进制数值,这个值用来赋给 $/。-00 打开段落模式,-0777 打开slurp 模式 (即可以一次把整个文件读入),这与把 $/ 设为空字符和 undef 一样效果。

单独使用 -l 有两个效果,第一自动 chomp 输入分隔号,第二 把$/ 值付给 $\ ( 这样 print 的时候就会自动在末尾加 \n )

我个人常常使用 -l 参数, 用来给每一个输出加 \n. 例如

$ Perl -le 'print "Hello World"'

原位编辑

使用已有的参数我们可以写出很有效的命令行程序. 常见的unix I/O 重定向:
$ Perl -pe 'some code' < input.txt > output.txt
这个程序从 input.txt 读取数据, 然后做一些处理再输出到 output.txt. 你当然也可以把输出重定向到同一个文件里. 上面的程序可以通过 -i 参数做的更简单些。-i 把源文件更名然后从这个更名的源文件里读取。最后把处理后的数据写入源文件。如果 -i 后跟有其他字符串,这个字符串与源文件名合成后来生成一个新的文件名。此文件会被用来储存原始文件以免被 -i 参数覆盖。

这个例子把所有 php 字符替换为 Perl :

$ Perl -i -pe 's/\bPHP\b/Perl/g' file.txt
程序读取文件的每一行, 然后替换字符, 处理后的数据重新写入( 即覆盖 ) 源文件. 如果不想覆盖源文件, 可以使用
$Perl -i.bak -pe 's/\bPHP\b/Perl/g' file.txt
这里处理过的数据写入 file.txt , file.txt.bak 是源文件的备份.
共2页 首页 上一页 [1] [2下一页 尾页>
字母检索 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z