Awk是什么?

1个回答

  • 中文释义:三位创造者Aho、Weinberger和Kernighan统称Awk简介  AWK是一种优良的文本处理工具.它不仅是 Linux 中也是任何环境中现有的功能最强大的数据处理引擎之一.这种编程及数据操作语言(其名称得自于它的创始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首个字母)的最大功能取决于一个人所拥有的知识.AWK 提供了极其强大的功能:可以进行样式装入、流控制、数学运算符、进程控制语句甚至于内置的变量和函数.它具备了一个完整的语言所应具有的几乎所有精美特性.实际上 AWK 的确拥有自己的语言:AWK 程序设计语言,三位创建者已将它正式定义为样式扫描和处理语言.它允许您创建简短的程序,这些程序读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,还有无数其他的功能.

    最简单地说,AWK 是一种用于处理文本的编程语言工具.AWK 在很多方面类似于 shell 编程语言,尽管 AWK 具有完全属于其本身的语法.它的设计思想来源于 SNOBOL4 、sed 、Marc Rochkind设计的有效性语言、语言工具 yacc 和 lex ,当然还从 C 语言中获取了一些优秀的思想.在最初创造 AWK 时,其目的是用于文本处理,并且这种语言的基础是,只要在输入数据中有模式匹配,就执行一系列指令.该实用工具扫描文件中的每一行,查找与命令行中所给定内容相匹配的模式.如果发现匹配内容,则进行下一个编程步骤.如果找不到匹配内容,则继续处理下一行.

    尽管操作可能会很复杂,但命令的语法始终是:

    awk '{pattern + action}'

    其中 pattern 表示 AWK 在数据中查找的内容,而 action 是在找到匹配内容时所执行的一系列命令.花括号 ({}) 不需要在程序中始终出现,但它们用于根据特定的模式对一系列指令进行分组.

    gawk 是 AWK 的 GNU 版本.

    一般的UNIX作业系统,本身即附有AWK,不同的UNIX作业系统所附的AWK其版本亦不尽相同,若读者所使用的系统上未附有AWK,可通过 anonymous ftp 到下列地方取得:

    phi.sinica.edu.tw:/pub/gnu

    ftp.edu.tw:/UNIX/gnu

    prep.ai.mit.edu:/pub/gnu

    注 一种编程语言,因其模式匹配语法而特别有用,通常用于数据检索和数据转换.一个GNU版本称为Gawk.

    Awk的调用方式

    awk提供了适应多种需要的不同解决方案,它们是:

    一、 awk命令行,你可以象使用普通UNIX命令一样使用awk,在命令行中你也可以使用awk程序设计语言,虽然awk支持多行的录入,但是录入长长的命令行并保证其正确无误却是一件令人头疼的事,因此,这种方法一般只用于解决简单的问题.当然,你也可以在shell script程序中引用awk命令行甚至awk程序脚本.

    二、使用-f选项调用awk程序.awk允许将一段awk程序写入一个文本文件,然后在awk命令行中用-f选项调用并执行这段程序.具体的方法我们将在后面的awk语法中讲到.

    三、利用命令解释器调用awk程序:利用UNIX支持的命令解释器功能,我们可以将一段awk程序写入文本文件,然后在它的第一行加上:

    #!/bin/awk -f

    并赋予这个文本文件以执行的权限.这样做之后,你就可以在命令行中用类似于下面这样的方式调用并执行这段awk程序了.

    awk脚本文本名 待处理文件Awk的语法  与其它UNIX命令一样,awk拥有自己的语法:

    awk [ -F re] [parameter...] ['prog'] [-f progfile]

    参数说明:

    -F re:允许awk更改其字段分隔符.

    parameter:该参数帮助为不同的变量赋值.

    'prog':awk的程序语句段.这个语句段必须用单拓号:'和'括起,以防被shell解释.这个程序语句段的标准形式为:

    'pattern '

    其中pattern参数可以是egrep正则表达式中的任何一个,它可以使用语法/re/再加上一些样式匹配技巧构成.与sed类似,你也可以使用,分开两样式以选择某个范围.关于匹配的细节,如果仍不懂的话,找本UNIX书学学grep和sed(本人是在学习ed时掌握匹配技术的).action参数总是被大括号包围,它由一系统awk语句组成,各语句之间用;分隔.awk解释它们,并在pattern给定的样式匹配的记录上执行其操作.与shell类似,你也可以使用#作为注释符,它使#到行尾的内容成为注释,在解释执行时,它们将被忽略.你可以省略pattern和 action之一,但不能两者同时省略,当省略pattern时没有样式匹配,表示对所有行(记录)均执行操作,省略action时执行缺省的操作--在标准输出上显示.

    -f progfile:允许awk调用并执行progfile指定有程序文件.progfile是一个文本文件,他必须符合awk的语法.

    in_file:awk的输入文件,awk允许对多个输入文件进行处理.值得注意的是awk不修改输入文件.如果未指定输入文件,awk将接受标准输入,并将结果显示在标准输出上.awk支持输入输出重定向.