  This is Info file gawk.info, produced by Makeinfo-1.55 from the input
  file gawk.texi.
  This file documents `awk', a program that you can use to select
  particular records in a file and perform operations upon them.
  This is Edition 0.15 of `The GAWK Manual',
  for the 2.15 version of the GNU implementation
  of AWK.
  8.    Copyright (C) 1989, 1991, 1992, 1993 Free Software Foundation, Inc.
  9.    Permission is granted to make and distribute verbatim copies of this
  10. manual provided the copyright notice and this permission notice are
  11. preserved on all copies.
  12.    Permission is granted to copy and distribute modified versions of
  13. this manual under the conditions for verbatim copying, provided that
  14. the entire resulting derived work is distributed under the terms of a
  15. permission notice identical to this one.
  16.    Permission is granted to copy and distribute translations of this
  17. manual into another language, under the above conditions for modified
  18. versions, except that this permission notice may be stated in a
  19. translation approved by the Foundation.
  20. File: gawk.info,  Node: Top,  Next: Preface,  Prev: (dir),  Up: (dir)
  21. General Introduction
  22. ********************
  23.    This file documents `awk', a program that you can use to select
  24. particular records in a file and perform operations upon them.
  25.    This is Edition 0.15 of `The GAWK Manual',
  26. for the 2.15 version of the GNU implementation
  27. of AWK.
  28. * Menu:
  29. * Preface::                     What you can do with `awk'; brief history
  30.                                 and acknowledgements.
  31. * Copying::                     Your right to copy and distribute `gawk'.
  32. * This Manual::                 Using this manual.
  33.                                 Includes sample input files that you can use.
  34. * Getting Started::             A basic introduction to using `awk'.
  35.                                 How to run an `awk' program.
  36.                                 Command line syntax.
  37. * Reading Files::               How to read files and manipulate fields.
  38. * Printing::                    How to print using `awk'.  Describes the
  39.                                 `print' and `printf' statements.
  40.                                 Also describes redirection of output.
  41. * One-liners::                  Short, sample `awk' programs.
  42. * Patterns::                    The various types of patterns
  43.                                 explained in detail.
  44. * Actions::                     The various types of actions are
  45.                                 introduced here.  Describes
  46.                                 expressions and the various operators in
  47.                                 detail.  Also describes comparison expressions.
  48. * Expressions::                 Expressions are the basic building
  49.                                 blocks of statements.
  50. * Statements::                  The various control statements are
  51.                                 described in detail.
  52. * Arrays::                      The description and use of arrays.
  53.                                 Also includes array-oriented control
  54.                                 statements.
  55. * Built-in::                    The built-in functions are summarized here.
  56. * User-defined::                User-defined functions are described in detail.
  57. * Built-in Variables::          Built-in Variables
  58. * Command Line::                How to run `gawk'.
  59. * Language History::            The evolution of the `awk' language.
  60. * Installation::                Installing `gawk' under
  61.                                 various operating systems.
  62. * Gawk Summary::                `gawk' Options and Language Summary.
  63. * Sample Program::              A sample `awk' program with a
  64.                                 complete explanation.
  65. * Bugs::                        Reporting Problems and Bugs.
  66. * Notes::                       Something about the
  67.                                 implementation of `gawk'.
  68. * Glossary::                    An explanation of some unfamiliar terms.
  69. * Index::
  70. File: gawk.info,  Node: Preface,  Next: Copying,  Prev: Top,  Up: Top
  71. Preface
  72. *******
  73.    If you are like many computer users, you would frequently like to
  74. make changes in various text files wherever certain patterns appear, or
  75. extract data from parts of certain lines while discarding the rest.  To
  76. write a program to do this in a language such as C or Pascal is a
  77. time-consuming inconvenience that may take many lines of code.  The job
  78. may be easier with `awk'.
  79.    The `awk' utility interprets a special-purpose programming language
  80. that makes it possible to handle simple data-reformatting jobs easily
  81. with just a few lines of code.
  82.    The GNU implementation of `awk' is called `gawk'; it is fully upward
  83. compatible with the System V Release 4 version of `awk'.  `gawk' is
  84. also upward compatible with the POSIX (draft) specification of the
  85. `awk' language.  This means that all properly written `awk' programs
  86. should work with `gawk'.  Thus, we usually don't distinguish between
  87. `gawk' and other `awk' implementations in this manual.
  88.    This manual teaches you what `awk' does and how you can use `awk'
  89. effectively.  You should already be familiar with basic system commands
  90. such as `ls'.  Using `awk' you can:
  91.    * manage small, personal databases
  92.    * generate reports
  93.    * validate data
  94.    * produce indexes, and perform other document preparation tasks
  95.    * even experiment with algorithms that can be adapted later to other
  96.      computer languages
  97. * Menu:
  98. * History::                     The history of `gawk' and
  99.                                 `awk'.  Acknowledgements.
  100. File: gawk.info,  Node: History,  Prev: Preface,  Up: Preface
  101. History of `awk' and `gawk'
  102. ===========================
  103.    The name `awk' comes from the initials of its designers: Alfred V.
  104. Aho, Peter J. Weinberger, and Brian W. Kernighan.  The original version
  105. of `awk' was written in 1977.  In 1985 a new version made the
  106. programming language more powerful, introducing user-defined functions,
  107. multiple input streams, and computed regular expressions.  This new
  108. version became generally available with System V Release 3.1.  The
  109. version in System V Release 4 added some new features and also cleaned
  110. up the behavior in some of the "dark corners" of the language.  The
  111. specification for `awk' in the POSIX Command Language and Utilities
  112. standard further clarified the language based on feedback from both the
  113. `gawk' designers, and the original `awk' designers.
  114.    The GNU implementation, `gawk', was written in 1986 by Paul Rubin
  115. and Jay Fenlason, with advice from Richard Stallman.  John Woods
  116. contributed parts of the code as well.  In 1988 and 1989, David
  117. Trueman, with help from Arnold Robbins, thoroughly reworked `gawk' for
  118. compatibility with the newer `awk'.  Current development (1992) focuses
  119. on bug fixes, performance improvements, and standards compliance.
  120.    We need to thank many people for their assistance in producing this
  121. manual.  Jay Fenlason contributed many ideas and sample programs.
  122. Richard Mlynarik and Robert J. Chassell gave helpful comments on early
  123. drafts of this manual.  The paper `A Supplemental Document for `awk''
  124. by John W.  Pierce of the Chemistry Department at UC San Diego,
  125. pinpointed several issues relevant both to `awk' implementation and to
  126. this manual, that would otherwise have escaped us.  David Trueman, Pat
  127. Rankin, and Michal Jaegermann also contributed sections of the manual.
  128.    The following people provided many helpful comments on this edition
  129. of the manual: Rick Adams, Michael Brennan, Rich Burridge, Diane Close,
  130. Christopher ("Topher") Eliot, Michael Lijewski, Pat Rankin, Miriam
  131. Robbins, and Michal Jaegermann.  Robert J. Chassell provided much
  132. valuable advice on the use of Texinfo.
  133.    Finally, we would like to thank Brian Kernighan of Bell Labs for
  134. invaluable assistance during the testing and debugging of `gawk', and
  135. for help in clarifying numerous points about the language.
  440. File: gawk.info,  Node: This Manual,  Next: Getting Started,  Prev: Copying,  Up: Top
  441. Using this Manual
  442. *****************
  443.    The term `awk' refers to a particular program, and to the language
  444. you use to tell this program what to do.  When we need to be careful,
  445. we call the program "the `awk' utility" and the language "the `awk'
  446. language."  The term `gawk' refers to a version of `awk' developed as
  447. part the GNU project.  The purpose of this manual is to explain both the
  448. `awk' language and how to run the `awk' utility.
  449.    While concentrating on the features of `gawk', the manual will also
  450. attempt to describe important differences between `gawk' and other
  451. `awk' implementations.  In particular, any features that are not in the
  452. POSIX standard for `awk' will be noted.
  453.    The term "`awk' program" refers to a program written by you in the
  454. `awk' programming language.
  455.    *Note Getting Started with `awk': Getting Started, for the bare
  456. essentials you need to know to start using `awk'.
  457.    Some useful "one-liners" are included to give you a feel for the
  458. `awk' language (*note Useful "One-liners": One-liners.).
  459.    A sample `awk' program has been provided for you (*note Sample
  460. Program::.).
  461.    If you find terms that you aren't familiar with, try looking them up
  462. in the glossary (*note Glossary::.).
  463.    The entire `awk' language is summarized for quick reference in *Note
  464. `gawk' Summary: Gawk Summary.  Look there if you just need to refresh
  465. your memory about a particular feature.
  466.    Most of the time complete `awk' programs are used as examples, but in
  467. some of the more advanced sections, only the part of the `awk' program
  468. that illustrates the concept being described is shown.
  469. * Menu:
  470. * Sample Data Files::           Sample data files for use in the `awk'
  471.                                 programs illustrated in this manual.
  472. File: gawk.info,  Node: Sample Data Files,  Prev: This Manual,  Up: This Manual
  473. Data Files for the Examples
  474. ===========================
  475.    Many of the examples in this manual take their input from two sample
  476. data files.  The first, called `BBS-list', represents a list of
  477. computer bulletin board systems together with information about those
  478. systems.  The second data file, called `inventory-shipped', contains
  479. information about shipments on a monthly basis.  Each line of these
  480. files is one "record".
  481.    In the file `BBS-list', each record contains the name of a computer
  482. bulletin board, its phone number, the board's baud rate, and a code for
  483. the number of hours it is operational.  An `A' in the last column means
  484. the board operates 24 hours a day.  A `B' in the last column means the
  485. board operates evening and weekend hours, only.  A `C' means the board
  486. operates only on weekends.
  487.      aardvark     555-5553     1200/300          B
  488.      alpo-net     555-3412     2400/1200/300     A
  489.      barfly       555-7685     1200/300          A
  490.      bites        555-1675     2400/1200/300     A
  491.      camelot      555-0542     300               C
  492.      core         555-2912     1200/300          C
  493.      fooey        555-1234     2400/1200/300     B
  494.      foot         555-6699     1200/300          B
  495.      macfoo       555-6480     1200/300          A
  496.      sdace        555-3430     2400/1200/300     A
  497.      sabafoo      555-2127     1200/300          C
  498.    The second data file, called `inventory-shipped', represents
  499. information about shipments during the year.  Each record contains the
  500. month of the year, the number of green crates shipped, the number of
  501. red boxes shipped, the number of orange bags shipped, and the number of
  502. blue packages shipped, respectively.  There are 16 entries, covering
  503. the 12 months of one year and 4 months of the next year.
  504.      Jan  13  25  15 115
  505.      Feb  15  32  24 226
  506.      Mar  15  24  34 228
  507.      Apr  31  52  63 420
  508.      May  16  34  29 208
  509.      Jun  31  42  75 492
  510.      Jul  24  34  67 436
  511.      Aug  15  34  47 316
  512.      Sep  13  55  37 277
  513.      Oct  29  54  68 525
  514.      Nov  20  87  82 577
  515.      Dec  17  35  61 401
  517.      Jan  21  36  64 620
  518.      Feb  26  58  80 652
  519.      Mar  24  75  70 495
  520.      Apr  21  70  74 514
  521.    If you are reading this in GNU Emacs using Info, you can copy the
  522. regions of text showing these sample files into your own test files.
  523. This way you can try out the examples shown in the remainder of this
  524. document.  You do this by using the command `M-x write-region' to copy
  525. text from the Info file into a file for use with `awk' (*Note Misc File
  526. Ops: (emacs)Misc File Ops, for more information).  Using this
  527. information, create your own `BBS-list' and `inventory-shipped' files,
  528. and practice what you learn in this manual.
  529. File: gawk.info,  Node: Getting Started,  Next: Reading Files,  Prev: This Manual,  Up: Top
  530. Getting Started with `awk'
  531. **************************
  532.    The basic function of `awk' is to search files for lines (or other
  533. units of text) that contain certain patterns.  When a line matches one
  534. of the patterns, `awk' performs specified actions on that line.  `awk'
  535. keeps processing input lines in this way until the end of the input
  536. file is reached.
  537.    When you run `awk', you specify an `awk' "program" which tells `awk'
  538. what to do.  The program consists of a series of "rules".  (It may also
  539. contain "function definitions", but that is an advanced feature, so we
  540. will ignore it for now.  *Note User-defined Functions: User-defined.)
  541. Each rule specifies one pattern to search for, and one action to
  542. perform when that pattern is found.
  543.    Syntactically, a rule consists of a pattern followed by an action.
  544. The action is enclosed in curly braces to separate it from the pattern.
  545. Rules are usually separated by newlines.  Therefore, an `awk' program
  546. looks like this:
  547.      PATTERN { ACTION }
  548.      PATTERN { ACTION }
  549.      ...
  550. * Menu:
  551. * Very Simple::                 A very simple example.
  552. * Two Rules::                   A less simple one-line example with two rules.
  553. * More Complex::                A more complex example.
  554. * Running gawk::                How to run `gawk' programs;
  555.                                 includes command line syntax.
  556. * Comments::                    Adding documentation to `gawk' programs.
  557. * Statements/Lines::            Subdividing or combining statements into lines.
  558. * When::                        When to use `gawk' and
  559.                                 when to use other things.
  560. File: gawk.info,  Node: Very Simple,  Next: Two Rules,  Prev: Getting Started,  Up: Getting Started
  561. A Very Simple Example
  562. =====================
  563.    The following command runs a simple `awk' program that searches the
  564. input file `BBS-list' for the string of characters: `foo'.  (A string
  565. of characters is usually called, a "string".  The term "string" is
  566. perhaps based on similar usage in English, such as "a string of
  567. pearls," or, "a string of cars in a train.")
  568.      awk '/foo/ { print $0 }' BBS-list
  569. When lines containing `foo' are found, they are printed, because
  570. `print $0' means print the current line.  (Just `print' by itself means
  571. the same thing, so we could have written that instead.)
  572.    You will notice that slashes, `/', surround the string `foo' in the
  573. actual `awk' program.  The slashes indicate that `foo' is a pattern to
  574. search for.  This type of pattern is called a "regular expression", and
  575. is covered in more detail later (*note Regular Expressions as Patterns:
  576. Regexp.).  There are single-quotes around the `awk' program so that the
  577. shell won't interpret any of it as special shell characters.
  578.    Here is what this program prints:
  579.      fooey        555-1234     2400/1200/300     B
  580.      foot         555-6699     1200/300          B
  581.      macfoo       555-6480     1200/300          A
  582.      sabafoo      555-2127     1200/300          C
  583.    In an `awk' rule, either the pattern or the action can be omitted,
  584. but not both.  If the pattern is omitted, then the action is performed
  585. for *every* input line.  If the action is omitted, the default action
  586. is to print all lines that match the pattern.
  587.    Thus, we could leave out the action (the `print' statement and the
  588. curly braces) in the above example, and the result would be the same:
  589. all lines matching the pattern `foo' would be printed.  By comparison,
  590. omitting the `print' statement but retaining the curly braces makes an
  591. empty action that does nothing; then no lines would be printed.
  592. File: gawk.info,  Node: Two Rules,  Next: More Complex,  Prev: Very Simple,  Up: Getting Started
  593. An Example with Two Rules
  594. =========================
  595.    The `awk' utility reads the input files one line at a time.  For
  596. each line, `awk' tries the patterns of each of the rules.  If several
  597. patterns match then several actions are run, in the order in which they
  598. appear in the `awk' program.  If no patterns match, then no actions are
  599.    After processing all the rules (perhaps none) that match the line,
  600. `awk' reads the next line (however, *note The `next' Statement: Next
  601. Statement.).  This continues until the end of the file is reached.
  602.    For example, the `awk' program:
  603.      /12/  { print $0 }
  604.      /21/  { print $0 }
  605. contains two rules.  The first rule has the string `12' as the pattern
  606. and `print $0' as the action.  The second rule has the string `21' as
  607. the pattern and also has `print $0' as the action.  Each rule's action
  608. is enclosed in its own pair of braces.
  609.    This `awk' program prints every line that contains the string `12'
  610. *or* the string `21'.  If a line contains both strings, it is printed
  611. twice, once by each rule.
  612.    If we run this program on our two sample data files, `BBS-list' and
  613. `inventory-shipped', as shown here:
  614.      awk '/12/ { print $0 }
  615.           /21/ { print $0 }' BBS-list inventory-shipped
  616. we get the following output:
  617.      aardvark     555-5553     1200/300          B
  618.      alpo-net     555-3412     2400/1200/300     A
  619.      barfly       555-7685     1200/300          A
  620.      bites        555-1675     2400/1200/300     A
  621.      core         555-2912     1200/300          C
  622.      fooey        555-1234     2400/1200/300     B
  623.      foot         555-6699     1200/300          B
  624.      macfoo       555-6480     1200/300          A
  625.      sdace        555-3430     2400/1200/300     A
  626.      sabafoo      555-2127     1200/300          C
  627.      sabafoo      555-2127     1200/300          C
  628.      Jan  21  36  64 620
  629.      Apr  21  70  74 514
  630. Note how the line in `BBS-list' beginning with `sabafoo' was printed
  631. twice, once for each rule.
  632. File: gawk.info,  Node: More Complex,  Next: Running gawk,  Prev: Two Rules,  Up: Getting Started
  633. A More Complex Example
  634. ======================
  635.    Here is an example to give you an idea of what typical `awk'
  636. programs do.  This example shows how `awk' can be used to summarize,
  637. select, and rearrange the output of another utility.  It uses features
  638. that haven't been covered yet, so don't worry if you don't understand
  639. all the details.
  640.      ls -l | awk '$5 == "Nov" { sum += $4 }
  641.                   END { print sum }'
  642.    This command prints the total number of bytes in all the files in the
  643. current directory that were last modified in November (of any year).
  644. (In the C shell you would need to type a semicolon and then a backslash
  645. at the end of the first line; in a POSIX-compliant shell, such as the
  646. Bourne shell or the Bourne-Again shell, you can type the example as
  647. shown.)
  648.    The `ls -l' part of this example is a command that gives you a
  649. listing of the files in a directory, including file size and date.  Its
  650. output looks like this:
  651.      -rw-r--r--  1 close        1933 Nov  7 13:05 Makefile
  652.      -rw-r--r--  1 close       10809 Nov  7 13:03 gawk.h
  653.      -rw-r--r--  1 close         983 Apr 13 12:14 gawk.tab.h
  654.      -rw-r--r--  1 close       31869 Jun 15 12:20 gawk.y
  655.      -rw-r--r--  1 close       22414 Nov  7 13:03 gawk1.c
  656.      -rw-r--r--  1 close       37455 Nov  7 13:03 gawk2.c
  657.      -rw-r--r--  1 close       27511 Dec  9 13:07 gawk3.c
  658.      -rw-r--r--  1 close        7989 Nov  7 13:03 gawk4.c
  659. The first field contains read-write permissions, the second field
  660. contains the number of links to the file, and the third field
  661. identifies the owner of the file.  The fourth field contains the size
  662. of the file in bytes.  The fifth, sixth, and seventh fields contain the
  663. month, day, and time, respectively, that the file was last modified.
  664. Finally, the eighth field contains the name of the file.
  665.    The `$5 == "Nov"' in our `awk' program is an expression that tests
  666. whether the fifth field of the output from `ls -l' matches the string
  667. `Nov'.  Each time a line has the string `Nov' in its fifth field, the
  668. action `{ sum += $4 }' is performed.  This adds the fourth field (the
  669. file size) to the variable `sum'.  As a result, when `awk' has finished
  670. reading all the input lines, `sum' is the sum of the sizes of files
  671. whose lines matched the pattern.  (This works because `awk' variables
  672. are automatically initialized to zero.)
  673.    After the last line of output from `ls' has been processed, the
  674. `END' rule is executed, and the value of `sum' is printed.  In this
  675. example, the value of `sum' would be 80600.
  676.    These more advanced `awk' techniques are covered in later sections
  677. (*note Overview of Actions: Actions.).  Before you can move on to more
  678. advanced `awk' programming, you have to know how `awk' interprets your
  679. input and displays your output.  By manipulating fields and using
  680. `print' statements, you can produce some very useful and spectacular
  681. looking reports.
  682. File: gawk.info,  Node: Running gawk,  Next: Comments,  Prev: More Complex,  Up: Getting Started
  683. How to Run `awk' Programs
  684. =========================
  685.    There are several ways to run an `awk' program.  If the program is
  686. short, it is easiest to include it in the command that runs `awk', like
  687. this:
  688.      awk 'PROGRAM' INPUT-FILE1 INPUT-FILE2 ...
  689. where PROGRAM consists of a series of patterns and actions, as
  690. described earlier.
  691.    When the program is long, it is usually more convenient to put it in
  692. a file and run it with a command like this:
  693.      awk -f PROGRAM-FILE INPUT-FILE1 INPUT-FILE2 ...
  694. * Menu:
  695. * One-shot::                    Running a short throw-away `awk' program.
  696. * Read Terminal::               Using no input files (input from
  697.                                 terminal instead).
  698. * Long::                        Putting permanent `awk' programs in files.
  699. * Executable Scripts::          Making self-contained `awk' programs.
  700. File: gawk.info,  Node: One-shot,  Next: Read Terminal,  Prev: Running gawk,  Up: Running gawk
  701. One-shot Throw-away `awk' Programs
  702. ----------------------------------
  703.    Once you are familiar with `awk', you will often type simple
  704. programs at the moment you want to use them.  Then you can write the
  705. program as the first argument of the `awk' command, like this:
  706.      awk 'PROGRAM' INPUT-FILE1 INPUT-FILE2 ...
  707. where PROGRAM consists of a series of PATTERNS and ACTIONS, as
  708. described earlier.
  709.    This command format instructs the shell to start `awk' and use the
  710. PROGRAM to process records in the input file(s).  There are single
  711. quotes around PROGRAM so that the shell doesn't interpret any `awk'
  712. characters as special shell characters.  They also cause the shell to
  713. treat all of PROGRAM as a single argument for `awk' and allow PROGRAM
  714. to be more than one line long.
  715.    This format is also useful for running short or medium-sized `awk'
  716. programs from shell scripts, because it avoids the need for a separate
  717. file for the `awk' program.  A self-contained shell script is more
  718. reliable since there are no other files to misplace.
  719. File: gawk.info,  Node: Read Terminal,  Next: Long,  Prev: One-shot,  Up: Running gawk
  720. Running `awk' without Input Files
  721. ---------------------------------
  722.    You can also run `awk' without any input files.  If you type the
  723. command line:
  724.      awk 'PROGRAM'
  725. then `awk' applies the PROGRAM to the "standard input", which usually
  726. means whatever you type on the terminal.  This continues until you
  727. indicate end-of-file by typing `Control-d'.
  728.    For example, if you execute this command:
  729.      awk '/th/'
  730. whatever you type next is taken as data for that `awk' program.  If you
  731. go on to type the following data:
  732.      Kathy
  733.      Ben
  734.      Tom
  735.      Beth
  736.      Seth
  737.      Karen
  738.      Thomas
  739.      `Control-d'
  740. then `awk' prints this output:
  741.      Kathy
  742.      Beth
  743.      Seth
  744. as matching the pattern `th'.  Notice that it did not recognize
  745. `Thomas' as matching the pattern.  The `awk' language is "case
  746. sensitive", and matches patterns exactly.  (However, you can override
  747. this with the variable `IGNORECASE'.  *Note Case-sensitivity in
  748. Matching: Case-sensitivity.)
  749. File: gawk.info,  Node: Long,  Next: Executable Scripts,  Prev: Read Terminal,  Up: Running gawk
  750. Running Long Programs
  751. ---------------------
  752.    Sometimes your `awk' programs can be very long.  In this case it is
  753. more convenient to put the program into a separate file.  To tell `awk'
  754. to use that file for its program, you type:
  755.      awk -f SOURCE-FILE INPUT-FILE1 INPUT-FILE2 ...
  756.    The `-f' instructs the `awk' utility to get the `awk' program from
  757. the file SOURCE-FILE.  Any file name can be used for SOURCE-FILE.  For
  758. example, you could put the program:
  759.      /th/
  760. into the file `th-prog'.  Then this command:
  761.      awk -f th-prog
  762. does the same thing as this one:
  763.      awk '/th/'
  764. which was explained earlier (*note Running `awk' without Input Files:
  765. Read Terminal.).  Note that you don't usually need single quotes around
  766. the file name that you specify with `-f', because most file names don't
  767. contain any of the shell's special characters.  Notice that in
  768. `th-prog', the `awk' program did not have single quotes around it.  The
  769. quotes are only needed for programs that are provided on the `awk'
  770. command line.
  771.    If you want to identify your `awk' program files clearly as such,
  772. you can add the extension `.awk' to the file name.  This doesn't affect
  773. the execution of the `awk' program, but it does make "housekeeping"
  774. easier.
  775. File: gawk.info,  Node: Executable Scripts,  Prev: Long,  Up: Running gawk
  776. Executable `awk' Programs
  777. -------------------------
  778.    Once you have learned `awk', you may want to write self-contained
  779. `awk' scripts, using the `#!' script mechanism.  You can do this on
  780. many Unix systems (1) (and someday on GNU).
  781.    For example, you could create a text file named `hello', containing
  782. the following (where `BEGIN' is a feature we have not yet discussed):
  783.      #! /bin/awk -f
  785.      # a sample awk program
  786.      BEGIN    { print "hello, world" }
  787. After making this file executable (with the `chmod' command), you can
  788. simply type:
  789.      hello
  790. at the shell, and the system will arrange to run `awk' (2) as if you
  791. had typed:
  792.      awk -f hello
  793. Self-contained `awk' scripts are useful when you want to write a
  794. program which users can invoke without knowing that the program is
  795. written in `awk'.
  796.    If your system does not support the `#!' mechanism, you can get a
  797. similar effect using a regular shell script.  It would look something
  798. like this:
  799.      : The colon makes sure this script is executed by the Bourne shell.
  800.      awk 'PROGRAM' "$@"
  801.    Using this technique, it is *vital* to enclose the PROGRAM in single
  802. quotes to protect it from interpretation by the shell.  If you omit the
  803. quotes, only a shell wizard can predict the results.
  804.    The `"$@"' causes the shell to forward all the command line
  805. arguments to the `awk' program, without interpretation.  The first
  806. line, which starts with a colon, is used so that this shell script will
  807. work even if invoked by a user who uses the C shell.
  808.    ---------- Footnotes ----------
  809.    (1)  The `#!' mechanism works on Unix systems derived from Berkeley
  810. Unix, System V Release 4, and some System V Release 3 systems.
  811.    (2)  The line beginning with `#!' lists the full pathname of an
  812. interpreter to be run, and an optional initial command line argument to
  813. pass to that interpreter.  The operating system then runs the
  814. interpreter with the given argument and the full argument list of the
  815. executed program.  The first argument in the list is the full pathname
  816. of the `awk' program.  The rest of the argument list will either be
  817. options to `awk', or data files, or both.
  818. File: gawk.info,  Node: Comments,  Next: Statements/Lines,  Prev: Running gawk,  Up: Getting Started
  819. Comments in `awk' Programs
  820. ==========================
  821.    A "comment" is some text that is included in a program for the sake
  822. of human readers, and that is not really part of the program.  Comments
  823. can explain what the program does, and how it works.  Nearly all
  824. programming languages have provisions for comments, because programs are
  825. typically hard to understand without their extra help.
  826.    In the `awk' language, a comment starts with the sharp sign
  827. character, `#', and continues to the end of the line.  The `awk'
  828. language ignores the rest of a line following a sharp sign.  For
  829. example, we could have put the following into `th-prog':
  830.      # This program finds records containing the pattern `th'.  This is how
  831.      # you continue comments on additional lines.
  832.      /th/
  833.    You can put comment lines into keyboard-composed throw-away `awk'
  834. programs also, but this usually isn't very useful; the purpose of a
  835. comment is to help you or another person understand the program at a
  836. later time.