home *** CD-ROM | disk | FTP | other *** search
/ The C Users' Group Library 1994 August / wc-cdrom-cusersgrouplibrary-1994-08.iso / vol_200 / 243_01 / cpp1.c < prev    next >
Text File  |  1990-05-14  |  36KB  |  883 lines

  1. /*
  2. **    name:        cpp1.c
  3. */
  4.  
  5. /*
  6.  * CPP main program.
  7.  *
  8.  * Edit history
  9.  * 21-May-84    MM      "Field test" release
  10.  * 23-May-84    MM      Some minor hacks.
  11.  * 30-May-84    ARF     Didn't get enough memory for __DATE__
  12.  *                      Added code to read stdin if no input
  13.  *                      files are provided.
  14.  * 29-Jun-84    MM      Added ARF's suggestions, Unixifying cpp.
  15.  * 11-Jul-84    MM      "Official" first release (that's what I thought!)
  16.  * 22-Jul-84    MM/ARF/SCK Fixed line number bugs, added cpp recognition
  17.  *                      of #line, fixed problems with #include.
  18.  * 23-Jul-84    MM      More (minor) include hacking, some documentation.
  19.  *                      Also, redid cpp's #include files
  20.  * 25-Jul-84    MM      #line filename isn't used for #include searchlist
  21.  *                      #line format is <number> <optional name>
  22.  * 25-Jul-84    ARF/MM  Various bugs, mostly serious.  Removed homemade doprint
  23.  * 01-Aug-84    MM      Fixed recursion bug, remove extra newlines and
  24.  *                      leading whitespace from cpp output.
  25.  * 02-Aug-84    MM      Hacked (i.e. optimized) out blank lines and unneeded
  26.  *                      whitespace in general.  Cleaned up unget()'s.
  27.  * 03-Aug-84    Keie    Several bug fixes from Ed Keizer, Vrije Universitet.
  28.  *                      -- corrected arg. count in -D and pre-defined
  29.  *                      macros.  Also, allow \n inside macro actual parameter
  30.  *                      lists.
  31.  * 06-Aug-84    MM      If debugging, dump the preset vector at startup.
  32.  * 12-Aug-84    MM/SCK  Some small changes from Sam Kendall
  33.  * 15-Aug-84    Keie/MM cerror, cwarn, etc. take a single string arg.
  34.  *                      cierror, etc. take a single int. arg.
  35.  *                      changed LINE_PREFIX slightly so it can be
  36.  *                      changed in the makefile.
  37.  * 31-Aug-84    MM      USENET net.sources release.
  38.  *  7-Sep-84    SCH/ado Lint complaints
  39.  * 10-Sep-84    Keie    Char's can't be signed in some implementations
  40.  * 11-Sep-84    ado     Added -C flag, pathological line number fix
  41.  * 13-Sep-84    ado     Added -E flag (does nothing) and "-" file for stdin.
  42.  * 14-Sep-84    MM      Allow # 123 as a synonym for #line 123
  43.  * 19-Sep-84    MM      scanid always reads to token, make sure #line is
  44.  *                      written to a new line, even if -C switch given.
  45.  *                      Also, cpp - - reads stdin, writes stdout.
  46.  * 03-Oct-84    ado/MM  Several changes to line counting and keepcomments
  47.  *                      stuff.  Also a rewritten control() hasher -- much
  48.  *                      simpler and no less "perfect". Note also changes
  49.  *                      in cpp3.c to fix numeric scanning.
  50.  * 04-Oct-84    MM      Added recognition of macro formal parameters if
  51.  *                      they are the only thing in a string, per the
  52.  *                      draft standard.
  53.  * 08-Oct-84    MM      One more attack on scannumber
  54.  * 15-Oct-84    MM/ado  Added -N to disable predefined symbols.  Fixed
  55.  *                      linecount if COMMENT_INVISIBLE enabled.
  56.  * 22-Oct-84    MM      Don't evaluate the #if/#ifdef argument if
  57.  *                      compilation is supressed.  This prevents
  58.  *                      unnecessary error messages in sequences such as
  59.  *                          #ifdef FOO          -- undefined
  60.  *                          #if FOO == 10       -- shouldn't print warning
  61.  * 25-Oct-84    MM      Fixed bug in false ifdef supression.  On vms,
  62.  *                      #include <foo> should open foo.h -- this duplicates
  63.  *                      the behavior of Vax-C
  64.  * 31-Oct-84    ado/MM  Parametized $ in indentifiers.  Added a better
  65.  *                      token concatenator and took out the trial
  66.  *                      concatenation code.  Also improved #ifdef code
  67.  *                      and cleaned up the macro recursion tester.
  68.  *  2-Nov-84    MM/ado  Some bug fixes in token concatenation, also
  69.  *                      a variety of minor (uninteresting) hacks.
  70.  *  6-Nov-84    MM      Happy Birthday.  Broke into 4 files and added
  71.  *                      #if sizeof (basic_types)
  72.  *  9-Nov-84    MM      Added -S* for pointer type sizes
  73.  * 13-Nov-84    MM      Split cpp1.c, added vms defaulting
  74.  * 23-Nov-84    MM/ado  -E supresses error exit, added CPP_INCLUDE,
  75.  *                      fixed strncpy bug.
  76.  *  3-Dec-84    ado/MM  Added OLD_PREPROCESSOR
  77.  *  7-Dec-84    MM      Stuff in Nov 12 Draft Standard
  78.  * 17-Dec-84    george  Fixed problems with recursive macros
  79.  * 17-Dec-84    MM      Yet another attack on #if's (f/t)level removed.
  80.  * 07-Jan-85    ado     Init defines before doing command line options
  81.  *                      so -Uunix works.
  82.  * 14-Jan-85    MM      Fixed bug with logical device translation on VMS.
  83.  * 18-Jan-85    MM      Rearrainged fgetname() conditionals.
  84.  * 27-Mar-85    ado     Fix bug in pcc
  85.  * 28-Mar-85    MM      Another attack on concatenation and some minor
  86.  *                      cleanup and typo corrections.
  87.  * 29-Mar-85    ado/MM  trigraphs, also fixed bug with / at end of macro.
  88.  * 11-Apr-85    ado     Buglets (typos and lint picking)
  89.  * 29-Apr-85    MM      Added concat without reexpansion.  Suggestion from ado.
  90.  * 07-Jun-85    KR      added -P option.  don't output #line
  91.  */
  92.  
  93. /*)BUILD
  94.         $(PROGRAM)      = cpp
  95.         $(FILES)        = { cpp1 cpp2 cpp3 cpp4 cpp5 cpp6 }
  96.         $(INCLUDE)      = { cppdef.h cpp.h }
  97.         $(STACK)        = 3000
  98.         $(TKBOPTIONS)   = {
  99.                 STACK   = 2000
  100.         }
  101. */
  102.  
  103. #ifdef  DOCUMENTATION
  104.  
  105. title   cpp             C Pre-Processor
  106. index                   C pre-processor
  107.  
  108. synopsis
  109.         .s.nf
  110.         cpp [-options] [infile [outfile]]
  111.         .s.f
  112. description
  113.  
  114.         CPP reads a C source file, expands macros and include
  115.         files, and writes an input file for the C compiler.
  116.         If no file arguments are given, CPP reads from stdin
  117.         and writes to stdout.  If one file argument is given,
  118.         it will define the input file, while two file arguments
  119.         define both input and output files.  The file name "-"
  120.         is a synonym for stdin or stdout as appropriate.
  121.  
  122.         The following options are supported.  Options may
  123.         be given in either case.
  124.         .lm +16
  125.         .p -16
  126.         -C              If set, source-file comments are written
  127.         to the output file.  This allows the output of CPP to be
  128.         used as the input to a program, such as lint, that expects
  129.         commands embedded in specially-formatted comments.
  130.         .p -16
  131.         -Dname=value    Define the name as if the programmer wrote
  132.  
  133.             #define name value
  134.  
  135.         at the start of the first file.  If "=value" is not
  136.         given, a value of "1" will be used.
  137.  
  138.         On non-unix systems, all alphabetic text will be forced
  139.         to upper-case.
  140.         .p -16
  141.         -E              Always return "success" to the operating
  142.         system, even if errors were detected.  Note that some fatal
  143.         errors, such as a missing #include file, will terminate
  144.         CPP, returning "failure" even if the -E option is given.
  145.         .p -16
  146.         -Idirectory     Add this directory to the list of
  147.         directories searched for #include "..." and #include <...>
  148.         commands.  Note that there is no space between the
  149.         "-I" and the directory string.  More than one -I command
  150.         is permitted.  On non-Unix systems "directory" is forced
  151.         to upper-case.
  152.         .p -16
  153.         -N              CPP normally predefines some symbols defining
  154.         the target computer and operating system.  If -N is specified,
  155.         no symbols will be predefined.  If -N -N is specified, the
  156.         "always present" symbols, __LINE__, __FILE__, and __DATE__
  157.         are not defined.
  158.         .p -16
  159.         -P              CPP normally writes lines of the form
  160.         #line <number> <file.name> to the output file so the compiler
  161.         can print the line number and name of the original source file
  162.         for diagnostic messages.  The -P option will suppress this output.
  163.         .p -16
  164.         -Stext          CPP normally assumes that the size of
  165.         the target computer's basic variable types is the same as the size
  166.         of these types of the host computer.  (This can be overridden
  167.         when CPP is compiled, however.)  The -S option allows dynamic
  168.         respecification of these values.  "text" is a string of
  169.         numbers, separated by commas, that specifies correct sizes.
  170.         The sizes must be specified in the exact order:
  171.  
  172.             char short int long float double
  173.  
  174.         If you specify the option as "-S*text", pointers to these
  175.         types will be specified.  -S* takes one additional argument
  176.         for pointer to function (e.g. int (*)())
  177.  
  178.         For example, to specify sizes appropriate for a PDP-11,
  179.         you would write:
  180.  
  181.                c s i l f d func
  182.              -S1,2,2,2,4,8,
  183.             -S*2,2,2,2,2,2,2
  184.  
  185.         Note that all values must be specified.
  186.         .p -16
  187.         -Tnumber        Enable (number = 1) or disable
  188.         trigraph recognition.  (If no number is given, the
  189.         default state is reversed.)  If enabled, the sequence
  190.         "??" is a character-escape to allow certain characters
  191.         to be entered on systems where the normal representation
  192.         is used for national letters.  This implementation
  193.         "merely" converts the trigraph to the internal representation,
  194.         and thus is probably incorrect.  A correct implementation
  195.         would seem to require recognition of Ansi escape sequences
  196.         in the input stream.  Someone else can write that routine.
  197.         .p -16
  198.         -Uname          Undefine the name as if
  199.  
  200.             #undef name
  201.  
  202.         were given.  On non-Unix systems, "name" will be forced to
  203.         upper-case.
  204.         .p -16
  205.         -Xnumber        Enable debugging code.  If no value is
  206.         given, a value of 1 will be used.  (For maintenence of
  207.         CPP only.)
  208.         .s.lm -16
  209.  
  210. Pre-Defined Variables
  211.  
  212.         When CPP begins processing, the following variables will
  213.         have been defined (unless the -N option is specified):
  214.         .s
  215.         Target computer (as appropriate):
  216.         .s
  217.             pdp11, vax, M68000 m68000 m68k
  218.         .s
  219.         Target operating system (as appropriate):
  220.         .s
  221.             rsx, rt11, vms, unix
  222.         .s
  223.         Target compiler (as appropriate):
  224.         .s
  225.             decus, vax11c
  226.         .s
  227.         The implementor may add definitions to this list.
  228.         The default definitions match the definition of the
  229.         host computer, operating system, and C compiler.
  230.         .s
  231.         The following are always available unless undefined (or
  232.         -N was specified twice):
  233.         .lm +16
  234.         .p -12
  235.         __FILE__        The input (or #include) file being compiled
  236.         (as a quoted string).
  237.         .p -12
  238.         __LINE__        The line number being compiled.
  239.         .p -12
  240.         __DATE__        The date and time of compilation as
  241.         a Unix ctime quoted string (the trailing newline is removed).
  242.         Thus,
  243.         .s
  244.             printf("Bug at line %s,", __LINE__);
  245.             printf(" source file %s", __FILE__);
  246.             printf(" compiled on %s", __DATE__);
  247.         .s.lm -16
  248.  
  249. Draft Proposed Ansi Standard Considerations
  250.  
  251.         The current version of the Draft Proposed Standard
  252.         explicitly states that "readers are requested not to specify
  253.         or claim conformance to this draft."  Readers and users
  254.         of Decus CPP should not assume that Decus CPP conforms
  255.         to the standard, or that it will conform to the actual
  256.         C Language Standard.
  257.  
  258.         When CPP is itself compiled, many features of the Draft
  259.         Proposed Standard that are incompatible with existing
  260.         preprocessors may be disabled.  See the comments in CPP's
  261.         source for details.
  262.  
  263.         The latest version of the Draft Proposed Standard (as reflected
  264.         in Decus CPP) is dated November 12, 1984.  A few things from
  265.         later drafts are included.
  266.  
  267.         Comments are removed from the input text.  The comment
  268.         is replaced by a single space character.  The -C option
  269.         preserves comments, writing them to the output file.
  270.  
  271.         The '$' character is considered to be a letter.  This is
  272.         a permitted extension.
  273.  
  274.         The following new features of C are processed by CPP:
  275.         .s.comment Note: significant spaces, not tabs, .br quotes #if, #elif
  276.         .br;####_#elif expression    (_#else _#if)
  277.         .br;####'_\xNNN'             (Hexadecimal constant)
  278.         .br;####'_\a'                (Ascii BELL)
  279.         .br;####'_\v'                (Ascii Vertical Tab)
  280.         .br;####_#if defined NAME    1 if defined, 0 if not
  281.         .br;####_#if defined (NAME)  1 if defined, 0 if not
  282.         .br;####_#if sizeof (basic type)
  283.         .br;####unary +
  284.         .br;####123U, 123LU         Unsigned ints and longs.
  285.         .br;####12.3L               Long double numbers
  286.         .br;####_#token              Stringize token
  287.         .br;####token_#_#token        Token concatenation
  288.         .br;####_#include token      Expands to filename
  289.  
  290.         The proposed national replacement letter fallbacks, using
  291.         "??", have not been implemented.
  292.  
  293.         The Draft Proposed Standard has extended C, adding a constant
  294.         string concatenation operator, where
  295.  
  296.             "foo" "bar"
  297.  
  298.         is regarded as the single string "foobar".  (This does not
  299.         affect CPP's processing but does permit a limited form of
  300.         macro argument substitution into strings as will be discussed.)
  301.  
  302.         The Standard Committee plans to add token concatenation
  303.         to #define command lines.  One suggested implementation
  304.         is as follows:  the sequence "Token1##Token2" is treated
  305.         as if the programmer wrote "Token1Token2".  This could
  306.         be used as follows:
  307.  
  308.             #line 123
  309.             #define ATLINE foo##__LINE__
  310.  
  311.         ATLINE would be defined as foo123.
  312.  
  313.         Note that "Token2" must either have the format of an
  314.         identifier or be a string of digits.  Thus, the string
  315.  
  316.             #define ATLINE foo##1x3
  317.  
  318.         generates two tokens: "foo1" and "x3".
  319.  
  320.         If the tokens T1 and T2 are concatenated into T3,
  321.         this implementation operates as follows:
  322.  
  323.           1. Expand T1 if it is a macro.
  324.           2. Expand T2 if it is a macro.
  325.           3. Join the tokens, forming T3.
  326.           4. Output T3 (without reexpansion).
  327.  
  328.         As implemented here, ## left-associates.  I.e., a##b##c
  329.         is effectively (a##b)##c.  Cpp can be compiled so as
  330.         to re-expand the constructed macro.
  331.  
  332.         A macro formal parameter will be substituted into a string
  333.         or character constant if it is preceded by a single #.
  334.  
  335.             #define VECSIZE 123
  336.             #define vprint(name, size) \
  337.               printf("name" "[" #size "] = {\n")
  338.               ... vprint(vector, VECSIZE);
  339.  
  340.         expands (effectively) to
  341.  
  342.               vprint("vector[123] = {\n");
  343.  
  344.         Note that this will be useful if your C compiler supports
  345.         the new string concatenation operation noted above.
  346.  
  347. error messages
  348.  
  349.         Many.  CPP prints warning or error messages if you try to
  350.         use multiple-byte character constants (non-transportable)
  351.         if you #undef a symbol that was not defined, or if your
  352.         program has potentially nested comments.
  353.  
  354. author
  355.  
  356.         Martin Minow
  357.  
  358. bugs
  359.  
  360.         The #if expression processor uses signed integers only.
  361.         I.e, #if 0xFFFFu < 0 may be TRUE.
  362.  
  363.         A / at the end of a macro expansion will not introduce
  364.         a comment:
  365.  
  366.             #define foo /
  367.                 foo* this is not a comment */
  368.  
  369. #endif
  370.  
  371.  
  372. #include        "cppdef.h"
  373. #include        "cpp.h"
  374.  
  375. FILE_LOCAL void    cppmain();
  376. FILE_LOCAL void    sharp();
  377.  
  378.  
  379. /*
  380.  * Commonly used global variables:
  381.  * line         is the current input line number.
  382.  * wrongline    is set in many places when the actual output
  383.  *              line is out of sync with the numbering, e.g,
  384.  *              when expanding a macro with an embedded newline.
  385.  *
  386.  * token        holds the last identifier scanned (which might
  387.  *              be a candidate for macro expansion).
  388.  * errors       is the running cpp error counter.
  389.  * infile       is the head of a linked list of input files (extended by
  390.  *              #include and macros being expanded).  infile always points
  391.  *              to the current file/macro.  infile->parent to the includer,
  392.  *              etc.  infile->fd is NULL if this input stream is a macro.
  393.  */
  394. int             line;                   /* Current line number          */
  395. int             wrongline;              /* Force #line to compiler      */
  396. char            token[IDMAX + 1];       /* Current input token          */
  397. int             errors;                 /* cpp error counter            */
  398. FILEINFO        *infile = NULL;         /* Current input file           */
  399. #if DEBUG
  400. int             debug;                  /* TRUE if debugging now        */
  401. #endif
  402. /*
  403.  * This counter is incremented when a macro expansion is initiated.
  404.  * If it exceeds a built-in value, the expansion stops -- this tests
  405.  * for a runaway condition:
  406.  *      #define X Y
  407.  *      #define Y X
  408.  *      X
  409.  * This can be disabled by falsifying rec_recover.  (Nothing does this
  410.  * currently: it is a hook for an eventual invocation flag.)
  411.  */
  412. int             recursion;              /* Infinite recursion counter   */
  413. int             rec_recover = TRUE;     /* Unwind recursive macros      */
  414.  
  415. /*
  416.  * instring is set TRUE when a string is scanned.  It modifies the
  417.  * behavior of the "get next character" routine, causing all characters
  418.  * to be passed to the caller (except <DEF_MAGIC>).  Note especially that
  419.  * comments and \<newline> are not removed from the source.  (This
  420.  * prevents cpp output lines from being arbitrarily long).
  421.  *
  422.  * inmacro is set by #define -- it absorbs comments and converts
  423.  * form-feed and vertical-tab to space, but returns \<newline>
  424.  * to the caller.  Strictly speaking, this is a bug as \<newline>
  425.  * shouldn't delimit tokens, but we'll worry about that some other
  426.  * time -- it is more important to prevent infinitly long output lines.
  427.  *
  428.  * instring and inmacro are parameters to the get() routine which
  429.  * were made global for speed.
  430.  */
  431. int             instring = FALSE;       /* TRUE if scanning string      */
  432. int             inmacro = FALSE;        /* TRUE if #defining a macro    */
  433.  
  434. /*
  435.  * work[] and workp are used to store one piece of text in a temporary
  436.  * buffer.  To initialize storage, set workp = work.  To store one
  437.  * character, call save(c);  (This will fatally exit if there isn't
  438.  * room.)  To terminate the string, call save(EOS).  Note that
  439.  * the work buffer is used by several subroutines -- be sure your
  440.  * data won't be overwritten.  The extra byte in the allocation is
  441.  * needed for string formal replacement.
  442.  */
  443. char            work[NWORK + 1];        /* Work buffer                  */
  444. char            *workp;                 /* Work buffer pointer          */
  445.  
  446. /*
  447.  * keepcomments is set TRUE by the -C option.  If TRUE, comments
  448.  * are written directly to the output stream.  This is needed if
  449.  * the output from cpp is to be passed to lint (which uses commands
  450.  * embedded in comments).  cflag contains the permanent state of the
  451.  * -C flag.  keepcomments is always falsified when processing #control
  452.  * commands and when compilation is supressed by a false #if
  453.  *
  454.  * If eflag is set, CPP returns "success" even if non-fatal errors
  455.  * were detected.
  456.  *
  457.  * If nflag is non-zero, no symbols are predefined except __LINE__.
  458.  * __FILE__, and __DATE__.  If nflag > 1, absolutely no symbols
  459.  * are predefined.
  460.  */
  461. int             keepcomments = FALSE;   /* Write out comments flag      */
  462. int             cflag = FALSE;          /* -C option (keep comments)    */
  463. int             eflag = FALSE;          /* -E option (never fail)       */
  464. int             nflag = 0;              /* -N option (no predefines)    */
  465. int             pflag = FALSE;          /* -P option (no #line output)  */
  466. int             tflag = TFLAG_INIT;     /* -T option (trigraphs)        */
  467.  
  468. /*
  469.  * ifstack[] holds information about nested #if's.  It is always
  470.  * accessed via *ifptr.  The information is as follows:
  471.  *      WAS_COMPILING   state of compiling flag at outer level.
  472.  *      ELSE_SEEN       set TRUE when #else seen to prevent 2nd #else.
  473.  *      TRUE_SEEN       set TRUE when #if or #elif succeeds
  474.  * ifstack[0] holds the compiling flag.  It is WAS_COMPILING if
  475.  * compilation is currently enabled.  Note that this must be
  476.  * initialized to WAS_COMPILING.
  477.  */
  478. char            ifstack[BLK_NEST] = { WAS_COMPILING };
  479. char            *ifptr = ifstack;               /* -> current ifstack[] */
  480.  
  481. /*
  482.  * incdir[] stores the -i directories (and the system-specific
  483.  * #include <...> directories.
  484.  */
  485. char    *incdir[NINCLUDE];              /* -i directories               */
  486. char    **incend = incdir;              /* -> free space in incdir[]    */
  487.  
  488. /*
  489.  * This is the table used to predefine target machine and operating
  490.  * system designators.  It may need hacking for specific circumstances.
  491.  * Note: it is not clear that this is part of the Ansi Standard.
  492.  * The -N option supresses preset definitions.
  493.  */
  494. char    *preset[] = {                   /* names defined at cpp start   */
  495. #ifdef  MACHINE
  496.         MACHINE,
  497. #endif
  498. #ifdef  SYSTEM
  499.         SYSTEM,
  500. #endif
  501. #ifdef  COMPILER
  502.         COMPILER,
  503. #endif
  504. #if     DEBUG
  505.         "decus_cpp",                    /* Ourselves!                   */
  506. #endif
  507.         NULL                            /* Must be last                 */
  508. };
  509.  
  510. /*
  511.  * The value of these predefined symbols must be recomputed whenever
  512.  * they are evaluated.  The order must not be changed.
  513.  */
  514. char    *magic[] = {                    /* Note: order is important     */
  515.         "__LINE__",
  516.         "__FILE__",
  517.         NULL                            /* Must be last                 */
  518. };
  519.  
  520. /*
  521.  * This variable is used to determine the memory model for MS-DOS.
  522.  * See cppdef.h for more information.
  523.  */
  524.  
  525. #if    HOST == SYS_MSDOS
  526. #ifdef    M_I86SM
  527. char ms_dos_model = 's';
  528. #else
  529. #ifdef    M_I86MM
  530. char ms_dos_model = 'm';
  531. #else
  532. #ifdef    M_I86LM
  533. char ms_dos_model = 'l';
  534. #else
  535. #ifdef    I8086S
  536. char ms_dos_model = 's';
  537. #else
  538. #ifdef    I8086P
  539. char ms_dos_model = 'p';
  540. #else
  541. #ifdef    I8086D
  542. char ms_dos_model = 'd';
  543. #else
  544. #ifdef    I8086L
  545. char ms_dos_model = 'l';
  546. #endif
  547. #endif
  548. #endif
  549. #endif
  550. #endif
  551. #endif
  552. #endif
  553. #endif
  554.  
  555.  
  556.  
  557. main(argc, argv)
  558. int             argc;
  559. char            *argv[];
  560. {
  561.         register int    i;
  562.  
  563. #if HOST == SYS_VMS
  564.         argc = getredirection(argc, argv);      /* vms >file and <file  */
  565. #endif
  566.         initdefines();                          /* O.S. specific def's  */
  567.         i = dooptions(argc, argv);              /* Command line -flags  */
  568.  
  569. #if    HOST == SYS_MSDOS
  570.             /*    Undefine inappropriate memory-model
  571.              * predefines, based on either the default memory
  572.              * model (see ms_dos_model) or the user-supplied
  573.              * memory model provided by the '-M' switch in
  574.              * dooptions() (in cpp3.c).
  575.              */
  576.     switch( ms_dos_model )
  577.     {
  578.         case 's' :    /* Small Model, Small data, small pointers...    */
  579.         case 'p' :    /* Large Code, Small Data, small pointers...    */
  580.                 /* Delete invalid MSC predefinitions...    */
  581.         defendel( "M_I86MM", TRUE );
  582.         defendel( "M_I86LM", TRUE );
  583.                 /* And invalid Lattice predefinitions    */
  584.         defendel( "LPTR", TRUE );
  585.         defendel( "I8086D", TRUE );
  586.         defendel( "I8086L", TRUE );
  587.         if ( ms_dos_model == 's' )
  588.             defendel( "I8086P", TRUE );
  589.         else {
  590.             defendel( "I8086S", TRUE );
  591.             defendel( "M_I86SM", TRUE );
  592.         } /* End if */
  593.         break;
  594.  
  595.         case 'd' :    /* Small Code, Large Data, large pointers...    */
  596.         case 'l' :    /* Large Code, Large Data, large pointers...    */
  597.                 /* Delete invalid MSC predefinitions    */
  598.         defendel( "M_I86MM", TRUE );
  599.         defendel( "M_I86SM", TRUE );
  600.                 /* And invalid Lattice predefinitions    */
  601.         defendel( "SPTR", TRUE );
  602.         defendel( "I8086S", TRUE );
  603.         defendel( "I8086P", TRUE );
  604.         if ( ms_dos_model == 'd' )
  605.         {
  606.             defendel( "I8086L", TRUE );
  607.             defendel( "M_I86LM", TRUE );
  608.         } else
  609.             defendel( "I8086D", TRUE );
  610.         break;
  611.  
  612.         case 'm' :    /* Large code, small data, mixed pointers...    */
  613.                 /* Delete invalid MSC predefinitions    */
  614.         defendel( "M_I86SM", TRUE );
  615.         defendel( "M_I86LM", TRUE );
  616.                 /* And invalid Lattice predefinitions    */
  617.         defendel( "LPTR", TRUE );
  618.         defendel( "SPTR", TRUE );
  619.         defendel( "I8086D", TRUE );
  620.         defendel( "I8086L", TRUE );
  621.         defendel( "I8086P", TRUE );
  622.         defendel( "I8086S", TRUE );
  623.         break;
  624.     } /* End switch */
  625. #endif
  626.  
  627.         switch (i) {
  628.         case 3:
  629.             /*
  630.              * Get output file, "-" means use stdout.
  631.              */
  632.             if (!streq(argv[2], "-")) {
  633. #if HOST == SYS_VMS
  634.                 /*
  635.                  * On vms, reopen stdout with "vanilla rms" attributes.
  636.                  */
  637.                 if ((i = creat(argv[2], 0, "rat=cr", "rfm=var")) == -1
  638.                  || dup2(i, fileno(stdout)) == -1) {
  639. #else
  640.                 if (freopen(argv[2], "w", stdout) == NULL) {
  641. #endif
  642.                     perror(argv[2]);
  643.                     cerror("Can't open output file \"%s\"", argv[2]);
  644.                     exit(IO_ERROR);
  645.                 }
  646.             }                           /* Continue by opening input    */
  647.         case 2:                         /* One file -> stdin            */
  648.             /*
  649.              * Open input file, "-" means use stdin.
  650.              */
  651.             if (!streq(argv[1], "-")) {
  652.                 if (freopen(argv[1], "r", stdin) == NULL) {
  653.                     perror(argv[1]);
  654.                     cerror("Can't open input file \"%s\"", argv[1]);
  655.                     exit(IO_ERROR);
  656.                 }
  657.                 strcpy(work, argv[1]);  /* Remember input filename      */
  658.                 break;
  659.             }                           /* Else, just get stdin         */
  660.         case 0:                         /* No args?                     */
  661.         case 1:                         /* No files, stdin -> stdout    */
  662. #if HOST == SYS_VMS || HOST == SYS_RSX || HOST == SYS_RT11
  663.             fgetname(stdin, work);      /* Vax-11C, Decus C know name   */
  664. #else
  665.             work[0] = EOS;              /* Unix can't find stdin name   */
  666. #endif
  667.             break;
  668.  
  669.         default:
  670.             exit(IO_ERROR);             /* Can't happen                 */
  671.         }
  672.         setincdirs();                   /* Setup -I include directories */
  673.         addfile(stdin, work);           /* "open" main input file       */
  674. #if DEBUG
  675.         if (debug > 0)
  676.             dumpdef("preset #define symbols");
  677. #endif
  678.         cppmain();                      /* Process main file            */
  679.         if ((i = (ifptr - &ifstack[0])) != 0) {
  680. #if OLD_PREPROCESSOR
  681.             ciwarn("Inside #ifdef block at end of input, depth = %d", i);
  682. #else
  683.             cierror("Inside #ifdef block at end of input, depth = %d", i);
  684. #endif
  685.         }
  686.         fclose(stdout);
  687.         if (errors > 0) {
  688.             fprintf(stderr, (errors == 1)
  689.                 ? "%d error in preprocessor\n"
  690.                 : "%d errors in preprocessor\n", errors);
  691.             if (!eflag)
  692.                 exit(IO_ERROR);
  693.         }
  694.     return(IO_SUCCESS);
  695.         exit(IO_SUCCESS);               /* No errors or -E option set   */
  696. }
  697.  
  698.  
  699. FILE_LOCAL
  700. void
  701. cppmain()
  702. /*
  703.  * Main process for cpp -- copies tokens from the current input
  704.  * stream (main file, include file, or a macro) to the output
  705.  * file.
  706.  */
  707. {
  708.         register int            c;              /* Current character    */
  709.         register int            counter;        /* newlines and spaces  */
  710.  
  711.         /*
  712.          * Explicitly output a #line at the start of cpp output so
  713.          * that lint (etc.) knows the name of the original source
  714.          * file.  If we don't do this explicitly, we may get
  715.          * the name of the first #include file instead.
  716.          *
  717.          * The extra putchar() and sharp() works around a bug in pcc.
  718.          */
  719.         sharp();
  720.         putchar('\n');
  721.         sharp();
  722.         /*
  723.          * This loop is started "from the top" at the beginning of each line
  724.          * wrongline is set TRUE in many places if it is necessary to write
  725.          * a #line record.  (But we don't write them when expanding macros.)
  726.          *
  727.          * The counter variable has two different uses:  at
  728.          * the start of a line, it counts the number of blank lines that
  729.          * have been skipped over.  These are then either output via
  730.          * #line records or by outputting explicit blank lines.
  731.          * When expanding tokens within a line, the counter remembers
  732.          * whether a blank/tab has been output.  These are dropped
  733.          * at the end of the line, and replaced by a single blank
  734.          * within lines.
  735.          */
  736.         for (;;) {
  737.             counter = 0;                        /* Count empty lines    */
  738.             for (;;) {                          /* For each line, ...   */
  739.                 while (type[(c = get())] == SPA) /* Skip leading blanks */
  740.                     ;                           /* in this line.        */
  741.                 if (c == '\n')                  /* If line's all blank, */
  742.                     ++counter;                  /* Do nothing now       */
  743.                 else if (c == '#') {            /* Is 1st non-space '#' */
  744.                     keepcomments = FALSE;       /* Don't pass comments  */
  745.                     counter = control(counter); /* Yes, do a #command   */
  746.                     keepcomments = (cflag && compiling);
  747.                 }
  748.                 else if (c == EOF_CHAR)         /* At end of file?      */
  749.                     break;
  750.                 else if (!compiling) {          /* #ifdef false?        */
  751.                     skipnl();                   /* Skip to newline      */
  752.                     counter++;                  /* Count it, too.       */
  753.                 }
  754.                 else {
  755.                     break;                      /* Actual token         */
  756.                 }
  757.             }
  758.             if (c == EOF_CHAR)                  /* Exit process at      */
  759.                 break;                          /* End of file          */
  760.             /*
  761.              * If the loop didn't terminate because of end of file, we
  762.              * know there is a token to compile.  First, clean up after
  763.              * absorbing newlines.  counter has the number we skipped.
  764.              */
  765.             if ((wrongline && infile->fp != NULL) || counter > 4)
  766.                 sharp();                        /* Output # line number */
  767.             else {                              /* If just a few, stuff */
  768.                 while (--counter >= 0)          /* them out ourselves   */
  769.                     putchar('\n');
  770.             }
  771.             /*
  772.              * Process each token on this line.
  773.              */
  774.             unget();                            /* Reread the char.     */
  775.             for (;;) {                          /* For the whole line,  */
  776.                 for (counter = 0; (type[(c = get())] == SPA);) {
  777. #if COMMENT_INVISIBLE | OK_CONCAT == CON_NOEXPAND
  778.                     if (c != COM_SEP)
  779.                         counter++;
  780. #else
  781.                     counter++;                  /* Skip over blanks     */
  782. #endif
  783.                 }
  784.                 if (c == EOF_CHAR || c == '\n')
  785.                     goto end_line;              /* Exit line loop       */
  786.                 else if (counter > 0)           /* If we got any spaces */
  787.                     putchar(' ');               /* Output one space     */
  788.                 c = macroid(c);                 /* Grab the token       */
  789.                 if (c == EOF_CHAR || c == '\n') /* From macro exp error */
  790.                     goto end_line;              /* Exit line loop       */
  791.                 switch (type[c]) {
  792.                 case LET:
  793.                     if (!catenate())            /* Anything happen?     */
  794.                         fputs(token, stdout);   /* Quite ordinary token */
  795.                     break;
  796.  
  797.                 case DIG:                       /* Output a number      */
  798.                 case DOT:                       /* Dot may begin floats */
  799.                     scannumber(c, output);
  800.                     break;
  801.  
  802.                 case QUO:                       /* char or string const */
  803.                     scanstring(c, output);      /* Copy it to output    */
  804.                     break;
  805.  
  806.                 default:                        /* Some other character */
  807.                     if (c == TOK_SEP) {
  808.                         unget();                /* Catenate must see it */
  809.                         token[0] = EOS;         /* Nothing on left side */
  810.                         catenate();
  811.                     }
  812.                     else {
  813.                         cput(c);                /* Just output it       */
  814.                     }
  815.                     break;
  816.                 }                               /* Switch ends          */
  817.             }                                   /* Line for loop        */
  818. end_line:   if (c == '\n') {                    /* Compiling at EOL?    */
  819.                 putchar('\n');                  /* Output newline, if   */
  820.                 if (infile->fp == NULL)         /* Expanding a macro,   */
  821.                     wrongline = TRUE;           /* Output # line later  */
  822.             }
  823.         }                                       /* Continue until EOF   */
  824. }
  825.  
  826. void
  827. output(c)
  828. int             c;
  829. /*
  830.  * Output one character to stdout -- output() is passed as an
  831.  * argument to scanstring()
  832.  */
  833. {
  834.         switch (c) {
  835.         case ST_QUOTE:                          /* Stringizer magic     */
  836.             putchar('"');
  837.             break;
  838.  
  839.         case TOK_SEP:                           /* Token separator      */
  840. #if COMMENT_INVISIBLE | OK_CONCAT == CON_NOEXPAND
  841.         case COM_SEP:                           /* Comment magic        */
  842. #endif
  843.             break;                              /* These are ignored    */
  844.  
  845.         default:
  846.             putchar(c);
  847.         }
  848. }
  849.  
  850. static char     *sharpfilename = NULL;
  851.  
  852. FILE_LOCAL
  853. void
  854. sharp()
  855. /*
  856.  * Output a line number line.
  857.  */
  858. {
  859.         register char           *name;
  860.  
  861.         if (keepcomments)                       /* Make sure # comes on */
  862.             putchar('\n');                      /* a fresh, new line.   */
  863.         if (pflag)
  864.             goto sharp_exit;
  865.         printf("#%s %d", LINE_PREFIX, line);
  866.         if (infile->fp != NULL) {
  867.             name = (infile->progname != NULL)
  868.                 ? infile->progname : infile->filename;
  869.             if (sharpfilename == NULL
  870.              || sharpfilename != NULL && !streq(name, sharpfilename)) {
  871.                 if (sharpfilename != NULL)
  872.                     free(sharpfilename);
  873.                 sharpfilename = savestring(name);
  874.                 printf(" \"%s\"", name);
  875.              }
  876.         }
  877.         putchar('\n');
  878.  
  879. sharp_exit:
  880.         wrongline = FALSE;
  881. }
  882.  
  883.