home *** CD-ROM | disk | FTP | other *** search
/ Education Sampler 1992 [NeXTSTEP] / Education_1992_Sampler.iso / NeXT / GnuSource / cc-61.0.1 / cc / protoize.c < prev    next >
C/C++ Source or Header  |  1991-06-03  |  138KB  |  4,252 lines

  1. /* Protoize program - Written by Ron Guilmette at the Microelectronics
  2.    and Computer Technology Corporation (MCC).  The author's current
  3.    E-mail address is rfg@ics.uci.edu.
  4.  
  5.    Copyright (C) 1989 Free Software Foundation, Inc.
  6.  
  7. This file is part of GNU CC.
  8.  
  9. GNU CC is free software; you can redistribute it and/or modify
  10. it under the terms of the GNU General Public License as published by
  11. the Free Software Foundation; either version 2, or (at your option)
  12. any later version.
  13.  
  14. GNU CC is distributed in the hope that it will be useful,
  15. but WITHOUT ANY WARRANTY; without even the implied warranty of
  16. MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  17. GNU General Public License for more details.
  18.  
  19. You should have received a copy of the GNU General Public License
  20. along with GNU CC; see the file COPYING.  If not, write to
  21. the Free Software Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.  */
  22.  
  23. #if defined (__cplusplus)
  24. extern "C" {            /* Start of extern "C" section.  */
  25. #endif
  26.  
  27. #include "config.h"
  28.  
  29. #include <stdio.h>
  30. #include <ctype.h>
  31. #include <errno.h>
  32. #include <sys/types.h>
  33. #include <sys/stat.h>
  34. #include <sys/dir.h>
  35. #include <sys/file.h>
  36. #include <sys/param.h>
  37. #include <sys/wait.h>
  38. #include <setjmp.h>
  39.  
  40. /* Sometimes param.h defines these macros.  */
  41. #undef CHAR_BIT
  42. #undef CHAR_MAX
  43. #undef CHAR_MIN
  44. #undef CLK_TCK
  45. #undef INT_MAX
  46. #undef INT_MIN
  47. #undef LONG_MAX
  48. #undef LONG_MIN
  49. #undef SCHAR_MAX
  50. #undef SCHAR_MIN
  51. #undef SHRT_MAX
  52. #undef SHRT_MIN
  53. #undef UCHAR_MAX
  54. #undef UINT_MAX
  55. #undef ULONG_MAX
  56. #undef USHRT_MAX
  57. #include <limits.h>
  58.  
  59. #ifdef USG
  60. #define vfork fork
  61. #endif
  62.  
  63. /* Emulate getwd on non-BSD systems.  */
  64.  
  65. #if defined(USG) || defined(VMS)
  66. #define getwd(addr) getcwd (addr, MAXPATHLEN)
  67. #endif
  68.  
  69. #if defined(USG) || defined(VMS)
  70. #include <string.h>
  71. #define rindex strrchr
  72. #else
  73. #include <strings.h>
  74. #if !defined (BSD)
  75. #define BSD 1
  76. #endif
  77. #endif
  78.  
  79. #if defined (__cplusplus)
  80. }                /* End of extern "C" section.  */
  81. #endif
  82.  
  83. /* Look for these where the `const' qualifier is intentionally cast aside.  */
  84.  
  85. #define NONCONST
  86.  
  87. #if (!defined (__GNUC__) && !defined (__cplusplus)) || defined (DGUX)
  88. #define inline
  89. #endif
  90.  
  91. #if !defined(__STDC__) && !defined (__cplusplus)
  92. #define const
  93. #define volatile
  94. #endif
  95.  
  96. /* The VAX C compiler doesn't believe in void pointers.  */
  97.  
  98. #if defined(vax) && !defined(__STDC__) && !defined(__GNUC__) && !defined (__cplusplus)
  99. typedef char * pointer_t;
  100. typedef const char * const_pointer_t;
  101. #else
  102. typedef void * pointer_t;
  103. typedef const void * const_pointer_t;
  104. #endif
  105.  
  106. typedef void void_t;
  107.  
  108. /* String to identify this version.  */
  109.  
  110. static const char * const version_string = "Version 1.07";
  111.  
  112. /* Suffix of aux_info files.  */
  113.  
  114. static const char * const aux_info_suffix = ".X";
  115.  
  116. /* String to attach to pathnames for saved versions of original files.  */
  117.  
  118. static const char * const save_suffix = ".save";
  119.  
  120. #ifndef UNPROTOIZE
  121.  
  122. /* File name of the file which contains descriptions of standard system
  123.    routines.  Note that we never actually do anything with this file per se,
  124.    but we do read in its corresponding aux_info file.  */
  125.  
  126. static const char * const syscalls_filename = "SYSCALLS.c";
  127.  
  128. /* Default place to find the above file.  */
  129.  
  130. #ifdef STD_PROTO_DIR
  131. static const char * const default_syscalls_dir = STD_PROTO_DIR;
  132. #else
  133. static const char * const default_syscalls_dir = "/usr/local/lib";
  134. #endif
  135.  
  136. /* Variable to hold the complete absolutized pathname of the SYSCALLS.c.X
  137.    file.  */
  138.  
  139. static char * syscalls_pathname;
  140.  
  141. #endif
  142.  
  143. /* Type of the structure that holds information about macro unexpansions. */
  144.  
  145. struct unexpansion_struct {
  146.   const char *expanded;
  147.   const char *contracted;
  148. };
  149. typedef struct unexpansion_struct unexpansion;
  150.  
  151. /* A table of conversions that may need to be made for some (stupid) older
  152.    operating systems where these types are preprocessor macros rather than
  153.    typedefs (as they really ought to be).
  154.  
  155.    WARNING: The contracted forms must be as small (or smaller) as the
  156.    expanded forms, or else havoc will ensue.  */
  157.  
  158. static const unexpansion unexpansions[] = {
  159.   { "struct _iobuf", "FILE" },
  160.   { 0, 0 }
  161. };
  162.  
  163. /* Maximum length of lines in both the aux_info files and in the actual
  164.    source file.  Lines had better not be bigger than this or we are in big
  165.    trouble.  */
  166.  
  167. #define MAX_LINE_LEN        8192
  168. #define INDENT_MAXCHARS        MAX_LINE_LEN
  169.  
  170. /* Maximum number of options that can be passed to the C compiler.  */
  171.  
  172. #define MAX_OPTIONS    2048
  173.  
  174. /* The number of "primary" slots in the hash tables for filenames and for
  175.    function names.  This can be as big or as small as you like, except that
  176.    it must be a power of two.  */
  177.  
  178. #define HASH_TABLE_SIZE        (1 << 9)
  179.  
  180. /* Bit mask to use when computing hash values.  */
  181.  
  182. static const int hash_mask = (HASH_TABLE_SIZE - 1);
  183.  
  184. /* Prefix of files that we should avoid trying to convert (unless the -f option
  185.    is in effect).  */
  186.  
  187. static const char * const usr_include = "/usr/include/";
  188.  
  189. /* A list of other directory names that we should also avoid messing with
  190.    (unless the -f option is used).  */
  191.  
  192. static const char * const gnu_include[] = {
  193.   "/gcc-include/",
  194.   "/g++-include/",
  195.   0
  196. };
  197.  
  198. /* The name of the other style of variable-number-of-parameters functions
  199.    (i.e. the style that we want to leave unconverted because we don't yet
  200.    know how to convert them to this style.  This string is used in warning
  201.    messages.  */
  202.  
  203. /* Also define here the string that we can search for in the parameter lists
  204.    taken from the .X files which will unambiguously indicate that we have
  205.    found a varargs style function.  */
  206.  
  207. #ifdef UNPROTOIZE
  208. static const char * const other_var_style = "stdarg";
  209. #else
  210. static const char * const other_var_style = "varargs";
  211. #if defined (m88k)
  212. static const char * const varargs_style_indicator = "__va_1st_arg";
  213. #elif defined (i860)
  214. static const char * const varargs_style_indicator = ???;
  215. #elif defined (mips)
  216. static const char * const varargs_style_indicator = "_va_alist";
  217. #elif defined (pyr)
  218. static const char * const varargs_style_indicator = "__builtin_va_alist";
  219. #elif defined (spur)
  220. static const char * const varargs_style_indicator = "__va_regs";
  221. #else
  222. static const char * const varargs_style_indicator = "__builtin_va_alist";
  223. #endif
  224. #endif
  225.  
  226. /* System supplied externals.  */
  227.  
  228. #if defined (__cplusplus)
  229. extern "C" {                /* Start of extern "C" section.  */
  230. #endif
  231.  
  232. extern int errno;
  233. extern char * sys_errlist[];
  234.  
  235. #ifndef bcopy
  236. extern int bcopy (const void *, void *, int);
  237. #else
  238. extern void *memcpy (void *, const void *, size_t);
  239. #endif
  240.  
  241. #ifdef getwd
  242. extern char *getcwd (char *, int);
  243. #else
  244. extern char *getwd (char *);
  245. #endif
  246.  
  247. #ifndef vfork
  248. extern int vfork (void);
  249. #else
  250. extern int fork (void);
  251. #endif
  252.  
  253. #if defined (BSD) || defined (__MACH__)
  254. #define WAIT_ARG_TYPE union wait
  255. extern int wait (union wait *);
  256. #else
  257. #define WAIT_ARG_TYPE int
  258. #endif
  259.  
  260. #if !defined (WIFEXITED) || defined (DGUX)
  261. #undef WIFEXITED
  262. #define WIFEXITED(status_word) ((*((int *)&status_word) & 0xff) == 0x00)
  263. #endif
  264.  
  265. #if !defined (WEXITSTATUS) || defined (DGUX)
  266. #undef WEXITSTATUS
  267. #define WEXITSTATUS(status_word) ((*((int *)&status_word) & 0xff00) >> 8)
  268. #endif
  269.  
  270. /* A prototype for open and stat would conflict with some
  271.    other declarations.  */
  272. /* extern int open (const char *, int, ...); */
  273. /* extern int stat (const char *, struct stat *); */
  274. extern int fprintf (FILE *, const char *, ...);
  275. extern int printf (const char *, ...);
  276. extern void_t exit (int);
  277. extern pointer_t malloc (size_t);
  278. extern pointer_t realloc (void *, size_t);
  279. extern void_t free (void *);
  280. extern int read (int, void *, size_t);
  281. extern int write (int, const void *, size_t);
  282. extern int close (int);
  283. extern int link (const char *, const char *);
  284. extern int unlink (const char *);
  285. extern int fflush (FILE *);
  286. extern int _flsbuf (unsigned int, FILE *);
  287. extern int atoi (const char *);
  288. extern int access (const char *, int);
  289. extern int puts (const char *);
  290. extern int fputs (const char *, FILE *);
  291. extern int fputc (int, FILE *);
  292. extern int execvp (const char *, const char **);
  293. extern int setjmp (jmp_buf);
  294. extern void_t longjmp (jmp_buf, int);
  295.  
  296. #if defined (__cplusplus)
  297. }                    /* End of extern "C" section.  */
  298. #endif
  299.  
  300. /* The following two types are used to create hash tables.  In this program,
  301.    there are two hash tables which are used to store and quickly lookup two
  302.    different classes of strings.  The first type of strings stored in the
  303.    first hash table are absolute pathnames of files which protoize needs to
  304.    know about.  The second type of strings (stored in the second hash table)
  305.    are function names.  It is this second class of strings which really
  306.    inspired the use of the hash tables, because there may be a lot of them.  */
  307.  
  308. typedef struct hash_table_entry_struct hash_table_entry;
  309.  
  310. /* Do some typedefs so that we don't have to write "struct" so often.  */
  311.  
  312. typedef struct def_dec_info_struct def_dec_info;
  313. typedef struct file_info_struct file_info;
  314. typedef struct f_list_chain_item_struct f_list_chain_item;
  315.  
  316. /* In the struct below, note that the "_info" field has two different uses
  317.    depending on the type of hash table we are in (i.e. either the pathnames
  318.    hash table or the function names hash table).  In the pathnames hash table
  319.    the info fields of the entries point to the file_info struct which is
  320.    associated with each pathname (1 per pathname).  In the function names
  321.    hash table, the info field points to the head of a singly linked list of
  322.    def_dec_info entries which are all defs or decs of the function whose
  323.    name is pointed to by the "symbol" field.  Keeping all of the defs/decs
  324.    for a given function name on a special list specifically for that function
  325.    name makes it quick and easy to find out all of the important information
  326.    about a given (named) function.  */
  327.  
  328. struct hash_table_entry_struct {
  329.   hash_table_entry *        hash_next;    /* -> to secondary entries */
  330.   const char *            symbol;        /* -> to the hashed string */
  331.   union {
  332.     const def_dec_info *    _ddip;
  333.     file_info *            _fip;
  334.   } _info;
  335. };
  336. #define ddip _info._ddip
  337. #define fip _info._fip
  338.  
  339. /* Define a type specifically for our two hash tables.  */
  340.  
  341. typedef hash_table_entry hash_table[HASH_TABLE_SIZE];
  342.  
  343. /* The following struct holds all of the important information about any
  344.    single pathname (e.g. file) which we need to know about.  */
  345.  
  346. struct file_info_struct {
  347.   const hash_table_entry *    hash_entry; /* -> to associated hash entry */
  348.   const def_dec_info *        defs_decs;  /* -> to chain of defs/decs */
  349.   time_t            mtime;      /* Time of last modification.  */
  350. };
  351.  
  352. /* Due to the possibility that functions may return pointers to functions,
  353.    (which may themselves have their own parameter lists) and due to the
  354.    fact that returned pointers-to-functions may be of type "pointer-to-
  355.    function-returning-pointer-to-function" (ad nauseum) we have to keep
  356.    an entire chain of ANSI style formal parameter lists for each function.
  357.  
  358.    Normally, for any given function, there will only be one formals list
  359.    on the chain, but you never know.
  360.  
  361.    Note that the head of each chain of formals lists is pointed to by the
  362.    `f_list_chain' field of the corresponding def_dec_info record.
  363.  
  364.    For any given chain, the item at the head of the chain is the *leftmost*
  365.    parameter list seen in the actual C language function declaration.  If
  366.    there are other members of the chain, then these are linked in left-to-right
  367.    order from the head of the chain.  */
  368.  
  369. struct f_list_chain_item_struct {
  370.   const f_list_chain_item *    chain_next;    /* -> to next item on chain */
  371.   const char *            formals_list;    /* -> to formals list string */
  372. };
  373.  
  374. /* The following struct holds all of the important information about any
  375.    single function definition or declaration which we need to know about.
  376.    Note that for unprotoize we don't need to know very much because we
  377.    never even create records for stuff that we don't intend to convert
  378.    (like for instance defs and decs which are already in old K&R format
  379.    and "implicit" function declarations).  */
  380.  
  381. struct def_dec_info_struct {
  382.   const def_dec_info *    next_in_file;    /* -> to rest of chain for file */
  383.   file_info *            file;        /* -> file_info for containing file */
  384.   int                line;        /* source line number of def/dec */
  385.   const char *        ansi_decl;    /* -> left end of ansi decl */
  386.   hash_table_entry *    hash_entry;    /* -> hash entry for function name */
  387.   unsigned int            is_func_def;    /* = 0 means this is a declaration */
  388.   const def_dec_info *    next_for_func;    /* -> to rest of chain for func name */
  389.   unsigned int        f_list_count;    /* count of formals lists we expect */
  390.   char            prototyped;    /* = 0 means already prototyped */
  391. #ifndef UNPROTOIZE
  392.   const f_list_chain_item * f_list_chain;    /* -> chain of formals lists */
  393.   const def_dec_info *    definition;    /* -> def/dec containing related def */
  394.   char                is_static;    /* = 0 means visiblilty is "extern"  */
  395.   char            is_implicit;    /* != 0 for implicit func decl's */
  396.   char            written;    /* != 0 means written for implicit */
  397. #else
  398.   const char *        formal_names;    /* -> to list of names of formals */
  399.   const char *        formal_decls;    /* -> to string of formal declartions */
  400. #endif
  401. };
  402.  
  403. /* Pointer to the tail component of the pathname by which this program was
  404.    invoked.  Used everywhere in error and warning messages.  */
  405.  
  406. static const char *pname;
  407.  
  408. /* Error counter.  Will be non-zero if we should give up at the next convenient
  409.    stopping point.  */
  410.  
  411. static int errors = 0;
  412.  
  413. /* Option flags.  */
  414.  
  415. static int version_flag = 0;        /* set by -V option */
  416. static int quiet_flag = 0;        /* set by -q option */
  417. static int force_flag = 0;        /* set by -f option */
  418. static int nochange_flag = 0;        /* set by -n option */
  419. static int nosave_flag = 0;        /* set by -N option */
  420. static int keep_flag = 0;        /* set by -k option */
  421. static const char ** compile_params = 0;    /* set by -c option */
  422. #ifdef UNPROTOIZE
  423. static const char *indent_string = "     ";    /* set by -i option */
  424. #else
  425. static int local_flag = 0;        /* set by -l option */
  426. static int global_flag = 0;        /* set by -g option */
  427. static int cplusplus_flag = 0;        /* set by -C option */
  428. static const char* nondefault_syscalls_dir = 0; /* set by -B option */
  429. #endif
  430.  
  431. /* An index into the compile_params array where we should insert the filename
  432.    parameter when we are ready to exec the C compiler.  A zero value indicates
  433.    that we have not yet called munge_compile_params().  */
  434.  
  435. static int filename_index = 0;
  436.  
  437. /* Count of command line arguments which were "filename" arguments.  */
  438.  
  439. static int base_source_files = 0;
  440.  
  441. /* Points to a malloc'ed list of pointers to all of the filenames of base
  442.    source files which were specified on the command line.  */
  443.  
  444. static const char **base_source_paths;
  445.  
  446. /* Line number of the line within the current aux_info file that we
  447.    are currently processing.  Used for error messages in case the prototypes
  448.    info file is corrupted somehow.  */
  449.  
  450. static int current_aux_info_lineno;
  451.  
  452. /* Pointer to the name of the source file currently being converted.  */
  453.  
  454. static const char *convert_path;
  455.  
  456. /* Pointer to relative root string (taken from aux_info file) which indicates
  457.    where directory the user was in when he did the compilation step that
  458.    produced the containing aux_info file. */
  459.  
  460. static const char *invocation_path;
  461.  
  462. /* Pointer to the base of the input buffer that holds the original text for the
  463.    source file currently being converted.  */
  464.  
  465. static const char *orig_text_base;
  466.  
  467. /* Pointer to the byte just beyond the end of the input buffer that holds the
  468.    original text for the source file currently being converted.  */
  469.  
  470. static const char *orig_text_limit;
  471.  
  472. /* Pointer to the base of the input buffer that holds the cleaned text for the
  473.    source file currently being converted.  */
  474.  
  475. static const char *clean_text_base;
  476.  
  477. /* Pointer to the byte just beyond the end of the input buffer that holds the
  478.    cleaned text for the source file currently being converted.  */
  479.  
  480. static const char *clean_text_limit;
  481.  
  482. /* Pointer to the last byte in the cleaned text buffer that we have already
  483.    (virtually) copied to the output buffer (or decided to ignore).  */
  484.  
  485. static const char * clean_read_ptr;
  486.  
  487. /* Pointer to the base of the output buffer that holds the replacement text
  488.    for the source file currently being converted.  */
  489.  
  490. static char *repl_text_base;
  491.  
  492. /* Pointer to the byte just beyond the end of the output buffer that holds the
  493.    replacement text for the source file currently being converted.  */
  494.  
  495. static char *repl_text_limit;
  496.  
  497. /* Pointer to the last byte which has been stored into the output buffer.
  498.    The next byte to be stored should be stored just past where this points
  499.    to.  */
  500.  
  501. static char * repl_write_ptr;
  502.  
  503. /* Pointer into the cleaned text buffer for the source file we are currently
  504.    converting.  This points to the first character of the line that we last
  505.    did a "seek_to_line()" to (see below).  */
  506.  
  507. static const char *last_known_line_start;
  508.  
  509. /* Number of the line (in the cleaned text buffer) that we last did a
  510.    "seek_to_line()" to.  Will be one if we just read a new source file
  511.    into the cleaned text buffer.  */
  512.  
  513. static int last_known_line_number;
  514.  
  515. /* The pathnames hash table.  */
  516.  
  517. static hash_table pathname_primary;
  518.  
  519. /* The function names hash table.  */
  520.  
  521. static hash_table function_name_primary;
  522.  
  523. /* The place to keep the recovery address which is used only in cases where
  524.    we get hopelessly confused by something in the cleaned original text.  */
  525.  
  526. static jmp_buf source_confusion_recovery;
  527.  
  528. /* An area to hold the current pathname (used by abspath).  */
  529.  
  530. static char cwd_buffer[MAXPATHLEN];
  531.  
  532. /* A place to save the read pointer until we are sure that an individual
  533.    attempt at editing will succeed.  */
  534.  
  535. static const char * saved_clean_read_ptr;
  536.  
  537. /* A place to save the write pointer until we are sure that an individual
  538.    attempt at editing will succeed.  */
  539.  
  540. static char * saved_repl_write_ptr;
  541.  
  542. /* Forward declaration.  */
  543.  
  544. static const char *shortpath (const char *cwd, const char *pathname);
  545.  
  546. /* Get setup to recover in case the edit we are about to do goes awry.  */
  547.  
  548. void save_pointers (void)
  549. {
  550.   saved_clean_read_ptr = clean_read_ptr;
  551.   saved_repl_write_ptr = repl_write_ptr;
  552. }
  553.  
  554. /* Call this routine to recover our previous state whenever something looks
  555.    too confusing in the source code we are trying to edit.  */
  556.  
  557. void restore_pointers (void)
  558. {
  559.   clean_read_ptr = saved_clean_read_ptr;
  560.   repl_write_ptr = saved_repl_write_ptr;
  561. }
  562.  
  563. /* Return true if the given character is a legal identifier character.  */
  564.  
  565. inline static int
  566. is_id_char (char ch)
  567. {
  568.   return (isalnum (ch) || (ch == '_') || (ch == '$'));
  569. }
  570.  
  571. /* Allocate some space, but check that the allocation was successful.  */
  572.  
  573. static pointer_t
  574. xmalloc (int byte_count)
  575. {
  576.   pointer_t rv;
  577.  
  578.   if ((rv = malloc (byte_count)) == NULL)
  579.     {
  580.       fprintf (stderr, "\n%s: fatal error: can't allocate %d more bytes of memory\n",
  581.         pname, byte_count);
  582.       exit (1);
  583.       return 0;        /* avoid warnings */
  584.     }
  585.   else
  586.     return rv;
  587. }
  588.  
  589. /* Reallocate some space, but check that the reallocation was successful.  */
  590.  
  591. static pointer_t
  592. xrealloc (pointer_t old_space, int byte_count)
  593. {
  594.   pointer_t rv;
  595.  
  596.   if ((rv = realloc (old_space, byte_count)) == NULL)
  597.     {
  598.       fprintf (stderr, "\n%s: fatal error: can't allocate %d more bytes of memory\n",
  599.         pname, byte_count);
  600.       exit (1);
  601.       return 0;        /* avoid warnings */
  602.     }
  603.   else
  604.     return rv;
  605. }
  606.  
  607. /* Deallocate the area pointed to by an arbitrary pointer, but first, strip
  608.    the `const' qualifier from it and also make sure that the pointer value
  609.    is non-null.  */
  610.  
  611. static void_t
  612. xfree (const_pointer_t p)
  613. {
  614.   if (p)
  615.     free ((NONCONST pointer_t) p);
  616. }
  617.  
  618. /* More 'friendly' abort that prints the line and file.
  619.    config.h can #define abort fancy_abort if you like that sort of thing.  */
  620.  
  621. void
  622. fancy_abort ()
  623. {
  624.   fprintf (stderr, "%s: internal abort.\n", pname);
  625.   exit (1);
  626. }
  627.  
  628. /* Make a duplicate of a given string in a newly allocated area.  */
  629.  
  630. static char *
  631. dupstr (const char *s)
  632. {
  633.   return strcpy ((char *) xmalloc (strlen (s) + 1), s);
  634. }
  635.  
  636. /* Make a duplicate of the first N bytes of a given string in a newly
  637.    allocated area.  */
  638.  
  639. static char *
  640. dupnstr (const char *s, int n)
  641. {
  642.   char *ret_val = strncpy ((char *) xmalloc (n + 1), s, n);
  643.  
  644.   ret_val[n] = '\0';
  645.   return ret_val;
  646. }
  647.  
  648. /* Return a pointer to the first occurance of s2 within s1 or NULL if s2
  649.    does not occur within s1.  Assume neither s1 nor s2 are null pointers.  */
  650.  
  651. static const char *
  652. substr (const char *s1, const char *const s2)
  653. {
  654.   for (; *s1 ; s1++)
  655.     {
  656.       const char *p1;
  657.       const char *p2;
  658.       char c;
  659.  
  660.       for (p1 = s1, p2 = s2; c = *p2; p1++, p2++)
  661.         if (*p1 != c)
  662.           goto outer;
  663.       return s1;
  664. outer:
  665.       ;
  666.     }
  667.   return 0;
  668. }
  669.  
  670. /* Give a message indicating the proper way to invoke this program and then
  671.    exit with non-zero status.  */
  672.  
  673. static void_t
  674. usage (void)
  675. {
  676. #ifdef UNPROTOIZE
  677.   fprintf (stderr, "%s: usage '%s [ -VqfnkN ] [ -i <istring> ] [ pathname ... ]'\n",
  678. #else
  679.   fprintf (stderr, "%s: usage '%s [ -VqfnkNlgC ] [ -B <diname> ] [ pathname ... ]'\n",
  680. #endif
  681.     pname, pname);
  682.   exit (1);
  683. }
  684.  
  685. /* Return true if the given pathname (assumed to be an absolute pathname)
  686.    designates a file residing anywhere beneath any one of the "system"
  687.    include directories.  */
  688.  
  689. static int
  690. in_system_include_dir (const char *path)
  691. {
  692.   const char * const *gnu_include_p;
  693.  
  694.   if (path[0] != '/')
  695.     abort ();        /* Must be an absolutized pathname.  */
  696.   if (!strncmp (path, usr_include, strlen (usr_include)))
  697.     return 1;
  698.  
  699.   for (gnu_include_p = gnu_include; *gnu_include_p; gnu_include_p++)
  700.     if (substr (path, *gnu_include_p))
  701.       return 1;
  702.   return 0;
  703. }
  704.  
  705. /* Return true if the given pathname designates a file that the user has
  706.    read access to and for which the user has write access to the containing
  707.    directory.  */
  708.  
  709. static int
  710. file_could_be_converted (const char *path)
  711. {
  712.   char dir_name[MAXPATHLEN];
  713.  
  714.   if (access (path, R_OK))
  715.     return 0;
  716.  
  717.   {
  718.     char *dir_last_slash;
  719.  
  720.     strcpy (dir_name, path);
  721.     dir_last_slash = rindex (dir_name, '/');
  722.     if (dir_last_slash)
  723.       *dir_last_slash = '\0';
  724.     else
  725.       abort ();  /* Should have been an absolutized pathname.  */
  726.   }
  727.  
  728.   if (access (path, W_OK))
  729.     return 0;
  730.  
  731.   return 1;
  732. }
  733.  
  734. /* Return true if the given pathname designates a file that has its "sticky"
  735.    bit set.  */
  736.  
  737. static int
  738. file_is_sticky (const char *path)
  739. {
  740.   struct stat stat_buf;
  741.  
  742.   if (stat (path, &stat_buf) == -1)
  743.     {
  744.       fprintf (stderr, "%s: warning: can't get mode of file `%s': %s\n",
  745.         pname,
  746.         shortpath (NULL, path),
  747.         sys_errlist[errno]);
  748.       return 0;
  749.     }
  750.   return (stat_buf.st_mode & S_ISVTX);
  751. }
  752.  
  753. /* Return true if the given pathname designates a file that we are allowed
  754.    to modify.  Files which we should not attempt to modify are (a) "system"
  755.    include files, and (b) files which the user doesn't have write access to
  756.    or for which the sticky bit is set, and (c) files which reside in
  757.    directories which the user doesn't have write access to or for which the
  758.    sticky bit is set.  Unless requested to be quiet, give warnings about
  759.    files that we will not try to convert for one reason or another.  An
  760.    exception is made for "system" include files, which we never try to
  761.    convert and for which we don't issue the usual warnings.  */
  762.  
  763. static int
  764. file_normally_convertable (const char *path)
  765. {
  766.   char dir_name[MAXPATHLEN];
  767.  
  768.   if (in_system_include_dir (path))
  769.     return 0;
  770.  
  771.   if (file_is_sticky (path))
  772.     {
  773.       if (!quiet_flag)
  774.         fprintf (stderr, "%s: warning: file `%s' is sticky\n",
  775.           pname, shortpath (NULL, path));
  776.       return 0;
  777.     }
  778.  
  779.   {
  780.     char *dir_last_slash;
  781.  
  782.     strcpy (dir_name, path);
  783.     dir_last_slash = rindex (dir_name, '/');
  784.     if (dir_last_slash)
  785.       *dir_last_slash = '\0';
  786.     else
  787.       abort ();  /* Should have been an absolutized pathname.  */
  788.   }
  789.  
  790.   if (file_is_sticky (dir_name))
  791.     {
  792.       if (!quiet_flag)
  793.         fprintf (stderr, "%s: warning: directory containing file `%s' is sticky\n",
  794.           pname, shortpath (NULL, path));
  795.       return 0;
  796.     }
  797.  
  798.   if (access (path, R_OK))
  799.     {
  800.       if (!quiet_flag)
  801.         fprintf (stderr, "%s: warning: no read access for file `%s'\n",
  802.           pname, shortpath (NULL, path));
  803.       return 0;
  804.     }
  805.  
  806.   if (access (path, W_OK))
  807.     {
  808.       if (!quiet_flag)
  809.         fprintf (stderr, "%s: warning: no write access for file `%s'\n",
  810.           pname, shortpath (NULL, path));
  811.       return 0;
  812.     }
  813.  
  814.   if (access (dir_name, W_OK))
  815.     {
  816.       if (!quiet_flag)
  817.         fprintf (stderr, "%s: warning: no write access for dir containing `%s'\n",
  818.           pname, shortpath (NULL, path));
  819.       return 0;
  820.     }
  821.  
  822.   return 1;
  823. }
  824.  
  825. #ifndef UNPROTOIZE
  826.  
  827. /* Return true if the given file_info struct refers to the special SYSCALLS.c.X
  828.    file.  Return false otherwise.  */
  829.  
  830. static int
  831. is_syscalls_file (const file_info *fi_p)
  832. {
  833.   return (substr (fi_p->hash_entry->symbol, syscalls_filename) != NULL);
  834. }
  835.  
  836. #endif
  837.  
  838. /* Check to see if this file will need to have anything done to it on this
  839.    run.  If there is nothing in the given file which both needs conversion
  840.    and for which we have the necessary stuff to do the conversion, return
  841.    false.  Otherwise, return true.
  842.  
  843.    Note that (for protoize) it is only valid to call this function *after*
  844.    the connections between declarations and definitions have all been made
  845.    by connect_defs_and_decs().  */
  846.  
  847. static int
  848. needs_to_be_converted (const file_info *file_p)
  849. {
  850.   const def_dec_info *ddp;
  851.  
  852. #ifndef UNPROTOIZE
  853.  
  854.   if (is_syscalls_file (file_p))
  855.     return 0;
  856.  
  857. #endif
  858.  
  859.   for (ddp = file_p->defs_decs; ddp; ddp = ddp->next_in_file)
  860.  
  861.     if (
  862.  
  863. #ifndef UNPROTOIZE
  864.  
  865.       /* ... and if we a protoizing and this function is in old style ... */
  866.       !ddp->prototyped
  867.       /* ... and if this a definition or is a decl with an associated def ... */
  868.       && (ddp->is_func_def || (!ddp->is_func_def && ddp->definition))
  869.  
  870. #else
  871.  
  872.       /* ... and if we are unprotoizing and this function is in new style ... */
  873.       ddp->prototyped
  874.  
  875. #endif
  876.       )
  877.           /* ... then the containing file needs converting.  */
  878.           return -1;
  879.   return 0;
  880. }
  881.  
  882. /* Given a hash table, apply some function to each node in the table. The
  883.    table to traverse is given as the "hash_tab_p" argument, and the
  884.    function to be applied to each node in the table is given as "func"
  885.    argument.  */
  886.  
  887. static void_t
  888. visit_each_hash_node (const hash_table_entry *hash_tab_p, void_t (*func) (const hash_table_entry *))
  889. {
  890.   const hash_table_entry *primary;
  891.  
  892.   for (primary = hash_tab_p; primary < &hash_tab_p[HASH_TABLE_SIZE]; primary++)
  893.     if (primary->symbol)
  894.       {
  895.         hash_table_entry *second;
  896.  
  897.         (*func)(primary);
  898.         for (second = primary->hash_next; second; second = second->hash_next)
  899.           (*func) (second);
  900.       }
  901. }
  902.  
  903. /* Initialize all of the fields of a new hash table entry, pointed
  904.    to by the "p" parameter.  Note that the space to hold the entry
  905.    is assumed to have already been allocated before this routine is
  906.    called.  */
  907.  
  908. static hash_table_entry *
  909. add_symbol (hash_table_entry *p, const char *s)
  910. {
  911.   p->hash_next = NULL;
  912.   p->symbol = dupstr (s);
  913.   p->ddip = NULL;
  914.   p->fip = NULL;
  915.   return p;
  916. }
  917.  
  918. /* Look for a particular function name or pathname in the particular
  919.    hash table indicated by "hash_tab_p".  If the name is not in the
  920.    given hash table, add it.  Either way, return a pointer to the
  921.    hash table entry for the given name.  */
  922.  
  923. static hash_table_entry *
  924. lookup (hash_table_entry *hash_tab_p, const char *search_symbol)
  925. {
  926.   int hash_value = 0;
  927.   const char *search_symbol_char_p = search_symbol;
  928.   hash_table_entry *p;
  929.  
  930.   while (*search_symbol_char_p)
  931.     hash_value += *search_symbol_char_p++;
  932.   hash_value &= hash_mask;
  933.   p = &hash_tab_p[hash_value];
  934.   if (! p->symbol)
  935.       return add_symbol (p, search_symbol);
  936.   if (!strcmp (p->symbol, search_symbol))
  937.     return p;
  938.   while (p->hash_next)
  939.     {
  940.       p = p->hash_next;
  941.       if (!strcmp (p->symbol, search_symbol))
  942.         return p;
  943.     }
  944.   p->hash_next = (hash_table_entry *) xmalloc (sizeof (hash_table_entry));
  945.   p = p->hash_next;
  946.   return add_symbol (p, search_symbol);
  947. }
  948.  
  949. /* Throw a def/dec record on the junk heap.
  950.  
  951.    Also, since we are not using this record anymore, free up all of the
  952.    stuff it pointed to.  */
  953.  
  954. inline static void_t
  955. free_def_dec (def_dec_info *p)
  956. {
  957.   xfree (p->ansi_decl);
  958.  
  959. #ifndef UNPROTOIZE
  960.   {
  961.     const f_list_chain_item * curr;
  962.     const f_list_chain_item * next;
  963.  
  964.     for (curr = p->f_list_chain; curr; curr = next)
  965.       {
  966.         next = curr->chain_next;
  967.         xfree (curr);
  968.       }
  969.   }
  970. #endif
  971.  
  972.   xfree (p);
  973. }
  974.  
  975. /* Unexpand as many macro symbol as we can find.
  976.  
  977.    If the given line must be unexpanded, make a copy of it in the heap and
  978.    return a pointer to the unexpanded copy.  Otherwise return NULL.  */
  979.  
  980. static char *
  981. unexpand_if_needed (const char *aux_info_line)
  982. {
  983.   char line_buf[MAX_LINE_LEN];
  984.   const unexpansion* unexp_p;
  985.   int got_unexpanded = 0;
  986.   const char *s;
  987.   char *copy_p = line_buf;
  988.  
  989.   /* Make a copy of the input string in line_buf, expanding as necessary.  */
  990.  
  991.   for (s = aux_info_line; *s != '\n'; )
  992.     {
  993.       for (unexp_p = unexpansions; unexp_p->expanded; unexp_p++)
  994.         {
  995.           const char *in_p = unexp_p->expanded;
  996.           int len = strlen (in_p);
  997.  
  998.           if (*s == *in_p && !strncmp (s, in_p, len) && !is_id_char (s[len]))
  999.             {
  1000.               got_unexpanded = 1;
  1001.               strcpy (copy_p, unexp_p->contracted);
  1002.               copy_p += strlen (unexp_p->contracted);
  1003.  
  1004.               /* Assume the there will not be another replacement required
  1005.                  within the text just replaced.  */
  1006.  
  1007.               s += len;
  1008.               goto continue_outer;
  1009.             }
  1010.         }
  1011.       *copy_p++ = *s++;
  1012. continue_outer: ;
  1013.     }
  1014.   *copy_p++ = '\n';
  1015.   *copy_p++ = '\0';
  1016.  
  1017.   return (got_unexpanded) ? dupstr (line_buf) : 0;
  1018. }
  1019.  
  1020. /* Return the absolutized pathname for the given relative
  1021.    pathname.  Note that if that pathname is already absolute, it may
  1022.    still be returned in a modified form because this routine also
  1023.    eliminates redundant slashes and single dots and eliminates double
  1024.    dots to get a shortest possible pathname from the given input
  1025.    pathname.  The absolutization of relative pathnames is made by
  1026.    assuming that the given pathname is to be taken as relative to
  1027.    the first argument (cwd) or to the current directory if cwd is
  1028.    NULL.  */
  1029.  
  1030. static char *
  1031. abspath (const char *cwd, const char *rel_pathname)
  1032. {
  1033.   char abs_buffer[MAXPATHLEN];
  1034.   char *endp;
  1035.   char *inp = abs_buffer;
  1036.   char *outp = abs_buffer;
  1037.  
  1038.   /* Setup the current working directory as needed.  */
  1039.  
  1040.   if (!cwd)
  1041.     cwd = cwd_buffer;
  1042.  
  1043.   /* Copy the  pathname (possibly preceeded by the current working
  1044.      directory name) into the absolutization buffer.  */
  1045.  
  1046.   endp = abs_buffer;
  1047.  
  1048.   {
  1049.     const char *src_p;
  1050.  
  1051.     if (rel_pathname[0] != '/')
  1052.       {
  1053.         src_p = cwd;
  1054.         while (*endp++ = *src_p++)
  1055.           continue;
  1056.         *(endp-1) = '/';                /* overwrite null */
  1057.       }
  1058.     src_p = rel_pathname;
  1059.     while (*endp++ = *src_p++)
  1060.       continue;
  1061.     if (endp[-1] == '/')
  1062.       *endp = '\0';
  1063.   }
  1064.  
  1065.   /* Now make a copy of abs_buffer into abs_buffer, shortening the
  1066.      pathname (by taking out slashes and dots) as we go.  */
  1067.  
  1068.   *outp++ = *inp++;            /* copy first slash */
  1069.   for (;;)
  1070.     {
  1071.       if (!inp[0])
  1072.         break;
  1073.       else if (inp[0] == '/' && outp[-1] == '/')
  1074.         {
  1075.           inp++;
  1076.           continue;
  1077.         }
  1078.       else if (inp[0] == '.' && outp[-1] == '/')
  1079.         {
  1080.           if (!inp[1])
  1081.                   break;
  1082.           else if (inp[1] == '/')
  1083.             {
  1084.                     inp += 2;
  1085.                     continue;
  1086.             }
  1087.           else if ((inp[1] == '.') && (inp[2] == 0 || inp[2] == '/'))
  1088.             {
  1089.                     inp += (inp[2] == '/') ? 3 : 2;
  1090.                     outp -= 2;
  1091.                     while (outp >= abs_buffer && *outp != '/')
  1092.                   outp--;
  1093.                     if (outp < abs_buffer)
  1094.                 {
  1095.                   /* Catch cases like /.. where we try to backup to a
  1096.                      point above the absolute root of the logical file
  1097.                      system.  */
  1098.  
  1099.                     fprintf (stderr, "%s: fatal error: invalid pathname: %s\n",
  1100.                     pname, rel_pathname);
  1101.                     exit (1);
  1102.                   }
  1103.                     *++outp = '\0';
  1104.                     continue;
  1105.             }
  1106.         }
  1107.       *outp++ = *inp++;
  1108.     }
  1109.  
  1110.   /* On exit, make sure that there is a trailing null, and make sure that
  1111.      the last character of the returned string is *not* a slash.  */
  1112.  
  1113.   *outp = '\0';
  1114.   if (outp[-1] == '/')
  1115.     *--outp  = '\0';
  1116.  
  1117.   /* Make a copy (in the heap) of the stuff left in the absolutization
  1118.      buffer and return a pointer to the copy.  */
  1119.  
  1120.   return dupstr (abs_buffer);
  1121. }
  1122.  
  1123. /* Given a pathname (and possibly a directory name from which the pathname
  1124.    is relative) return a string which is the shortest possible
  1125.    equivalent for the corresponding full (absolutized) pathname.  The
  1126.    shortest possible equivalent may be constructed by converting the
  1127.    absolutized pathname to be a relative pathname (i.e. relative to
  1128.    the actual current working directory).  However if a relative pathname
  1129.    is longer, then the full absolute pathname is returned.
  1130.  
  1131.    KNOWN BUG:
  1132.  
  1133.    Note that "simple-minded" conversion of any given type of pathname (either
  1134.    relative or absolute) may not result in a valid equivalent pathname if any
  1135.    subpart of the original pathname is actually a symbolic link.  */
  1136.  
  1137. static const char *
  1138. shortpath (const char *cwd, const char *pathname)
  1139. {
  1140.   static char cwd_buffer[MAXPATHLEN];
  1141.   char rel_buffer[MAXPATHLEN];
  1142.   char *rel_buf_p = rel_buffer;
  1143.   char *cwd_p = cwd_buffer;
  1144.   char *path_p;
  1145.   int unmatched_slash_count = 0;
  1146.  
  1147.   path_p = abspath (cwd, pathname);
  1148.   if (!cwd_buffer[0])
  1149.     getwd (cwd_buffer);
  1150.  
  1151.   while (*cwd_p && (*cwd_p == *path_p))
  1152.     {
  1153.       cwd_p++;
  1154.       path_p++;
  1155.     }
  1156.   if (!*cwd_p)                /* whole pwd matched */
  1157.     {
  1158.       if (!*path_p)            /* input *is* the current path! */
  1159.         return ".";
  1160.       else
  1161.         return ++path_p;
  1162.     }
  1163.   else
  1164.     {
  1165.       if (*path_p)
  1166.         {
  1167.           --cwd_p;
  1168.           --path_p;
  1169.           while (*cwd_p != '/')            /* backup to last slash */
  1170.             {
  1171.               --cwd_p;
  1172.               --path_p;
  1173.             }
  1174.           cwd_p++;
  1175.           path_p++;
  1176.           unmatched_slash_count++;
  1177.         }
  1178.       while (*cwd_p)
  1179.         if (*cwd_p++ == '/')
  1180.                 unmatched_slash_count++;
  1181.       while (unmatched_slash_count--)
  1182.         {
  1183.           *rel_buf_p++ = '.';
  1184.           *rel_buf_p++ = '.';
  1185.           *rel_buf_p++ = '/';
  1186.         }
  1187.       while (*rel_buf_p++ = *path_p++)
  1188.         continue;
  1189.       --rel_buf_p;
  1190.       if (*(rel_buf_p-1) == '/')
  1191.         *--rel_buf_p = '\0';
  1192.       if (strlen (rel_buffer) > strlen (pathname))
  1193.         return pathname;
  1194.       else
  1195.         return dupstr (rel_buffer);
  1196.     }
  1197.   return 0;    /* Prevent warnings for old versions of GCC.  */
  1198. }
  1199.  
  1200. /* Lookup the given pathname in the hash table for pathnames.  If it is a
  1201.    new one, then the hash table info pointer will be null.  In this case,
  1202.    we create a new file_info record to go with the pathname, and we initialize
  1203.    that record with some reasonable values.  */
  1204.  
  1205. static file_info *
  1206. find_file (const char *pathname, int do_not_stat)
  1207. {
  1208.   hash_table_entry *hash_entry_p;
  1209.  
  1210.   hash_entry_p = lookup (pathname_primary, pathname);
  1211.   if (hash_entry_p->fip)
  1212.     return hash_entry_p->fip;
  1213.   else
  1214.     {
  1215.       struct stat stat_buf;
  1216.       file_info *file_p = (file_info *) xmalloc (sizeof (file_info));
  1217.  
  1218.       /* If we cannot get status on any given source file, give a warning
  1219.          and then just set its time of last modification to infinity.  */
  1220.  
  1221.       if (do_not_stat)
  1222.         stat_buf.st_mtime = (time_t) 0;
  1223.       else
  1224.         {
  1225.           if (stat (pathname, &stat_buf) == -1)
  1226.             {
  1227.               fprintf (stderr, "%s: error: can't get status of `%s': %s\n",
  1228.                 pname, shortpath (NULL, pathname), sys_errlist[errno]);
  1229.               stat_buf.st_mtime = (time_t) -1;
  1230.             }
  1231.         }
  1232.  
  1233.       hash_entry_p->fip = file_p;
  1234.       file_p->hash_entry = hash_entry_p;
  1235.       file_p->defs_decs = NULL;
  1236.       file_p->mtime = stat_buf.st_mtime;
  1237.       return file_p;
  1238.     }
  1239. }
  1240.  
  1241. /* Generate a fatal error because some part of the aux_info file is
  1242.    messed up.  */
  1243.  
  1244. static void_t
  1245. aux_info_corrupted (void)
  1246. {
  1247.   fprintf (stderr, "\n%s: fatal error: aux info file corrupted at line %d\n",
  1248.     pname, current_aux_info_lineno);
  1249.   exit (1);
  1250. }
  1251.  
  1252. /* Check to see that a condition is true.  This is kind of like an assert().  */
  1253.  
  1254. inline static void_t
  1255. check_aux_info (int cond)
  1256. {
  1257.   if (! cond)
  1258.     aux_info_corrupted ();
  1259. }
  1260.  
  1261. /* Given a pointer to the closing right parenthesis for a particular formals
  1262.    list (in a aux_info file) find the corresponding left parenthesis and
  1263.    return a pointer to it.  */
  1264.  
  1265. static const char *
  1266. find_corresponding_lparen (const char *p)
  1267. {
  1268.   const char *q;
  1269.   int paren_depth;
  1270.  
  1271.   for (paren_depth = 1, q = p-1; paren_depth; q--)
  1272.     {
  1273.       switch (*q)
  1274.         {
  1275.           case ')':
  1276.             paren_depth++;
  1277.             break;
  1278.           case '(':
  1279.             paren_depth--;
  1280.             break;
  1281.         }
  1282.     }
  1283.   return ++q;
  1284. }
  1285.  
  1286. /* Given a line from  an aux info file, and a time at which the aux info
  1287.    file it came from was created, check to see if the item described in
  1288.    the line comes from a file which has been modified since the aux info
  1289.    file was created.  If so, return non-zero, else return zero.  */
  1290.  
  1291. static int
  1292. referenced_file_is_newer (const char *l, time_t aux_info_mtime)
  1293. {
  1294.   const char *p;
  1295.   file_info *fi_p;
  1296.   char filename[MAXPATHLEN];
  1297.  
  1298.   check_aux_info (l[0] == '/');
  1299.   check_aux_info (l[1] == '*');
  1300.   check_aux_info (l[2] == ' ');
  1301.  
  1302.   {
  1303.     const char *filename_start = p = l + 3;
  1304.  
  1305.     while (*p != ':')
  1306.       p++;
  1307.     strncpy (filename, filename_start, p - filename_start);
  1308.     filename[p-filename_start] = '\0';
  1309.   }
  1310.  
  1311.   /* Call find_file to find the file_info record associated with the file
  1312.      which contained this particular def or dec item.  Note that this call
  1313.      may cause a new file_info record to be created if this is the first time
  1314.      that we have ever known about this particular file.  */
  1315.  
  1316.   fi_p = find_file (abspath (invocation_path, filename), 0);
  1317.  
  1318.   return (fi_p->mtime > aux_info_mtime);
  1319. }
  1320.  
  1321. /* Given a line of info from the aux_info file, create a new
  1322.    def_dec_info record to remember all of the important information about
  1323.    a function definition or declaration.
  1324.  
  1325.    Link this record onto the list of such records for the particular file in
  1326.    which it occured in proper (descending) line number order (for now).
  1327.  
  1328.    If there is an identical record already on the list for the file, throw
  1329.    this one away.  Doing so takes care of the (useless and troublesome)
  1330.    duplicates which are bound to crop up due to multiple inclusions of any
  1331.    given individual header file.
  1332.  
  1333.    Finally, link the new def_dec record onto the list of such records
  1334.    pertaining to this particular function name.  */
  1335.  
  1336. static void_t
  1337. save_def_or_dec (const char *l, int is_syscalls)
  1338. {
  1339.   const char *p;
  1340.   const char *semicolon_p;
  1341.   def_dec_info *def_dec_p = (def_dec_info *) xmalloc (sizeof (def_dec_info));
  1342.  
  1343. #ifndef UNPROTOIZE
  1344.   def_dec_p->written = 0;
  1345. #endif
  1346.  
  1347.   /* Start processing the line by picking off 5 pieces of information from
  1348.      the left hand end of the line.  These are filename, line number,
  1349.      new/old/implicit flag (new = ANSI prototype format), definition or
  1350.      declaration flag, and extern/static flag).  */
  1351.  
  1352.   check_aux_info (l[0] == '/');
  1353.   check_aux_info (l[1] == '*');
  1354.   check_aux_info (l[2] == ' ');
  1355.  
  1356.   {
  1357.     const char *filename_start = p = l + 3;
  1358.     char filename[MAXPATHLEN];
  1359.  
  1360.     while (*p != ':')
  1361.       p++;
  1362.     strncpy (filename, filename_start, p - filename_start);
  1363.     filename[p-filename_start] = '\0';
  1364.  
  1365.     /* Call find_file to find the file_info record associated with the file
  1366.        which contained this particular def or dec item.  Note that this call
  1367.        may cause a new file_info record to be created if this is the first time
  1368.        that we have ever known about this particular file.
  1369.   
  1370.        Note that we started out by forcing all of the base source file pathnames
  1371.        (i.e. the names of the aux_info files with the .X stripped off) into the
  1372.        pathnames hash table, and we simultaneously setup file_info records for
  1373.        all of these base file pathnames (even if they may be useless later).
  1374.        The file_info records for all of these "base" file pathnames (properly)
  1375.        act as file_info records for the "original" (i.e. un-included) files
  1376.        which were submitted to gcc for compilation (when the -fgen-aux-info
  1377.        option was used).  */
  1378.   
  1379.     def_dec_p->file = find_file (abspath (invocation_path, filename), is_syscalls);
  1380.   }
  1381.  
  1382.   {
  1383.     const char *line_number_start = ++p;
  1384.     char line_number[10];
  1385.  
  1386.     while (*p != ':')
  1387.       p++;
  1388.     strncpy (line_number, line_number_start, p - line_number_start);
  1389.     line_number[p-line_number_start] = '\0';
  1390.     def_dec_p->line = atoi (line_number);
  1391.   }
  1392.  
  1393.   /* Check that this record describes a new-style, old-style, or implicit
  1394.      definition or declaration.  */
  1395.  
  1396.   p++;    /* Skip over the `:'. */
  1397.   check_aux_info ((*p == 'N') || (*p == 'O') || (*p == 'I'));
  1398.  
  1399.   /* Is this a new style (ANSI prototyped) definition or declaration? */
  1400.  
  1401.   def_dec_p->prototyped = (*p == 'N');
  1402.  
  1403. #ifndef UNPROTOIZE
  1404.  
  1405.   /* Is this an implicit declaration? */
  1406.  
  1407.   def_dec_p->is_implicit = (*p == 'I');
  1408.  
  1409. #endif
  1410.  
  1411.   p++;
  1412.  
  1413.   check_aux_info ((*p == 'C') || (*p == 'F'));
  1414.  
  1415.   /* Is this item a function definition (F) or a declaration (C).  Note that
  1416.      we treat item taken from the syscalls file as though they were function
  1417.      definitions regardless of what the stuff in the file says.  */
  1418.  
  1419.   def_dec_p->is_func_def = ((*p++ == 'F') || is_syscalls);
  1420.  
  1421. #ifndef UNPROTOIZE
  1422.   def_dec_p->definition = 0;    /* Fill this in later if protoizing.  */
  1423. #endif
  1424.  
  1425.   check_aux_info (*p++ == ' ');
  1426.   check_aux_info (*p++ == '*');
  1427.   check_aux_info (*p++ == '/');
  1428.   check_aux_info (*p++ == ' ');
  1429.  
  1430. #ifdef UNPROTOIZE
  1431.   check_aux_info ((!strncmp (p, "static", 6)) || (!strncmp (p, "extern", 6)));
  1432. #else
  1433.   if (!strncmp (p, "static", 6))
  1434.     def_dec_p->is_static = -1;
  1435.   else if (!strncmp (p, "extern", 6))
  1436.     def_dec_p->is_static = 0;
  1437.   else
  1438.     check_aux_info (0);    /* Didn't find either `extern' or `static'.  */
  1439. #endif
  1440.  
  1441.   {
  1442.     const char *ansi_start = p;
  1443.  
  1444.     p += 6;    /* Pass over the "static" or "extern".  */
  1445.  
  1446.     /* We are now past the initial stuff.  Search forward from here to find
  1447.        the terminating semicolon that should immediately follow the entire
  1448.        ANSI format function declaration.  */
  1449.  
  1450.     while (*++p != ';')
  1451.       continue;
  1452.  
  1453.     semicolon_p = p;
  1454.  
  1455.     /* Make a copy of the ansi declaration part of the line from the aux_info
  1456.        file.  */
  1457.  
  1458.     def_dec_p->ansi_decl = dupnstr (ansi_start, (semicolon_p+1) - ansi_start);
  1459.   }
  1460.  
  1461.   /* Backup and point at the final right paren of the final argument list.  */
  1462.  
  1463.   p--;
  1464.  
  1465.   /* Now isolate a whole set of formal argument lists, one-by-one.  Normally,
  1466.      there will only be one list to isolate, but there could be more.  */
  1467.  
  1468.   def_dec_p->f_list_count = 0;
  1469.  
  1470. #ifndef UNPROTOIZE
  1471.   def_dec_p->f_list_chain = NULL;
  1472. #endif
  1473.  
  1474.   for (;;)
  1475.     {
  1476.       const char *left_paren_p = find_corresponding_lparen (p);
  1477. #ifndef UNPROTOIZE
  1478.       {
  1479.         f_list_chain_item *cip =
  1480.           (f_list_chain_item *) xmalloc (sizeof (f_list_chain_item));
  1481.  
  1482.         cip->formals_list = dupnstr (left_paren_p+1, p - (left_paren_p+1));
  1483.       
  1484.         /* Add the new chain item at the head of the current list.  */
  1485.  
  1486.         cip->chain_next = def_dec_p->f_list_chain;
  1487.         def_dec_p->f_list_chain = cip;
  1488.       }
  1489. #endif
  1490.       def_dec_p->f_list_count++;
  1491.  
  1492.       p = left_paren_p - 2;
  1493.  
  1494.       /* p must now point either to another right paren, or to the last
  1495.          character of the name of the function that was declared/defined.
  1496.          If p points to another right paren, then this indicates that we
  1497.          are dealing with multiple formals lists.  In that case, there
  1498.          really should be another right paren preceeding this right paren.  */
  1499.  
  1500.       if (*p != ')')
  1501.         break;
  1502.       else
  1503.         check_aux_info (*--p == ')');
  1504.     }
  1505.  
  1506.  
  1507.   {
  1508.     const char *past_fn = p + 1;
  1509.     char fn_string[1024];
  1510.  
  1511.     check_aux_info (*past_fn == ' ');
  1512.  
  1513.     /* Scan leftwards over the identifier that names the function.  */
  1514.  
  1515.     while (is_id_char (*p))
  1516.       p--;
  1517.     p++;
  1518.  
  1519.     /* p now points to the leftmost character of the function name.  */
  1520.  
  1521.     strncpy (fn_string, p, past_fn - p);
  1522.     fn_string[past_fn-p] = '\0';
  1523.     def_dec_p->hash_entry = lookup (function_name_primary, fn_string);
  1524.   }
  1525.  
  1526.   /* Look at all of the defs and decs for this function name that we have
  1527.      collected so far.  If there is already one which is at the same
  1528.      line number in the same file, then we can discard this new def_dec_info
  1529.      record.
  1530.  
  1531.      As an extra assurance that any such pair of (nominally) identical
  1532.      function declarations are in fact identical, we also compare the
  1533.      ansi_decl parts of the lines from the aux_info files just to be on
  1534.      the safe side.
  1535.  
  1536.      This comparison will fail if (for instance) the user was playing
  1537.      messy games with the preprocessor which ultimately causes one
  1538.      function declaration in one header file to look differently when
  1539.      that file is included by two (or more) other files.  */
  1540.  
  1541.   {
  1542.     const def_dec_info *other;
  1543.  
  1544.     for (other = def_dec_p->hash_entry->ddip; other; other = other->next_for_func)
  1545.       {
  1546.         if (def_dec_p->line == other->line && def_dec_p->file == other->file)
  1547.           {
  1548.             if (strcmp (def_dec_p->ansi_decl, other->ansi_decl))
  1549.               {
  1550.                 fprintf (stderr, "%s: error: declaration of function `%s' at %s(%d) takes different forms\n",
  1551.              pname,
  1552.              def_dec_p->hash_entry->symbol,
  1553.              def_dec_p->file->hash_entry->symbol,
  1554.              def_dec_p->line);
  1555.                 exit (1);
  1556.               }
  1557.             free_def_dec (def_dec_p);
  1558.             return;
  1559.           }
  1560.       }
  1561.   }
  1562.  
  1563. #ifdef UNPROTOIZE
  1564.  
  1565.   /* If we are doing unprotoizing, we must now setup the pointers that will
  1566.      point to the K&R name list and to the K&R argument declarations list.
  1567.  
  1568.      Note that if this is only a function declaration, then we should not
  1569.      expect to find any K&R style formals list following the ANSI-style
  1570.      formals list.  This is because GCC knows that such information is
  1571.      useless in the case of function declarations (function definitions
  1572.      are a different story however).
  1573.  
  1574.      Since we are unprotoizing, we don't need any such lists anyway.
  1575.      All we plan to do is to delete all characters between ()'s in any
  1576.      case.  */
  1577.  
  1578.   def_dec_p->formal_names = NULL;
  1579.   def_dec_p->formal_decls = NULL;
  1580.  
  1581.   if (def_dec_p->is_func_def)
  1582.     {
  1583.       p = semicolon_p;
  1584.       check_aux_info (*++p == ' ');
  1585.       check_aux_info (*++p == '/');
  1586.       check_aux_info (*++p == '*');
  1587.       check_aux_info (*++p == ' ');
  1588.       check_aux_info (*++p == '(');
  1589.  
  1590.       {
  1591.         const char *kr_names_start = ++p;   /* Point just inside '('. */
  1592.  
  1593.         while (*p++ != ')')
  1594.           continue;
  1595.         p--;        /* point to closing right paren */
  1596.  
  1597.         /* Make a copy of the K&R parameter names list.  */
  1598.  
  1599.         def_dec_p->formal_names = dupnstr (kr_names_start, p - kr_names_start);
  1600.       }
  1601.  
  1602.       check_aux_info (*++p == ' ');
  1603.       p++;
  1604.  
  1605.       /* p now points to the first character of the K&R style declarations
  1606.          list (if there is one) or to the star-slash combination that ends
  1607.          the comment in which such lists get embedded.  */
  1608.  
  1609.       /* Make a copy of the K&R formal decls list and set the def_dec record
  1610.          to point to it.  */
  1611.  
  1612.       if (*p == '*')        /* Are there no K&R declarations? */
  1613.         {
  1614.           check_aux_info (*++p == '/');
  1615.           def_dec_p->formal_decls = "";
  1616.         }
  1617.       else
  1618.         {
  1619.           const char *kr_decls_start = p;
  1620.  
  1621.           while (p[0] != '*' || p[1] != '/')
  1622.             p++;
  1623.           p--;
  1624.  
  1625.           check_aux_info (*p == ' ');
  1626.  
  1627.           def_dec_p->formal_decls = dupnstr (kr_decls_start, p-kr_decls_start);
  1628.         }
  1629.  
  1630.       /* Handle a special case.  If we have a function definition marked as
  1631.          being in "old" style, and if it's formal names list is empty, then
  1632.          it may actually have the string "void" in its real formals list
  1633.          in the original source code.  Just to make sure, we will get setup
  1634.          to convert such things anyway.
  1635.  
  1636.          This kludge only needs to be here because of an insurmountable
  1637.          problem with generating .X files.  */
  1638.  
  1639.       if (!def_dec_p->prototyped && !*def_dec_p->formal_names)
  1640.         def_dec_p->prototyped = 1;
  1641.     }
  1642.  
  1643.   /* Since we are unprotoizing, if this item is already in old (K&R) style,
  1644.      we can just ignore it.  If that is true, throw away the itme now.  */
  1645.  
  1646.   if (!def_dec_p->prototyped)
  1647.     {
  1648.       free_def_dec (def_dec_p);
  1649.       return;
  1650.     }
  1651.  
  1652. #endif
  1653.  
  1654.   /* Add this record to the head of the list of records pertaining to this
  1655.      particular function name.  */
  1656.  
  1657.   def_dec_p->next_for_func = def_dec_p->hash_entry->ddip;
  1658.   def_dec_p->hash_entry->ddip = def_dec_p;
  1659.  
  1660.   /* Add this new def_dec_info record to the sorted list of def_dec_info
  1661.      records for this file.  Note that we don't have to worry about duplicates
  1662.      (caused by multiple inclusions of header files) here because we have
  1663.      already eliminated duplicates above.  */
  1664.  
  1665.   if (!def_dec_p->file->defs_decs)
  1666.     {
  1667.       def_dec_p->file->defs_decs = def_dec_p;
  1668.       def_dec_p->next_in_file = NULL;
  1669.     }
  1670.   else
  1671.     {
  1672.       int line = def_dec_p->line;
  1673.       const def_dec_info *prev = NULL;
  1674.       const def_dec_info *curr = def_dec_p->file->defs_decs;
  1675.       const def_dec_info *next = curr->next_in_file;
  1676.  
  1677.       while (next && (line < curr->line))
  1678.         {
  1679.           prev = curr;
  1680.           curr = next;
  1681.           next = next->next_in_file;
  1682.         }
  1683.       if (line >= curr->line)
  1684.         {
  1685.           def_dec_p->next_in_file = curr;
  1686.           if (prev)
  1687.             ((NONCONST def_dec_info *) prev)->next_in_file = def_dec_p;
  1688.           else
  1689.             def_dec_p->file->defs_decs = def_dec_p;
  1690.         }
  1691.       else    /* assert (next == NULL); */
  1692.         {
  1693.           ((NONCONST def_dec_info *) curr)->next_in_file = def_dec_p;
  1694.           /* assert (next == NULL); */
  1695.           def_dec_p->next_in_file = next;
  1696.         }
  1697.     }
  1698. }
  1699.  
  1700. /* Rewrite the options list used to recompile base source files.  All we are
  1701.    really doing here is removing -g, -O, -S, -c, and -o options, and then
  1702.    adding a final group of options like '-fgen-aux-info -S  -o /dev/null'.  */
  1703.  
  1704. static void
  1705. munge_compile_params (const char *params_list)
  1706. {
  1707.   const char *temp_params[MAX_OPTIONS];
  1708.   int param_count = 0;
  1709.   const char *param;
  1710.  
  1711.   temp_params[param_count++] = "gcc";
  1712.   for (;;)
  1713.     {
  1714.       while (isspace (*params_list))
  1715.         params_list++;
  1716.       if (!*params_list)
  1717.         break;
  1718.       param = params_list;
  1719.       while (*params_list && !isspace (*params_list))
  1720.         params_list++;
  1721.       if (param[0] != '-')
  1722.         temp_params[param_count++] = dupnstr (param, params_list - param);
  1723.       else
  1724.         {
  1725.           switch (param[1])
  1726.             {
  1727.               case 'g':
  1728.               case 'O':
  1729.               case 'S':
  1730.               case 'c':
  1731.                 break;        /* Don't copy these.  */
  1732.               case 'o':
  1733.                 while (isspace (*params_list))
  1734.                   params_list++;
  1735.                 while (*params_list && !isspace (*params_list))
  1736.                   params_list++;
  1737.                 break;
  1738.               default:
  1739.                 temp_params[param_count++] = dupnstr (param, params_list - param);
  1740.             }
  1741.         }
  1742.       if (!*params_list)
  1743.         break;
  1744.     }
  1745.   temp_params[param_count++] = "-fgen-aux-info";
  1746.   temp_params[param_count++] = "-S";
  1747.   temp_params[param_count++] = "-o";
  1748.   temp_params[param_count++] = "/dev/null";
  1749.  
  1750.   /* Leave room for the filename argument and a terminating null pointer.  */
  1751.  
  1752.   temp_params[filename_index = param_count++] = NULL;
  1753.   temp_params[param_count++] = NULL;
  1754.  
  1755.   /* Make a copy of the compile_params in heap space.  */
  1756.  
  1757.   compile_params = xmalloc (sizeof (char *) * (param_count+1));
  1758.   bcopy (temp_params, compile_params, sizeof (char *) * param_count);
  1759. }
  1760.  
  1761. /* Do a recompilation for the express purpose of generating a new aux_info
  1762.    file to go with a specific base source file.  */
  1763.  
  1764. static int
  1765. gen_aux_info_file (const char *base_pathname)
  1766. {
  1767.   int child_pid;
  1768.  
  1769.   if (!filename_index)
  1770.     munge_compile_params ("");
  1771.  
  1772.   compile_params[filename_index] = shortpath (NULL, base_pathname);
  1773.  
  1774.   if (!quiet_flag)
  1775.     fprintf (stderr, "%s: compiling `%s'\n",
  1776.       pname, compile_params[filename_index]);
  1777.  
  1778.   if (child_pid = vfork ())
  1779.     {
  1780.       if (child_pid == -1)
  1781.         {
  1782.           fprintf (stderr, "%s: error: could not fork process: %s\n",
  1783.             pname, sys_errlist[errno]);
  1784.           return 0;
  1785.         }
  1786.  
  1787. #if 0
  1788.       /* Print out the command line that the other process is now executing.  */
  1789.  
  1790.       if (!quiet_flag)
  1791.         {
  1792.           const char **arg;
  1793.   
  1794.           fputs ("\t", stderr);
  1795.           for (arg = compile_params; *arg; arg++)
  1796.             {
  1797.               fputs (*arg, stderr);
  1798.               fputc (' ', stderr);
  1799.             }
  1800.           fputc ('\n', stderr);
  1801.           fflush (stderr);
  1802.         }
  1803. #endif
  1804.  
  1805.       {
  1806.         WAIT_ARG_TYPE wait_status;
  1807.  
  1808.         if (wait (&wait_status) == -1)
  1809.           {
  1810.             fprintf (stderr, "%s: error: wait for process failed: %s\n",
  1811.               pname, sys_errlist[errno]);
  1812.             return 0;
  1813.           }
  1814.         if (!WIFEXITED (wait_status))
  1815.           {
  1816.             kill (child_pid, 9);
  1817.             return 0;
  1818.           }
  1819.         return (WEXITSTATUS (wait_status) == 0) ? 1 : 0;
  1820.       }
  1821.     }
  1822.   else
  1823.     {
  1824.       if (execvp (compile_params[0], compile_params))
  1825.         {
  1826.           fprintf (stderr, "%s: error: execvp returned: %s\n",
  1827.             pname, sys_errlist[errno]);
  1828.           exit (errno);
  1829.         }
  1830.       return 1;        /* Never executed.  */
  1831.     }
  1832. }
  1833.  
  1834. /* Read in all of the information contained in a single aux_info file.
  1835.    Save all of the important stuff for later.  */
  1836.  
  1837. static void_t
  1838. process_aux_info_file (const char *base_source_pathname, int keep_it, int is_syscalls)
  1839. {
  1840.   char aux_info_pathname[MAXPATHLEN];
  1841.   char *aux_info_base;
  1842.   char *aux_info_limit;
  1843.   const char *aux_info_second_line;
  1844.   time_t aux_info_mtime;
  1845.   size_t aux_info_size;
  1846.  
  1847.   /* Construct the aux_info pathname from the base source pathname.  */
  1848.  
  1849.   strcpy (aux_info_pathname, base_source_pathname);
  1850.   strcat (aux_info_pathname, aux_info_suffix);
  1851.  
  1852.   /* Check that the aux_info file exists and is readable.  If it does not
  1853.      exist, try to create it (once only).  */
  1854.  
  1855. start_over: ;
  1856.  
  1857.   {
  1858.     int retries = 0;
  1859.  
  1860. retry:
  1861.     if (access (aux_info_pathname, R_OK) == -1)
  1862.       {
  1863.         if (errno == ENOENT && retries == 0)
  1864.           {
  1865.             if (is_syscalls)
  1866.               {
  1867.                 fprintf (stderr, "%s: warning: missing SYSCALLS file `%s'\n",
  1868.                   pname, aux_info_pathname);
  1869.                 return;
  1870.               }
  1871.             if (!gen_aux_info_file (base_source_pathname))
  1872.               return;
  1873.             retries++;
  1874.             goto retry;
  1875.           }
  1876.         else
  1877.           {
  1878.             fprintf (stderr, "%s: error: can't read aux info file `%s': %s\n",
  1879.               pname, shortpath (NULL, aux_info_pathname), sys_errlist[errno]);
  1880.             errors++;
  1881.             return;
  1882.           }
  1883.       }
  1884.   }
  1885.  
  1886.   {
  1887.     struct stat stat_buf;
  1888.  
  1889.     /* Get some status information about this aux_info file.  */
  1890.   
  1891.     if (stat (aux_info_pathname, &stat_buf) == -1)
  1892.       {
  1893.         fprintf (stderr, "%s: error: can't get status of aux info file `%s': %s\n",
  1894.           pname, shortpath (NULL, aux_info_pathname), sys_errlist[errno]);
  1895.         errors++;
  1896.         return;
  1897.       }
  1898.   
  1899.     /* Check on whether or not this aux_info file is zero length.  If it is,
  1900.        then just ignore it and return.  */
  1901.   
  1902.     if ((aux_info_size = stat_buf.st_size) == 0)
  1903.       return;
  1904.   
  1905.     /* Get the date/time of last modification for this aux_info file and
  1906.        remember it.  We will have to check that any source files that it
  1907.        contains information about are at least this old or older.  */
  1908.   
  1909.     aux_info_mtime = stat_buf.st_mtime;
  1910.   }
  1911.  
  1912.   {
  1913.     int aux_info_file;
  1914.  
  1915.     /* Open the aux_info file.  */
  1916.   
  1917.     if ((aux_info_file = open (aux_info_pathname, O_RDONLY )) == -1)
  1918.       {
  1919.         fprintf (stderr, "%s: error: can't open aux info file `%s' for reading: %s\n",
  1920.           pname, shortpath (NULL, aux_info_pathname), sys_errlist[errno]);
  1921.         return;
  1922.       }
  1923.   
  1924.     /* Allocate space to hold the aux_info file in memory.  */
  1925.   
  1926.     aux_info_base = xmalloc (aux_info_size + 1);
  1927.     aux_info_limit = aux_info_base + aux_info_size;
  1928.     *aux_info_limit = '\0';
  1929.   
  1930.     /* Read the aux_info file into memory.  */
  1931.   
  1932.     if (read (aux_info_file, aux_info_base, aux_info_size) != aux_info_size)
  1933.       {
  1934.         fprintf (stderr, "%s: error: while reading aux info file `%s': %s\n",
  1935.           pname, shortpath (NULL, aux_info_pathname), sys_errlist[errno]);
  1936.         free (aux_info_base);
  1937.         close (aux_info_file);
  1938.         return;
  1939.       }
  1940.   
  1941.     /* Close the aux info file.  */
  1942.   
  1943.     if (close (aux_info_file))
  1944.       {
  1945.         fprintf (stderr, "%s: error: while closing aux info file `%s': %s\n",
  1946.           pname, shortpath (NULL, aux_info_pathname), sys_errlist[errno]);
  1947.         free (aux_info_base);
  1948.         close (aux_info_file);
  1949.         return;
  1950.       }
  1951.   }
  1952.  
  1953.   /* Delete the aux_info file (unless requested not to).  If the deletion
  1954.      fails for some reason, don't even worry about it.  */
  1955.  
  1956.   if (!keep_it)
  1957.     if (unlink (aux_info_pathname) == -1)
  1958.       fprintf (stderr, "%s: error: can't delete aux info file `%s': %s\n",
  1959.         pname, shortpath (NULL, aux_info_pathname), sys_errlist[errno]);
  1960.  
  1961.   /* Save a pointer into the first line of the aux_info file which
  1962.      contains the pathname of the directory from which the compiler
  1963.      was invoked when the associated source file was compiled.
  1964.      This information is used later to help create complete
  1965.      pathnames out of the (potentially) relative pathnames in
  1966.      the aux_info file.  */
  1967.  
  1968.   {
  1969.     char *p = aux_info_base;
  1970.  
  1971.     while (*p != ':')
  1972.       p++;
  1973.     p++;
  1974.     while (*p == ' ')
  1975.       p++;
  1976.     invocation_path = p;    /* Save a pointer to first byte of path.  */
  1977.     while (*p != ' ')
  1978.       p++;
  1979.     *p++ = '/';
  1980.     *p++ = '\0';
  1981.     while (*p++ != '\n')
  1982.       continue;
  1983.     aux_info_second_line = p;
  1984.   }
  1985.  
  1986.  
  1987.   {
  1988.     const char *aux_info_p;
  1989.  
  1990.     /* Do a pre-pass on the lines in the aux_info file, making sure that all
  1991.        of the source files referenced in there are at least as old as this
  1992.        aux_info file itself.  If not, go back and regenerate the aux_info
  1993.        file anew.  Don't do any of this for the syscalls file.  */
  1994.  
  1995.     if (!is_syscalls)
  1996.       {
  1997.         current_aux_info_lineno = 2;
  1998.     
  1999.         for (aux_info_p = aux_info_second_line; *aux_info_p; )
  2000.           {
  2001.             if (referenced_file_is_newer (aux_info_p, aux_info_mtime))
  2002.               {
  2003.                 free (aux_info_base);
  2004.                 if (unlink (aux_info_pathname) == -1)
  2005.                   {
  2006.                     fprintf (stderr, "%s: error: can't delete file `%s': %s\n",
  2007.                       pname,
  2008.                       shortpath (NULL, aux_info_pathname),
  2009.                       sys_errlist[errno]);
  2010.                     return;
  2011.                   }
  2012.                 goto start_over;
  2013.               }
  2014.     
  2015.             /* Skip over the rest of this line to start of next line.  */
  2016.     
  2017.             while (*aux_info_p != '\n')
  2018.               aux_info_p++;
  2019.             aux_info_p++;
  2020.             current_aux_info_lineno++;
  2021.           }
  2022.       }
  2023.  
  2024.     /* Now do the real pass on the aux_info lines.  Save their information in
  2025.        the in-core data base.  */
  2026.   
  2027.     current_aux_info_lineno = 2;
  2028.   
  2029.     for (aux_info_p = aux_info_second_line; *aux_info_p;)
  2030.       {
  2031.         char *unexpanded_line = unexpand_if_needed (aux_info_p);
  2032.   
  2033.         if (unexpanded_line)
  2034.           {
  2035.             save_def_or_dec (unexpanded_line, is_syscalls);
  2036.             free (unexpanded_line);
  2037.           }
  2038.         else
  2039.           save_def_or_dec (aux_info_p, is_syscalls);
  2040.   
  2041.         /* Skip over the rest of this line and get to start of next line.  */
  2042.   
  2043.         while (*aux_info_p != '\n')
  2044.           aux_info_p++;
  2045.         aux_info_p++;
  2046.         current_aux_info_lineno++;
  2047.       }
  2048.   }
  2049.  
  2050.   free (aux_info_base);
  2051. }
  2052.  
  2053. #ifndef UNPROTOIZE
  2054.  
  2055. /* Check an individual filename for a .c suffix.  If the filename has this
  2056.    suffix, rename the file such that its suffix is changed to .C.  This
  2057.    function implements the -C option.  */
  2058.  
  2059. static void_t
  2060. rename_c_file (const hash_table_entry *hp)
  2061. {
  2062.   const char *pathname = hp->symbol;
  2063.   int last_char_index = strlen (pathname) - 1;
  2064.   char new_pathname[MAXPATHLEN];
  2065.  
  2066.   /* Note that we don't care here if the given file was converted or not.  It
  2067.      is possible that the given file was *not* converted, simply because there
  2068.      was nothing in it which actually required conversion.  Even in this case,
  2069.      we want to do the renaming.  Note that we only rename files with the .c
  2070.      suffix.  */
  2071.  
  2072.   if (pathname[last_char_index] != 'c' || pathname[last_char_index-1] != '.')
  2073.     return;
  2074.  
  2075.   strcpy (new_pathname, pathname);
  2076.   new_pathname[last_char_index] = 'C';
  2077.  
  2078.   if (link (pathname, new_pathname) == -1)
  2079.     {
  2080.       fprintf (stderr, "%s: warning: can't link file `%s' to `%s': %s\n",
  2081.         pname, shortpath (NULL, pathname),
  2082.           shortpath (NULL, new_pathname), sys_errlist[errno]);
  2083.       errors++;
  2084.       return;
  2085.     }
  2086.  
  2087.   if (unlink (pathname) == -1)
  2088.     {
  2089.       fprintf (stderr, "%s: warning: can't delete file `%s': %s\n",
  2090.         pname, shortpath (NULL, pathname), sys_errlist[errno]);
  2091.       errors++;
  2092.       return;
  2093.     }
  2094. }
  2095.  
  2096. #endif
  2097.  
  2098. /* Take the list of definitions and declarations attached to a particular
  2099.    file_info node and reverse the order of the list.  This should get the
  2100.    list into an order such that the item with the lowest associated line
  2101.    number is nearest the head of the list.  When these lists are originally
  2102.    built, they are in the opposite order.  We want to traverse them in
  2103.    normal line number order later (i.e. lowest to highest) so reverse the
  2104.    order here.  */
  2105.  
  2106. static void_t
  2107. reverse_def_dec_list (const hash_table_entry *hp)
  2108. {
  2109.   file_info *file_p = hp->fip;
  2110.   const def_dec_info *prev = NULL;
  2111.   const def_dec_info *current = file_p->defs_decs;
  2112.  
  2113.   if (!( current = file_p->defs_decs))
  2114.     return;                /* no list to reverse */
  2115.  
  2116.   prev = current;
  2117.   if (! (current = current->next_in_file))
  2118.     return;                /* can't reverse a single list element */
  2119.  
  2120.   ((NONCONST def_dec_info *) prev)->next_in_file = NULL;
  2121.  
  2122.   while (current)
  2123.     {
  2124.       const def_dec_info *next = current->next_in_file;
  2125.  
  2126.       ((NONCONST def_dec_info *) current)->next_in_file = prev;
  2127.       prev = current;
  2128.       current = next;
  2129.     }
  2130.  
  2131.   file_p->defs_decs = prev;
  2132. }
  2133.  
  2134. #ifndef UNPROTOIZE
  2135.  
  2136. /* Find the (only?) extern definition for a particular function name, starting
  2137.    from the head of the linked list of entries for the given name.  If we
  2138.    cannot find an extern definition for the given function name, issue a
  2139.    warning and scrounge around for the next best thing, i.e. an extern
  2140.    function declaration with a prototype attached to it.  Note that we only
  2141.    allow such substitutions for extern declarations and never for static
  2142.    declarations.  That's because the only reason we allow them at all is
  2143.    to let un-prototyped function declarations for system-supplied library
  2144.    functions get their prototypes from our own extra SYSCALLS.c.X file which
  2145.    contains all of the correct prototypes for system functions.  */
  2146.  
  2147. static const def_dec_info *
  2148. find_extern_def (const def_dec_info *head, const def_dec_info *user)
  2149. {
  2150.   const def_dec_info *dd_p;
  2151.   const def_dec_info *extern_def_p = NULL;
  2152.   int conflict_noted = 0;
  2153.  
  2154.   /* Don't act too stupid here.  Somebody may try to convert an entire system
  2155.      in one swell fwoop (rather than one program at a time, as should be done)
  2156.      and in that case, we may find that there are multiple extern definitions
  2157.      of a given function name in the entire set of source files that we are
  2158.      converting.  If however one of these definitions resides in exactly the
  2159.      same source file as the reference we are trying to satisfy then in that
  2160.      case it would be stupid for us to fail to realize that this one definition
  2161.      *must* be the precise one we are looking for.
  2162.  
  2163.      To make sure that we don't miss an opportunity to make this "same file"
  2164.      leap of faith, we do a prescan of the list of records relating to the
  2165.      given function name, and we look (on this first scan) *only* for a
  2166.      definition of the function which is in the same file as the reference
  2167.      we are currently trying to satisfy.  */
  2168.  
  2169.   for (dd_p = head; dd_p; dd_p = dd_p->next_for_func)
  2170.     if (dd_p->is_func_def && !dd_p->is_static && dd_p->file == user->file)
  2171.       return dd_p;
  2172.  
  2173.   /* Now, since we have not found a definition in the same file as the
  2174.      reference, we scan the list again and consider all possibilities from
  2175.      all files.  Here we may get conflicts with the things listed in the
  2176.      SYSCALLS.c.X file, but if that happens it only means that the source
  2177.      code being converted contains its own definition of a function which
  2178.      could have been supplied by libc.a.  In such cases, we should avoid
  2179.      issuing the normal warning, and defer to the definition given in the
  2180.      user's own code.   */
  2181.  
  2182.   for (dd_p = head; dd_p; dd_p = dd_p->next_for_func)
  2183.     if (dd_p->is_func_def && !dd_p->is_static)
  2184.       {
  2185.         if (!extern_def_p)    /* Previous definition? */
  2186.           extern_def_p = dd_p;    /* Remember the first definition found. */
  2187.         else
  2188.           {
  2189.             /* Ignore definition just found if it came from SYSCALLS.c.X.  */
  2190.  
  2191.             if (is_syscalls_file (dd_p->file))
  2192.               continue;
  2193.  
  2194.             /* Quietly replace the definition previously found with the one
  2195.                just found if the previous one was from SYSCALLS.c.X.  */
  2196.  
  2197.             if (is_syscalls_file (extern_def_p->file))
  2198.               {
  2199.                 extern_def_p = dd_p;
  2200.                 continue;
  2201.               }
  2202.  
  2203.             /* If we get here, then there is a conflict between two function
  2204.                declarations for the same function, both of which came from the
  2205.                user's own code.  */
  2206.  
  2207.             if (!conflict_noted)    /* first time we noticed? */
  2208.               {
  2209.                 conflict_noted = 1;
  2210.                 fprintf (stderr, "%s: error: conflicting extern definitions of '%s'\n",
  2211.                   pname, head->hash_entry->symbol);
  2212.                 if (!quiet_flag)
  2213.                   {
  2214.                     fprintf (stderr, "%s: declarations of '%s' will not be converted\n",
  2215.                       pname, head->hash_entry->symbol);
  2216.                     fprintf (stderr, "%s: conflict list for '%s' follows:\n",
  2217.                       pname, head->hash_entry->symbol);
  2218.                     fprintf (stderr, "%s:     %s(%d): %s\n",
  2219.                       pname,
  2220.                       shortpath (NULL, extern_def_p->file->hash_entry->symbol),
  2221.                       extern_def_p->line,
  2222.                       extern_def_p->ansi_decl);
  2223.                   }
  2224.               }
  2225.             if (!quiet_flag)
  2226.               fprintf (stderr, "%s:     %s(%d): %s\n",
  2227.                 pname,
  2228.                 shortpath (NULL, dd_p->file->hash_entry->symbol),
  2229.                 dd_p->line,
  2230.                 dd_p->ansi_decl);
  2231.           }
  2232.       }
  2233.  
  2234.   /* We want to err on the side of caution, so if we found multiple conflicting
  2235.      definitions for the same function, treat this as being that same as if we
  2236.      had found no definitions (i.e. return NULL).  */
  2237.  
  2238.   if (conflict_noted)
  2239.     return NULL;
  2240.  
  2241.   if (!extern_def_p)
  2242.     {
  2243.       /* We have no definitions for this function so do the next best thing.
  2244.          Search for an extern declaration already in prototype form.  */
  2245.  
  2246.       for (dd_p = head; dd_p; dd_p = dd_p->next_for_func)
  2247.         if (!dd_p->is_func_def && !dd_p->is_static && dd_p->prototyped)
  2248.           {
  2249.             extern_def_p = dd_p;    /* save a pointer to the definition */
  2250.             if (!quiet_flag)
  2251.               fprintf (stderr, "%s: warning: using formals list from %s(%d) for function `%s'\n",
  2252.                 pname,
  2253.                 shortpath (NULL, dd_p->file->hash_entry->symbol),
  2254.                 dd_p->line, dd_p->hash_entry->symbol);
  2255.             break;
  2256.           }
  2257.  
  2258.       /* Gripe about unprototyped function declarations that we found no
  2259.          corresponding definition (or other source of prototype information)
  2260.          for.
  2261.  
  2262.          Gripe even if the unprototyped declaration we are worried about
  2263.          exists in a file in one of the "system" include directories.  We
  2264.          can gripe about these because we should have at least found a
  2265.          corresponding (pseudo) definition in the SYSCALLS.c.X file.  If we
  2266.      didn't, then that means that the SYSCALLS.c.X file is missing some
  2267.          needed prototypes for this particular system.  That is worth telling
  2268.          the user about!  */
  2269.  
  2270.       if (!extern_def_p)
  2271.         {
  2272.           const char *file = user->file->hash_entry->symbol;
  2273.  
  2274.           if (!quiet_flag)
  2275.             if (in_system_include_dir (file))
  2276.               {
  2277.                 char needed[MAX_LINE_LEN];
  2278.                 char *p;
  2279.  
  2280.                 strcpy (needed, user->ansi_decl);
  2281.                 p = (NONCONST char *) substr (needed, user->hash_entry->symbol)
  2282.                     + strlen (user->hash_entry->symbol) + 2;
  2283.                 strcpy (p, "???);");
  2284.  
  2285.                 fprintf (stderr, "%s: please add `%s' to SYSCALLS (see %s(%d))\n",
  2286.                   pname,
  2287.                   needed+7,    /* Don't print "extern " */
  2288.                   shortpath (NULL, file),
  2289.                   user->line);
  2290.               }
  2291.             else
  2292.               fprintf (stderr, "%s: warning: no extern definition for `%s' (see %s(%d))\n",
  2293.                 pname,
  2294.                 user->hash_entry->symbol,
  2295.                 shortpath (NULL, file),
  2296.                 user->line);
  2297.         }
  2298.     }
  2299.   return extern_def_p;
  2300. }
  2301.  
  2302. /* Find the (only?) static definition for a particular function name in a
  2303.    given file.  Here we get the function-name and the file info indirectly
  2304.    from the def_dec_info record pointer which is passed in. */
  2305.  
  2306. static const def_dec_info *
  2307. find_static_definition (const def_dec_info *user)
  2308. {
  2309.   const def_dec_info *head = user->hash_entry->ddip;
  2310.   const def_dec_info *dd_p;
  2311.   int num_static_defs = 0;
  2312.   const def_dec_info *static_def_p = NULL;
  2313.  
  2314.   for (dd_p = head; dd_p; dd_p = dd_p->next_for_func)
  2315.     if (dd_p->is_func_def && dd_p->is_static && (dd_p->file == user->file))
  2316.       {
  2317.         static_def_p = dd_p;    /* save a pointer to the definition */
  2318.         num_static_defs++;
  2319.       }
  2320.   if (num_static_defs == 0)
  2321.     {
  2322.       if (!quiet_flag)
  2323.         fprintf (stderr, "%s: warning: no static definition for `%s' in file `%s'\n",
  2324.           pname,
  2325.           head->hash_entry->symbol,
  2326.           shortpath (NULL, user->file->hash_entry->symbol));
  2327.     }
  2328.   else if (num_static_defs > 1)
  2329.     {
  2330.       fprintf (stderr, "%s: error: multiple static defs of `%s' in file `%s'\n",
  2331.         pname,
  2332.         head->hash_entry->symbol,
  2333.         shortpath (NULL, user->file->hash_entry->symbol));
  2334.       return NULL;
  2335.     }
  2336.   return static_def_p;
  2337. }
  2338.  
  2339. /* Find good prototype style formal argument lists for all of the function
  2340.    declarations which didn't have them before now.
  2341.  
  2342.    To do this we consider each function name one at a time.  For each function
  2343.    name, we look at the items on the linked list of def_dec_info records for
  2344.    that particular name.
  2345.  
  2346.    Somewhere on this list we should find one (and only one) def_dec_info
  2347.    record which represents the actual function definition, and this record
  2348.    should have a nice formal argument list already associated with it.
  2349.  
  2350.    Thus, all we have to do is to connect up all of the other def_dec_info
  2351.    records for this particular function name to the special one which has
  2352.    the full-blown formals list.
  2353.  
  2354.    Of course it is a little more complicated than just that.  See below for
  2355.    more details.  */
  2356.  
  2357. static void_t
  2358. connect_defs_and_decs (const hash_table_entry *hp)
  2359. {
  2360.   const def_dec_info *dd_p;
  2361.   const def_dec_info *extern_def_p = NULL;
  2362.   int first_extern_reference = 1;
  2363.  
  2364.   /* Traverse the list of definitions and declarations for this particular
  2365.      function name.  For each item on the list, if it is a function
  2366.      definition (either old style or new style) then GCC has already been
  2367.      kind enough to produce a prototype for us, and it is associated with
  2368.      the item already, so declare the item as its own associated "definition".
  2369.  
  2370.      Also, for each item which is only a function declaration, but which
  2371.      nonetheless has its own prototype already (obviously supplied by the user)
  2372.      declare the item as it's own definition.
  2373.  
  2374.      Note that when/if there are multiple user-supplied prototypes already
  2375.      present for multiple declarations of any given function, these multiple
  2376.      prototypes *should* all match exactly with one another and with the
  2377.      prototype for the actual function definition.  We don't check for this
  2378.      here however, since we assume that the compiler must have already done
  2379.      this consistancy checking when it was creating the .X files.  */
  2380.  
  2381.   for (dd_p = hp->ddip; dd_p; dd_p = dd_p->next_for_func)
  2382.     if (dd_p->prototyped)
  2383.       ((NONCONST def_dec_info *) dd_p)->definition = dd_p;
  2384.  
  2385.   /* Traverse the list of definitions and declarations for this particular
  2386.      function name.  For each item on the list, if it is an extern function
  2387.      declaration and if it has no associated definition yet, go try to find
  2388.      the matching extern definition for the declaration.
  2389.  
  2390.      When looking for the matching function definition, warn the user if we
  2391.      fail to find one.
  2392.  
  2393.      If we find more that one function definition also issue a warning.
  2394.  
  2395.      Do the search for the matching definition only once per unique function
  2396.      name (and only when absolutely needed) so that we can avoid putting out
  2397.      redundant warning messages, and so that we will only put out warning
  2398.      messages when there is actually a reference (i.e. a declaration) for
  2399.      which we need to find a matching definition.  */
  2400.  
  2401.   for (dd_p = hp->ddip; dd_p; dd_p = dd_p->next_for_func)
  2402.     if (!dd_p->is_func_def && !dd_p->is_static && !dd_p->definition)
  2403.       {
  2404.         if (first_extern_reference)
  2405.           {
  2406.             extern_def_p = find_extern_def (hp->ddip, dd_p);
  2407.             first_extern_reference = 0;
  2408.           }
  2409.         ((NONCONST def_dec_info *) dd_p)->definition = extern_def_p;
  2410.       }
  2411.  
  2412.   /* Traverse the list of definitions and declarations for this particular
  2413.      function name.  For each item on the list, if it is a static function
  2414.      declaration and if it has no associated definition yet, go try to find
  2415.      the matching static definition for the declaration within the same file.
  2416.  
  2417.      When looking for the matching function definition, warn the user if we
  2418.      fail to find one in the same file with the declaration, and refuse to
  2419.      convert this kind of cross-file static function declaration.  After all,
  2420.      this is stupid practice and should be discouraged.
  2421.  
  2422.      We don't have to worry about the possibility that there is more than one
  2423.      matching function definition in the given file because that would have
  2424.      been flagged as an error by the compiler.
  2425.  
  2426.      Do the search for the matching definition only once per unique
  2427.      function-name/source-file pair (and only when absolutely needed) so that
  2428.      we can avoid putting out redundant warning messages, and so that we will
  2429.      only put out warning messages when there is actually a reference (i.e. a
  2430.      declaration) for which we actually need to find a matching definition.  */
  2431.  
  2432.   for (dd_p = hp->ddip; dd_p; dd_p = dd_p->next_for_func)
  2433.     if (!dd_p->is_func_def && dd_p->is_static && !dd_p->definition)
  2434.       {
  2435.         const def_dec_info *dd_p2;
  2436.         const def_dec_info *static_def;
  2437.  
  2438.         /* We have now found a single static declaration for which we need to
  2439.            find a matching definition.  We want to minimize the work (and the
  2440.            number of warnings), so we will find an appropriate (matching)
  2441.            static definition for this declaration, and then distribute it
  2442.            (as the definition for) any and all other static declarations
  2443.            for this function name which occur within the same file, and which
  2444.            do not already have definitions.
  2445.  
  2446.            Note that a trick is used here to prevent subsequent attempts to
  2447.            call find_static_definition() for a given function-name & file
  2448.            if the first such call returns NULL.  Essentially, we convert
  2449.            these NULL return values to -1, and put the -1 into the definition
  2450.            field for each other static declaration from the same file which
  2451.            does not already have an associated definition.
  2452.            This makes these other static declarations look like they are
  2453.            actually defined already when the outer loop here revisits them
  2454.            later on.  Thus, the outer loop will skip over them.  Later, we
  2455.            turn the -1's back to NULL's.  */
  2456.  
  2457.       ((NONCONST def_dec_info *) dd_p)->definition =
  2458.         (static_def = find_static_definition (dd_p))
  2459.           ? static_def
  2460.           : (const def_dec_info *) -1;
  2461.  
  2462.       for (dd_p2 = dd_p->next_for_func; dd_p2; dd_p2 = dd_p2->next_for_func)
  2463.         if (!dd_p2->is_func_def && dd_p2->is_static
  2464.          && !dd_p2->definition && (dd_p2->file == dd_p->file))
  2465.           ((NONCONST def_dec_info *)dd_p2)->definition = dd_p->definition;
  2466.       }
  2467.  
  2468.   /* Convert any dummy (-1) definitions we created in the step above back to
  2469.      NULL's (as they should be).  */
  2470.  
  2471.   for (dd_p = hp->ddip; dd_p; dd_p = dd_p->next_for_func)
  2472.     if (dd_p->definition == (def_dec_info *) -1)
  2473.       ((NONCONST def_dec_info *) dd_p)->definition = NULL;
  2474. }
  2475.  
  2476. #endif
  2477.  
  2478. /* Give a pointer into the clean text buffer, return a number which is the
  2479.    original source line number that the given pointer points into.  */
  2480.  
  2481. static int
  2482. identify_lineno (const char *clean_p)
  2483. {
  2484.   int line_num = 1;
  2485.   const char *scan_p;
  2486.  
  2487.   for (scan_p = clean_text_base; scan_p <= clean_p; scan_p++)
  2488.     if (*scan_p == '\n')
  2489.       line_num++;
  2490.   return line_num;
  2491. }
  2492.  
  2493. /* Issue an error message and give up on doing this particular edit.  */
  2494.  
  2495. static void_t
  2496. declare_source_confusing (const char *clean_p)
  2497. {
  2498.   if (!quiet_flag)
  2499.     {
  2500.       if (clean_p == 0)
  2501.         fprintf (stderr, "%s: warning: source too confusing near %s(%d)\n",
  2502.         pname, shortpath (NULL, convert_path), last_known_line_number);
  2503.       else
  2504.         fprintf (stderr, "%s: warning: source too confusing at %s(%d)\n",
  2505.         pname, shortpath (NULL, convert_path), identify_lineno (clean_p));
  2506.     }
  2507.   longjmp (source_confusion_recovery, 1);
  2508. }
  2509.  
  2510. /* Check that a condition which is expected to be true in the original source
  2511.    code is in fact true.  If not, issue an error message and give up on
  2512.    converting this particular source file.  */
  2513.  
  2514. inline static void_t
  2515. check_source (int cond, const char *clean_p)
  2516. {
  2517.   if (!cond)
  2518.     declare_source_confusing (clean_p);
  2519. }
  2520.  
  2521. /* If we think of the in-core cleaned text buffer as a memory mapped
  2522.    file (with the variable last_known_line_start acting as sort of a
  2523.    file pointer) then we can imagine doing "seeks" on the buffer.  The
  2524.    following routine implements a kind of "seek" operation for the in-core
  2525.    (cleaned) copy of the source file.  When finished, it returns a pointer to
  2526.    the start of a given (numbered) line in the cleaned text buffer.
  2527.  
  2528.    Note that protoize only has to "seek" in the forward direction on the
  2529.    in-core cleaned text file buffers, and it never needs to back up.
  2530.  
  2531.    This routine is made a little bit faster by remembering the line number
  2532.    (and pointer value) supplied (and returned) from the previous "seek".
  2533.    This prevents us from always having to start all over back at the top
  2534.    of the in-core cleaned buffer again.  */
  2535.  
  2536. static const char *
  2537. seek_to_line (int n)
  2538. {
  2539.   if (n < last_known_line_number)
  2540.     abort ();
  2541.  
  2542.   while (n > last_known_line_number)
  2543.     {
  2544.       while (*last_known_line_start != '\n')
  2545.         check_source (++last_known_line_start < clean_text_limit, 0);
  2546.       last_known_line_start++;
  2547.       last_known_line_number++;
  2548.     }
  2549.   return last_known_line_start;
  2550. }
  2551.  
  2552. /* Given a pointer to a character in the cleaned text buffer, return a pointer
  2553.    to the next non-whitepace character which follows it.  */
  2554.  
  2555. static const char *
  2556. forward_to_next_token_char (const char *ptr)
  2557. {
  2558.   for (++ptr; isspace (*ptr); check_source (++ptr < clean_text_limit, 0))
  2559.     continue;
  2560.   return ptr;
  2561. }
  2562.  
  2563. /* Copy a chunk of text of length `len' and starting at `str' to the current
  2564.    output buffer.  Note that all attempts to add stuff to the current output
  2565.    buffer ultimately go through here.  */
  2566.  
  2567. static void_t
  2568. output_bytes (const char *str, int len)
  2569. {
  2570.   if ((repl_write_ptr + 1) + len >= repl_text_limit)
  2571.     {
  2572.       size_t new_size = (repl_text_limit - repl_text_base) << 1;
  2573.       char *new_buf = (char *) xrealloc (repl_text_base, new_size);
  2574.  
  2575.       repl_write_ptr = new_buf + (repl_write_ptr - repl_text_base);
  2576.       repl_text_base = new_buf;
  2577.       repl_text_limit = new_buf + new_size;
  2578.     }
  2579.   bcopy (str, repl_write_ptr + 1, len);
  2580.   repl_write_ptr += len;
  2581. }
  2582.  
  2583. /* Copy all bytes (except the trailing null) of a null terminated string to
  2584.    the current output buffer.  */
  2585.  
  2586. static void_t
  2587. output_string (const char *str)
  2588. {
  2589.   output_bytes (str, strlen (str));
  2590. }
  2591.  
  2592. /* Copy some characters from the original text buffer to the current output
  2593.    buffer.
  2594.  
  2595.    This routine takes a pointer argument `p' which is assumed to be a pointer
  2596.    into the cleaned text buffer.  The bytes which are copied are the `original'
  2597.    equivalents for the set of bytes between the last value of `clean_read_ptr'
  2598.    and the argument value `p'.
  2599.  
  2600.    The set of bytes copied however, comes *not* from the cleaned text buffer,
  2601.    but rather from the direct counterparts of these bytes within the original
  2602.    text buffer.
  2603.  
  2604.    Thus, when this function is called, some bytes from the original text
  2605.    buffer (which may include original comments and preprocessing directives)
  2606.    will be copied into the  output buffer.
  2607.  
  2608.    Note that the request implide when this routine is called includes the
  2609.    byte pointed to by the argument pointer `p'.  */
  2610.  
  2611. static void_t
  2612. output_up_to (const char *p)
  2613. {
  2614.   int copy_length = p - clean_read_ptr;
  2615.   const char *copy_start = orig_text_base+(clean_read_ptr-clean_text_base)+1;
  2616.  
  2617.   if (copy_length == 0)
  2618.     return;
  2619.  
  2620.   if (copy_length < 0)
  2621.     abort ();
  2622.  
  2623.   output_bytes (copy_start, copy_length);
  2624.   clean_read_ptr = p;
  2625. }
  2626.  
  2627. /* Given a pointer to a def_dec_info record which represents some form of
  2628.    definition of a function (perhaps a real definition, or in lieu of that
  2629.    perhaps just a declaration with a full prototype) return true if this
  2630.    function is one which we should avoid converting.  Return false
  2631.    otherwise.  */
  2632.  
  2633. static int
  2634. other_variable_style_function (const char *ansi_header)
  2635. {
  2636. #ifdef UNPROTOIZE
  2637.  
  2638.   /* See if we have a stdarg function, or a function which has stdarg style
  2639.      parameters or a stdarg style return type.  */
  2640.  
  2641.   return (int) substr (ansi_header, "...");
  2642.  
  2643. #else
  2644.  
  2645.   /* See if we have a varargs function, or a function which has varargs style
  2646.      parameters or a varargs style return type.  */
  2647.  
  2648.   const char *p;
  2649.   int len = strlen (varargs_style_indicator);
  2650.  
  2651.   for (p = ansi_header; p; )
  2652.     {
  2653.       const char *candidate;
  2654.  
  2655.       if ((candidate = substr (p, varargs_style_indicator)) == 0)
  2656.         return 0;
  2657.       else
  2658.         if (!is_id_char (candidate[-1]) && !is_id_char (candidate[len]))
  2659.           return 1;
  2660.         else
  2661.           p = candidate + 1;
  2662.     }
  2663.   return 0;
  2664. #endif
  2665. }
  2666.  
  2667. /* Do the editing operation specifically for a function "declaration".  Note
  2668.    that editing for function "definitions" are handled in a separate routine
  2669.    below.  */
  2670.  
  2671. static void_t
  2672. edit_fn_declaration (const def_dec_info *def_dec_p,
  2673.              const char *volatile clean_text_p)
  2674. {
  2675.   const char *start_formals;
  2676.   const char *end_formals;
  2677.   const char *function_to_edit = def_dec_p->hash_entry->symbol;
  2678.   int func_name_len = strlen (function_to_edit);
  2679.   const char *end_of_fn_name;
  2680.  
  2681. #ifndef UNPROTOIZE
  2682.  
  2683.   const f_list_chain_item *this_f_list_chain_item;
  2684.   const def_dec_info *definition = def_dec_p->definition;
  2685.  
  2686.   /* If we are protoizing, and if we found no corresponding definition for
  2687.      this particular function declaration, then just leave this declaration
  2688.      exactly as it is.  */
  2689.  
  2690.   if (!definition)
  2691.     return;
  2692.  
  2693.   /* If we are protoizing, and if the corresponding definition that we found
  2694.      for this particular function declaration defined an old style varargs
  2695.      function, then we want to issue a warning and just leave this function
  2696.      declaration unconverted.  */
  2697.  
  2698.   if (other_variable_style_function (definition->ansi_decl))
  2699.     {
  2700.       if (!quiet_flag)
  2701.         fprintf (stderr, "%s: warning: varargs function declaration at %s(%d) not converted\n",
  2702.           pname,
  2703.           shortpath (NULL, def_dec_p->file->hash_entry->symbol),
  2704.           def_dec_p->line);
  2705.       return;
  2706.     }
  2707.  
  2708. #endif
  2709.  
  2710.   /* Setup here to recover from confusing source code detected during this
  2711.      particular "edit".  */
  2712.  
  2713.   save_pointers ();
  2714.   if (setjmp (source_confusion_recovery))
  2715.     {
  2716.       restore_pointers ();
  2717.       fprintf (stderr, "%s: declaration of function `%s' not converted\n",
  2718.         pname, function_to_edit);
  2719.       return;
  2720.     }
  2721.  
  2722.   /* We are editing a function declaration.  The line number we did a seek to
  2723.      contains the comma or semicolon which follows the declaration.  Our job
  2724.      now is to scan backwards looking for the function name.  This name *must*
  2725.      be followed by open paren (ignoring whitespace, of course).  We need to
  2726.      replace everything between that open paren and the corresponding closing
  2727.      paren.  If we are protoizing, we need to insert the prototype-style
  2728.      formals lists.  If we are unprotoizing, we need to just delete everything
  2729.      between the pairs of opening and closing parens.  */
  2730.  
  2731.   /* First move up to the end of the line.  */
  2732.  
  2733.   while (*clean_text_p != '\n')
  2734.     check_source (++clean_text_p < clean_text_limit, 0);
  2735.   clean_text_p--;  /* Point to just before the newline character.  */
  2736.  
  2737.   /* Now we can scan backwards for the function name.  */
  2738.  
  2739.   do
  2740.     {
  2741.       for (;;)
  2742.         {
  2743.           /* Scan leftwards until we find some character which can be
  2744.              part of an identifier.  */
  2745.  
  2746.           while (!is_id_char (*clean_text_p))
  2747.             check_source (--clean_text_p > clean_read_ptr, 0);
  2748.  
  2749.           /* Scan backwards until we find a char that cannot be part of an
  2750.              identifier.  */
  2751.  
  2752.           while (is_id_char (*clean_text_p))
  2753.             check_source (--clean_text_p > clean_read_ptr, 0);
  2754.  
  2755.           /* Having found an "id break", see if the following id is the one
  2756.              that we are looking for.  If so, then exit from this loop.  */
  2757.  
  2758.           if (!strncmp (clean_text_p+1, function_to_edit, func_name_len))
  2759.             {
  2760.               char ch = *(clean_text_p + 1 + func_name_len);
  2761.  
  2762.               /* Must also check to see that the name in the source text
  2763.                  ends where it should (in order to prevent bogus matches
  2764.                  on similar but longer identifiers.  */
  2765.  
  2766.               if (! is_id_char (ch))
  2767.                 break;            /* exit from loop */
  2768.             }
  2769.         }
  2770.     
  2771.       /* We have now found the first perfect match for the function name in
  2772.          our backward search.  This may or may not be the actual function
  2773.          name at the start of the actual function declaration (i.e. we could
  2774.          have easily been mislead).  We will try to avoid getting fooled too
  2775.          often by looking forward for the open paren which should follow the
  2776.          identifier we just found.  We ignore whitespace while hunting.  If
  2777.          the next non-whitespace byte we see is *not* an open left paren,
  2778.          then we must assume that we have been fooled and we start over
  2779.          again accordingly.  Note that there is no guarrantee, that even if
  2780.          we do see the open paren, that we are in the right place.
  2781.          Programmers do the strangest things sometimes!  */
  2782.     
  2783.       end_of_fn_name = clean_text_p + strlen (def_dec_p->hash_entry->symbol);
  2784.       start_formals = forward_to_next_token_char (end_of_fn_name);
  2785.     }
  2786.   while (*start_formals != '(');
  2787.  
  2788.   /* start_of_formals now points to the opening left paren which immediately
  2789.      follows the name of the function.  */
  2790.  
  2791.   /* Note that there may be several formals lists which need to be modified
  2792.      due to the possibility that the return type of this function is a
  2793.      pointer-to-function type.  If there are several formals lists, we
  2794.      convert them in left-to-right order here.  */
  2795.  
  2796. #ifndef UNPROTOIZE
  2797.   this_f_list_chain_item = definition->f_list_chain;
  2798. #endif
  2799.   for (;;)
  2800.     {
  2801.       {
  2802.         int depth;
  2803.  
  2804.         end_formals = start_formals + 1;
  2805.         depth = 1;
  2806.         for (; depth; check_source (++end_formals < clean_text_limit, 0))
  2807.           {
  2808.             switch (*end_formals)
  2809.               {
  2810.                 case '(':
  2811.                   depth++;
  2812.                   break;
  2813.                 case ')':
  2814.                   depth--;
  2815.                   break;
  2816.               }
  2817.           }
  2818.         end_formals--;
  2819.       }
  2820.  
  2821.       /* end_formals now points to the closing right paren of the formals
  2822.          list whose left paren is pointed to by start_formals.  */
  2823.     
  2824.       /* Now, if we are protoizing, we insert the new ANSI-style formals list
  2825.          attached to the associated definition of this function.  If however
  2826.          we are unprotoizing, then we simply delete any formals list which
  2827.          may be present.  */
  2828.     
  2829.       output_up_to (start_formals);
  2830. #ifndef UNPROTOIZE
  2831.       if (this_f_list_chain_item)
  2832.         {
  2833.           output_string (this_f_list_chain_item->formals_list);
  2834.           this_f_list_chain_item = this_f_list_chain_item->chain_next;
  2835.         }
  2836.       else
  2837.         {
  2838.           if (!quiet_flag)
  2839.             fprintf (stderr, "%s: warning: too many parameter lists in declaration of `%s'\n",
  2840.               pname, def_dec_p->hash_entry->symbol);
  2841.           check_source (0, end_formals);  /* leave the declaration intact */
  2842.         }
  2843. #endif
  2844.       clean_read_ptr = end_formals - 1;
  2845.  
  2846.       /* Now see if it looks like there may be another formals list associated
  2847.          with the function declaration that we are converting (following the
  2848.          formals list that we just converted.  */
  2849.  
  2850.       {
  2851.         const char *another_r_paren = forward_to_next_token_char (end_formals);
  2852.  
  2853.         if ((*another_r_paren != ')')
  2854.             || (*(start_formals = forward_to_next_token_char (another_r_paren)) != '('))
  2855.           {
  2856. #ifndef UNPROTOIZE
  2857.             if (this_f_list_chain_item)
  2858.               {
  2859.                 if (!quiet_flag)
  2860.                   fprintf (stderr, "\n%s: warning: too few parameter lists in declaration of `%s'\n",
  2861.                     pname, def_dec_p->hash_entry->symbol);
  2862.                 check_source (0, start_formals); /* leave the decl intact */
  2863.               }
  2864. #endif
  2865.             break;
  2866.   
  2867.           }
  2868.       }
  2869.  
  2870.       /* There does appear to be yet another formals list, so loop around
  2871.          again, and convert it also.  */
  2872.     }
  2873. }
  2874.  
  2875. /* Edit a whole group of formals lists, starting with the rightmost one
  2876.    from some set of formals lists.  This routine is called once (from the
  2877.    outside) for each function declaration which is converted.  It is
  2878.    recursive however, and it calls itself once for each remaining formal
  2879.    list that lies to the left of the one it was originally called to work
  2880.    on.  Thus, a whole set gets done in right-to-left order.
  2881.  
  2882.    This routine returns non-zero if it thinks that it should not be trying
  2883.    to convert this particular function definition (because the name of the
  2884.    function doesn't match the one expected).  */
  2885.  
  2886. static int
  2887. edit_formals_lists (const char *end_formals, int f_list_count, const def_dec_info *def_dec_p)
  2888. {
  2889.   const char *start_formals;
  2890.   int depth;
  2891.  
  2892.   start_formals = end_formals - 1;
  2893.   depth = 1;
  2894.   for (; depth; check_source (--start_formals > clean_read_ptr, 0))
  2895.     {
  2896.       switch (*start_formals)
  2897.         {
  2898.           case '(':
  2899.             depth--;
  2900.             break;
  2901.           case ')':
  2902.             depth++;
  2903.             break;
  2904.         }
  2905.     }
  2906.   start_formals++;
  2907.  
  2908.   /* start_formals now points to the opening left paren of the formals list.  */
  2909.  
  2910.   f_list_count--;
  2911.  
  2912.   if (f_list_count)
  2913.     {
  2914.       const char *next_end;
  2915.  
  2916.       /* There should be more formal lists to the left of here.  */
  2917.  
  2918.       next_end = start_formals - 1;
  2919.       check_source (next_end > clean_read_ptr, 0);
  2920.       while (isspace (*next_end))
  2921.         check_source (--next_end > clean_read_ptr, 0);
  2922.       check_source (*next_end == ')', next_end);
  2923.       check_source (--next_end > clean_read_ptr, 0);
  2924.       check_source (*next_end == ')', next_end);
  2925.       if (edit_formals_lists (next_end, f_list_count, def_dec_p))
  2926.         return 1;
  2927.     }
  2928.  
  2929.   /* Check that the function name in the header we are working on is the same
  2930.      as the one we would expect to find.  If not, issue a warning and return
  2931.      non-zero.  */
  2932.  
  2933.   if (f_list_count == 0)
  2934.     {
  2935.       const char *expected = def_dec_p->hash_entry->symbol;
  2936.       const char *func_name_start;
  2937.       const char *func_name_limit;
  2938.       size_t func_name_len;
  2939.  
  2940.       for (func_name_limit = start_formals-1; isspace (*func_name_limit); )
  2941.         check_source (--func_name_limit > clean_read_ptr, 0);
  2942.  
  2943.       for (func_name_start = func_name_limit++;
  2944.            is_id_char (*func_name_start);
  2945.            func_name_start--)
  2946.         check_source (func_name_start > clean_read_ptr, 0);
  2947.       func_name_start++;
  2948.       func_name_len = func_name_limit - func_name_start;
  2949.       if (func_name_len == 0)
  2950.         check_source (0, func_name_start);
  2951.       if (func_name_len != strlen (expected)
  2952.         || strncmp (func_name_start, expected, func_name_len))
  2953.         {
  2954.           fprintf (stderr, "%s: warning: found `%s' at %s(%d) but expected `%s'\n",
  2955.             pname,
  2956.             dupnstr (func_name_start, func_name_len),
  2957.             shortpath (NULL, def_dec_p->file->hash_entry->symbol),
  2958.             identify_lineno (func_name_start),
  2959.             expected);
  2960.           return 1;
  2961.         }
  2962.     }
  2963.  
  2964.   output_up_to (start_formals);
  2965.  
  2966. #ifdef UNPROTOIZE
  2967.   if (f_list_count == 0)
  2968.     output_string (def_dec_p->formal_names);
  2969. #else
  2970.   {
  2971.     int f_list_depth;
  2972.     const f_list_chain_item *flci_p = def_dec_p->f_list_chain;
  2973.  
  2974.     /* At this point, the current value of f_list count says how many
  2975.        links we have to follow through the f_list_chain to get to the
  2976.        particular formals list that we need to output next.  */
  2977.  
  2978.     for (f_list_depth = 0; f_list_depth < f_list_count; f_list_depth++)
  2979.       flci_p = flci_p->chain_next;
  2980.     output_string (flci_p->formals_list);
  2981.   }
  2982. #endif
  2983.  
  2984.   clean_read_ptr = end_formals - 1;
  2985.   return 0;
  2986. }
  2987.  
  2988. /* Given a pointer to a byte in the clean text buffer which points to the
  2989.    beginning of a line that contains a "follower" token for a function
  2990.    definition header, do whatever is necessary to find the right closing
  2991.    paren for the rightmost formals list of the function definition header.
  2992. */
  2993.  
  2994. static const char *
  2995. find_rightmost_formals_list (const char *clean_text_p)
  2996. {
  2997.   const char *end_formals;
  2998.  
  2999.   /* We are editing a function definition.  The line number we did a seek
  3000.      to contains the first token which immediately follows the entire set of
  3001.      formals lists which are part of this particular function definition
  3002.      header.
  3003.  
  3004.      Our job now is to scan leftwards in the clean text looking for the
  3005.      right-paren which is at the end of the function header's rightmost
  3006.      formals list.
  3007.  
  3008.      If we ignore whitespace, this right paren should be the first one we
  3009.      see which is (ignoring whitespace) immediately followed either by the
  3010.      open curly-brace beginning the function body or by an alphabetic
  3011.      character (in the case where the function definition is in old (K&R)
  3012.      style and there are some declarations of formal parameters).  */
  3013.  
  3014.    /* It is possible that the right paren we are looking for is on the
  3015.       current line (together with its following token).  Just in case that
  3016.       might be true, we start out here by skipping down to the right end of
  3017.       the current line before starting our scan.  */
  3018.  
  3019.   for (end_formals = clean_text_p; *end_formals != '\n'; end_formals++)
  3020.     continue;
  3021.   end_formals--;
  3022.  
  3023.   /* Now scan backwards while looking for the right end of the rightmost
  3024.      formals list associated with this function definition.  */
  3025.  
  3026.   for (;;)
  3027.     {
  3028.       char ch;
  3029.       const char *l_brace_p;
  3030.  
  3031.       /* Look leftward and try to find a right-paren.  */
  3032.  
  3033.       while (*end_formals != ')')
  3034.         {
  3035.           if (isspace (*end_formals))
  3036.             while (isspace (*end_formals))
  3037.               check_source (--end_formals > clean_read_ptr, 0);
  3038.           else
  3039.             check_source (--end_formals > clean_read_ptr, 0);
  3040.         }
  3041.  
  3042.       ch = *(l_brace_p = forward_to_next_token_char (end_formals));
  3043.  
  3044. #ifdef UNPROTOIZE
  3045.  
  3046.       /* Since we are unprotoizing an ANSI-style (prototyped) function
  3047.          definition, there had better not be anything (except whitespace)
  3048.          between the end of the ANSI formals list and the beginning of the
  3049.          function body (i.e. the '{').  */
  3050.  
  3051.       check_source (ch == '{', l_brace_p);
  3052.       break;
  3053.  
  3054. #else
  3055.  
  3056.       /* Since it is possible that we found a right paren before the starting
  3057.          '{' of the body which IS NOT the one at the end of the real K&R
  3058.          formals list (say for instance, we found one embedded inside one of
  3059.          the old K&R formal parameter declarations) we have to check to be
  3060.          sure that this is in fact the right paren that we were looking for.
  3061.  
  3062.          The one we were looking for *must* be followed by either a '{' or
  3063.          by an alphabetic character, while others *cannot* legally be followed
  3064.          by such characters.  */
  3065.  
  3066.       if ((ch == '{') || isalpha (ch))
  3067.         break;
  3068.  
  3069.       /* At this point, we have found a right paren, but we know that it is
  3070.          not the one we were looking for, so backup one character and keep
  3071.          looking.  */
  3072.  
  3073.       check_source (--end_formals > clean_read_ptr, 0);
  3074.  
  3075. #endif
  3076.  
  3077.     }
  3078.  
  3079.   return end_formals;
  3080. }
  3081.  
  3082. #ifndef UNPROTOIZE
  3083.  
  3084. /* Insert into the output file a totally new declaration for a function
  3085.    which (up until now) was being called from within the current block
  3086.    without having been declared at any point such that the declaration
  3087.    was visible (i.e. in scope) at the point of the call.
  3088.  
  3089.    We need to add in explicit declarations for all such function calls
  3090.    in order to get the full benefit of prototype-based function call
  3091.    parameter type checking.  */
  3092.  
  3093. static void_t
  3094. add_local_decl (const def_dec_info *def_dec_p, const char *clean_text_p)
  3095. {
  3096.   const char *start_of_block;
  3097.   const char *function_to_edit = def_dec_p->hash_entry->symbol;
  3098.  
  3099.   /* Don't insert new local explicit declarations unless explicitly requested
  3100.      to do so.  */
  3101.  
  3102.   if (!local_flag)
  3103.     return;
  3104.  
  3105.   /* Setup here to recover from confusing source code detected during this
  3106.      particular "edit".  */
  3107.  
  3108.   save_pointers ();
  3109.   if (setjmp (source_confusion_recovery))
  3110.     {
  3111.       restore_pointers ();
  3112.       fprintf (stderr, "%s: local declaration for function `%s' not inserted\n",
  3113.         pname, function_to_edit);
  3114.       return;
  3115.     }
  3116.  
  3117.   /* We have already done a seek to the start of the line which should
  3118.      contain *the* open curly brace which begins the block in which we need
  3119.      to insert an explicit function declaration (to replace the implicit one).
  3120.  
  3121.      Now we scan that line, starting from the left, until we find the
  3122.      open curly brace we are looking for.  Note that there may actually be
  3123.      multiple open curly braces on the given line, but we will be happy
  3124.      with the leftmost one no matter what.  */
  3125.  
  3126.   start_of_block = clean_text_p;
  3127.   while (*start_of_block != '{' && *start_of_block != '\n')
  3128.     check_source (++start_of_block < clean_text_limit, 0);
  3129.  
  3130.   /* Note that the line from the original source could possibly
  3131.      contain *no* open curly braces!  This happens if the line contains
  3132.      a macro call which expands into a chunk of text which includes a
  3133.      block (and that block's associated open and close curly braces).
  3134.      In cases like this, we give up, issue a warning, and do nothing.  */
  3135.  
  3136.   if (*start_of_block != '{')
  3137.     {
  3138.       if (!quiet_flag)
  3139.         fprintf (stderr,
  3140.           "\n%s: warning: can't add declaration of `%s' into macro call at %s(%d)\n",
  3141.           pname,
  3142.           def_dec_p->hash_entry->symbol,
  3143.           def_dec_p->file->hash_entry->symbol,
  3144.           def_dec_p->line);
  3145.       return;
  3146.     }
  3147.  
  3148.   /* Figure out what a nice (pretty) indentation would be for the new
  3149.      declaration we are adding.  In order to do this, we must scan forward
  3150.      from the '{' until we find the first line which starts with some
  3151.      non-whitespace characters (i.e. real "token" material).  */
  3152.  
  3153.   {
  3154.     const char *ep = forward_to_next_token_char (start_of_block) - 1;
  3155.     const char *sp;
  3156.  
  3157.     /* Now we have ep pointing at the rightmost byte of some existing indent
  3158.        stuff.  At least that is the hope.
  3159.  
  3160.        We can now just scan backwards and find the left end of the existing
  3161.        indentation string, and then copy it to the output buffer.  */
  3162.  
  3163.     for (sp = ep; isspace (*sp) && *sp != '\n'; sp--)
  3164.       continue;
  3165.  
  3166.     /* Now write out the open { which began this block, and any following
  3167.        trash up to and including the last byte of the existing indent that
  3168.        we just found.  */
  3169.  
  3170.     output_up_to (ep);
  3171.   
  3172.     /* Now we go ahead and insert the new declaration at this point.
  3173.  
  3174.        If the definition of the given function is in the same file that we
  3175.        are currently editing, and if its full ANSI declaration normally
  3176.        would start with the keyword `extern', suppress the `extern'.  */
  3177.   
  3178.     {
  3179.       const char *decl = def_dec_p->definition->ansi_decl;
  3180.   
  3181.       if ((*decl == 'e') && (def_dec_p->file == def_dec_p->definition->file))
  3182.         decl += 7;
  3183.       output_string (decl);
  3184.     }
  3185.  
  3186.     /* Finally, write out a new indent string, just like the preceeding one
  3187.        that we found.  This will typically include a newline as the first
  3188.        character of the indent string.  */
  3189.  
  3190.     output_bytes (sp, (ep - sp) + 1);
  3191.   }
  3192. }
  3193.  
  3194. /* Given a pointer to a file_info record, and a pointer to the beginning
  3195.    of a line (in the clean text buffer) which is assumed to contain the
  3196.    first "follower" token for the first function definition header in the
  3197.    given file, find a good place to insert some new global function
  3198.    declarations (which will replace scattered and imprecise implicit ones)
  3199.    and then insert the new explicit declaration at that point in the file.  */
  3200.  
  3201. static void_t
  3202. add_global_decls (const file_info *file_p, const char *clean_text_p)
  3203. {
  3204.   const def_dec_info *dd_p;
  3205.   const char *scan_p;
  3206.  
  3207.   /* Setup here to recover from confusing source code detected during this
  3208.      particular "edit".  */
  3209.  
  3210.   save_pointers ();
  3211.   if (setjmp (source_confusion_recovery))
  3212.     {
  3213.       restore_pointers ();
  3214.       fprintf (stderr, "%s: global declarations for file `%s' not inserted\n",
  3215.         pname, shortpath (NULL, file_p->hash_entry->symbol));
  3216.       return;
  3217.     }
  3218.  
  3219.   /* Start by finding a good location for adding the new explicit function
  3220.      declarations.  To do this, we scan backwards, ignoring whitespace
  3221.      and comments and other junk until we find either a semicolon, or until
  3222.      we hit the beginning of the file.  */
  3223.  
  3224.   scan_p = find_rightmost_formals_list (clean_text_p);
  3225.   for (;; --scan_p)
  3226.     {
  3227.       if (scan_p < clean_text_base)
  3228.         break;
  3229.       check_source (scan_p > clean_read_ptr, 0);
  3230.       if (*scan_p == ';')
  3231.         break;
  3232.     }
  3233.  
  3234.   /* scan_p now points either to a semicolon, or to just before the start
  3235.      of the whole file.  */
  3236.  
  3237.   /* Now scan forward for the first non-whitespace character.  In theory,
  3238.      this should be the first character of the following function definition
  3239.      header.  We will put in the added declarations just prior to that. */
  3240.  
  3241.   scan_p++;
  3242.   while (isspace (*scan_p))
  3243.     scan_p++;
  3244.   scan_p--;
  3245.  
  3246.   output_up_to (scan_p);
  3247.  
  3248.   /* Now write out full prototypes for all of the things that had been
  3249.      implicitly declared in this file (but only those for which we were
  3250.      actually able to find unique matching definitions).  Avoid duplicates
  3251.      by marking things that we write out as we go.   */
  3252.  
  3253.   {
  3254.     int some_decls_added = 0;
  3255.   
  3256.     for (dd_p = file_p->defs_decs; dd_p; dd_p = dd_p->next_in_file)
  3257.       if (dd_p->is_implicit && dd_p->definition && !dd_p->definition->written)
  3258.         {
  3259.           const char *decl = dd_p->definition->ansi_decl;
  3260.   
  3261.           /* If the function for which we are inserting a declaration is
  3262.              actually defined later in the same file, then suppress the
  3263.              leading `extern' keyword (if there is one).  */
  3264.   
  3265.           if (*decl == 'e' && (dd_p->file == dd_p->definition->file))
  3266.             decl += 7;
  3267.   
  3268.           output_string ("\n");
  3269.           output_string (decl);
  3270.           some_decls_added = 1;
  3271.           ((NONCONST def_dec_info *) dd_p->definition)->written = 1;
  3272.         }
  3273.     if (some_decls_added)
  3274.       output_string ("\n\n");
  3275.   }
  3276.  
  3277.   /* Unmark all of the definitions that we just marked.  */
  3278.  
  3279.   for (dd_p = file_p->defs_decs; dd_p; dd_p = dd_p->next_in_file)
  3280.     if (dd_p->definition)
  3281.       ((NONCONST def_dec_info *) dd_p->definition)->written = 0;
  3282. }
  3283.  
  3284. #endif
  3285.  
  3286. /* Do the editing operation specifically for a function "definition".  Note
  3287.    that editing operations for function "declarations" are handled by a
  3288.    separate routine above.  */
  3289.  
  3290. static void_t
  3291. edit_fn_definition (const def_dec_info *def_dec_p, const char *clean_text_p)
  3292. {
  3293.   const char *end_formals;
  3294.   const char *function_to_edit = def_dec_p->hash_entry->symbol;
  3295.  
  3296.   /* Setup here to recover from confusing source code detected during this
  3297.      particular "edit".  */
  3298.  
  3299.   save_pointers ();
  3300.   if (setjmp (source_confusion_recovery))
  3301.     {
  3302.       restore_pointers ();
  3303.       fprintf (stderr, "%s: definition of function `%s' not converted\n",
  3304.         pname, function_to_edit);
  3305.       return;
  3306.     }
  3307.  
  3308.   end_formals = find_rightmost_formals_list (clean_text_p);
  3309.  
  3310.   /* end_of_formals now points to the closing right paren of the rightmost
  3311.      formals list which is actually part of the `header' of the function
  3312.      definition that we are converting.  */
  3313.  
  3314.   /* If the header of this function definition looks like it declares a
  3315.      function with a variable number of arguments, and if the way it does
  3316.      that is different from that way we would like it (i.e. varargs vs.
  3317.      stdarg) then issue a warning and leave the header unconverted.  */
  3318.      
  3319.   if (other_variable_style_function (def_dec_p->ansi_decl))
  3320.     {
  3321.       if (!quiet_flag)
  3322.         fprintf (stderr, "%s: warning: %s function definition at %s(%d) not converted\n",
  3323.           pname,
  3324.           other_var_style,
  3325.           shortpath (NULL, def_dec_p->file->hash_entry->symbol),
  3326.           identify_lineno (end_formals));
  3327.       output_up_to (end_formals);
  3328.       return;
  3329.     }
  3330.  
  3331.   if (edit_formals_lists (end_formals, def_dec_p->f_list_count, def_dec_p))
  3332.     {
  3333.       restore_pointers ();
  3334.       fprintf (stderr, "%s: definition of function `%s' not converted\n",
  3335.         pname, function_to_edit);
  3336.       return;
  3337.     }
  3338.  
  3339.   /* Have to output the last right paren because this never gets flushed by
  3340.      edit_formals_list.  */
  3341.  
  3342.   output_up_to (end_formals);
  3343.  
  3344. #ifdef UNPROTOIZE
  3345.   {
  3346.     const char *decl_p;
  3347.     const char *semicolon_p;
  3348.     const char *limit_p;
  3349.     const char *scan_p;
  3350.     int had_newlines = 0;
  3351.  
  3352.     /* Now write out the K&R style formal declarations, one per line.  */
  3353.  
  3354.     decl_p = def_dec_p->formal_decls;
  3355.     limit_p = decl_p + strlen (decl_p);
  3356.     for (;decl_p < limit_p; decl_p = semicolon_p + 2)
  3357.       {
  3358.         for (semicolon_p = decl_p; *semicolon_p != ';'; semicolon_p++)
  3359.           continue;
  3360.         output_string ("\n");
  3361.         output_string (indent_string);
  3362.         output_bytes (decl_p, (semicolon_p + 1) - decl_p);
  3363.       }
  3364.  
  3365.     /* If there are no newlines between the end of the formals list and the
  3366.        start of the body, we should insert one now.  */
  3367.  
  3368.     for (scan_p = end_formals+1; *scan_p != '{'; )
  3369.       {
  3370.         if (*scan_p == '\n')
  3371.           {
  3372.             had_newlines = 1;
  3373.             break;
  3374.           }
  3375.         check_source (++scan_p < clean_text_limit, 0);
  3376.       }
  3377.     if (!had_newlines)
  3378.       output_string ("\n");
  3379.   }
  3380. #else
  3381.   /* If we are protoizing, there may be some flotsum & jetsum (like comments
  3382.      and preprocessing directives) after the old formals list but before
  3383.      the following { and we would like to preserve that stuff while effectively
  3384.      deleting the existing K&R formal parameter declarations.  We do so here
  3385.      in a rather tricky way.  Basically, we white out any stuff *except*
  3386.      the comments/pp-directives in the original text buffer, then, if there
  3387.      is anything in this area *other* than whitespace, we output it.  */
  3388.   {
  3389.     const char *end_formals_orig;
  3390.     const char *start_body;
  3391.     const char *start_body_orig;
  3392.     const char *scan;
  3393.     const char *scan_orig;
  3394.     int have_flotsum = 0;
  3395.     int have_newlines = 0;
  3396.  
  3397.     for (start_body = end_formals + 1; *start_body != '{';)
  3398.       check_source (++start_body < clean_text_limit, 0);
  3399.  
  3400.     end_formals_orig = orig_text_base + (end_formals - clean_text_base);
  3401.     start_body_orig = orig_text_base + (start_body - clean_text_base);
  3402.     scan = end_formals + 1;
  3403.     scan_orig = end_formals_orig + 1;
  3404.     for (; scan < start_body; scan++, scan_orig++)
  3405.       {
  3406.         if (*scan == *scan_orig)
  3407.           {
  3408.             have_newlines |= (*scan_orig == '\n');
  3409.             /* Leave identical whitespace alone.  */
  3410.             if (!isspace (*scan_orig))
  3411.               *((NONCONST char *)scan_orig) = ' '; /* identical - so whiteout */
  3412.           }
  3413.         else
  3414.           have_flotsum = 1;
  3415.       }
  3416.     if (have_flotsum)
  3417.       output_bytes (end_formals_orig + 1, start_body_orig-end_formals_orig-1);
  3418.     else
  3419.       if (have_newlines)
  3420.         output_string ("\n");
  3421.       else
  3422.         output_string (" ");
  3423.     clean_read_ptr = start_body - 1;
  3424.   }
  3425. #endif
  3426. }
  3427.  
  3428. /* Clean up the clean text buffer.  Do this by converting comments and
  3429.    preprocessor directives into spaces.   Also convert line continuations
  3430.    into whitespace.  Also, whiteout string and character literals.  */
  3431.  
  3432. static void
  3433. do_cleaning (char *new_clean_text_base, char *new_clean_text_limit)
  3434. {
  3435.   char *scan_p;
  3436.   int non_whitespace_since_newline = 0;
  3437.  
  3438.   for (scan_p = new_clean_text_base; scan_p < new_clean_text_limit; scan_p++)
  3439.     {
  3440.       switch (*scan_p)
  3441.         {
  3442.           case '/':            /* Handle comments.  */
  3443.             if (scan_p[1] != '*')
  3444.               goto regular;
  3445.             non_whitespace_since_newline = 1;
  3446.             scan_p[0] = ' ';
  3447.             scan_p[1] = ' ';
  3448.             scan_p += 2;
  3449.             while (scan_p[1] != '/' || scan_p[0] != '*')
  3450.               {
  3451.                 if (!isspace (*scan_p))
  3452.                   *scan_p = ' ';
  3453.                 if (++scan_p >= new_clean_text_limit)
  3454.                   abort ();
  3455.               }
  3456.             *scan_p++ = ' ';
  3457.             *scan_p = ' ';
  3458.             break;
  3459.  
  3460.           case '#':            /* Handle pp directives.  */
  3461.             if (non_whitespace_since_newline)
  3462.               goto regular;
  3463.             *scan_p = ' ';
  3464.             while (scan_p[1] != '\n' || scan_p[0] == '\\')
  3465.               {
  3466.                 if (!isspace (*scan_p))
  3467.                   *scan_p = ' ';
  3468.                 if (++scan_p >= new_clean_text_limit)
  3469.                   abort ();
  3470.               }
  3471.             *scan_p++ = ' ';
  3472.             break;
  3473.  
  3474.           case '\'':            /* Handle character literals.  */
  3475.             non_whitespace_since_newline = 1;
  3476.             while (scan_p[1] != '\'' || scan_p[0] == '\\')
  3477.               {
  3478.                 if (scan_p[0] == '\\' && !isspace (scan_p[1]))
  3479.                   scan_p[1] = ' ';
  3480.                 if (!isspace (*scan_p))
  3481.                   *scan_p = ' ';
  3482.                 if (++scan_p >= new_clean_text_limit)
  3483.                   abort ();
  3484.               }
  3485.             *scan_p++ = ' ';
  3486.             break;
  3487.  
  3488.           case '"':            /* Handle string literals.  */
  3489.             non_whitespace_since_newline = 1;
  3490.             while (scan_p[1] != '"' || scan_p[0] == '\\')
  3491.               {
  3492.                 if (scan_p[0] == '\\' && !isspace (scan_p[1]))
  3493.                   scan_p[1] = ' ';
  3494.                 if (!isspace (*scan_p))
  3495.                   *scan_p = ' ';
  3496.                 if (++scan_p >= new_clean_text_limit)
  3497.                   abort ();
  3498.               }
  3499.             *scan_p++ = ' ';
  3500.             break;
  3501.  
  3502.           case '\\':            /* Handle line continuations.  */
  3503.             if (scan_p[1] != '\n')
  3504.               goto regular;
  3505.             *scan_p = ' ';
  3506.             break;
  3507.  
  3508.           case '\n':
  3509.             non_whitespace_since_newline = 0;    /* Reset.  */
  3510.             break;
  3511.  
  3512.           case ' ':
  3513.           case '\v':
  3514.           case '\t':
  3515.           case '\r':
  3516.           case '\f':
  3517.           case '\b':
  3518.             break;        /* Whitespace characters.  */
  3519.  
  3520.           default:
  3521. regular:
  3522.             non_whitespace_since_newline = 1;
  3523.             break;
  3524.         }
  3525.     }
  3526. }
  3527.  
  3528. /* Given a pointer to the closing right parenthesis for a particular formals
  3529.    list (in the clean text buffer) find the corresponding left parenthesis
  3530.    and return a pointer to it.  */
  3531.  
  3532. static const char *
  3533. careful_find_l_paren (const char *p)
  3534. {
  3535.   const char *q;
  3536.   int paren_depth;
  3537.  
  3538.   for (paren_depth = 1, q = p-1; paren_depth; check_source (--q >= clean_text_base, 0))
  3539.     {
  3540.       switch (*q)
  3541.         {
  3542.           case ')':
  3543.             paren_depth++;
  3544.             break;
  3545.           case '(':
  3546.             paren_depth--;
  3547.             break;
  3548.         }
  3549.     }
  3550.   return ++q;
  3551. }
  3552.  
  3553. /* Scan the clean text buffer for cases of function definitions that we
  3554.    don't really know about because they were preprocessed out when the
  3555.    aux info files were created.
  3556.  
  3557.    In this version of protoize/unprotoize we just give a warning for each
  3558.    one found.  A later version may be able to at least unprotoize such
  3559.    missed items.
  3560.  
  3561.    Note that we may easily find all function definitions simply by
  3562.    looking for places where there is a left paren which is (ignoring
  3563.    whitespace) immediately followed by either a left-brace or by an
  3564.    upper or lower case letter.  Whenever we find this combination, we
  3565.    have also found a function definition header.
  3566.  
  3567.    Finding function *declarations* using syntactic clues is much harder.
  3568.    I will probably try to do this in a later version though.  */
  3569.  
  3570. static void
  3571. scan_for_missed_items (const file_info *file_p)
  3572. {
  3573.   static const char *scan_p;
  3574.   const char *limit = clean_text_limit - 3;
  3575.   static const char *backup_limit;
  3576.  
  3577.   backup_limit = clean_text_base - 1;
  3578.  
  3579.   for (scan_p = clean_text_base; scan_p < limit; scan_p++)
  3580.     {
  3581.       if (*scan_p == ')')
  3582.         {
  3583.           static const char *last_r_paren;
  3584.           const char *ahead_p;
  3585.  
  3586.           last_r_paren = scan_p;
  3587.  
  3588.           for (ahead_p = scan_p + 1; isspace (*ahead_p); )
  3589.             check_source (++ahead_p < limit, limit);
  3590.  
  3591.           scan_p = ahead_p - 1;
  3592.  
  3593.           if (isalpha (*ahead_p) || *ahead_p == '{')
  3594.             {
  3595.               const char *last_l_paren;
  3596.               const int lineno = identify_lineno (ahead_p);
  3597.  
  3598.               if (setjmp (source_confusion_recovery))
  3599.                 continue;
  3600.  
  3601.               /* We know we have a function definition header.  Now skip
  3602.                  leftwards over all of its associated formals lists.  */
  3603.  
  3604.               do
  3605.                 {
  3606.                   last_l_paren = careful_find_l_paren (last_r_paren);
  3607.                   for (last_r_paren = last_l_paren-1; isspace (*last_r_paren); )
  3608.                     check_source (--last_r_paren >= backup_limit, backup_limit);
  3609.                 }
  3610.               while (*last_r_paren == ')');
  3611.  
  3612.               if (is_id_char (*last_r_paren))
  3613.                 {
  3614.                   char func_name[MAX_LINE_LEN];
  3615.                   const char *id_limit = last_r_paren + 1;
  3616.                   const char *id_start;
  3617.                   int id_length;
  3618.                   const def_dec_info *dd_p;
  3619.  
  3620.                   for (id_start = id_limit-1; is_id_char (*id_start); )
  3621.                     check_source (--id_start >= backup_limit, backup_limit);
  3622.                   id_start++;
  3623.                   backup_limit = id_start;
  3624.                   if ((id_length = id_limit - id_start) == 0)
  3625.                     goto not_missed;
  3626.                   strncpy (func_name, id_start, id_length);
  3627.                   func_name[id_length] = '\0';
  3628.  
  3629.                   {
  3630.                     static const char * const stmt_keywords[] =
  3631.                       { "if", "while", "for", "switch", "return", 0 };
  3632.                     const char * const *stmt_keyword;
  3633.  
  3634.                     /* We must check here to see if we are actually looking at
  3635.                        a statement rather than an actual function call.  */
  3636.  
  3637.                     for (stmt_keyword = stmt_keywords; *stmt_keyword; stmt_keyword++)
  3638.                       if (!strcmp (func_name, *stmt_keyword))
  3639.                         goto not_missed;
  3640.                   }
  3641.  
  3642. #if 0
  3643.                   fprintf (stderr, "%s: found definition of `%s' at %s(%d)\n",
  3644.                     pname,
  3645.                     func_name,
  3646.                     shortpath (NULL, file_p->hash_entry->symbol),
  3647.                     identify_lineno (id_start));
  3648. #endif
  3649.                   /* We really should check for a match of the function name
  3650.                      here also, but why bother.  */
  3651.  
  3652.                   for (dd_p = file_p->defs_decs; dd_p; dd_p = dd_p->next_in_file)
  3653.                     if (dd_p->is_func_def && dd_p->line == lineno)
  3654.                       goto not_missed;
  3655.  
  3656.                   /* If we make it here, then we did not know about this
  3657.                      function definition.  */
  3658.  
  3659.                   fprintf (stderr, "%s: warning: `%s' at %s(%d) was #if 0\n",
  3660.                     pname,
  3661.                     func_name,
  3662.                     shortpath (NULL, file_p->hash_entry->symbol),
  3663.                     identify_lineno (id_start));
  3664.                   fprintf (stderr, "%s: function definition not converted\n",
  3665.                     pname);
  3666. not_missed: ;
  3667.                 }
  3668.             }
  3669.         }
  3670.     }
  3671. }
  3672.  
  3673. /* Do all editing operations for a single source file (either a "base" file
  3674.    or an "include" file).  To do this we read the file into memory, keep a
  3675.    virgin copy there, make another cleaned in-core copy of the original file
  3676.    (i.e. one in which all of the comments and preprocessor directives have
  3677.    been replaced with whitespace), then use these two in-core copies of the
  3678.    file to make a new edited in-core copy of the file.  Finally, rename the
  3679.    original file (as a way of saving it), and then write the edited version
  3680.    of the file from core to a disk file of the same name as the original.
  3681.  
  3682.    Note that the trick of making a copy of the original sans comments &
  3683.    preprocessor directives make the editing a whole lot easier.  */
  3684.    
  3685. static void_t
  3686. edit_file (const hash_table_entry *hp)
  3687. {
  3688.   struct stat stat_buf;
  3689.   const file_info *file_p = hp->fip;
  3690.   char *new_orig_text_base;
  3691.   char *new_orig_text_limit;
  3692.   char *new_clean_text_base;
  3693.   char *new_clean_text_limit;
  3694.   size_t orig_size;
  3695.   size_t repl_size;
  3696.   int first_definition_in_file;
  3697.  
  3698.   /* If we are not supposed to be converting this file, or if there is
  3699.      nothing in there which needs converting, just skip this file.  */
  3700.  
  3701.   if (!needs_to_be_converted (file_p))
  3702.     return;
  3703.  
  3704.   convert_path = file_p->hash_entry->symbol;
  3705.  
  3706.   /* If this file should not be converted for any reason, don't even try
  3707.      unless the -f option was used.  Even with the -f flag, don't bother
  3708.      with those files that we could not read & replace even if we tried.  */
  3709.  
  3710.   if ((!file_normally_convertable (convert_path) && !force_flag)
  3711.       || !file_could_be_converted (convert_path))
  3712.     {
  3713.       if (!quiet_flag
  3714. #ifdef UNPROTOIZE
  3715.           /* Don't even mention "system" include files unless we are
  3716.              protoizing.  If we are protoizing, we mention these as a
  3717.              gentile way of prodding the user to convert his "system"
  3718.              include files to prototype format.  */
  3719.           && !in_system_include_dir (convert_path)
  3720. #endif
  3721.           )
  3722.         fprintf (stderr, "%s: file `%s' not converted\n",
  3723.           pname, shortpath (NULL, convert_path));
  3724.       return;
  3725.     }
  3726.  
  3727.   /* Let the user know what we are up to.  */
  3728.  
  3729.   if (nochange_flag)
  3730.       puts (shortpath (NULL, convert_path));
  3731.   else
  3732.     {
  3733.       fprintf (stderr, "%s: converting file `%s'\n",
  3734.         pname, shortpath (NULL, convert_path));
  3735.       fflush (stderr);
  3736.     }
  3737.  
  3738.   /* Find out the size (in bytes) of the original file.  */
  3739.  
  3740.   if (stat (convert_path, &stat_buf) == -1)
  3741.     {
  3742.       fprintf (stderr, "%s: error: can't get status for file `%s': %s\n",
  3743.         pname, shortpath (NULL, convert_path), sys_errlist[errno]);
  3744.       return;
  3745.     }
  3746.   orig_size = stat_buf.st_size;
  3747.  
  3748.   /* Allocate a buffer to hold the original text.  */
  3749.  
  3750.   orig_text_base = new_orig_text_base = (char *) xmalloc (orig_size + 2);
  3751.   orig_text_limit = new_orig_text_limit = new_orig_text_base + orig_size;
  3752.  
  3753.   /* Allocate a buffer to hold the cleaned-up version of the original text.  */
  3754.  
  3755.   clean_text_base = new_clean_text_base = (char *) xmalloc (orig_size + 2);
  3756.   clean_text_limit = new_clean_text_limit = new_clean_text_base + orig_size;
  3757.   clean_read_ptr = clean_text_base - 1;
  3758.  
  3759.   /* Allocate a buffer that will hopefully be large enough to hold the entire
  3760.      converted output text.  As an initial guess for the maximum size of the
  3761.      output buffer, use 125% of the size of the original + some extra.  This
  3762.      buffer can be expanded later as needed.  */
  3763.  
  3764.   repl_size = orig_size + (orig_size >> 2) + 4096;
  3765.   repl_text_base = (char *) xmalloc (repl_size + 2);
  3766.   repl_text_limit = repl_text_base + repl_size - 1;
  3767.   repl_write_ptr = repl_text_base - 1;
  3768.  
  3769.   {
  3770.     int input_file;
  3771.  
  3772.     /* Open the file to be converted in READ ONLY mode.  */
  3773.  
  3774.     if ((input_file = open (convert_path, O_RDONLY)) == -1)
  3775.       {
  3776.         fprintf (stderr, "%s: error: can't open file `%s' for reading: %s\n",
  3777.           pname, shortpath (NULL, convert_path), sys_errlist[errno]);
  3778.         return;
  3779.       }
  3780.  
  3781.     /* Read the entire original source text file into the original text buffer
  3782.        in one swell fwoop.  Then figure out where the end of the text is and
  3783.        make sure that it ends with a newline followed by a null.  */
  3784.  
  3785.     if (read (input_file, new_orig_text_base, orig_size) != orig_size)
  3786.       {
  3787.         close (input_file);
  3788.         fprintf (stderr, "\n%s: error: while reading input file `%s': %s\n",
  3789.           pname, shortpath (NULL, convert_path), sys_errlist[errno]);
  3790.         return;
  3791.       }
  3792.  
  3793.     close (input_file);
  3794.   }
  3795.  
  3796.   if (orig_size == 0 || orig_text_limit[-1] != '\n')
  3797.     {
  3798.       *new_orig_text_limit++ = '\n';
  3799.       orig_text_limit++;
  3800.     }
  3801.  
  3802.   /* Create the cleaned up copy of the original text.  */
  3803.  
  3804.   bcopy (orig_text_base, new_clean_text_base, orig_text_limit - orig_text_base);
  3805.   do_cleaning (new_clean_text_base, new_clean_text_limit);
  3806.  
  3807. #if 0
  3808.   {
  3809.     int clean_file;
  3810.     size_t clean_size = orig_text_limit - orig_text_base;
  3811.     char clean_path[MAXPATHLEN];
  3812.  
  3813.     /* Open (and create) the clean file.  */
  3814.   
  3815.     strcpy (clean_path, convert_path);
  3816.     strcat (clean_path, ".clean");
  3817.     if ((clean_file = open (clean_path, O_CREAT | O_WRONLY, 0666)) == -1)
  3818.       {
  3819.         fprintf (stderr, "%s: error: can't create/open clean file `%s': %s\n",
  3820.           pname,
  3821.           shortpath (NULL, clean_path),
  3822.           sys_errlist[errno]);
  3823.         return;
  3824.       }
  3825.   
  3826.     /* Write the clean file.  */
  3827.   
  3828.     if (write (clean_file, new_clean_text_base, clean_size) != clean_size)
  3829.       fprintf (stderr, "%s: error: while writing file `%s': %s\n",
  3830.         pname, shortpath (NULL, clean_path), sys_errlist[errno]);
  3831.   
  3832.     close (clean_file);
  3833.   }
  3834. #endif
  3835.  
  3836.   /* Do a simplified scan of the input looking for things that were not
  3837.      mentioned in the aux info files because of the fact that they were
  3838.      in a region of the source which was preprocessed-out (via #if or
  3839.      via #ifdef).  */
  3840.  
  3841.   scan_for_missed_items (file_p);
  3842.  
  3843.   /* Setup to do line-oriented forward seeking in the clean text buffer.  */
  3844.  
  3845.   last_known_line_number = 1;
  3846.   last_known_line_start = clean_text_base;
  3847.  
  3848.   /* Now get down to business and make all of the necessary edits.  */
  3849.  
  3850.   {
  3851.     const def_dec_info *def_dec_p;
  3852.  
  3853.     first_definition_in_file = 1;
  3854.     def_dec_p = file_p->defs_decs;
  3855.     for (; def_dec_p; def_dec_p = def_dec_p->next_in_file)
  3856.       {
  3857.         const char *clean_text_p = seek_to_line (def_dec_p->line);
  3858.   
  3859.         /* clean_text_p now points to the first character of the line which
  3860.            contains the `terminator' for the declaration or definition that
  3861.            we are about to process.  */
  3862.   
  3863. #ifndef UNPROTOIZE
  3864.   
  3865.         if (global_flag && def_dec_p->is_func_def && first_definition_in_file)
  3866.           {
  3867.             add_global_decls (def_dec_p->file, clean_text_p);
  3868.             first_definition_in_file = 0;
  3869.           }
  3870.  
  3871.         /* Don't edit this item if it is already in prototype format or if it
  3872.            is a function declaration and we have found no corresponding
  3873.            definition.  */
  3874.  
  3875.         if (def_dec_p->prototyped
  3876.          || (!def_dec_p->is_func_def && !def_dec_p->definition))
  3877.           continue;
  3878.  
  3879. #endif
  3880.  
  3881.         if (def_dec_p->is_func_def)
  3882.           edit_fn_definition (def_dec_p, clean_text_p);
  3883.         else
  3884. #ifndef UNPROTOIZE
  3885.       if (def_dec_p->is_implicit)
  3886.         add_local_decl (def_dec_p, clean_text_p);
  3887.       else
  3888. #endif
  3889.             edit_fn_declaration (def_dec_p, clean_text_p);
  3890.       }
  3891.   }
  3892.  
  3893.   /* Finalize things.  Output the last trailing part of the original text.  */
  3894.  
  3895.   output_up_to (clean_text_limit - 1);
  3896.  
  3897.   /* If this is just a test run, stop now and just deallocate the buffers.  */
  3898.  
  3899.   if (nochange_flag)
  3900.     {
  3901.       free (new_orig_text_base);
  3902.       free (new_clean_text_base);
  3903.       free (repl_text_base);
  3904.       return;
  3905.     }
  3906.  
  3907.   /* Change the name of the original input file.  This is just a quick way of
  3908.      saving the original file.  */
  3909.  
  3910.   if (!nosave_flag)
  3911.     {
  3912.       char *new_path =
  3913.           (char *) xmalloc (strlen (convert_path) + strlen (save_suffix) + 2);
  3914.   
  3915.       strcpy (new_path, convert_path);
  3916.       strcat (new_path, save_suffix);
  3917.       if (link (convert_path, new_path) == -1)
  3918.         {
  3919.           if (errno == EEXIST)
  3920.             {
  3921.               if (!quiet_flag)
  3922.                 fprintf (stderr, "%s: warning: file `%s' already saved in `%s'\n",
  3923.                   pname,
  3924.                   shortpath (NULL, convert_path),
  3925.                   shortpath (NULL, new_path));
  3926.             }
  3927.           else
  3928.             {
  3929.               fprintf (stderr, "%s: error: can't link file `%s' to `%s': %s\n",
  3930.                 pname,
  3931.                 shortpath (NULL, convert_path),
  3932.                 shortpath (NULL, new_path),
  3933.                 sys_errlist[errno]);
  3934.               return;
  3935.             }
  3936.         }
  3937.     }
  3938.  
  3939.   if (unlink (convert_path) == -1)
  3940.     {
  3941.       fprintf (stderr, "%s: error: can't delete file `%s': %s\n",
  3942.         pname,
  3943.         shortpath (NULL, convert_path),
  3944.         sys_errlist[errno]);
  3945.       return;
  3946.     }
  3947.  
  3948.   {
  3949.     int output_file;
  3950.  
  3951.     /* Open (and create) the output file.  */
  3952.   
  3953.     if ((output_file = open (convert_path, O_CREAT | O_WRONLY, 0777)) == -1)
  3954.       {
  3955.         fprintf (stderr, "%s: error: can't create/open output file `%s': %s\n",
  3956.           pname,
  3957.           shortpath (NULL, convert_path),
  3958.           sys_errlist[errno]);
  3959.         return;
  3960.       }
  3961.   
  3962.     /* Write the output file.  */
  3963.   
  3964.     {
  3965.       unsigned int out_size = (repl_write_ptr + 1) - repl_text_base;
  3966.   
  3967.       if (write (output_file, repl_text_base, out_size) != out_size)
  3968.         fprintf (stderr, "%s: error: while writing file `%s': %s\n",
  3969.           pname, shortpath (NULL, convert_path), sys_errlist[errno]);
  3970.     }
  3971.   
  3972.     close (output_file);
  3973.   }
  3974.  
  3975.   /* Deallocate the conversion buffers.  */
  3976.  
  3977.   free (new_orig_text_base);
  3978.   free (new_clean_text_base);
  3979.   free (repl_text_base);
  3980.  
  3981.   /* Change the mode of the output file to match the original file.  */
  3982.  
  3983.   if (chmod (convert_path, stat_buf.st_mode) == -1)
  3984.     fprintf (stderr, "%s: error: can't change mode of file `%s': %s\n",
  3985.       pname, shortpath (NULL, convert_path), sys_errlist[errno]);
  3986.  
  3987.   /* Note:  We would try to change the owner and group of the output file
  3988.      to match those of the input file here, except that may not be a good
  3989.      thing to do because it might be misleading.  Also, it might not even
  3990.      be possible to do that (on BSD systems with quotas for instance).  */
  3991. }
  3992.  
  3993. /* Do all of the individual steps needed to do the protoization (or
  3994.    unprotoization) of the files referenced in the aux_info files given
  3995.    in the command line.  */
  3996.  
  3997. static void_t
  3998. do_processing (void)
  3999. {
  4000.   const char * const *base_pp;
  4001.   const char * const * const end_pps = &base_source_paths[base_source_files];
  4002.  
  4003. #ifndef UNPROTOIZE
  4004.   int syscalls_len;
  4005. #endif
  4006.  
  4007.   /* One-by-one, check (and create if necessary), open, and read all of the
  4008.      stuff in each aux_info file.  After reading each aux_info file, the
  4009.      aux_info_file just read will be automatically deleted unless the
  4010.      keep_flag is set.  */
  4011.  
  4012.   for (base_pp = base_source_paths; base_pp < end_pps; base_pp++)
  4013.     process_aux_info_file (*base_pp, keep_flag, 0);
  4014.  
  4015. #ifndef UNPROTOIZE
  4016.  
  4017.   /* Also open and read the special SYSCALLS.c aux_info file which gives us
  4018.      the prototypes for all of the standard system-supplied functions.  */
  4019.  
  4020.   if (nondefault_syscalls_dir)
  4021.     {
  4022.       syscalls_pathname
  4023.         = (char *) xmalloc (strlen (nondefault_syscalls_dir)
  4024.                             + strlen (syscalls_filename) + 1);
  4025.       strcpy (syscalls_pathname, nondefault_syscalls_dir);
  4026.     }
  4027.   else
  4028.     {
  4029.       syscalls_pathname
  4030.         = (char *) xmalloc (strlen (default_syscalls_dir)
  4031.                             + strlen (syscalls_filename) + 1);
  4032.       strcpy (syscalls_pathname, default_syscalls_dir);
  4033.     }
  4034.  
  4035.   syscalls_len = strlen (syscalls_pathname);
  4036.   if (*(syscalls_pathname + syscalls_len - 1) != '/')
  4037.     {
  4038.       *(syscalls_pathname + syscalls_len++) = '/';
  4039.       *(syscalls_pathname + syscalls_len) = '\0';
  4040.     }
  4041.   strcat (syscalls_pathname, syscalls_filename);
  4042.   
  4043.   /* Call process_aux_info_file in such a way that it does not try to
  4044.      delete the SYSCALLS aux_info file.  */
  4045.  
  4046.   process_aux_info_file (syscalls_pathname, 1, 1);
  4047.  
  4048. #endif
  4049.  
  4050.   /* When we first read in all of the information from the aux_info files
  4051.      we saved in it decending line number order, because that was likely to
  4052.      be faster.  Now however, we want the chains of def & dec records to
  4053.      appear in ascending line number order as we get further away from the
  4054.      file_info record that they hang from.  The following line causes all of
  4055.      these lists to be rearranged into ascending line number order.  */
  4056.  
  4057.   visit_each_hash_node (pathname_primary, reverse_def_dec_list);
  4058.  
  4059. #ifndef UNPROTOIZE
  4060.  
  4061.   /* Now do the "real" work.  The following line causes each declaration record
  4062.      to be "visited".  For each of these nodes, an attempt is made to match
  4063.      up the function declaration with a corresponding function definition,
  4064.      which should have a full prototype-format formals list with it.  Once
  4065.      these match-ups are made, the conversion of the function declarations
  4066.      to prototype format can be made.  */
  4067.  
  4068.   visit_each_hash_node (function_name_primary, connect_defs_and_decs);
  4069.  
  4070. #endif
  4071.  
  4072.   /* Now convert each file that can be converted (and needs to be).  */
  4073.  
  4074.   visit_each_hash_node (pathname_primary, edit_file);
  4075.  
  4076. #ifndef UNPROTOIZE
  4077.  
  4078.   /* If we are working in cplusplus mode, try to rename all .c files to .C
  4079.      files.  Don't panic if some of the renames don't work.  */
  4080.  
  4081.   if (cplusplus_flag && !nochange_flag)
  4082.     visit_each_hash_node (pathname_primary, rename_c_file);
  4083.  
  4084. #endif
  4085. }
  4086.  
  4087. int
  4088. main (int argc, const char **const argv)
  4089. {
  4090.   const char **argn;
  4091.   const char *option_letter_p;
  4092.  
  4093.   pname = (pname = rindex (argv[0], '/')) ? pname+1 : argv[0];
  4094.  
  4095.   /* On DG/UX 4.10 (AViiON) both getcwd and getwd are supplied, but I don't
  4096.      trust either of them.  Internally, they call fclose() without having
  4097.      first called fopen().  */
  4098.  
  4099.   getwd (cwd_buffer);
  4100.  
  4101.   for (argn = argv+1; *argn; argn++)
  4102.     {
  4103.       if (**argn != '-')
  4104.         base_source_files++;  /* Just count the possible filename args for now.  */
  4105.       else
  4106.         {
  4107.           option_letter_p = (*argn) + 1;
  4108.           if (!*option_letter_p)
  4109.             {
  4110.               fprintf (stderr, "%s: fatal error: invalid option: -\n", pname);
  4111.               errors = -1;
  4112.             }
  4113.           for (;*option_letter_p; option_letter_p++)
  4114.             {
  4115.               switch (*option_letter_p)
  4116.                 {
  4117.                   case 'V':
  4118.                     version_flag = 1;
  4119.                     break;
  4120.                   case 'q':
  4121.                     quiet_flag = 1;
  4122.                     break;
  4123.                   case 'f':
  4124.                     force_flag = 1;
  4125.                     break;
  4126.                   case 'n':
  4127.                     nochange_flag = 1;
  4128.                     keep_flag = 1;
  4129.                     break;
  4130.                   case 'N':
  4131.                     nosave_flag = 1;
  4132.                     break;
  4133.                   case 'k':
  4134.                     keep_flag = 1;
  4135.                     break;
  4136.                   case 'c':
  4137.                     if (*++argn)
  4138.                       {
  4139.                         munge_compile_params (*argn);
  4140.                         *argn = NULL;
  4141.                       }
  4142.                     else
  4143.                       {
  4144.                         fprintf (stderr, "%s: fatal error: missing argument for -c option\n",
  4145.                           pname);
  4146.                         errors++;
  4147.                       }
  4148.                     if (*(option_letter_p + 1))
  4149.                       {
  4150.                         fprintf (stderr, "%s: fatal error: -c must be last in a group\n",
  4151.                           pname);
  4152.                         errors++;
  4153.                       }
  4154.                     break;
  4155. #ifdef UNPROTOIZE
  4156.                   case 'i':
  4157.                     if (*++argn)
  4158.                       {
  4159.                         indent_string = *argn;
  4160.                         *argn = NULL;
  4161.                       }
  4162.                     else
  4163.                       {
  4164.                         fprintf (stderr, "%s: fatal error: missing argument for -i option\n",
  4165.                           pname);
  4166.                         errors++;
  4167.                       }
  4168.                     if (*(option_letter_p + 1))
  4169.                       {
  4170.                         fprintf (stderr, "%s: fatal error: -i must be last in a group\n",
  4171.                           pname);
  4172.                         errors++;
  4173.                       }
  4174.                     break;
  4175. #else
  4176.                   case 'l':
  4177.                     local_flag = 1;
  4178.                     break;
  4179.                   case 'g':
  4180.                     global_flag = 1;
  4181.                     break;
  4182.                   case 'C':
  4183.                     cplusplus_flag = 1;
  4184.                     break;
  4185.                   case 'B':
  4186.                     if (*++argn)
  4187.                       {
  4188.                         nondefault_syscalls_dir = *argn;
  4189.                         *argn = NULL;
  4190.                       }
  4191.                     else
  4192.                       {
  4193.                         fprintf (stderr, "%s: fatal error: missing argument for -B option\n",
  4194.                           pname);
  4195.                         errors++;
  4196.                       }
  4197.                     if (*(option_letter_p + 1))
  4198.                       {
  4199.                         fprintf (stderr, "%s: fatal error: -B must be last in a group\n",
  4200.                           pname);
  4201.                         errors++;
  4202.                       }
  4203.                     break;
  4204. #endif
  4205.                   default:
  4206.                     fprintf (stderr, "%s: fatal error: invalid option: -%c\n",
  4207.                       pname, *option_letter_p);
  4208.                     errors = -1;
  4209.                 }
  4210.             }
  4211.         }
  4212.     }
  4213.  
  4214.   /* Now actually make a list of the base source pathnames.  */
  4215.  
  4216.   base_source_paths =
  4217.     (const char **) xmalloc ((base_source_files + 1) * sizeof (char *));
  4218.   base_source_files = 0;
  4219.   argc--;
  4220.   for (argn = argv+1; argc; argn++, argc--)
  4221.     {
  4222.       if (*argn && **argn != '-')
  4223.         {
  4224.           const char *path = abspath (NULL, *argn);
  4225.           int len = strlen (path);
  4226.  
  4227.           if (path[len-1] == 'c' && path[len-2] == '.')
  4228.             base_source_paths[base_source_files++] = path;
  4229.           else
  4230.             {
  4231.               fprintf (stderr, "%s: fatal error: input pathnames must have .c suffixes: %s\n",
  4232.                 pname, shortpath (NULL, path));
  4233.               errors++;
  4234.             }
  4235.         }
  4236.     }
  4237.  
  4238.   if (errors)
  4239.     usage ();
  4240.   else
  4241.     {
  4242.       if (version_flag)
  4243.         fprintf (stderr, "%s: %s\n", pname, version_string);
  4244.       do_processing ();
  4245.     }
  4246.   if (errors)
  4247.     exit (1);
  4248.   else
  4249.     exit (0);
  4250.   return 1;
  4251. }
  4252.