home *** CD-ROM | disk | FTP | other *** search
/ Club Amiga de Montreal - CAM / CAM_CD_1.iso / files / 278.lha / GnuSed / src / glob.c < prev    next >
C/C++ Source or Header  |  1989-08-08  |  17KB  |  617 lines

  1. /* File-name wildcard pattern matching for GNU.
  2.    Copyright (C) 1985, 1988 Free Software Foundation, Inc.
  3.  
  4.                        NO WARRANTY
  5.  
  6.   BECAUSE THIS PROGRAM IS LICENSED FREE OF CHARGE, WE PROVIDE ABSOLUTELY
  7. NO WARRANTY, TO THE EXTENT PERMITTED BY APPLICABLE STATE LAW.  EXCEPT
  8. WHEN OTHERWISE STATED IN WRITING, FREE SOFTWARE FOUNDATION, INC,
  9. RICHARD M. STALLMAN AND/OR OTHER PARTIES PROVIDE THIS PROGRAM "AS IS"
  10. WITHOUT WARRANTY OF ANY KIND, EITHER EXPRESSED OR IMPLIED, INCLUDING,
  11. BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
  12. FITNESS FOR A PARTICULAR PURPOSE.  THE ENTIRE RISK AS TO THE QUALITY
  13. AND PERFORMANCE OF THE PROGRAM IS WITH YOU.  SHOULD THE PROGRAM PROVE
  14. DEFECTIVE, YOU ASSUME THE COST OF ALL NECESSARY SERVICING, REPAIR OR
  15. CORRECTION.
  16.  
  17.  IN NO EVENT UNLESS REQUIRED BY APPLICABLE LAW WILL RICHARD M.
  18. STALLMAN, THE FREE SOFTWARE FOUNDATION, INC., AND/OR ANY OTHER PARTY
  19. WHO MAY MODIFY AND REDISTRIBUTE THIS PROGRAM AS PERMITTED BELOW, BE
  20. LIABLE TO YOU FOR DAMAGES, INCLUDING ANY LOST PROFITS, LOST MONIES, OR
  21. OTHER SPECIAL, INCIDENTAL OR CONSEQUENTIAL DAMAGES ARISING OUT OF THE
  22. USE OR INABILITY TO USE (INCLUDING BUT NOT LIMITED TO LOSS OF DATA OR
  23. DATA BEING RENDERED INACCURATE OR LOSSES SUSTAINED BY THIRD PARTIES OR
  24. A FAILURE OF THE PROGRAM TO OPERATE WITH ANY OTHER PROGRAMS) THIS
  25. PROGRAM, EVEN IF YOU HAVE BEEN ADVISED OF THE POSSIBILITY OF SUCH
  26. DAMAGES, OR FOR ANY CLAIM BY ANY OTHER PARTY.
  27.  
  28.                 GENERAL PUBLIC LICENSE TO COPY
  29.  
  30.   1. You may copy and distribute verbatim copies of this source file
  31. as you receive it, in any medium, provided that you conspicuously and
  32. appropriately publish on each copy a valid copyright notice "Copyright
  33. (C) 1988 Free Software Foundation, Inc."; and include following the
  34. copyright notice a verbatim copy of the above disclaimer of warranty
  35. and of this License.
  36.  
  37.   2. You may modify your copy or copies of this source file or
  38. any portion of it, and copy and distribute such modifications under
  39. the terms of Paragraph 1 above, provided that you also do the following:
  40.  
  41.     a) cause the modified files to carry prominent notices stating
  42.     that you changed the files and the date of any change; and
  43.  
  44.     b) cause the whole of any work that you distribute or publish,
  45.     that in whole or in part contains or is a derivative of this
  46.     program or any part thereof, to be licensed at no charge to all
  47.     third parties on terms identical to those contained in this
  48.     License Agreement (except that you may choose to grant more extensive
  49.     warranty protection to some or all third parties, at your option).
  50.  
  51.     c) You may charge a distribution fee for the physical act of
  52.     transferring a copy, and you may at your option offer warranty
  53.     protection in exchange for a fee.
  54.  
  55. Mere aggregation of another unrelated program with this program (or its
  56. derivative) on a volume of a storage or distribution medium does not bring
  57. the other program under the scope of these terms.
  58.  
  59.   3. You may copy and distribute this program (or a portion or derivative
  60. of it, under Paragraph 2) in object code or executable form under the terms
  61. of Paragraphs 1 and 2 above provided that you also do one of the following:
  62.  
  63.     a) accompany it with the complete corresponding machine-readable
  64.     source code, which must be distributed under the terms of
  65.     Paragraphs 1 and 2 above; or,
  66.  
  67.     b) accompany it with a written offer, valid for at least three
  68.     years, to give any third party free (except for a nominal
  69.     shipping charge) a complete machine-readable copy of the
  70.     corresponding source code, to be distributed under the terms of
  71.     Paragraphs 1 and 2 above; or,
  72.  
  73.     c) accompany it with the information you received as to where the
  74.     corresponding source code may be obtained.  (This alternative is
  75.     allowed only for noncommercial distribution and only if you
  76.     received the program in object code or executable form alone.)
  77.  
  78. For an executable file, complete source code means all the source code for
  79. all modules it contains; but, as a special exception, it need not include
  80. source code for modules which are standard libraries that accompany the
  81. operating system on which the executable file runs.
  82.  
  83.   4. You may not copy, sublicense, distribute or transfer this program
  84. except as expressly provided under this License Agreement.  Any attempt
  85. otherwise to copy, sublicense, distribute or transfer this program is void and
  86. your rights to use the program under this License agreement shall be
  87. automatically terminated.  However, parties who have received computer
  88. software programs from you with this License Agreement will not have
  89. their licenses terminated so long as such parties remain in full compliance.
  90.  
  91.  
  92. In other words, you are welcome to use, share and improve this program.
  93. You are forbidden to forbid anyone else to use, share and improve
  94. what you give them.   Help stamp out software-hoarding!  */
  95.  
  96.  
  97. /* To whomever it may concern: I have never seen the code which most
  98.  Unix programs use to perform this function.  I wrote this from scratch
  99.  based on specifications for the pattern matching.  */
  100.  
  101. #ifdef AMIGA
  102. #include <exec/types.h>
  103. #else
  104. #include <sys/types.h>
  105. #endif
  106.  
  107. #ifdef AMIGA
  108. #include "dir.h"
  109. #define DP_NAMELEN(x) (x)->d_namlen
  110. #endif
  111.  
  112. #ifdef AZTEC_C
  113. #define bcopy(s, d, n) movmem((s),(d),(n))
  114. #endif
  115.  
  116. #ifdef USG_OLD
  117. #include <ndir.h>
  118. #include <memory.h>
  119. #include <string.h>
  120. #define bcopy(s, d, n) ((void) memcpy ((d), (s), (n)))
  121.  
  122. extern char *memcpy ();
  123.  
  124. #else  /* not USG */
  125.  
  126. #ifdef HPUX
  127. #include <sys/dir.h>
  128. #endif
  129.  
  130. #ifdef USG
  131. #include <sys/dir.h>
  132. #include <dirent.h>
  133. #include <string.h>
  134. #define DP_NAMELEN(x) strlen ((x)->d_name)
  135. #define direct dirent
  136. #else
  137.  
  138. #if unix
  139. #include <sys/dir.h>
  140. #include <strings.h>
  141. extern void bcopy ();
  142. #endif  /* unix */
  143.  
  144. #endif  /* USG */
  145. #endif  /* USG_OLD */
  146.  
  147. #ifndef DP_NAMELEN
  148. #define DP_NAMELEN(x) (x)->d_namlen
  149. #endif
  150.  
  151. #ifdef  sparc
  152. #include <alloca.h>
  153. #else
  154. extern char *alloca ();
  155. #endif  /* sparc */
  156.  
  157. extern char *malloc (), *realloc ();
  158. extern void free ();
  159.  
  160. #ifndef NULL
  161. #define NULL 0
  162. #endif
  163.  
  164.  
  165. #ifdef unix
  166. #define CURRENTDIR "."
  167. #endif
  168.  
  169. #ifdef AMIGA
  170. #define CURRENTDIR ""
  171. #endif
  172.  
  173. /* Global variable which controls whether or not * matches .files.
  174.    Non-zero says no match. */
  175. int noglob_dot_filenames = 1;
  176.  
  177.  
  178. static int glob_match_after_star ();
  179.  
  180. /* Return nonzero if PATTERN has any special globbing chars in it.  */
  181. int
  182. glob_pattern_p (pattern)
  183.      char *pattern;
  184. {
  185.   register char *p = pattern;
  186.   register char c;
  187.  
  188.   while ((c = *p++))
  189.     {
  190.       switch (c)
  191.         {
  192.         case '?':
  193.         case '[':
  194.         case '*':
  195.           return 1;
  196.  
  197.         case '\\':
  198.           if (*p++ == 0) return 0;
  199.         default:
  200.           ;
  201.         }
  202.     }
  203.  
  204.   return 0;
  205. }
  206.  
  207.  
  208. /* Match the pattern PATTERN against the string TEXT;
  209.    return 1 if it matches, 0 otherwise.
  210.  
  211.    A match means the entire string TEXT is used up in matching.
  212.  
  213.    In the pattern string, `*' matches any sequence of characters,
  214.    `?' matches any character, [SET] matches any character in the specified set,
  215.    [^SET] matches any character not in the specified set.
  216.  
  217.    A set is composed of characters or ranges; a range looks like
  218.    character hyphen character (as in 0-9 or A-Z).
  219.    [0-9a-zA-Z_] is the set of characters allowed in C identifiers.
  220.    Any other character in the pattern must be matched exactly.
  221.  
  222.    To suppress the special syntactic significance of any of `[]*?^-\',
  223.    and match the character exactly, precede it with a `\'.
  224.  
  225.    If DOT_SPECIAL is nonzero,
  226.    `*' and `?' do not match `.' at the beginning of TEXT.  */
  227.  
  228. int
  229. glob_match (pattern, text, dot_special)
  230.      char *pattern, *text;
  231.      int dot_special;
  232. {
  233.   register char *p = pattern, *t = text;
  234.   register char c;
  235.  
  236.   while ((c = *p++))
  237.     {
  238.       switch (c)
  239.         {
  240.         case '?':
  241.           if (*t == 0 || (dot_special && t == text && *t == '.')) return 0;
  242.           else ++t;
  243.           break;
  244.  
  245.         case '\\':
  246.           if (*p++ != *t++) return 0;
  247.           break;
  248.  
  249.         case '*':
  250.           if (dot_special && t == text && *t == '.')
  251.             return 0;
  252.           return glob_match_after_star (p, t);
  253.  
  254.         case '[':
  255.           {
  256.             register char c1 = *t++;
  257.             register int invert = (*p == '^');
  258.  
  259.             if (invert) p++;
  260.  
  261.             c = *p++;
  262.             while (1)
  263.               {
  264.                 register char cstart = c, cend = c;
  265.  
  266.                 if (c == '\\')
  267.                   {
  268.                     cstart = *p++; cend = cstart;
  269.                   }
  270.  
  271.                 if (!c) return (0);
  272.  
  273.                 c = *p++;
  274.  
  275.                 if (c == '-')
  276.                   {
  277.                     cend = *p++;
  278.                     if (cend == '\\')
  279.                       cend = *p++;
  280.                     if (!cend) return (0);
  281.                     c = *p++;
  282.                   }
  283.                 if (c1 >= cstart && c1 <= cend) goto match;
  284.                 if (c == ']')
  285.                   break;
  286.               }
  287.             if (!invert) return 0;
  288.             break;
  289.  
  290.           match:
  291.             /* Skip the rest of the [...] construct that already matched.  */
  292.             while (c != ']')
  293.               {
  294.                 if (!c || !(c = *p++)) return (0);
  295.                 if (c == '\\') p++;
  296.               }
  297.             if (invert) return 0;
  298.             break;
  299.           }
  300.  
  301.         default:
  302.           if (c != *t++) return 0;
  303.         }
  304.     }
  305.  
  306.   if (*t) return 0;
  307.   return 1;
  308. }
  309.  
  310. /* Like glob_match, but match PATTERN against any final segment of TEXT.  */
  311.  
  312. static int
  313. glob_match_after_star (pattern, text)
  314.      char *pattern, *text;
  315. {
  316.   register char *p = pattern, *t = text;
  317.   register char c, c1;
  318.  
  319.   while ((c = *p++) == '?' || c == '*')
  320.     {
  321.       if (c == '?' && *t++ == 0)
  322.         return 0;
  323.     }
  324.  
  325.   if (c == 0)
  326.     return 1;
  327.  
  328.   if (c == '\\') c1 = *p;
  329.   else c1 = c;
  330.  
  331.   for (;;)
  332.     {
  333.       if ((c == '[' || *t == c1)
  334.           && glob_match (p - 1, t, 0))
  335.         return 1;
  336.       if (*t++ == 0) return 0;
  337.     }
  338. }
  339.  
  340. /* Return a vector of names of files in directory DIR
  341.    whose names match glob pattern PAT.
  342.    The names are not in any particular order.
  343.    Wildcards at the beginning of PAT do not match an initial period.
  344.  
  345.    The vector is terminated by an element that is a null pointer.
  346.  
  347.    To free the space allocated, first free the vector's elements,
  348.    then free the vector.
  349.  
  350.    Return 0 if cannot get enough memory to hold the pointer
  351.    and the names.
  352.  
  353.    Return -1 if cannot access directory DIR.
  354.    Look in errno for more information.  */
  355.  
  356. char **
  357. glob_vector (pat, dir)
  358.      char *pat;
  359.      char *dir;
  360. {
  361.   struct globval
  362.     {
  363.       struct globval *next;
  364.       char *name;
  365.     };
  366.  
  367.   DIR *d;
  368.   register struct direct *dp;
  369.   struct globval *lastlink;
  370.   register struct globval *nextlink;
  371.   register char *nextname;
  372.   int count;
  373.   int lose;
  374.   register char **name_vector;
  375.   register int i;
  376.  
  377.   if (!(d = opendir (dir)))
  378.     return (char **) -1;
  379.  
  380.   lastlink = 0;
  381.   count = 0;
  382.   lose = 0;
  383.  
  384.   /* Scan the directory, finding all names that match.
  385.      For each name that matches, allocate a struct globval
  386.      on the stack and store the name in it.
  387.      Chain those structs together; lastlink is the front of the chain.  */
  388.   /* Loop reading blocks */
  389.   while (1)
  390.     {
  391.       dp = readdir (d);
  392.       if (!dp) break;
  393.  
  394.       if (dp->d_ino && glob_match (pat, dp->d_name, noglob_dot_filenames))
  395.         {
  396.           nextlink = (struct globval *) alloca (sizeof (struct globval));
  397.           nextlink->next = lastlink;
  398.           nextname = (char *) malloc (DP_NAMELEN (dp) + 1);
  399.           if (!nextname)
  400.             {
  401.               lose = 1;
  402.               break;
  403.             }
  404.           lastlink = nextlink;
  405.           nextlink->name = nextname;
  406.           bcopy (dp->d_name, nextname, DP_NAMELEN(dp) + 1);
  407.           count++;
  408.         }
  409.     }
  410.   closedir (d);
  411.  
  412.   name_vector = (char **) malloc ((count + 1) * sizeof (char *));
  413.  
  414.   /* Have we run out of memory?  */
  415.   if (!name_vector || lose)
  416.     {
  417.       /* Here free the strings we have got */
  418.       while (lastlink)
  419.         {
  420.           free (lastlink->name);
  421.           lastlink = lastlink->next;
  422.         }
  423.       return 0;
  424.     }
  425.  
  426.   /* Copy the name pointers from the linked list into the vector */
  427.   for (i = 0; i < count; i++)
  428.     {
  429.       name_vector[i] = lastlink->name;
  430.       lastlink = lastlink->next;
  431.     }
  432.  
  433.   name_vector[count] = 0;
  434.   return name_vector;
  435. }
  436.  
  437. /* Return a new array which is the concatenation of each string in
  438.    ARRAY to DIR. */
  439.  
  440. static char **
  441. glob_dir_to_array (dir, array)
  442.      char *dir, **array;
  443. {
  444.   register int i, l;
  445.   int add_slash = 0;
  446.   char **result;
  447.  
  448.   l = strlen (dir);
  449.   if (!l) return (array);
  450.  
  451.   if (dir[l - 1] != '/') add_slash++;
  452.  
  453.   for (i = 0; array[i]; i++);
  454.  
  455.   result = (char **)malloc ((1 + i) * sizeof (char *));
  456.   if (!result) return (result);
  457.  
  458.   for (i = 0; array[i]; i++) {
  459.     result[i] = (char *)malloc (1 + l + add_slash + strlen (array[i]));
  460.     if (!result[i]) return (char **)NULL;
  461.     strcpy (result[i], dir);
  462.     if (add_slash) strcat (result[i], "/");
  463.     strcat (result[i], array[i]);
  464.   }
  465.   result[i] = (char *)NULL;
  466.  
  467.   /* Free the input array. */
  468.   for (i = 0; array[i]; i++) free (array[i]);
  469.   free (array);
  470.   return (result);
  471. }
  472.  
  473. /* Do globbing on PATHNAME.  Return an array of pathnames that match,
  474.    marking the end of the array with a null-pointer as an element.
  475.    If no pathnames match, then the array is empty (first element is null).
  476.    If there isn't enough memory, then return NULL.
  477.    If a file system error occurs, return -1; `errno' has the error code.
  478.  
  479.    Wildcards at the beginning of PAT, or following a slash,
  480.    do not match an initial period.  */
  481.  
  482. char **
  483. glob_filename (pathname)
  484.      char *pathname;
  485. {
  486.   char **result = (char **)malloc (1 * sizeof (char *));
  487.   int i, result_size = 1;
  488.   char *directory_name, *filename;
  489.  
  490.   if (result) result[0] = (char *)NULL;
  491.   else return (result);
  492.  
  493.   /* Find the filename. */
  494.   i = strlen (pathname) - 1;
  495.  
  496. look_again:
  497.   while (i > -1 && pathname[i] != '/') i--;
  498.   if (i > 0 && pathname[i - 1] == '\\')
  499.     {
  500.       --i;
  501.       goto look_again;
  502.     }
  503.   i++;
  504.  
  505.   filename = (char *)alloca (strlen (pathname) - i + 1);
  506.   directory_name = (char *)alloca (i + 1);
  507.  
  508.   if (!filename || !directory_name)
  509.     {
  510.     memory_error:
  511.       if (result)
  512.         {
  513.           for (i = 0; result[i]; i++)
  514.             free (result[i]);
  515.           free (result);
  516.         }
  517.       return (char **)NULL;
  518.     }
  519.  
  520.   strcpy (filename, pathname + i);
  521.   strncpy (directory_name, pathname, i);
  522.   directory_name[i] = '\0';
  523.  
  524.   /* If directory_name contains globbing characters, then we have
  525.      to expand the previous levels.  Just recurse. */
  526.  
  527.   if (glob_pattern_p (directory_name))
  528.     {
  529.       char **directories;
  530.  
  531.       if (directory_name[i - 1] == '/')
  532.         directory_name[i - 1] = '\0';
  533.  
  534.       directories = glob_filename (directory_name);
  535.  
  536.       if (directories == (char **)NULL) goto memory_error;
  537.       if ((directories == (char **)-1) || !(*directories))
  538.         return (directories);
  539.  
  540.       /* We have successfully globbed the preceding directory name.
  541.          For each name in DIRECTORIES, call glob_vector on it and
  542.          FILENAME.  Concatenate the results together. */
  543.       for (i = 0; directories[i]; i++)
  544.         {
  545.           char **temp_results = glob_vector (filename, directories[i]);
  546.           /* Handle error cases ... */
  547.           if (!temp_results) goto memory_error;
  548.           if (temp_results == (char **)-1)
  549.             {
  550.               /* This filename is probably not a directory.  Ignore it. */
  551.             }
  552.           else
  553.             {
  554.               char **array = glob_dir_to_array (directories[i], temp_results);
  555.               register int l = 0;
  556.  
  557.               while (array[l]) l++;
  558.  
  559.               result =
  560.                 (char **)realloc (result, (result_size + l) * sizeof (char *));
  561.               for (l = 0; array[l]; l++, result_size++)
  562.                 result[result_size - 1] = array[l];
  563.               result[result_size - 1] = (char *)NULL;
  564.               free (array);     /* DO NOT FREE THE STRINGS, THOUGH! */
  565.             }
  566.         }
  567.       /* Free the directories. */
  568.       for (i = 0; directories[i]; i++)
  569.         free (directories[i]);
  570.       free (directories);
  571.     }
  572.   else
  573.     {
  574.       /* Otherwise, just return what glob_vector returns appended to
  575.          the directory name. */
  576.       char **temp_results;
  577.  
  578.       if (*directory_name)
  579.         temp_results = glob_vector (filename, directory_name);
  580.       else
  581.         temp_results = glob_vector (filename, CURRENTDIR);
  582.  
  583.       if (!temp_results || ((int)temp_results) == -1)
  584.         return temp_results;
  585.  
  586.       result = glob_dir_to_array (directory_name, temp_results);
  587.     }
  588.   return result;
  589. }
  590.  
  591.  
  592.  
  593. #ifdef TEST
  594.  
  595. main (argc, argv)
  596.      int argc;
  597.      char **argv;
  598. {
  599.   char **value;
  600.   int i, index = 1;
  601.  
  602.   while (index < argc) {
  603.     value = glob_filename (argv[index]);
  604.     if ((int) value == 0)
  605.       printf ("Memory exhausted.\n");
  606.     else if ((int) value == -1)
  607.       perror (argv[index]);
  608.     else
  609.       for (i = 0; value[i]; i++)
  610.         printf ("%s\n", value[i]);
  611.     index++;
  612.   }
  613.   return 0;
  614. }
  615.  
  616. #endif /* TEST */
  617.