home *** CD-ROM | disk | FTP | other *** search
/ OS/2 Shareware BBS: 10 Tools / 10-Tools.zip / PERL4036.ZIP / toke.c < prev    next >
C/C++ Source or Header  |  1993-02-08  |  62KB  |  2,762 lines

  1. /* $RCSfile: toke.c,v $$Revision: 4.0.1.9 $$Date: 1993/02/05 19:48:43 $
  2.  *
  3.  *    Copyright (c) 1991, Larry Wall
  4.  *
  5.  *    You may distribute under the terms of either the GNU General Public
  6.  *    License or the Artistic License, as specified in the README file.
  7.  *
  8.  * $Log: toke.c,v $
  9.  * Revision 4.0.1.9  1993/02/05  19:48:43  lwall
  10.  * patch36: now detects ambiguous use of filetest operators as well as unary
  11.  * patch36: fixed ambiguity on - within tr///
  12.  *
  13.  * Revision 4.0.1.8  92/06/23  12:33:45  lwall
  14.  * patch35: bad interaction between backslash and hyphen in tr///
  15.  * 
  16.  * Revision 4.0.1.7  92/06/11  21:16:30  lwall
  17.  * patch34: expectterm incorrectly set to indicate start of program or block
  18.  * 
  19.  * Revision 4.0.1.6  92/06/08  16:03:49  lwall
  20.  * patch20: an EXPR may now start with a bareword
  21.  * patch20: print $fh EXPR can now expect term rather than operator in EXPR
  22.  * patch20: added ... as variant on ..
  23.  * patch20: new warning on spurious backslash
  24.  * patch20: new warning on missing $ for foreach variable
  25.  * patch20: "foo"x1024 now legal without space after x
  26.  * patch20: new warning on print accidentally used as function
  27.  * patch20: tr/stuff// wasn't working right
  28.  * patch20: 2. now eats the dot
  29.  * patch20: <@ARGV> now notices @ARGV
  30.  * patch20: tr/// now lets you say \-
  31.  * 
  32.  * Revision 4.0.1.5  91/11/11  16:45:51  lwall
  33.  * patch19: default arg for shift was wrong after first subroutine definition
  34.  * 
  35.  * Revision 4.0.1.4  91/11/05  19:02:48  lwall
  36.  * patch11: \x and \c were subject to double interpretation in regexps
  37.  * patch11: prepared for ctype implementations that don't define isascii()
  38.  * patch11: nested list operators could miscount parens
  39.  * patch11: once-thru blocks didn't display right in the debugger
  40.  * patch11: sort eval "whatever" didn't work
  41.  * patch11: underscore is now allowed within literal octal and hex numbers
  42.  * 
  43.  * Revision 4.0.1.3  91/06/10  01:32:26  lwall
  44.  * patch10: m'$foo' now treats string as single quoted
  45.  * patch10: certain pattern optimizations were botched
  46.  * 
  47.  * Revision 4.0.1.2  91/06/07  12:05:56  lwall
  48.  * patch4: new copyright notice
  49.  * patch4: debugger lost track of lines in eval
  50.  * patch4: //o and s///o now optimize themselves fully at runtime
  51.  * patch4: added global modifier for pattern matches
  52.  * 
  53.  * Revision 4.0.1.1  91/04/12  09:18:18  lwall
  54.  * patch1: perl -de "print" wouldn't stop at the first statement
  55.  * 
  56.  * Revision 4.0  91/03/20  01:42:14  lwall
  57.  * 4.0 baseline.
  58.  * 
  59.  */
  60.  
  61. #include "EXTERN.h"
  62. #include "perl.h"
  63. #include "perly.h"
  64.  
  65. static void set_csh();
  66.  
  67. #ifdef I_FCNTL
  68. #include <fcntl.h>
  69. #endif
  70. #ifdef I_SYS_FILE
  71. #include <sys/file.h>
  72. #endif
  73.  
  74. #ifdef f_next
  75. #undef f_next
  76. #endif
  77.  
  78. /* which backslash sequences to keep in m// or s// */
  79.  
  80. static char *patleave = "\\.^$@dDwWsSbB+*?|()-nrtfeaxc0123456789[{]}";
  81.  
  82. char *reparse;        /* if non-null, scanident found ${foo[$bar]} */
  83.  
  84. void checkcomma();
  85.  
  86. #ifdef CLINE
  87. #undef CLINE
  88. #endif
  89. #define CLINE (cmdline = (curcmd->c_line < cmdline ? curcmd->c_line : cmdline))
  90.  
  91. #ifdef atarist
  92. #define PERL_META(c) ((c) | 128)
  93. #else
  94. #define META(c) ((c) | 128)
  95. #endif
  96.  
  97. #define RETURN(retval) return (bufptr = s,(int)retval)
  98. #define OPERATOR(retval) return (expectterm = TRUE,bufptr = s,(int)retval)
  99. #define TERM(retval) return (CLINE, expectterm = FALSE,bufptr = s,(int)retval)
  100. #define LOOPX(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)LOOPEX)
  101. #define FTST(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)FILETEST)
  102. #define FUN0(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC0)
  103. #define FUN1(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC1)
  104. #define FUN2(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC2)
  105. #define FUN2x(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC2x)
  106. #define FUN3(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC3)
  107. #define FUN4(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC4)
  108. #define FUN5(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC5)
  109. #define FL(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FLIST)
  110. #define FL2(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FLIST2)
  111. #define HFUN(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)HSHFUN)
  112. #define HFUN3(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)HSHFUN3)
  113. #define LFUN(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)LVALFUN)
  114. #define AOP(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)ADDOP)
  115. #define MOP(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)MULOP)
  116. #define EOP(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)EQOP)
  117. #define ROP(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)RELOP)
  118. #define FOP(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FILOP)
  119. #define FOP2(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FILOP2)
  120. #define FOP3(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FILOP3)
  121. #define FOP4(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FILOP4)
  122. #define FOP22(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FILOP22)
  123. #define FOP25(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FILOP25)
  124.  
  125. static char *last_uni;
  126.  
  127. /* This bit of chicanery makes a unary function followed by
  128.  * a parenthesis into a function with one argument, highest precedence.
  129.  */
  130. #define UNI(f) return(yylval.ival = f, \
  131.     expectterm = TRUE, \
  132.     bufptr = s, \
  133.     last_uni = oldbufptr, \
  134.     (*s == '(' || (s = skipspace(s), *s == '(') ? (int)FUNC1 : (int)UNIOP) )
  135.  
  136. /* This does similarly for list operators, merely by pretending that the
  137.  * paren came before the listop rather than after.
  138.  */
  139. #ifdef atarist
  140. #define LOP(f) return(CLINE, *s == '(' || (s = skipspace(s), *s == '(') ? \
  141.     (*s = (char) PERL_META('('), bufptr = oldbufptr, '(') : \
  142.     (yylval.ival=f,expectterm = TRUE,bufptr = s,(int)LISTOP))
  143. #else
  144. #define LOP(f) return(CLINE, *s == '(' || (s = skipspace(s), *s == '(') ? \
  145.     (*s = (char) META('('), bufptr = oldbufptr, '(') : \
  146.     (yylval.ival=f,expectterm = TRUE,bufptr = s,(int)LISTOP))
  147. #endif
  148. /* grandfather return to old style */
  149. #define OLDLOP(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)LISTOP)
  150.  
  151. char *
  152. skipspace(s)
  153. register char *s;
  154. {
  155.     while (s < bufend && isSPACE(*s))
  156.     s++;
  157.     return s;
  158. }
  159.  
  160. void
  161. check_uni() {
  162.     char *s;
  163.     char ch;
  164.  
  165.     if (oldoldbufptr != last_uni)
  166.     return;
  167.     while (isSPACE(*last_uni))
  168.     last_uni++;
  169.     for (s = last_uni; isALNUM(*s) || *s == '-'; s++) ;
  170.     ch = *s;
  171.     *s = '\0';
  172.     warn("Warning: Use of \"%s\" without parens is ambiguous", last_uni);
  173.     *s = ch;
  174. }
  175.  
  176. #ifdef CRIPPLED_CC
  177.  
  178. #undef UNI
  179. #undef LOP
  180. #define UNI(f) return uni(f,s)
  181. #define LOP(f) return lop(f,s)
  182.  
  183. int
  184. uni(f,s)
  185. int f;
  186. char *s;
  187. {
  188.     yylval.ival = f;
  189.     expectterm = TRUE;
  190.     bufptr = s;
  191.     last_uni = oldbufptr;
  192.     if (*s == '(')
  193.     return FUNC1;
  194.     s = skipspace(s);
  195.     if (*s == '(')
  196.     return FUNC1;
  197.     else
  198.     return UNIOP;
  199. }
  200.  
  201. int
  202. lop(f,s)
  203. int f;
  204. char *s;
  205. {
  206.     CLINE;
  207.     if (*s != '(')
  208.     s = skipspace(s);
  209.     if (*s == '(') {
  210. #ifdef atarist
  211.     *s = PERL_META('(');
  212. #else
  213.     *s = META('(');
  214. #endif
  215.     bufptr = oldbufptr;
  216.     return '(';
  217.     }
  218.     else {
  219.     yylval.ival=f;
  220.     expectterm = TRUE;
  221.     bufptr = s;
  222.     return LISTOP;
  223.     }
  224. }
  225.  
  226. #endif /* CRIPPLED_CC */
  227.  
  228. int
  229. yylex()
  230. {
  231.     register char *s = bufptr;
  232.     register char *d;
  233.     register int tmp;
  234.     static bool in_format = FALSE;
  235.     static bool firstline = TRUE;
  236.     extern int yychar;        /* last token */
  237.  
  238.     oldoldbufptr = oldbufptr;
  239.     oldbufptr = s;
  240.  
  241.   retry:
  242. #ifdef YYDEBUG
  243.     if (debug & 1)
  244.     if (index(s,'\n'))
  245.         fprintf(stderr,"Tokener at %s",s);
  246.     else
  247.         fprintf(stderr,"Tokener at %s\n",s);
  248. #endif
  249. #ifdef BADSWITCH
  250.     if (*s & 128) {
  251.     if ((*s & 127) == '(') {
  252.         *s++ = '(';
  253.         oldbufptr = s;
  254.     }
  255.     else if ((*s & 127) == '}') {
  256.         *s++ = '}';
  257.         RETURN('}');
  258.     }
  259.     else
  260.         warn("Unrecognized character \\%03o ignored", *s++ & 255);
  261.     goto retry;
  262.     }
  263. #endif
  264.     switch (*s) {
  265.     default:
  266.     if ((*s & 127) == '(') {
  267.         *s++ = '(';
  268.         oldbufptr = s;
  269.     }
  270.     else if ((*s & 127) == '}') {
  271.         *s++ = '}';
  272.         RETURN('}');
  273.     }
  274.     else
  275.         warn("Unrecognized character \\%03o ignored", *s++ & 255);
  276.     goto retry;
  277.     case 4:
  278.     case 26:
  279.     goto fake_eof;            /* emulate EOF on ^D or ^Z */
  280.     case 0:
  281.     if (!rsfp)
  282.         RETURN(0);
  283.     if (s++ < bufend)
  284.         goto retry;            /* ignore stray nulls */
  285.     last_uni = 0;
  286.     if (firstline) {
  287.         firstline = FALSE;
  288.         if (minus_n || minus_p || perldb) {
  289.         str_set(linestr,"");
  290.         if (perldb) {
  291.             char *getenv();
  292.             char *pdb = getenv("PERLDB");
  293.  
  294.             str_cat(linestr, pdb ? pdb : "require 'perldb.pl'");
  295.             str_cat(linestr, ";");
  296.         }
  297.         if (minus_n || minus_p) {
  298.             str_cat(linestr,"line: while (<>) {");
  299.             if (minus_l)
  300.             str_cat(linestr,"chop;");
  301.             if (minus_a)
  302.             str_cat(linestr,"@F=split(' ');");
  303.         }
  304.         oldoldbufptr = oldbufptr = s = str_get(linestr);
  305.         bufend = linestr->str_ptr + linestr->str_cur;
  306.         goto retry;
  307.         }
  308.     }
  309.     if (in_format) {
  310.         bufptr = bufend;
  311.         yylval.formval = load_format();
  312.         in_format = FALSE;
  313.         oldoldbufptr = oldbufptr = s = str_get(linestr) + 1;
  314.         bufend = linestr->str_ptr + linestr->str_cur;
  315.         OPERATOR(FORMLIST);
  316.     }
  317.     curcmd->c_line++;
  318. #ifdef CRYPTSCRIPT
  319.     cryptswitch();
  320. #endif /* CRYPTSCRIPT */
  321.     do {
  322.         if ((s = str_gets(linestr, rsfp, 0)) == Nullch) {
  323.           fake_eof:
  324.         if (rsfp) {
  325.             if (preprocess)
  326.             (void)mypclose(rsfp);
  327.             else if ((FILE*)rsfp == stdin)
  328.             clearerr(stdin);
  329.             else
  330.             (void)fclose(rsfp);
  331.             rsfp = Nullfp;
  332.         }
  333.         if (minus_n || minus_p) {
  334.             str_set(linestr,minus_p ? ";}continue{print" : "");
  335.             str_cat(linestr,";}");
  336.             oldoldbufptr = oldbufptr = s = str_get(linestr);
  337.             bufend = linestr->str_ptr + linestr->str_cur;
  338.             minus_n = minus_p = 0;
  339.             goto retry;
  340.         }
  341.         oldoldbufptr = oldbufptr = s = str_get(linestr);
  342.         str_set(linestr,"");
  343.         RETURN(';');    /* not infinite loop because rsfp is NULL now */
  344.         }
  345.         if (doextract && *linestr->str_ptr == '#')
  346.         doextract = FALSE;
  347.     } while (doextract);
  348.     oldoldbufptr = oldbufptr = bufptr = s;
  349.     if (perldb) {
  350.         STR *str = Str_new(85,0);
  351.  
  352.         str_sset(str,linestr);
  353.         astore(stab_xarray(curcmd->c_filestab),(int)curcmd->c_line,str);
  354.     }
  355. #ifdef DEBUG
  356.     if (firstline) {
  357.         char *showinput();
  358.         s = showinput();
  359.     }
  360. #endif
  361.     bufend = linestr->str_ptr + linestr->str_cur;
  362.     if (curcmd->c_line == 1) {
  363.         if (*s == '#' && s[1] == '!') {
  364.         if (!in_eval && !instr(s,"perl") && instr(origargv[0],"perl")) {
  365.             char **newargv;
  366.             char *cmd;
  367.  
  368.             s += 2;
  369.             if (*s == ' ')
  370.             s++;
  371.             cmd = s;
  372.             while (s < bufend && !isSPACE(*s))
  373.             s++;
  374.             *s++ = '\0';
  375.             while (s < bufend && isSPACE(*s))
  376.             s++;
  377.             if (s < bufend) {
  378.             Newz(899,newargv,origargc+3,char*);
  379.             newargv[1] = s;
  380.             while (s < bufend && !isSPACE(*s))
  381.                 s++;
  382.             *s = '\0';
  383.             Copy(origargv+1, newargv+2, origargc+1, char*);
  384.             }
  385.             else
  386.             newargv = origargv;
  387.             newargv[0] = cmd;
  388.             execv(cmd,newargv);
  389.             fatal("Can't exec %s", cmd);
  390.         }
  391.         }
  392.         else {
  393.         while (s < bufend && isSPACE(*s))
  394.             s++;
  395.         if (*s == ':')    /* for csh's that have to exec sh scripts */
  396.             s++;
  397.         }
  398.     }
  399.     goto retry;
  400.     case ' ': case '\t': case '\f': case '\r': case 013:
  401.     s++;
  402.     goto retry;
  403.     case '#':
  404.     if (preprocess && s == str_get(linestr) &&
  405.            s[1] == ' ' && (isDIGIT(s[2]) || strnEQ(s+2,"line ",5)) ) {
  406.         while (*s && !isDIGIT(*s))
  407.         s++;
  408.         curcmd->c_line = atoi(s)-1;
  409.         while (isDIGIT(*s))
  410.         s++;
  411.         d = bufend;
  412.         while (s < d && isSPACE(*s)) s++;
  413.         s[strlen(s)-1] = '\0';    /* wipe out newline */
  414.         if (*s == '"') {
  415.         s++;
  416.         s[strlen(s)-1] = '\0';    /* wipe out trailing quote */
  417.         }
  418.         if (*s)
  419.         curcmd->c_filestab = fstab(s);
  420.         else
  421.         curcmd->c_filestab = fstab(origfilename);
  422.         oldoldbufptr = oldbufptr = s = str_get(linestr);
  423.     }
  424.     /* FALL THROUGH */
  425.     case '\n':
  426.     if (in_eval && !rsfp) {
  427.         d = bufend;
  428.         while (s < d && *s != '\n')
  429.         s++;
  430.         if (s < d)
  431.         s++;
  432.         if (in_format) {
  433.         bufptr = s;
  434.         yylval.formval = load_format();
  435.         in_format = FALSE;
  436.         oldoldbufptr = oldbufptr = s = bufptr + 1;
  437.         TERM(FORMLIST);
  438.         }
  439.         curcmd->c_line++;
  440.     }
  441.     else {
  442.         *s = '\0';
  443.         bufend = s;
  444.     }
  445.     goto retry;
  446.     case '-':
  447.     if (s[1] && isALPHA(s[1]) && !isALPHA(s[2])) {
  448.         s++;
  449.         last_uni = oldbufptr;
  450.         switch (*s++) {
  451.         case 'r': FTST(O_FTEREAD);
  452.         case 'w': FTST(O_FTEWRITE);
  453.         case 'x': FTST(O_FTEEXEC);
  454.         case 'o': FTST(O_FTEOWNED);
  455.         case 'R': FTST(O_FTRREAD);
  456.         case 'W': FTST(O_FTRWRITE);
  457.         case 'X': FTST(O_FTREXEC);
  458.         case 'O': FTST(O_FTROWNED);
  459.         case 'e': FTST(O_FTIS);
  460.         case 'z': FTST(O_FTZERO);
  461.         case 's': FTST(O_FTSIZE);
  462.         case 'f': FTST(O_FTFILE);
  463.         case 'd': FTST(O_FTDIR);
  464.         case 'l': FTST(O_FTLINK);
  465.         case 'p': FTST(O_FTPIPE);
  466.         case 'S': FTST(O_FTSOCK);
  467.         case 'u': FTST(O_FTSUID);
  468.         case 'g': FTST(O_FTSGID);
  469.         case 'k': FTST(O_FTSVTX);
  470.         case 'b': FTST(O_FTBLK);
  471.         case 'c': FTST(O_FTCHR);
  472.         case 't': FTST(O_FTTTY);
  473.         case 'T': FTST(O_FTTEXT);
  474.         case 'B': FTST(O_FTBINARY);
  475.         case 'M': stabent("\024",TRUE); FTST(O_FTMTIME);
  476.         case 'A': stabent("\024",TRUE); FTST(O_FTATIME);
  477.         case 'C': stabent("\024",TRUE); FTST(O_FTCTIME);
  478.         default:
  479.         s -= 2;
  480.         break;
  481.         }
  482.     }
  483.     tmp = *s++;
  484.     if (*s == tmp) {
  485.         s++;
  486.         RETURN(DEC);
  487.     }
  488.     if (expectterm) {
  489.         if (isSPACE(*s) || !isSPACE(*bufptr))
  490.         check_uni();
  491.         OPERATOR('-');
  492.     }
  493.     else
  494.         AOP(O_SUBTRACT);
  495.     case '+':
  496.     tmp = *s++;
  497.     if (*s == tmp) {
  498.         s++;
  499.         RETURN(INC);
  500.     }
  501.     if (expectterm) {
  502.         if (isSPACE(*s) || !isSPACE(*bufptr))
  503.         check_uni();
  504.         OPERATOR('+');
  505.     }
  506.     else
  507.         AOP(O_ADD);
  508.  
  509.     case '*':
  510.     if (expectterm) {
  511.         check_uni();
  512.         s = scanident(s,bufend,tokenbuf);
  513.         yylval.stabval = stabent(tokenbuf,TRUE);
  514.         TERM(STAR);
  515.     }
  516.     tmp = *s++;
  517.     if (*s == tmp) {
  518.         s++;
  519.         OPERATOR(POW);
  520.     }
  521.     MOP(O_MULTIPLY);
  522.     case '%':
  523.     if (expectterm) {
  524.         if (!isALPHA(s[1]))
  525.         check_uni();
  526.         s = scanident(s,bufend,tokenbuf);
  527.         yylval.stabval = hadd(stabent(tokenbuf,TRUE));
  528.         TERM(HSH);
  529.     }
  530.     s++;
  531.     MOP(O_MODULO);
  532.  
  533.     case '^':
  534.     case '~':
  535.     case '(':
  536.     case ',':
  537.     case ':':
  538.     case '[':
  539.     tmp = *s++;
  540.     OPERATOR(tmp);
  541.     case '{':
  542.     tmp = *s++;
  543.     yylval.ival = curcmd->c_line;
  544.     if (isSPACE(*s) || *s == '#')
  545.         cmdline = NOLINE;   /* invalidate current command line number */
  546.     expectterm = 2;
  547.     RETURN(tmp);
  548.     case ';':
  549.     if (curcmd->c_line < cmdline)
  550.         cmdline = curcmd->c_line;
  551.     tmp = *s++;
  552.     OPERATOR(tmp);
  553.     case ')':
  554.     case ']':
  555.     tmp = *s++;
  556.     TERM(tmp);
  557.     case '}':
  558.     *s |= 128;
  559.     RETURN(';');
  560.     case '&':
  561.     s++;
  562.     tmp = *s++;
  563.     if (tmp == '&')
  564.         OPERATOR(ANDAND);
  565.     s--;
  566.     if (expectterm) {
  567.         d = bufend;
  568.         while (s < d && isSPACE(*s))
  569.         s++;
  570.         if (isALPHA(*s) || *s == '_' || *s == '\'')
  571.         *(--s) = '\\';    /* force next ident to WORD */
  572.         else
  573.         check_uni();
  574.         OPERATOR(AMPER);
  575.     }
  576.     OPERATOR('&');
  577.     case '|':
  578.     s++;
  579.     tmp = *s++;
  580.     if (tmp == '|')
  581.         OPERATOR(OROR);
  582.     s--;
  583.     OPERATOR('|');
  584.     case '=':
  585.     s++;
  586.     tmp = *s++;
  587.     if (tmp == '=')
  588.         EOP(O_EQ);
  589.     if (tmp == '~')
  590.         OPERATOR(MATCH);
  591.     s--;
  592.     OPERATOR('=');
  593.     case '!':
  594.     s++;
  595.     tmp = *s++;
  596.     if (tmp == '=')
  597.         EOP(O_NE);
  598.     if (tmp == '~')
  599.         OPERATOR(NMATCH);
  600.     s--;
  601.     OPERATOR('!');
  602.     case '<':
  603.     if (expectterm) {
  604.         if (s[1] != '<' && !index(s,'>'))
  605.         check_uni();
  606.         s = scanstr(s, SCAN_DEF);
  607.         TERM(RSTRING);
  608.     }
  609.     s++;
  610.     tmp = *s++;
  611.     if (tmp == '<')
  612.         OPERATOR(LS);
  613.     if (tmp == '=') {
  614.         tmp = *s++;
  615.         if (tmp == '>')
  616.         EOP(O_NCMP);
  617.         s--;
  618.         ROP(O_LE);
  619.     }
  620.     s--;
  621.     ROP(O_LT);
  622.     case '>':
  623.     s++;
  624.     tmp = *s++;
  625.     if (tmp == '>')
  626.         OPERATOR(RS);
  627.     if (tmp == '=')
  628.         ROP(O_GE);
  629.     s--;
  630.     ROP(O_GT);
  631.  
  632. #define SNARFWORD \
  633.     d = tokenbuf; \
  634.     while (isALNUM(*s) || *s == '\'') \
  635.         *d++ = *s++; \
  636.     while (d[-1] == '\'') \
  637.         d--,s--; \
  638.     *d = '\0'; \
  639.     d = tokenbuf;
  640.  
  641.     case '$':
  642.     if (s[1] == '#' && (isALPHA(s[2]) || s[2] == '_')) {
  643.         s++;
  644.         s = scanident(s,bufend,tokenbuf);
  645.         yylval.stabval = aadd(stabent(tokenbuf,TRUE));
  646.         TERM(ARYLEN);
  647.     }
  648.     d = s;
  649.     s = scanident(s,bufend,tokenbuf);
  650.     if (reparse) {        /* turn ${foo[bar]} into ($foo[bar]) */
  651.       do_reparse:
  652.         s[-1] = ')';
  653.         s = d;
  654.         s[1] = s[0];
  655.         s[0] = '(';
  656.         goto retry;
  657.     }
  658.     yylval.stabval = stabent(tokenbuf,TRUE);
  659.     expectterm = FALSE;
  660.     if (isSPACE(*s) && oldoldbufptr && oldoldbufptr < bufptr) {
  661.         s++;
  662.         while (isSPACE(*oldoldbufptr))
  663.         oldoldbufptr++;
  664.         if (*oldoldbufptr == 'p' && strnEQ(oldoldbufptr,"print",5)) {
  665.         if (index("&*<%", *s) && isALPHA(s[1]))
  666.             expectterm = TRUE;        /* e.g. print $fh &sub */
  667.         else if (*s == '.' && isDIGIT(s[1]))
  668.             expectterm = TRUE;        /* e.g. print $fh .3 */
  669.         else if (index("/?-+", *s) && !isSPACE(s[1]))
  670.             expectterm = TRUE;        /* e.g. print $fh -1 */
  671.         }
  672.     }
  673.     RETURN(REG);
  674.  
  675.     case '@':
  676.     d = s;
  677.     s = scanident(s,bufend,tokenbuf);
  678.     if (reparse)
  679.         goto do_reparse;
  680.     yylval.stabval = aadd(stabent(tokenbuf,TRUE));
  681.     TERM(ARY);
  682.  
  683.     case '/':            /* may either be division or pattern */
  684.     case '?':            /* may either be conditional or pattern */
  685.     if (expectterm) {
  686.         check_uni();
  687.         s = scanpat(s);
  688.         TERM(PATTERN);
  689.     }
  690.     tmp = *s++;
  691.     if (tmp == '/')
  692.         MOP(O_DIVIDE);
  693.     OPERATOR(tmp);
  694.  
  695.     case '.':
  696.     if (!expectterm || !isDIGIT(s[1])) {
  697.         tmp = *s++;
  698.         if (*s == tmp) {
  699.         s++;
  700.         if (*s == tmp) {
  701.             s++;
  702.             yylval.ival = 0;
  703.         }
  704.         else
  705.             yylval.ival = AF_COMMON;
  706.         OPERATOR(DOTDOT);
  707.         }
  708.         if (expectterm)
  709.         check_uni();
  710.         AOP(O_CONCAT);
  711.     }
  712.     /* FALL THROUGH */
  713.     case '0': case '1': case '2': case '3': case '4':
  714.     case '5': case '6': case '7': case '8': case '9':
  715.     case '\'': case '"': case '`':
  716.     s = scanstr(s, SCAN_DEF);
  717.     TERM(RSTRING);
  718.  
  719.     case '\\':    /* some magic to force next word to be a WORD */
  720.     s++;    /* used by do and sub to force a separate namespace */
  721.     if (!isALPHA(*s) && *s != '_' && *s != '\'') {
  722.         warn("Spurious backslash ignored");
  723.         goto retry;
  724.     }
  725.     /* FALL THROUGH */
  726.     case '_':
  727.     SNARFWORD;
  728.     if (d[1] == '_') {
  729.         if (strEQ(d,"__LINE__") || strEQ(d,"__FILE__")) {
  730.         ARG *arg = op_new(1);
  731.  
  732.         yylval.arg = arg;
  733.         arg->arg_type = O_ITEM;
  734.         if (d[2] == 'L')
  735.             (void)sprintf(tokenbuf,"%ld",(long)curcmd->c_line);
  736.         else
  737.             strcpy(tokenbuf, stab_val(curcmd->c_filestab)->str_ptr);
  738.         arg[1].arg_type = A_SINGLE;
  739.         arg[1].arg_ptr.arg_str = str_make(tokenbuf,strlen(tokenbuf));
  740.         TERM(RSTRING);
  741.         }
  742.         else if (strEQ(d,"__END__")) {
  743.         STAB *stab;
  744.         int fd;
  745.  
  746.         /*SUPPRESS 560*/
  747.         if (!in_eval && (stab = stabent("DATA",FALSE))) {
  748.             stab->str_pok |= SP_MULTI;
  749.             if (!stab_io(stab))
  750.             stab_io(stab) = stio_new();
  751.             stab_io(stab)->ifp = rsfp;
  752. #if defined(HAS_FCNTL) && defined(F_SETFD)
  753.             fd = fileno(rsfp);
  754.             fcntl(fd,F_SETFD,fd >= 3);
  755. #endif
  756.             if (preprocess)
  757.             stab_io(stab)->type = '|';
  758.             else if ((FILE*)rsfp == stdin)
  759.             stab_io(stab)->type = '-';
  760.             else
  761.             stab_io(stab)->type = '<';
  762.             rsfp = Nullfp;
  763.         }
  764.         goto fake_eof;
  765.         }
  766.     }
  767.     break;
  768.     case 'a': case 'A':
  769.     SNARFWORD;
  770.     if (strEQ(d,"alarm"))
  771.         UNI(O_ALARM);
  772.     if (strEQ(d,"accept"))
  773.         FOP22(O_ACCEPT);
  774.     if (strEQ(d,"atan2"))
  775.         FUN2(O_ATAN2);
  776.     break;
  777.     case 'b': case 'B':
  778.     SNARFWORD;
  779.     if (strEQ(d,"bind"))
  780.         FOP2(O_BIND);
  781.     if (strEQ(d,"binmode"))
  782.         FOP(O_BINMODE);
  783.     break;
  784.     case 'c': case 'C':
  785.     SNARFWORD;
  786.     if (strEQ(d,"chop"))
  787.         LFUN(O_CHOP);
  788.     if (strEQ(d,"continue"))
  789.         OPERATOR(CONTINUE);
  790.     if (strEQ(d,"chdir")) {
  791.         (void)stabent("ENV",TRUE);    /* may use HOME */
  792.         UNI(O_CHDIR);
  793.     }
  794.     if (strEQ(d,"close"))
  795.         FOP(O_CLOSE);
  796.     if (strEQ(d,"closedir"))
  797.         FOP(O_CLOSEDIR);
  798.     if (strEQ(d,"cmp"))
  799.         EOP(O_SCMP);
  800.     if (strEQ(d,"caller"))
  801.         UNI(O_CALLER);
  802.     if (strEQ(d,"crypt")) {
  803. #ifdef FCRYPT
  804.         static int cryptseen = 0;
  805.  
  806.         if (!cryptseen++)
  807.         init_des();
  808. #endif
  809.         FUN2(O_CRYPT);
  810.     }
  811.     if (strEQ(d,"chmod"))
  812.         LOP(O_CHMOD);
  813.     if (strEQ(d,"chown"))
  814.         LOP(O_CHOWN);
  815.     if (strEQ(d,"connect"))
  816.         FOP2(O_CONNECT);
  817.     if (strEQ(d,"cos"))
  818.         UNI(O_COS);
  819.     if (strEQ(d,"chroot"))
  820.         UNI(O_CHROOT);
  821.     break;
  822.     case 'd': case 'D':
  823.     SNARFWORD;
  824.     if (strEQ(d,"do")) {
  825.         d = bufend;
  826.         while (s < d && isSPACE(*s))
  827.         s++;
  828.         if (isALPHA(*s) || *s == '_')
  829.         *(--s) = '\\';    /* force next ident to WORD */
  830.         OPERATOR(DO);
  831.     }
  832.     if (strEQ(d,"die"))
  833.         LOP(O_DIE);
  834.     if (strEQ(d,"defined"))
  835.         LFUN(O_DEFINED);
  836.     if (strEQ(d,"delete"))
  837.         OPERATOR(DELETE);
  838.     if (strEQ(d,"dbmopen"))
  839.         HFUN3(O_DBMOPEN);
  840.     if (strEQ(d,"dbmclose"))
  841.         HFUN(O_DBMCLOSE);
  842.     if (strEQ(d,"dump"))
  843.         LOOPX(O_DUMP);
  844.     break;
  845.     case 'e': case 'E':
  846.     SNARFWORD;
  847.     if (strEQ(d,"else"))
  848.         OPERATOR(ELSE);
  849.     if (strEQ(d,"elsif")) {
  850.         yylval.ival = curcmd->c_line;
  851.         OPERATOR(ELSIF);
  852.     }
  853.     if (strEQ(d,"eq") || strEQ(d,"EQ"))
  854.         EOP(O_SEQ);
  855.     if (strEQ(d,"exit"))
  856.         UNI(O_EXIT);
  857.     if (strEQ(d,"eval")) {
  858.         allstabs = TRUE;        /* must initialize everything since */
  859.         UNI(O_EVAL);        /* we don't know what will be used */
  860.     }
  861.     if (strEQ(d,"eof"))
  862.         FOP(O_EOF);
  863.     if (strEQ(d,"exp"))
  864.         UNI(O_EXP);
  865.     if (strEQ(d,"each"))
  866.         HFUN(O_EACH);
  867.     if (strEQ(d,"exec")) {
  868.         set_csh();
  869.         LOP(O_EXEC_OP);
  870.     }
  871.     if (strEQ(d,"endhostent"))
  872.         FUN0(O_EHOSTENT);
  873.     if (strEQ(d,"endnetent"))
  874.         FUN0(O_ENETENT);
  875.     if (strEQ(d,"endservent"))
  876.         FUN0(O_ESERVENT);
  877.     if (strEQ(d,"endprotoent"))
  878.         FUN0(O_EPROTOENT);
  879.     if (strEQ(d,"endpwent"))
  880.         FUN0(O_EPWENT);
  881.     if (strEQ(d,"endgrent"))
  882.         FUN0(O_EGRENT);
  883.     break;
  884.     case 'f': case 'F':
  885.     SNARFWORD;
  886.     if (strEQ(d,"for") || strEQ(d,"foreach")) {
  887.         yylval.ival = curcmd->c_line;
  888.         while (s < bufend && isSPACE(*s))
  889.         s++;
  890.         if (isALPHA(*s))
  891.         fatal("Missing $ on loop variable");
  892.         OPERATOR(FOR);
  893.     }
  894.     if (strEQ(d,"format")) {
  895.         d = bufend;
  896.         while (s < d && isSPACE(*s))
  897.         s++;
  898.         if (isALPHA(*s) || *s == '_')
  899.         *(--s) = '\\';    /* force next ident to WORD */
  900.         in_format = TRUE;
  901.         allstabs = TRUE;        /* must initialize everything since */
  902.         OPERATOR(FORMAT);        /* we don't know what will be used */
  903.     }
  904.     if (strEQ(d,"fork"))
  905.         FUN0(O_FORK);
  906.     if (strEQ(d,"fcntl"))
  907.         FOP3(O_FCNTL);
  908.     if (strEQ(d,"fileno"))
  909.         FOP(O_FILENO);
  910.     if (strEQ(d,"flock"))
  911.         FOP2(O_FLOCK);
  912.     break;
  913.     case 'g': case 'G':
  914.     SNARFWORD;
  915.     if (strEQ(d,"gt") || strEQ(d,"GT"))
  916.         ROP(O_SGT);
  917.     if (strEQ(d,"ge") || strEQ(d,"GE"))
  918.         ROP(O_SGE);
  919.     if (strEQ(d,"grep"))
  920.         FL2(O_GREP);
  921.     if (strEQ(d,"goto"))
  922.         LOOPX(O_GOTO);
  923.     if (strEQ(d,"gmtime"))
  924.         UNI(O_GMTIME);
  925.     if (strEQ(d,"getc"))
  926.         FOP(O_GETC);
  927.     if (strnEQ(d,"get",3)) {
  928.         d += 3;
  929.         if (*d == 'p') {
  930.         if (strEQ(d,"ppid"))
  931.             FUN0(O_GETPPID);
  932.         if (strEQ(d,"pgrp"))
  933.             UNI(O_GETPGRP);
  934.         if (strEQ(d,"priority"))
  935.             FUN2(O_GETPRIORITY);
  936.         if (strEQ(d,"protobyname"))
  937.             UNI(O_GPBYNAME);
  938.         if (strEQ(d,"protobynumber"))
  939.             FUN1(O_GPBYNUMBER);
  940.         if (strEQ(d,"protoent"))
  941.             FUN0(O_GPROTOENT);
  942.         if (strEQ(d,"pwent"))
  943.             FUN0(O_GPWENT);
  944.         if (strEQ(d,"pwnam"))
  945.             FUN1(O_GPWNAM);
  946.         if (strEQ(d,"pwuid"))
  947.             FUN1(O_GPWUID);
  948.         if (strEQ(d,"peername"))
  949.             FOP(O_GETPEERNAME);
  950.         }
  951.         else if (*d == 'h') {
  952.         if (strEQ(d,"hostbyname"))
  953.             UNI(O_GHBYNAME);
  954.         if (strEQ(d,"hostbyaddr"))
  955.             FUN2(O_GHBYADDR);
  956.         if (strEQ(d,"hostent"))
  957.             FUN0(O_GHOSTENT);
  958.         }
  959.         else if (*d == 'n') {
  960.         if (strEQ(d,"netbyname"))
  961.             UNI(O_GNBYNAME);
  962.         if (strEQ(d,"netbyaddr"))
  963.             FUN2(O_GNBYADDR);
  964.         if (strEQ(d,"netent"))
  965.             FUN0(O_GNETENT);
  966.         }
  967.         else if (*d == 's') {
  968.         if (strEQ(d,"servbyname"))
  969.             FUN2(O_GSBYNAME);
  970.         if (strEQ(d,"servbyport"))
  971.             FUN2(O_GSBYPORT);
  972.         if (strEQ(d,"servent"))
  973.             FUN0(O_GSERVENT);
  974.         if (strEQ(d,"sockname"))
  975.             FOP(O_GETSOCKNAME);
  976.         if (strEQ(d,"sockopt"))
  977.             FOP3(O_GSOCKOPT);
  978.         }
  979.         else if (*d == 'g') {
  980.         if (strEQ(d,"grent"))
  981.             FUN0(O_GGRENT);
  982.         if (strEQ(d,"grnam"))
  983.             FUN1(O_GGRNAM);
  984.         if (strEQ(d,"grgid"))
  985.             FUN1(O_GGRGID);
  986.         }
  987.         else if (*d == 'l') {
  988.         if (strEQ(d,"login"))
  989.             FUN0(O_GETLOGIN);
  990.         }
  991.         d -= 3;
  992.     }
  993.     break;
  994.     case 'h': case 'H':
  995.     SNARFWORD;
  996.     if (strEQ(d,"hex"))
  997.         UNI(O_HEX);
  998.     break;
  999.     case 'i': case 'I':
  1000.     SNARFWORD;
  1001.     if (strEQ(d,"if")) {
  1002.         yylval.ival = curcmd->c_line;
  1003.         OPERATOR(IF);
  1004.     }
  1005.     if (strEQ(d,"index"))
  1006.         FUN2x(O_INDEX);
  1007.     if (strEQ(d,"int"))
  1008.         UNI(O_INT);
  1009.     if (strEQ(d,"ioctl"))
  1010.         FOP3(O_IOCTL);
  1011.     break;
  1012.     case 'j': case 'J':
  1013.     SNARFWORD;
  1014.     if (strEQ(d,"join"))
  1015.         FL2(O_JOIN);
  1016.     break;
  1017.     case 'k': case 'K':
  1018.     SNARFWORD;
  1019.     if (strEQ(d,"keys"))
  1020.         HFUN(O_KEYS);
  1021.     if (strEQ(d,"kill"))
  1022.         LOP(O_KILL);
  1023.     break;
  1024.     case 'l': case 'L':
  1025.     SNARFWORD;
  1026.     if (strEQ(d,"last"))
  1027.         LOOPX(O_LAST);
  1028.     if (strEQ(d,"local"))
  1029.         OPERATOR(LOCAL);
  1030.     if (strEQ(d,"length"))
  1031.         UNI(O_LENGTH);
  1032.     if (strEQ(d,"lt") || strEQ(d,"LT"))
  1033.         ROP(O_SLT);
  1034.     if (strEQ(d,"le") || strEQ(d,"LE"))
  1035.         ROP(O_SLE);
  1036.     if (strEQ(d,"localtime"))
  1037.         UNI(O_LOCALTIME);
  1038.     if (strEQ(d,"log"))
  1039.         UNI(O_LOG);
  1040.     if (strEQ(d,"link"))
  1041.         FUN2(O_LINK);
  1042.     if (strEQ(d,"listen"))
  1043.         FOP2(O_LISTEN);
  1044.     if (strEQ(d,"lstat"))
  1045.         FOP(O_LSTAT);
  1046.     break;
  1047.     case 'm': case 'M':
  1048.     if (s[1] == '\'') {
  1049.         d = "m";
  1050.         s++;
  1051.     }
  1052.     else {
  1053.         SNARFWORD;
  1054.     }
  1055.     if (strEQ(d,"m")) {
  1056.         s = scanpat(s-1);
  1057.         if (yylval.arg)
  1058.         TERM(PATTERN);
  1059.         else
  1060.         RETURN(1);    /* force error */
  1061.     }
  1062.     switch (d[1]) {
  1063.     case 'k':
  1064.         if (strEQ(d,"mkdir"))
  1065.         FUN2(O_MKDIR);
  1066.         break;
  1067.     case 's':
  1068.         if (strEQ(d,"msgctl"))
  1069.         FUN3(O_MSGCTL);
  1070.         if (strEQ(d,"msgget"))
  1071.         FUN2(O_MSGGET);
  1072.         if (strEQ(d,"msgrcv"))
  1073.         FUN5(O_MSGRCV);
  1074.         if (strEQ(d,"msgsnd"))
  1075.         FUN3(O_MSGSND);
  1076.         break;
  1077.     }
  1078.     break;
  1079.     case 'n': case 'N':
  1080.     SNARFWORD;
  1081.     if (strEQ(d,"next"))
  1082.         LOOPX(O_NEXT);
  1083.     if (strEQ(d,"ne") || strEQ(d,"NE"))
  1084.         EOP(O_SNE);
  1085.     break;
  1086.     case 'o': case 'O':
  1087.     SNARFWORD;
  1088.     if (strEQ(d,"open"))
  1089.         OPERATOR(OPEN);
  1090.     if (strEQ(d,"ord"))
  1091.         UNI(O_ORD);
  1092.     if (strEQ(d,"oct"))
  1093.         UNI(O_OCT);
  1094.     if (strEQ(d,"opendir"))
  1095.         FOP2(O_OPEN_DIR);
  1096.     break;
  1097.     case 'p': case 'P':
  1098.     SNARFWORD;
  1099.     if (strEQ(d,"print")) {
  1100.         checkcomma(s,d,"filehandle");
  1101.         LOP(O_PRINT);
  1102.     }
  1103.     if (strEQ(d,"printf")) {
  1104.         checkcomma(s,d,"filehandle");
  1105.         LOP(O_PRTF);
  1106.     }
  1107.     if (strEQ(d,"push")) {
  1108.         yylval.ival = O_PUSH;
  1109.         OPERATOR(PUSH);
  1110.     }
  1111.     if (strEQ(d,"pop"))
  1112.         OPERATOR(POP);
  1113.     if (strEQ(d,"pack"))
  1114.         FL2(O_PACK);
  1115.     if (strEQ(d,"package"))
  1116.         OPERATOR(PACKAGE);
  1117.     if (strEQ(d,"pipe"))
  1118.         FOP22(O_PIPE_OP);
  1119.     break;
  1120.     case 'q': case 'Q':
  1121.     SNARFWORD;
  1122.     if (strEQ(d,"q")) {
  1123.         s = scanstr(s-1, SCAN_DEF);
  1124.         TERM(RSTRING);
  1125.     }
  1126.     if (strEQ(d,"qq")) {
  1127.         s = scanstr(s-2, SCAN_DEF);
  1128.         TERM(RSTRING);
  1129.     }
  1130.     if (strEQ(d,"qx")) {
  1131.         s = scanstr(s-2, SCAN_DEF);
  1132.         TERM(RSTRING);
  1133.     }
  1134.     break;
  1135.     case 'r': case 'R':
  1136.     SNARFWORD;
  1137.     if (strEQ(d,"return"))
  1138.         OLDLOP(O_RETURN);
  1139.     if (strEQ(d,"require")) {
  1140.         allstabs = TRUE;        /* must initialize everything since */
  1141.         UNI(O_REQUIRE);        /* we don't know what will be used */
  1142.     }
  1143.     if (strEQ(d,"reset"))
  1144.         UNI(O_RESET);
  1145.     if (strEQ(d,"redo"))
  1146.         LOOPX(O_REDO);
  1147.     if (strEQ(d,"rename"))
  1148.         FUN2(O_RENAME);
  1149.     if (strEQ(d,"rand"))
  1150.         UNI(O_RAND);
  1151.     if (strEQ(d,"rmdir"))
  1152.         UNI(O_RMDIR);
  1153.     if (strEQ(d,"rindex"))
  1154.         FUN2x(O_RINDEX);
  1155.     if (strEQ(d,"read"))
  1156.         FOP3(O_READ);
  1157.     if (strEQ(d,"readdir"))
  1158.         FOP(O_READDIR);
  1159.     if (strEQ(d,"rewinddir"))
  1160.         FOP(O_REWINDDIR);
  1161.     if (strEQ(d,"recv"))
  1162.         FOP4(O_RECV);
  1163.     if (strEQ(d,"reverse"))
  1164.         LOP(O_REVERSE);
  1165.     if (strEQ(d,"readlink"))
  1166.         UNI(O_READLINK);
  1167.     break;
  1168.     case 's': case 'S':
  1169.     if (s[1] == '\'') {
  1170.         d = "s";
  1171.         s++;
  1172.     }
  1173.     else {
  1174.         SNARFWORD;
  1175.     }
  1176.     if (strEQ(d,"s")) {
  1177.         s = scansubst(s);
  1178.         if (yylval.arg)
  1179.         TERM(SUBST);
  1180.         else
  1181.         RETURN(1);    /* force error */
  1182.     }
  1183.     switch (d[1]) {
  1184.     case 'a':
  1185.     case 'b':
  1186.         break;
  1187.     case 'c':
  1188.         if (strEQ(d,"scalar"))
  1189.         UNI(O_SCALAR);
  1190.         break;
  1191.     case 'd':
  1192.         break;
  1193.     case 'e':
  1194.         if (strEQ(d,"select"))
  1195.         OPERATOR(SSELECT);
  1196.         if (strEQ(d,"seek"))
  1197.         FOP3(O_SEEK);
  1198.         if (strEQ(d,"semctl"))
  1199.         FUN4(O_SEMCTL);
  1200.         if (strEQ(d,"semget"))
  1201.         FUN3(O_SEMGET);
  1202.         if (strEQ(d,"semop"))
  1203.         FUN2(O_SEMOP);
  1204.         if (strEQ(d,"send"))
  1205.         FOP3(O_SEND);
  1206.         if (strEQ(d,"setpgrp"))
  1207.         FUN2(O_SETPGRP);
  1208.         if (strEQ(d,"setpriority"))
  1209.         FUN3(O_SETPRIORITY);
  1210.         if (strEQ(d,"sethostent"))
  1211.         FUN1(O_SHOSTENT);
  1212.         if (strEQ(d,"setnetent"))
  1213.         FUN1(O_SNETENT);
  1214.         if (strEQ(d,"setservent"))
  1215.         FUN1(O_SSERVENT);
  1216.         if (strEQ(d,"setprotoent"))
  1217.         FUN1(O_SPROTOENT);
  1218.         if (strEQ(d,"setpwent"))
  1219.         FUN0(O_SPWENT);
  1220.         if (strEQ(d,"setgrent"))
  1221.         FUN0(O_SGRENT);
  1222.         if (strEQ(d,"seekdir"))
  1223.         FOP2(O_SEEKDIR);
  1224.         if (strEQ(d,"setsockopt"))
  1225.         FOP4(O_SSOCKOPT);
  1226.         break;
  1227.     case 'f':
  1228.     case 'g':
  1229.         break;
  1230.     case 'h':
  1231.         if (strEQ(d,"shift"))
  1232.         TERM(SHIFT);
  1233.         if (strEQ(d,"shmctl"))
  1234.         FUN3(O_SHMCTL);
  1235.         if (strEQ(d,"shmget"))
  1236.         FUN3(O_SHMGET);
  1237.         if (strEQ(d,"shmread"))
  1238.         FUN4(O_SHMREAD);
  1239.         if (strEQ(d,"shmwrite"))
  1240.         FUN4(O_SHMWRITE);
  1241.         if (strEQ(d,"shutdown"))
  1242.         FOP2(O_SHUTDOWN);
  1243.         break;
  1244.     case 'i':
  1245.         if (strEQ(d,"sin"))
  1246.         UNI(O_SIN);
  1247.         break;
  1248.     case 'j':
  1249.     case 'k':
  1250.         break;
  1251.     case 'l':
  1252.         if (strEQ(d,"sleep"))
  1253.         UNI(O_SLEEP);
  1254.         break;
  1255.     case 'm':
  1256.     case 'n':
  1257.         break;
  1258.     case 'o':
  1259.         if (strEQ(d,"socket"))
  1260.         FOP4(O_SOCKET);
  1261.         if (strEQ(d,"socketpair"))
  1262.         FOP25(O_SOCKPAIR);
  1263.         if (strEQ(d,"sort")) {
  1264.         checkcomma(s,d,"subroutine name");
  1265.         d = bufend;
  1266.         while (s < d && isSPACE(*s)) s++;
  1267.         if (*s == ';' || *s == ')')        /* probably a close */
  1268.             fatal("sort is now a reserved word");
  1269.         if (isALPHA(*s) || *s == '_') {
  1270.             /*SUPPRESS 530*/
  1271.             for (d = s; isALNUM(*d); d++) ;
  1272.             strncpy(tokenbuf,s,d-s);
  1273.             tokenbuf[d-s] = '\0';
  1274.             if (strNE(tokenbuf,"keys") &&
  1275.             strNE(tokenbuf,"values") &&
  1276.             strNE(tokenbuf,"split") &&
  1277.             strNE(tokenbuf,"grep") &&
  1278.             strNE(tokenbuf,"readdir") &&
  1279.             strNE(tokenbuf,"unpack") &&
  1280.             strNE(tokenbuf,"do") &&
  1281.             strNE(tokenbuf,"eval") &&
  1282.             (d >= bufend || isSPACE(*d)) )
  1283.             *(--s) = '\\';    /* force next ident to WORD */
  1284.         }
  1285.         LOP(O_SORT);
  1286.         }
  1287.         break;
  1288.     case 'p':
  1289.         if (strEQ(d,"split"))
  1290.         TERM(SPLIT);
  1291.         if (strEQ(d,"sprintf"))
  1292.         FL(O_SPRINTF);
  1293.         if (strEQ(d,"splice")) {
  1294.         yylval.ival = O_SPLICE;
  1295.         OPERATOR(PUSH);
  1296.         }
  1297.         break;
  1298.     case 'q':
  1299.         if (strEQ(d,"sqrt"))
  1300.         UNI(O_SQRT);
  1301.         break;
  1302.     case 'r':
  1303.         if (strEQ(d,"srand"))
  1304.         UNI(O_SRAND);
  1305.         break;
  1306.     case 's':
  1307.         break;
  1308.     case 't':
  1309.         if (strEQ(d,"stat"))
  1310.         FOP(O_STAT);
  1311.         if (strEQ(d,"study")) {
  1312.         sawstudy++;
  1313.         LFUN(O_STUDY);
  1314.         }
  1315.         break;
  1316.     case 'u':
  1317.         if (strEQ(d,"substr"))
  1318.         FUN2x(O_SUBSTR);
  1319.         if (strEQ(d,"sub")) {
  1320.         yylval.ival = savestack->ary_fill; /* restore stuff on reduce */
  1321.         savelong(&subline);
  1322.         saveitem(subname);
  1323.  
  1324.         subline = curcmd->c_line;
  1325.         d = bufend;
  1326.         while (s < d && isSPACE(*s))
  1327.             s++;
  1328.         if (isALPHA(*s) || *s == '_' || *s == '\'') {
  1329.             str_sset(subname,curstname);
  1330.             str_ncat(subname,"'",1);
  1331.             for (d = s+1; isALNUM(*d) || *d == '\''; d++)
  1332.             /*SUPPRESS 530*/
  1333.             ;
  1334.             if (d[-1] == '\'')
  1335.             d--;
  1336.             str_ncat(subname,s,d-s);
  1337.             *(--s) = '\\';    /* force next ident to WORD */
  1338.         }
  1339.         else
  1340.             str_set(subname,"?");
  1341.         OPERATOR(SUB);
  1342.         }
  1343.         break;
  1344.     case 'v':
  1345.     case 'w':
  1346.     case 'x':
  1347.         break;
  1348.     case 'y':
  1349.         if (strEQ(d,"system")) {
  1350.         set_csh();
  1351.         LOP(O_SYSTEM);
  1352.         }
  1353.         if (strEQ(d,"symlink"))
  1354.         FUN2(O_SYMLINK);
  1355.         if (strEQ(d,"syscall"))
  1356.         LOP(O_SYSCALL);
  1357.         if (strEQ(d,"sysread"))
  1358.         FOP3(O_SYSREAD);
  1359.         if (strEQ(d,"syswrite"))
  1360.         FOP3(O_SYSWRITE);
  1361.         break;
  1362.     case 'z':
  1363.         break;
  1364.     }
  1365.     break;
  1366.     case 't': case 'T':
  1367.     SNARFWORD;
  1368.     if (strEQ(d,"tr")) {
  1369.         s = scantrans(s);
  1370.         if (yylval.arg)
  1371.         TERM(TRANS);
  1372.         else
  1373.         RETURN(1);    /* force error */
  1374.     }
  1375.     if (strEQ(d,"tell"))
  1376.         FOP(O_TELL);
  1377.     if (strEQ(d,"telldir"))
  1378.         FOP(O_TELLDIR);
  1379.     if (strEQ(d,"time"))
  1380.         FUN0(O_TIME);
  1381.     if (strEQ(d,"times"))
  1382.         FUN0(O_TMS);
  1383.     if (strEQ(d,"truncate"))
  1384.         FOP2(O_TRUNCATE);
  1385.     break;
  1386.     case 'u': case 'U':
  1387.     SNARFWORD;
  1388.     if (strEQ(d,"using"))
  1389.         OPERATOR(USING);
  1390.     if (strEQ(d,"until")) {
  1391.         yylval.ival = curcmd->c_line;
  1392.         OPERATOR(UNTIL);
  1393.     }
  1394.     if (strEQ(d,"unless")) {
  1395.         yylval.ival = curcmd->c_line;
  1396.         OPERATOR(UNLESS);
  1397.     }
  1398.     if (strEQ(d,"unlink"))
  1399.         LOP(O_UNLINK);
  1400.     if (strEQ(d,"undef"))
  1401.         LFUN(O_UNDEF);
  1402.     if (strEQ(d,"unpack"))
  1403.         FUN2(O_UNPACK);
  1404.     if (strEQ(d,"utime"))
  1405.         LOP(O_UTIME);
  1406.     if (strEQ(d,"umask"))
  1407.         UNI(O_UMASK);
  1408.     if (strEQ(d,"unshift")) {
  1409.         yylval.ival = O_UNSHIFT;
  1410.         OPERATOR(PUSH);
  1411.     }
  1412.     break;
  1413.     case 'v': case 'V':
  1414.     SNARFWORD;
  1415.     if (strEQ(d,"values"))
  1416.         HFUN(O_VALUES);
  1417.     if (strEQ(d,"vec")) {
  1418.         sawvec = TRUE;
  1419.         FUN3(O_VEC);
  1420.     }
  1421.     break;
  1422.     case 'w': case 'W':
  1423.     SNARFWORD;
  1424.     if (strEQ(d,"while")) {
  1425.         yylval.ival = curcmd->c_line;
  1426.         OPERATOR(WHILE);
  1427.     }
  1428.     if (strEQ(d,"warn"))
  1429.         LOP(O_WARN);
  1430.     if (strEQ(d,"wait"))
  1431.         FUN0(O_WAIT);
  1432.     if (strEQ(d,"waitpid"))
  1433.         FUN2(O_WAITPID);
  1434.     if (strEQ(d,"wantarray")) {
  1435.         yylval.arg = op_new(1);
  1436.         yylval.arg->arg_type = O_ITEM;
  1437.         yylval.arg[1].arg_type = A_WANTARRAY;
  1438.         TERM(RSTRING);
  1439.     }
  1440.     if (strEQ(d,"write"))
  1441.         FOP(O_WRITE);
  1442.     break;
  1443.     case 'x': case 'X':
  1444.     if (*s == 'x' && isDIGIT(s[1]) && !expectterm) {
  1445.         s++;
  1446.         MOP(O_REPEAT);
  1447.     }
  1448.     SNARFWORD;
  1449.     if (strEQ(d,"x")) {
  1450.         if (!expectterm)
  1451.         MOP(O_REPEAT);
  1452.         check_uni();
  1453.     }
  1454.     break;
  1455.     case 'y': case 'Y':
  1456.     if (s[1] == '\'') {
  1457.         d = "y";
  1458.         s++;
  1459.     }
  1460.     else {
  1461.         SNARFWORD;
  1462.     }
  1463.     if (strEQ(d,"y")) {
  1464.         s = scantrans(s);
  1465.         TERM(TRANS);
  1466.     }
  1467.     break;
  1468.     case 'z': case 'Z':
  1469.     SNARFWORD;
  1470.     break;
  1471.     }
  1472.     yylval.cval = savestr(d);
  1473.     if (expectterm == 2) {        /* special case: start of statement */
  1474.     while (isSPACE(*s)) s++;
  1475.     if (*s == ':') {
  1476.         s++;
  1477.         CLINE;
  1478.         OPERATOR(LABEL);
  1479.     }
  1480.     TERM(WORD);
  1481.     }
  1482.     expectterm = FALSE;
  1483.     if (oldoldbufptr && oldoldbufptr < bufptr) {
  1484.     while (isSPACE(*oldoldbufptr))
  1485.         oldoldbufptr++;
  1486.     if (*oldoldbufptr == 'p' && strnEQ(oldoldbufptr,"print",5))
  1487.         expectterm = TRUE;
  1488.     else if (*oldoldbufptr == 's' && strnEQ(oldoldbufptr,"sort",4))
  1489.         expectterm = TRUE;
  1490.     }
  1491.     return (CLINE, bufptr = s, (int)WORD);
  1492. }
  1493.  
  1494. void
  1495. checkcomma(s,name,what)
  1496. register char *s;
  1497. char *name;
  1498. char *what;
  1499. {
  1500.     char *w;
  1501.  
  1502.     if (dowarn && *s == ' ' && s[1] == '(') {
  1503.     w = index(s,')');
  1504.     if (w)
  1505.         for (w++; *w && isSPACE(*w); w++) ;
  1506.     if (!w || !*w || !index(";|}", *w))    /* an advisory hack only... */
  1507.         warn("%s (...) interpreted as function",name);
  1508.     }
  1509.     while (s < bufend && isSPACE(*s))
  1510.     s++;
  1511.     if (*s == '(')
  1512.     s++;
  1513.     while (s < bufend && isSPACE(*s))
  1514.     s++;
  1515.     if (isALPHA(*s) || *s == '_') {
  1516.     w = s++;
  1517.     while (isALNUM(*s))
  1518.         s++;
  1519.     while (s < bufend && isSPACE(*s))
  1520.         s++;
  1521.     if (*s == ',') {
  1522.         *s = '\0';
  1523.         w = instr(
  1524.           "tell eof times getlogin wait length shift umask getppid \
  1525.           cos exp int log rand sin sqrt ord wantarray",
  1526.           w);
  1527.         *s = ',';
  1528.         if (w)
  1529.         return;
  1530.         fatal("No comma allowed after %s", what);
  1531.     }
  1532.     }
  1533. }
  1534.  
  1535. char *
  1536. scanident(s,send,dest)
  1537. register char *s;
  1538. register char *send;
  1539. char *dest;
  1540. {
  1541.     register char *d;
  1542.     int brackets = 0;
  1543.  
  1544.     reparse = Nullch;
  1545.     s++;
  1546.     d = dest;
  1547.     if (isDIGIT(*s)) {
  1548.     while (isDIGIT(*s))
  1549.         *d++ = *s++;
  1550.     }
  1551.     else {
  1552.     while (isALNUM(*s) || *s == '\'')
  1553.         *d++ = *s++;
  1554.     }
  1555.     while (d > dest+1 && d[-1] == '\'')
  1556.     d--,s--;
  1557.     *d = '\0';
  1558.     d = dest;
  1559.     if (!*d) {
  1560.     *d = *s++;
  1561.     if (*d == '{' /* } */ ) {
  1562.         d = dest;
  1563.         brackets++;
  1564.         while (s < send && brackets) {
  1565.         if (!reparse && (d == dest || (*s && isALNUM(*s) ))) {
  1566.             *d++ = *s++;
  1567.             continue;
  1568.         }
  1569.         else if (!reparse)
  1570.             reparse = s;
  1571.         switch (*s++) {
  1572.         /* { */
  1573.         case '}':
  1574.             brackets--;
  1575.             if (reparse && reparse == s - 1)
  1576.             reparse = Nullch;
  1577.             break;
  1578.         case '{':   /* } */
  1579.             brackets++;
  1580.             break;
  1581.         }
  1582.         }
  1583.         *d = '\0';
  1584.         d = dest;
  1585.     }
  1586.     else
  1587.         d[1] = '\0';
  1588.     }
  1589.     if (*d == '^' && (isUPPER(*s) || index("[\\]^_?", *s))) {
  1590. #ifdef DEBUGGING
  1591.     if (*s == 'D')
  1592.         debug |= 32768;
  1593. #endif
  1594.     *d = *s++ ^ 64;
  1595.     }
  1596.     return s;
  1597. }
  1598.  
  1599. void
  1600. scanconst(spat,string,len)
  1601. SPAT *spat;
  1602. char *string;
  1603. int len;
  1604. {
  1605.     register STR *tmpstr;
  1606.     register char *t;
  1607.     register char *d;
  1608.     register char *e;
  1609.     char *origstring = string;
  1610.     static char *vert = "|";
  1611.  
  1612.     if (ninstr(string, string+len, vert, vert+1))
  1613.     return;
  1614.     if (*string == '^')
  1615.     string++, len--;
  1616.     tmpstr = Str_new(86,len);
  1617.     str_nset(tmpstr,string,len);
  1618.     t = str_get(tmpstr);
  1619.     e = t + len;
  1620.     tmpstr->str_u.str_useful = 100;
  1621.     for (d=t; d < e; ) {
  1622.     switch (*d) {
  1623.     case '{':
  1624.         if (isDIGIT(d[1]))
  1625.         e = d;
  1626.         else
  1627.         goto defchar;
  1628.         break;
  1629.     case '.': case '[': case '$': case '(': case ')': case '|': case '+':
  1630.     case '^':
  1631.         e = d;
  1632.         break;
  1633.     case '\\':
  1634.         if (d[1] && index("wWbB0123456789sSdDlLuUExc",d[1])) {
  1635.         e = d;
  1636.         break;
  1637.         }
  1638.         Move(d+1,d,e-d,char);
  1639.         e--;
  1640.         switch(*d) {
  1641.         case 'n':
  1642.         *d = '\n';
  1643.         break;
  1644.         case 't':
  1645.         *d = '\t';
  1646.         break;
  1647.         case 'f':
  1648.         *d = '\f';
  1649.         break;
  1650.         case 'r':
  1651.         *d = '\r';
  1652.         break;
  1653.         case 'e':
  1654.         *d = '\033';
  1655.         break;
  1656.         case 'a':
  1657.         *d = '\007';
  1658.         break;
  1659.         }
  1660.         /* FALL THROUGH */
  1661.     default:
  1662.       defchar:
  1663.         if (d[1] == '*' || (d[1] == '{' && d[2] == '0') || d[1] == '?') {
  1664.         e = d;
  1665.         break;
  1666.         }
  1667.         d++;
  1668.     }
  1669.     }
  1670.     if (d == t) {
  1671.     str_free(tmpstr);
  1672.     return;
  1673.     }
  1674.     *d = '\0';
  1675.     tmpstr->str_cur = d - t;
  1676.     if (d == t+len)
  1677.     spat->spat_flags |= SPAT_ALL;
  1678.     if (*origstring != '^')
  1679.     spat->spat_flags |= SPAT_SCANFIRST;
  1680.     spat->spat_short = tmpstr;
  1681.     spat->spat_slen = d - t;
  1682. }
  1683.  
  1684. char *
  1685. scanpat(s)
  1686. register char *s;
  1687. {
  1688.     register SPAT *spat;
  1689.     register char *d;
  1690.     register char *e;
  1691.     int len;
  1692.     SPAT savespat;
  1693.     STR *str = Str_new(93,0);
  1694.     char delim;
  1695.  
  1696.     Newz(801,spat,1,SPAT);
  1697.     spat->spat_next = curstash->tbl_spatroot;    /* link into spat list */
  1698.     curstash->tbl_spatroot = spat;
  1699.  
  1700.     switch (*s++) {
  1701.     case 'm':
  1702.     s++;
  1703.     break;
  1704.     case '/':
  1705.     break;
  1706.     case '?':
  1707.     spat->spat_flags |= SPAT_ONCE;
  1708.     break;
  1709.     default:
  1710.     fatal("panic: scanpat");
  1711.     }
  1712.     s = str_append_till(str,s,bufend,s[-1],patleave);
  1713.     if (s >= bufend) {
  1714.     str_free(str);
  1715.     yyerror("Search pattern not terminated");
  1716.     yylval.arg = Nullarg;
  1717.     return s;
  1718.     }
  1719.     delim = *s++;
  1720.     while (*s == 'i' || *s == 'o' || *s == 'g') {
  1721.     if (*s == 'i') {
  1722.         s++;
  1723.         sawi = TRUE;
  1724.         spat->spat_flags |= SPAT_FOLD;
  1725.     }
  1726.     if (*s == 'o') {
  1727.         s++;
  1728.         spat->spat_flags |= SPAT_KEEP;
  1729.     }
  1730.     if (*s == 'g') {
  1731.         s++;
  1732.         spat->spat_flags |= SPAT_GLOBAL;
  1733.     }
  1734.     }
  1735.     len = str->str_cur;
  1736.     e = str->str_ptr + len;
  1737.     if (delim == '\'')
  1738.     d = e;
  1739.     else
  1740.     d = str->str_ptr;
  1741.     for (; d < e; d++) {
  1742.     if (*d == '\\')
  1743.         d++;
  1744.     else if ((*d == '$' && d[1] && d[1] != '|' && d[1] != ')') ||
  1745.          (*d == '@')) {
  1746.         register ARG *arg;
  1747.  
  1748.         spat->spat_runtime = arg = op_new(1);
  1749.         arg->arg_type = O_ITEM;
  1750.         arg[1].arg_type = A_DOUBLE;
  1751.         arg[1].arg_ptr.arg_str = str_smake(str);
  1752.         d = scanident(d,bufend,buf);
  1753.         (void)stabent(buf,TRUE);        /* make sure it's created */
  1754.         for (; d < e; d++) {
  1755.         if (*d == '\\')
  1756.             d++;
  1757.         else if (*d == '$' && d[1] && d[1] != '|' && d[1] != ')') {
  1758.             d = scanident(d,bufend,buf);
  1759.             (void)stabent(buf,TRUE);
  1760.         }
  1761.         else if (*d == '@') {
  1762.             d = scanident(d,bufend,buf);
  1763.             if (strEQ(buf,"ARGV") || strEQ(buf,"ENV") ||
  1764.               strEQ(buf,"SIG") || strEQ(buf,"INC"))
  1765.             (void)stabent(buf,TRUE);
  1766.         }
  1767.         }
  1768.         goto got_pat;        /* skip compiling for now */
  1769.     }
  1770.     }
  1771.     if (spat->spat_flags & SPAT_FOLD)
  1772.     StructCopy(spat, &savespat, SPAT);
  1773.     scanconst(spat,str->str_ptr,len);
  1774.     if ((spat->spat_flags & SPAT_ALL) && (spat->spat_flags & SPAT_SCANFIRST)) {
  1775.     fbmcompile(spat->spat_short, spat->spat_flags & SPAT_FOLD);
  1776.     spat->spat_regexp = regcomp(str->str_ptr,str->str_ptr+len,
  1777.         spat->spat_flags & SPAT_FOLD);
  1778.         /* Note that this regexp can still be used if someone says
  1779.          * something like /a/ && s//b/;  so we can't delete it.
  1780.          */
  1781.     }
  1782.     else {
  1783.     if (spat->spat_flags & SPAT_FOLD)
  1784.     StructCopy(&savespat, spat, SPAT);
  1785.     if (spat->spat_short)
  1786.         fbmcompile(spat->spat_short, spat->spat_flags & SPAT_FOLD);
  1787.     spat->spat_regexp = regcomp(str->str_ptr,str->str_ptr+len,
  1788.         spat->spat_flags & SPAT_FOLD);
  1789.     hoistmust(spat);
  1790.     }
  1791.   got_pat:
  1792.     str_free(str);
  1793.     yylval.arg = make_match(O_MATCH,stab2arg(A_STAB,defstab),spat);
  1794.     return s;
  1795. }
  1796.  
  1797. char *
  1798. scansubst(start)
  1799. char *start;
  1800. {
  1801.     register char *s = start;
  1802.     register SPAT *spat;
  1803.     register char *d;
  1804.     register char *e;
  1805.     int len;
  1806.     STR *str = Str_new(93,0);
  1807.     char term = *s;
  1808.  
  1809.     if (term && (d = index("([{< )]}> )]}>",term)))
  1810.     term = d[5];
  1811.  
  1812.     Newz(802,spat,1,SPAT);
  1813.     spat->spat_next = curstash->tbl_spatroot;    /* link into spat list */
  1814.     curstash->tbl_spatroot = spat;
  1815.  
  1816.     s = str_append_till(str,s+1,bufend,term,patleave);
  1817.     if (s >= bufend) {
  1818.     str_free(str);
  1819.     yyerror("Substitution pattern not terminated");
  1820.     yylval.arg = Nullarg;
  1821.     return s;
  1822.     }
  1823.     len = str->str_cur;
  1824.     e = str->str_ptr + len;
  1825.     for (d = str->str_ptr; d < e; d++) {
  1826.     if (*d == '\\')
  1827.         d++;
  1828.     else if ((*d == '$' && d[1] && d[1] != '|' && /*(*/ d[1] != ')') ||
  1829.         *d == '@' ) {
  1830.         register ARG *arg;
  1831.  
  1832.         spat->spat_runtime = arg = op_new(1);
  1833.         arg->arg_type = O_ITEM;
  1834.         arg[1].arg_type = A_DOUBLE;
  1835.         arg[1].arg_ptr.arg_str = str_smake(str);
  1836.         d = scanident(d,e,buf);
  1837.         (void)stabent(buf,TRUE);        /* make sure it's created */
  1838.         for (; *d; d++) {
  1839.         if (*d == '$' && d[1] && d[-1] != '\\' && d[1] != '|') {
  1840.             d = scanident(d,e,buf);
  1841.             (void)stabent(buf,TRUE);
  1842.         }
  1843.         else if (*d == '@' && d[-1] != '\\') {
  1844.             d = scanident(d,e,buf);
  1845.             if (strEQ(buf,"ARGV") || strEQ(buf,"ENV") ||
  1846.               strEQ(buf,"SIG") || strEQ(buf,"INC"))
  1847.             (void)stabent(buf,TRUE);
  1848.         }
  1849.         }
  1850.         goto get_repl;        /* skip compiling for now */
  1851.     }
  1852.     }
  1853.     scanconst(spat,str->str_ptr,len);
  1854. get_repl:
  1855.     if (term != *start)
  1856.     s++;
  1857.     s = scanstr(s, SCAN_REPL);
  1858.     if (s >= bufend) {
  1859.     str_free(str);
  1860.     yyerror("Substitution replacement not terminated");
  1861.     yylval.arg = Nullarg;
  1862.     return s;
  1863.     }
  1864.     spat->spat_repl = yylval.arg;
  1865.     if ((spat->spat_repl[1].arg_type & A_MASK) == A_SINGLE)
  1866.     spat->spat_flags |= SPAT_CONST;
  1867.     else if ((spat->spat_repl[1].arg_type & A_MASK) == A_DOUBLE) {
  1868.     STR *tmpstr;
  1869.     register char *t;
  1870.  
  1871.     spat->spat_flags |= SPAT_CONST;
  1872.     tmpstr = spat->spat_repl[1].arg_ptr.arg_str;
  1873.     e = tmpstr->str_ptr + tmpstr->str_cur;
  1874.     for (t = tmpstr->str_ptr; t < e; t++) {
  1875.         if (*t == '$' && t[1] && (index("`'&+0123456789",t[1]) ||
  1876.           (t[1] == '{' /*}*/ && isDIGIT(t[2])) ))
  1877.         spat->spat_flags &= ~SPAT_CONST;
  1878.     }
  1879.     }
  1880.     while (*s == 'g' || *s == 'i' || *s == 'e' || *s == 'o') {
  1881.     int es = 0;
  1882.  
  1883.     if (*s == 'e') {
  1884.         s++;
  1885.         es++;
  1886.         if ((spat->spat_repl[1].arg_type & A_MASK) == A_DOUBLE)
  1887.         spat->spat_repl[1].arg_type = A_SINGLE;
  1888.         spat->spat_repl = make_op(
  1889.         (!es && spat->spat_repl[1].arg_type == A_SINGLE
  1890.             ? O_EVALONCE
  1891.             : O_EVAL),
  1892.         2,
  1893.         spat->spat_repl,
  1894.         Nullarg,
  1895.         Nullarg);
  1896.         spat->spat_flags &= ~SPAT_CONST;
  1897.     }
  1898.     if (*s == 'g') {
  1899.         s++;
  1900.         spat->spat_flags |= SPAT_GLOBAL;
  1901.     }
  1902.     if (*s == 'i') {
  1903.         s++;
  1904.         sawi = TRUE;
  1905.         spat->spat_flags |= SPAT_FOLD;
  1906.         if (!(spat->spat_flags & SPAT_SCANFIRST)) {
  1907.         str_free(spat->spat_short);    /* anchored opt doesn't do */
  1908.         spat->spat_short = Nullstr;    /* case insensitive match */
  1909.         spat->spat_slen = 0;
  1910.         }
  1911.     }
  1912.     if (*s == 'o') {
  1913.         s++;
  1914.         spat->spat_flags |= SPAT_KEEP;
  1915.     }
  1916.     }
  1917.     if (spat->spat_short && (spat->spat_flags & SPAT_SCANFIRST))
  1918.     fbmcompile(spat->spat_short, spat->spat_flags & SPAT_FOLD);
  1919.     if (!spat->spat_runtime) {
  1920.     spat->spat_regexp = regcomp(str->str_ptr,str->str_ptr+len,
  1921.       spat->spat_flags & SPAT_FOLD);
  1922.     hoistmust(spat);
  1923.     }
  1924.     yylval.arg = make_match(O_SUBST,stab2arg(A_STAB,defstab),spat);
  1925.     str_free(str);
  1926.     return s;
  1927. }
  1928.  
  1929. void
  1930. hoistmust(spat)
  1931. register SPAT *spat;
  1932. {
  1933.     if (!spat->spat_short && spat->spat_regexp->regstart &&
  1934.     (!spat->spat_regexp->regmust || spat->spat_regexp->reganch & ROPT_ANCH)
  1935.        ) {
  1936.     if (!(spat->spat_regexp->reganch & ROPT_ANCH))
  1937.         spat->spat_flags |= SPAT_SCANFIRST;
  1938.     else if (spat->spat_flags & SPAT_FOLD)
  1939.         return;
  1940.     spat->spat_short = str_smake(spat->spat_regexp->regstart);
  1941.     }
  1942.     else if (spat->spat_regexp->regmust) {/* is there a better short-circuit? */
  1943.     if (spat->spat_short &&
  1944.       str_eq(spat->spat_short,spat->spat_regexp->regmust))
  1945.     {
  1946.         if (spat->spat_flags & SPAT_SCANFIRST) {
  1947.         str_free(spat->spat_short);
  1948.         spat->spat_short = Nullstr;
  1949.         }
  1950.         else {
  1951.         str_free(spat->spat_regexp->regmust);
  1952.         spat->spat_regexp->regmust = Nullstr;
  1953.         return;
  1954.         }
  1955.     }
  1956.     if (!spat->spat_short ||    /* promote the better string */
  1957.       ((spat->spat_flags & SPAT_SCANFIRST) &&
  1958.        (spat->spat_short->str_cur < spat->spat_regexp->regmust->str_cur) )){
  1959.         str_free(spat->spat_short);        /* ok if null */
  1960.         spat->spat_short = spat->spat_regexp->regmust;
  1961.         spat->spat_regexp->regmust = Nullstr;
  1962.         spat->spat_flags |= SPAT_SCANFIRST;
  1963.     }
  1964.     }
  1965. }
  1966.  
  1967. char *
  1968. scantrans(start)
  1969. char *start;
  1970. {
  1971.     register char *s = start;
  1972.     ARG *arg =
  1973.     l(make_op(O_TRANS,2,stab2arg(A_STAB,defstab),Nullarg,Nullarg));
  1974.     STR *tstr;
  1975.     STR *rstr;
  1976.     register char *t;
  1977.     register char *r;
  1978.     register short *tbl;
  1979.     register int i;
  1980.     register int j;
  1981.     int tlen, rlen;
  1982.     int squash;
  1983.     int delete;
  1984.     int complement;
  1985.  
  1986.     New(803,tbl,256,short);
  1987.     arg[2].arg_type = A_NULL;
  1988.     arg[2].arg_ptr.arg_cval = (char*) tbl;
  1989.  
  1990.     s = scanstr(s, SCAN_TR);
  1991.     if (s >= bufend) {
  1992.     yyerror("Translation pattern not terminated");
  1993.     yylval.arg = Nullarg;
  1994.     return s;
  1995.     }
  1996.     tstr = yylval.arg[1].arg_ptr.arg_str; 
  1997.     yylval.arg[1].arg_ptr.arg_str = Nullstr; 
  1998.     arg_free(yylval.arg);
  1999.     t = tstr->str_ptr;
  2000.     tlen = tstr->str_cur;
  2001.  
  2002.     if (s[-1] == *start)
  2003.     s--;
  2004.  
  2005.     s = scanstr(s, SCAN_TR|SCAN_REPL);
  2006.     if (s >= bufend) {
  2007.     yyerror("Translation replacement not terminated");
  2008.     yylval.arg = Nullarg;
  2009.     return s;
  2010.     }
  2011.     rstr = yylval.arg[1].arg_ptr.arg_str; 
  2012.     yylval.arg[1].arg_ptr.arg_str = Nullstr; 
  2013.     arg_free(yylval.arg);
  2014.     r = rstr->str_ptr;
  2015.     rlen = rstr->str_cur;
  2016.  
  2017.     complement = delete = squash = 0;
  2018.     while (*s == 'c' || *s == 'd' || *s == 's') {
  2019.     if (*s == 'c')
  2020.         complement = 1;
  2021.     else if (*s == 'd')
  2022.         delete = 2;
  2023.     else
  2024.         squash = 1;
  2025.     s++;
  2026.     }
  2027.     arg[2].arg_len = delete|squash;
  2028.     yylval.arg = arg;
  2029.     if (complement) {
  2030.     Zero(tbl, 256, short);
  2031.     for (i = 0; i < tlen; i++)
  2032.         tbl[t[i] & 0377] = -1;
  2033.     for (i = 0, j = 0; i < 256; i++) {
  2034.         if (!tbl[i]) {
  2035.         if (j >= rlen) {
  2036.             if (delete)
  2037.             tbl[i] = -2;
  2038.             else if (rlen)
  2039.             tbl[i] = r[j-1] & 0377;
  2040.             else
  2041.             tbl[i] = i;
  2042.         }
  2043.         else
  2044.             tbl[i] = r[j++] & 0377;
  2045.         }
  2046.     }
  2047.     }
  2048.     else {
  2049.     if (!rlen && !delete) {
  2050.         r = t; rlen = tlen;
  2051.     }
  2052.     for (i = 0; i < 256; i++)
  2053.         tbl[i] = -1;
  2054.     for (i = 0, j = 0; i < tlen; i++,j++) {
  2055.         if (j >= rlen) {
  2056.         if (delete) {
  2057.             if (tbl[t[i] & 0377] == -1)
  2058.             tbl[t[i] & 0377] = -2;
  2059.             continue;
  2060.         }
  2061.         --j;
  2062.         }
  2063.         if (tbl[t[i] & 0377] == -1)
  2064.         tbl[t[i] & 0377] = r[j] & 0377;
  2065.     }
  2066.     }
  2067.     str_free(tstr);
  2068.     str_free(rstr);
  2069.     return s;
  2070. }
  2071.  
  2072. char *
  2073. scanstr(start, in_what)
  2074. char *start;
  2075. int in_what;
  2076. {
  2077.     register char *s = start;
  2078.     register char term;
  2079.     register char *d;
  2080.     register ARG *arg;
  2081.     register char *send;
  2082.     register bool makesingle = FALSE;
  2083.     register STAB *stab;
  2084.     bool alwaysdollar = FALSE;
  2085.     bool hereis = FALSE;
  2086.     STR *herewas;
  2087.     STR *str;
  2088.     /* which backslash sequences to keep */
  2089.     char *leave = (in_what & SCAN_TR)
  2090.     ? "\\$@nrtfbeacx0123456789-"
  2091.     : "\\$@nrtfbeacx0123456789[{]}lLuUE";
  2092.     int len;
  2093.  
  2094.     arg = op_new(1);
  2095.     yylval.arg = arg;
  2096.     arg->arg_type = O_ITEM;
  2097.  
  2098.     switch (*s) {
  2099.     default:            /* a substitution replacement */
  2100.     arg[1].arg_type = A_DOUBLE;
  2101.     makesingle = TRUE;    /* maybe disable runtime scanning */
  2102.     term = *s;
  2103.     if (term == '\'')
  2104.         leave = Nullch;
  2105.     goto snarf_it;
  2106.     case '0':
  2107.     {
  2108.         unsigned long i;
  2109.         int shift;
  2110.  
  2111.         arg[1].arg_type = A_SINGLE;
  2112.         if (s[1] == 'x') {
  2113.         shift = 4;
  2114.         s += 2;
  2115.         }
  2116.         else if (s[1] == '.')
  2117.         goto decimal;
  2118.         else
  2119.         shift = 3;
  2120.         i = 0;
  2121.         for (;;) {
  2122.         switch (*s) {
  2123.         default:
  2124.             goto out;
  2125.         case '_':
  2126.             s++;
  2127.             break;
  2128.         case '8': case '9':
  2129.             if (shift != 4)
  2130.             yyerror("Illegal octal digit");
  2131.             /* FALL THROUGH */
  2132.         case '0': case '1': case '2': case '3': case '4':
  2133.         case '5': case '6': case '7':
  2134.             i <<= shift;
  2135.             i += *s++ & 15;
  2136.             break;
  2137.         case 'a': case 'b': case 'c': case 'd': case 'e': case 'f':
  2138.         case 'A': case 'B': case 'C': case 'D': case 'E': case 'F':
  2139.             if (shift != 4)
  2140.             goto out;
  2141.             i <<= 4;
  2142.             i += (*s++ & 7) + 9;
  2143.             break;
  2144.         }
  2145.         }
  2146.       out:
  2147.         str = Str_new(92,0);
  2148.         str_numset(str,(double)i);
  2149.         if (str->str_ptr) {
  2150.         Safefree(str->str_ptr);
  2151.         str->str_ptr = Nullch;
  2152.         str->str_len = str->str_cur = 0;
  2153.         }
  2154.         arg[1].arg_ptr.arg_str = str;
  2155.     }
  2156.     break;
  2157.     case '1': case '2': case '3': case '4': case '5':
  2158.     case '6': case '7': case '8': case '9': case '.':
  2159.       decimal:
  2160.     arg[1].arg_type = A_SINGLE;
  2161.     d = tokenbuf;
  2162.     while (isDIGIT(*s) || *s == '_') {
  2163.         if (*s == '_')
  2164.         s++;
  2165.         else
  2166.         *d++ = *s++;
  2167.     }
  2168.     if (*s == '.' && s[1] != '.') {
  2169.         *d++ = *s++;
  2170.         while (isDIGIT(*s) || *s == '_') {
  2171.         if (*s == '_')
  2172.             s++;
  2173.         else
  2174.             *d++ = *s++;
  2175.         }
  2176.     }
  2177.     if (*s && index("eE",*s) && index("+-0123456789",s[1])) {
  2178.         *d++ = *s++;
  2179.         if (*s == '+' || *s == '-')
  2180.         *d++ = *s++;
  2181.         while (isDIGIT(*s))
  2182.         *d++ = *s++;
  2183.     }
  2184.     *d = '\0';
  2185.     str = Str_new(92,0);
  2186.     str_numset(str,atof(tokenbuf));
  2187.     if (str->str_ptr) {
  2188.         Safefree(str->str_ptr);
  2189.         str->str_ptr = Nullch;
  2190.         str->str_len = str->str_cur = 0;
  2191.     }
  2192.     arg[1].arg_ptr.arg_str = str;
  2193.     break;
  2194.     case '<':
  2195.     if (in_what & (SCAN_REPL|SCAN_TR))
  2196.         goto do_double;
  2197.     if (*++s == '<') {
  2198.         hereis = TRUE;
  2199.         d = tokenbuf;
  2200.         if (!rsfp)
  2201.         *d++ = '\n';
  2202.         if (*++s && index("`'\"",*s)) {
  2203.         term = *s++;
  2204.         s = cpytill(d,s,bufend,term,&len);
  2205.         if (s < bufend)
  2206.             s++;
  2207.         d += len;
  2208.         }
  2209.         else {
  2210.         if (*s == '\\')
  2211.             s++, term = '\'';
  2212.         else
  2213.             term = '"';
  2214.         while (isALNUM(*s))
  2215.             *d++ = *s++;
  2216.         }                /* assuming tokenbuf won't clobber */
  2217.         *d++ = '\n';
  2218.         *d = '\0';
  2219.         len = d - tokenbuf;
  2220.         d = "\n";
  2221.         if (rsfp || !(d=ninstr(s,bufend,d,d+1)))
  2222.         herewas = str_make(s,bufend-s);
  2223.         else
  2224.         s--, herewas = str_make(s,d-s);
  2225.         s += herewas->str_cur;
  2226.         if (term == '\'')
  2227.         goto do_single;
  2228.         if (term == '`')
  2229.         goto do_back;
  2230.         goto do_double;
  2231.     }
  2232.     d = tokenbuf;
  2233.     s = cpytill(d,s,bufend,'>',&len);
  2234.     if (s < bufend)
  2235.         s++;
  2236.     else
  2237.         fatal("Unterminated <> operator");
  2238.  
  2239.     if (*d == '$') d++;
  2240.     while (*d && (isALNUM(*d) || *d == '\''))
  2241.         d++;
  2242.     if (d - tokenbuf != len) {
  2243.         s = start;
  2244.         term = *s;
  2245.         arg[1].arg_type = A_GLOB;
  2246.         set_csh();
  2247.         alwaysdollar = TRUE;    /* treat $) and $| as variables */
  2248.         goto snarf_it;
  2249.     }
  2250.     else {
  2251.         d = tokenbuf;
  2252.         if (!len)
  2253.         (void)strcpy(d,"ARGV");
  2254.         if (*d == '$') {
  2255.         arg[1].arg_type = A_INDREAD;
  2256.         arg[1].arg_ptr.arg_stab = stabent(d+1,TRUE);
  2257.         }
  2258.         else {
  2259.         arg[1].arg_type = A_READ;
  2260.         arg[1].arg_ptr.arg_stab = stabent(d,TRUE);
  2261.         if (!stab_io(arg[1].arg_ptr.arg_stab))
  2262.             stab_io(arg[1].arg_ptr.arg_stab) = stio_new();
  2263.         if (strEQ(d,"ARGV")) {
  2264.             (void)aadd(arg[1].arg_ptr.arg_stab);
  2265.             stab_io(arg[1].arg_ptr.arg_stab)->flags |=
  2266.               IOF_ARGV|IOF_START;
  2267.         }
  2268.         }
  2269.     }
  2270.     break;
  2271.  
  2272.     case 'q':
  2273.     s++;
  2274.     if (*s == 'q') {
  2275.         s++;
  2276.         goto do_double;
  2277.     }
  2278.     if (*s == 'x') {
  2279.         s++;
  2280.         goto do_back;
  2281.     }
  2282.     /* FALL THROUGH */
  2283.     case '\'':
  2284.       do_single:
  2285.     term = *s;
  2286.     arg[1].arg_type = A_SINGLE;
  2287.     leave = Nullch;
  2288.     goto snarf_it;
  2289.  
  2290.     case '"': 
  2291.       do_double:
  2292.     term = *s;
  2293.     arg[1].arg_type = A_DOUBLE;
  2294.     makesingle = TRUE;    /* maybe disable runtime scanning */
  2295.     alwaysdollar = TRUE;    /* treat $) and $| as variables */
  2296.     goto snarf_it;
  2297.     case '`':
  2298.       do_back:
  2299.     term = *s;
  2300.     arg[1].arg_type = A_BACKTICK;
  2301.     set_csh();
  2302.     alwaysdollar = TRUE;    /* treat $) and $| as variables */
  2303.       snarf_it:
  2304.     {
  2305.         STR *tmpstr;
  2306.         STR *tmpstr2 = Nullstr;
  2307.         char *tmps;
  2308.         char *start;
  2309.         bool dorange = FALSE;
  2310.  
  2311.         CLINE;
  2312.         multi_start = curcmd->c_line;
  2313.         if (hereis)
  2314.         multi_open = multi_close = '<';
  2315.         else {
  2316.         multi_open = term;
  2317.         if (term && (tmps = index("([{< )]}> )]}>",term)))
  2318.             term = tmps[5];
  2319.         multi_close = term;
  2320.         }
  2321.         tmpstr = Str_new(87,80);
  2322.         if (hereis) {
  2323.         term = *tokenbuf;
  2324.         if (!rsfp) {
  2325.             d = s;
  2326.             while (s < bufend &&
  2327.               (*s != term || bcmp(s,tokenbuf,len) != 0) ) {
  2328.             if (*s++ == '\n')
  2329.                 curcmd->c_line++;
  2330.             }
  2331.             if (s >= bufend) {
  2332.             curcmd->c_line = multi_start;
  2333.             fatal("EOF in string");
  2334.             }
  2335.             str_nset(tmpstr,d+1,s-d);
  2336.             s += len - 1;
  2337.             str_ncat(herewas,s,bufend-s);
  2338.             str_replace(linestr,herewas);
  2339.             oldoldbufptr = oldbufptr = bufptr = s = str_get(linestr);
  2340.             bufend = linestr->str_ptr + linestr->str_cur;
  2341.             hereis = FALSE;
  2342.         }
  2343.         else
  2344.             str_nset(tmpstr,"",0);   /* avoid "uninitialized" warning */
  2345.         }
  2346.         else
  2347.         s = str_append_till(tmpstr,s+1,bufend,term,leave);
  2348.         while (s >= bufend) {    /* multiple line string? */
  2349.         if (!rsfp ||
  2350.          !(oldoldbufptr = oldbufptr = s = str_gets(linestr, rsfp, 0))) {
  2351.             curcmd->c_line = multi_start;
  2352.             fatal("EOF in string");
  2353.         }
  2354.         curcmd->c_line++;
  2355.         if (perldb) {
  2356.             STR *str = Str_new(88,0);
  2357.  
  2358.             str_sset(str,linestr);
  2359.             astore(stab_xarray(curcmd->c_filestab),
  2360.               (int)curcmd->c_line,str);
  2361.         }
  2362.         bufend = linestr->str_ptr + linestr->str_cur;
  2363.         if (hereis) {
  2364.             if (*s == term && bcmp(s,tokenbuf,len) == 0) {
  2365.             s = bufend - 1;
  2366.             *s = ' ';
  2367.             str_scat(linestr,herewas);
  2368.             bufend = linestr->str_ptr + linestr->str_cur;
  2369.             }
  2370.             else {
  2371.             s = bufend;
  2372.             str_scat(tmpstr,linestr);
  2373.             }
  2374.         }
  2375.         else
  2376.             s = str_append_till(tmpstr,s,bufend,term,leave);
  2377.         }
  2378.         multi_end = curcmd->c_line;
  2379.         s++;
  2380.         if (tmpstr->str_cur + 5 < tmpstr->str_len) {
  2381.         tmpstr->str_len = tmpstr->str_cur + 1;
  2382.         Renew(tmpstr->str_ptr, tmpstr->str_len, char);
  2383.         }
  2384.         if (arg[1].arg_type == A_SINGLE) {
  2385.         arg[1].arg_ptr.arg_str = tmpstr;
  2386.         break;
  2387.         }
  2388.         tmps = s;
  2389.         s = tmpstr->str_ptr;
  2390.         send = s + tmpstr->str_cur;
  2391.         while (s < send) {        /* see if we can make SINGLE */
  2392.         if (*s == '\\' && s[1] && isDIGIT(s[1]) && !isDIGIT(s[2]) &&
  2393.           !alwaysdollar && s[1] != '0')
  2394.             *s = '$';        /* grandfather \digit in subst */
  2395.         if ((*s == '$' || *s == '@') && s+1 < send &&
  2396.           (alwaysdollar || (s[1] != ')' && s[1] != '|'))) {
  2397.             makesingle = FALSE;    /* force interpretation */
  2398.         }
  2399.         else if (*s == '\\' && s+1 < send) {
  2400.             if (index("lLuUE",s[1]))
  2401.             makesingle = FALSE;
  2402.             s++;
  2403.         }
  2404.         s++;
  2405.         }
  2406.         s = d = start = tmpstr->str_ptr;    /* assuming shrinkage only */
  2407.         while (s < send || dorange) {
  2408.         if (in_what & SCAN_TR) {
  2409.             if (dorange) {
  2410.             int i;
  2411.             int max;
  2412.             if (!tmpstr2) {    /* oops, have to grow */
  2413.                 tmpstr2 = str_smake(tmpstr);
  2414.                 s = tmpstr2->str_ptr + (s - tmpstr->str_ptr);
  2415.                 send = tmpstr2->str_ptr + (send - tmpstr->str_ptr);
  2416.             }
  2417.             i = d - tmpstr->str_ptr;
  2418.             STR_GROW(tmpstr, tmpstr->str_len + 256);
  2419.             d = tmpstr->str_ptr + i;
  2420.             d -= 2;
  2421.             max = d[1] & 0377;
  2422.             for (i = (*d & 0377); i <= max; i++)
  2423.                 *d++ = i;
  2424.             start = s;
  2425.             dorange = FALSE;
  2426.             continue;
  2427.             }
  2428.             else if (*s == '-' && s+1 < send  && s != start) {
  2429.             dorange = TRUE;
  2430.             s++;
  2431.             }
  2432.         }
  2433.         else {
  2434.             if ((*s == '$' && s+1 < send &&
  2435.             (alwaysdollar || /*(*/(s[1] != ')' && s[1] != '|')) ) ||
  2436.             (*s == '@' && s+1 < send) ) {
  2437.             if (s[1] == '#' && (isALPHA(s[2]) || s[2] == '_'))
  2438.                 *d++ = *s++;
  2439.             len = scanident(s,send,tokenbuf) - s;
  2440.             if (*s == '$' || strEQ(tokenbuf,"ARGV")
  2441.               || strEQ(tokenbuf,"ENV")
  2442.               || strEQ(tokenbuf,"SIG")
  2443.               || strEQ(tokenbuf,"INC") )
  2444.                 (void)stabent(tokenbuf,TRUE); /* add symbol */
  2445.             while (len--)
  2446.                 *d++ = *s++;
  2447.             continue;
  2448.             }
  2449.         }
  2450.         if (*s == '\\' && s+1 < send) {
  2451.             s++;
  2452.             switch (*s) {
  2453.             case '-':
  2454.             if (in_what & SCAN_TR) {
  2455.                 *d++ = *s++;
  2456.                 continue;
  2457.             }
  2458.             /* FALL THROUGH */
  2459.             default:
  2460.             if (!makesingle && (!leave || (*s && index(leave,*s))))
  2461.                 *d++ = '\\';
  2462.             *d++ = *s++;
  2463.             continue;
  2464.             case '0': case '1': case '2': case '3':
  2465.             case '4': case '5': case '6': case '7':
  2466.             *d++ = scanoct(s, 3, &len);
  2467.             s += len;
  2468.             continue;
  2469.             case 'x':
  2470.             *d++ = scanhex(++s, 2, &len);
  2471.             s += len;
  2472.             continue;
  2473.             case 'c':
  2474.             s++;
  2475.             *d = *s++;
  2476.             if (isLOWER(*d))
  2477.                 *d = toupper(*d);
  2478.             *d++ ^= 64;
  2479.             continue;
  2480.             case 'b':
  2481.             *d++ = '\b';
  2482.             break;
  2483.             case 'n':
  2484.             *d++ = '\n';
  2485.             break;
  2486.             case 'r':
  2487.             *d++ = '\r';
  2488.             break;
  2489.             case 'f':
  2490.             *d++ = '\f';
  2491.             break;
  2492.             case 't':
  2493.             *d++ = '\t';
  2494.             break;
  2495.             case 'e':
  2496.             *d++ = '\033';
  2497.             break;
  2498.             case 'a':
  2499.             *d++ = '\007';
  2500.             break;
  2501.             }
  2502.             s++;
  2503.             continue;
  2504.         }
  2505.         *d++ = *s++;
  2506.         }
  2507.         *d = '\0';
  2508.  
  2509.         if (arg[1].arg_type == A_DOUBLE && makesingle)
  2510.         arg[1].arg_type = A_SINGLE;    /* now we can optimize on it */
  2511.  
  2512.         tmpstr->str_cur = d - tmpstr->str_ptr;
  2513.         if (arg[1].arg_type == A_GLOB) {
  2514.         arg[1].arg_ptr.arg_stab = stab = genstab();
  2515.         stab_io(stab) = stio_new();
  2516.         str_sset(stab_val(stab), tmpstr);
  2517.         }
  2518.         else
  2519.         arg[1].arg_ptr.arg_str = tmpstr;
  2520.         s = tmps;
  2521.         if (tmpstr2)
  2522.         str_free(tmpstr2);
  2523.         break;
  2524.     }
  2525.     }
  2526.     if (hereis)
  2527.     str_free(herewas);
  2528.     return s;
  2529. }
  2530.  
  2531. FCMD *
  2532. load_format()
  2533. {
  2534.     FCMD froot;
  2535.     FCMD *flinebeg;
  2536.     char *eol;
  2537.     register FCMD *fprev = &froot;
  2538.     register FCMD *fcmd;
  2539.     register char *s;
  2540.     register char *t;
  2541.     register STR *str;
  2542.     bool noblank;
  2543.     bool repeater;
  2544.  
  2545.     Zero(&froot, 1, FCMD);
  2546.     s = bufptr;
  2547.     while (s < bufend || (rsfp && (s = str_gets(linestr,rsfp, 0)) != Nullch)) {
  2548.     curcmd->c_line++;
  2549.     if (in_eval && !rsfp) {
  2550.         eol = index(s,'\n');
  2551.         if (!eol++)
  2552.         eol = bufend;
  2553.     }
  2554.     else
  2555.         eol = bufend = linestr->str_ptr + linestr->str_cur;
  2556.     if (perldb) {
  2557.         STR *tmpstr = Str_new(89,0);
  2558.  
  2559.         str_nset(tmpstr, s, eol-s);
  2560.         astore(stab_xarray(curcmd->c_filestab), (int)curcmd->c_line,tmpstr);
  2561.     }
  2562.     if (*s == '.') {
  2563.         /*SUPPRESS 530*/
  2564.         for (t = s+1; *t == ' ' || *t == '\t'; t++) ;
  2565.         if (*t == '\n') {
  2566.         bufptr = s;
  2567.         return froot.f_next;
  2568.         }
  2569.     }
  2570.     if (*s == '#') {
  2571.         s = eol;
  2572.         continue;
  2573.     }
  2574.     flinebeg = Nullfcmd;
  2575.     noblank = FALSE;
  2576.     repeater = FALSE;
  2577.     while (s < eol) {
  2578.         Newz(804,fcmd,1,FCMD);
  2579.         fprev->f_next = fcmd;
  2580.         fprev = fcmd;
  2581.         for (t=s; t < eol && *t != '@' && *t != '^'; t++) {
  2582.         if (*t == '~') {
  2583.             noblank = TRUE;
  2584.             *t = ' ';
  2585.             if (t[1] == '~') {
  2586.             repeater = TRUE;
  2587.             t[1] = ' ';
  2588.             }
  2589.         }
  2590.         }
  2591.         fcmd->f_pre = nsavestr(s, t-s);
  2592.         fcmd->f_presize = t-s;
  2593.         s = t;
  2594.         if (s >= eol) {
  2595.         if (noblank)
  2596.             fcmd->f_flags |= FC_NOBLANK;
  2597.         if (repeater)
  2598.             fcmd->f_flags |= FC_REPEAT;
  2599.         break;
  2600.         }
  2601.         if (!flinebeg)
  2602.         flinebeg = fcmd;        /* start values here */
  2603.         if (*s++ == '^')
  2604.         fcmd->f_flags |= FC_CHOP;    /* for doing text filling */
  2605.         switch (*s) {
  2606.         case '*':
  2607.         fcmd->f_type = F_LINES;
  2608.         *s = '\0';
  2609.         break;
  2610.         case '<':
  2611.         fcmd->f_type = F_LEFT;
  2612.         while (*s == '<')
  2613.             s++;
  2614.         break;
  2615.         case '>':
  2616.         fcmd->f_type = F_RIGHT;
  2617.         while (*s == '>')
  2618.             s++;
  2619.         break;
  2620.         case '|':
  2621.         fcmd->f_type = F_CENTER;
  2622.         while (*s == '|')
  2623.             s++;
  2624.         break;
  2625.         case '#':
  2626.         case '.':
  2627.         /* Catch the special case @... and handle it as a string
  2628.            field. */
  2629.         if (*s == '.' && s[1] == '.') {
  2630.             goto default_format;
  2631.         }
  2632.         fcmd->f_type = F_DECIMAL;
  2633.         {
  2634.             char *p;
  2635.  
  2636.             /* Read a format in the form @####.####, where either group
  2637.                of ### may be empty, or the final .### may be missing. */
  2638.             while (*s == '#')
  2639.             s++;
  2640.             if (*s == '.') {
  2641.             s++;
  2642.             p = s;
  2643.             while (*s == '#')
  2644.                 s++;
  2645.             fcmd->f_decimals = s-p;
  2646.             fcmd->f_flags |= FC_DP;
  2647.             } else {
  2648.             fcmd->f_decimals = 0;
  2649.             }
  2650.         }
  2651.         break;
  2652.         default:
  2653.         default_format:
  2654.         fcmd->f_type = F_LEFT;
  2655.         break;
  2656.         }
  2657.         if (fcmd->f_flags & FC_CHOP && *s == '.') {
  2658.         fcmd->f_flags |= FC_MORE;
  2659.         while (*s == '.')
  2660.             s++;
  2661.         }
  2662.         fcmd->f_size = s-t;
  2663.     }
  2664.     if (flinebeg) {
  2665.       again:
  2666.         if (s >= bufend &&
  2667.           (!rsfp || (s = str_gets(linestr, rsfp, 0)) == Nullch) )
  2668.         goto badform;
  2669.         curcmd->c_line++;
  2670.         if (in_eval && !rsfp) {
  2671.         eol = index(s,'\n');
  2672.         if (!eol++)
  2673.             eol = bufend;
  2674.         }
  2675.         else
  2676.         eol = bufend = linestr->str_ptr + linestr->str_cur;
  2677.         if (perldb) {
  2678.         STR *tmpstr = Str_new(90,0);
  2679.  
  2680.         str_nset(tmpstr, s, eol-s);
  2681.         astore(stab_xarray(curcmd->c_filestab),
  2682.             (int)curcmd->c_line,tmpstr);
  2683.         }
  2684.         if (strnEQ(s,".\n",2)) {
  2685.         bufptr = s;
  2686.         yyerror("Missing values line");
  2687.         return froot.f_next;
  2688.         }
  2689.         if (*s == '#') {
  2690.         s = eol;
  2691.         goto again;
  2692.         }
  2693.         str = flinebeg->f_unparsed = Str_new(91,eol - s);
  2694.         str->str_u.str_hash = curstash;
  2695.         str_nset(str,"(",1);
  2696.         flinebeg->f_line = curcmd->c_line;
  2697.         eol[-1] = '\0';
  2698.         if (!flinebeg->f_next->f_type || index(s, ',')) {
  2699.         eol[-1] = '\n';
  2700.         str_ncat(str, s, eol - s - 1);
  2701.         str_ncat(str,",$$);",5);
  2702.         s = eol;
  2703.         }
  2704.         else {
  2705.         eol[-1] = '\n';
  2706.         while (s < eol && isSPACE(*s))
  2707.             s++;
  2708.         t = s;
  2709.         while (s < eol) {
  2710.             switch (*s) {
  2711.             case ' ': case '\t': case '\n': case ';':
  2712.             str_ncat(str, t, s - t);
  2713.             str_ncat(str, "," ,1);
  2714.             while (s < eol && (isSPACE(*s) || *s == ';'))
  2715.                 s++;
  2716.             t = s;
  2717.             break;
  2718.             case '$':
  2719.             str_ncat(str, t, s - t);
  2720.             t = s;
  2721.             s = scanident(s,eol,tokenbuf);
  2722.             str_ncat(str, t, s - t);
  2723.             t = s;
  2724.             if (s < eol && *s && index("$'\"",*s))
  2725.                 str_ncat(str, ",", 1);
  2726.             break;
  2727.             case '"': case '\'':
  2728.             str_ncat(str, t, s - t);
  2729.             t = s;
  2730.             s++;
  2731.             while (s < eol && (*s != *t || s[-1] == '\\'))
  2732.                 s++;
  2733.             if (s < eol)
  2734.                 s++;
  2735.             str_ncat(str, t, s - t);
  2736.             t = s;
  2737.             if (s < eol && *s && index("$'\"",*s))
  2738.                 str_ncat(str, ",", 1);
  2739.             break;
  2740.             default:
  2741.             yyerror("Please use commas to separate fields");
  2742.             }
  2743.         }
  2744.         str_ncat(str,"$$);",4);
  2745.         }
  2746.     }
  2747.     }
  2748.   badform:
  2749.     bufptr = str_get(linestr);
  2750.     yyerror("Format not terminated");
  2751.     return froot.f_next;
  2752. }
  2753.  
  2754. static void
  2755. set_csh()
  2756. {
  2757. #ifdef CSH
  2758.     if (!cshlen)
  2759.     cshlen = strlen(cshname);
  2760. #endif
  2761. }
  2762.