home *** CD-ROM | disk | FTP | other *** search
/ Turbo Toolbox / Turbo_Toolbox.iso / dtx9202 / pretty / prscan.mod < prev   
Encoding:
Modula Implementation  |  1991-02-18  |  6.2 KB  |  255 lines

  1.  
  2. IMPLEMENTATION MODULE PRSCAN;
  3. (*****************************************************************************)
  4. (*                              Modula-2 Scanner                             *)
  5. (*                       (c) Peter Engels       1990                         *)
  6. (*****************************************************************************)
  7.  
  8. FROM FIO IMPORT File,EOF,RdChar;
  9.  
  10. TYPE charset = SET OF CHAR;
  11.  
  12. VAR doubleperiod : BOOLEAN;
  13.     crlfseen : BOOLEAN;
  14.     lastch : CHAR;
  15.     again : BOOLEAN;
  16.  
  17.   PROCEDURE InitScanner;
  18.  
  19.   BEGIN
  20.     doubleperiod := FALSE;
  21.     crlfseen := TRUE;
  22.     again := FALSE
  23.   END InitScanner;
  24.  
  25.   PROCEDURE ReadAgain;
  26.  
  27.   BEGIN
  28.     again := TRUE
  29.   END ReadAgain;
  30.  
  31.   PROCEDURE ReadChar (tin : File;
  32.                       VAR ch : CHAR);
  33.  
  34.   BEGIN
  35.     IF again THEN
  36.       ch := lastch;
  37.       again := FALSE
  38.     ELSE
  39.       ch := RdChar (tin);
  40.       lastch := ch
  41.     END
  42.   END ReadChar;
  43.  
  44.   PROCEDURE GetToken (tin : File;
  45.                       VAR token : TokenTyp);
  46.  
  47.   VAR ch : CHAR;
  48.  
  49.     PROCEDURE Letters (ch : CHAR) : BOOLEAN;
  50.  
  51.     BEGIN
  52.       RETURN ch IN charset {'a'..'z','A'..'Z','_'}
  53.     END Letters;
  54.  
  55.     PROCEDURE Numbers (ch : CHAR) : BOOLEAN;
  56.  
  57.     BEGIN
  58.       RETURN ch IN charset {'0'..'9'}
  59.     END Numbers;
  60.  
  61.     PROCEDURE getnextchar;
  62.  
  63.     BEGIN
  64.       WITH token DO
  65.         value [length] := ch;
  66.         INC (length)
  67.       END;
  68.       ReadChar (tin,ch);
  69.     END getnextchar;
  70.  
  71.     PROCEDURE getidentifier;
  72.  
  73.     BEGIN
  74.       REPEAT
  75.         getnextchar
  76.       UNTIL ~ (Letters (ch) OR Numbers (ch));
  77.       token.symbol := identifier
  78.     END getidentifier;
  79.  
  80.     PROCEDURE getnumber;
  81.  
  82.     BEGIN
  83.       REPEAT
  84.         getnextchar
  85.       UNTIL ~ Numbers (ch);
  86.       IF ch = '.' THEN
  87.         getnextchar;
  88.         IF ~ Numbers (ch) THEN
  89.           IF ch = '.' THEN
  90.             doubleperiod := TRUE;
  91.             DEC (token.length);
  92.             token.symbol := number
  93.           END;
  94.           RETURN
  95.         ELSE
  96.           REPEAT
  97.             getnextchar
  98.           UNTIL ~ Numbers (ch);
  99.           ch := CAP (ch);
  100.           IF (ch = 'E') OR (ch = 'D') THEN
  101.             getnextchar;
  102.             IF (ch = '+') OR (ch = '-') THEN
  103.               getnextchar;
  104.               IF ~ Numbers (ch) THEN
  105.                 RETURN
  106.               ELSE
  107.                 REPEAT
  108.                   getnextchar
  109.                 UNTIL ~ Numbers (ch)
  110.               END
  111.             ELSE
  112.               WHILE Numbers (ch) DO
  113.                 getnextchar
  114.               END
  115.             END
  116.           END
  117.         END
  118.       ELSE
  119.         ch := CAP (ch);
  120.         IF ((ch >= 'A') & (ch <= 'F')) OR (ch = 'O') OR (ch = 'L') OR (ch =
  121.            'H') THEN
  122.           getnumber
  123.         END
  124.       END;
  125.       token.symbol := number
  126.     END getnumber;
  127.  
  128.     PROCEDURE getspecialchar;
  129.  
  130.     VAR lastchar : CHAR;
  131.  
  132.       PROCEDURE getstring;
  133.  
  134.       BEGIN
  135.         WHILE (ch # lastchar) DO
  136.           getnextchar;
  137.           IF EOF THEN
  138.             RETURN
  139.           END
  140.         END;
  141.         getnextchar;
  142.         token.symbol := stringsy
  143.       END getstring;
  144.  
  145.     BEGIN
  146.       WITH token DO
  147.         lastchar := ch;
  148.         getnextchar;
  149.         CASE lastchar OF
  150.         | '(' : IF ch = '*' THEN
  151.                   symbol := opencom;
  152.                   getnextchar;
  153.                 ELSE
  154.                   symbol := lpar
  155.                 END
  156.         | '.' : IF ch = '.' THEN
  157.                   symbol := dblperiod;
  158.                   getnextchar
  159.                 ELSE
  160.                   symbol := period
  161.                 END
  162.         | '<' : CASE ch OF
  163.                 | '=' : symbol := lesseq;
  164.                         getnextchar
  165.                 | '>' : symbol := notequal;
  166.                         getnextchar
  167.                 | '<' : symbol := shiftl;
  168.                         getnextchar
  169.                 ELSE
  170.                   symbol := less
  171.                 END
  172.         | ':' : CASE ch OF
  173.                 | ':' : getnextchar;
  174.                         IF ch = '=' THEN
  175.                           symbol := alias;
  176.                           getnextchar
  177.                         ELSE
  178.                           symbol := notallowed
  179.                         END
  180.                 | '=' : symbol := define;
  181.                         getnextchar
  182.                 ELSE
  183.                   symbol := colon;
  184.                 END
  185.         | '*' : IF ch = ')' THEN
  186.                   symbol := closecom;
  187.                   getnextchar;
  188.                 ELSE
  189.                   symbol := operationsy
  190.                 END
  191.         | '>' : IF ch = '=' THEN
  192.                   symbol := greq;
  193.                   getnextchar
  194.                 ELSIF ch = '>' THEN
  195.                   symbol := shiftr;
  196.                   getnextchar
  197.                 ELSE
  198.                   symbol := gr
  199.                 END
  200.         | ',' : symbol := comma
  201.         | ';' : symbol := semicolon
  202.         | '#' : symbol := notequal
  203.         | '=' : symbol := equal
  204.         | '~' : symbol := notsy
  205.         | '&' : symbol := andsy
  206.         | '^' : symbol := drefsy
  207.         | ')' : symbol := rpar
  208.         | '{' : symbol := lbr;
  209.         | '}' : symbol := rbr;
  210.         | '[' : symbol := lbk;
  211.         | ']' : symbol := rbk;
  212.         | "'",'"' : getstring
  213.         | '|','!' : symbol := bar;
  214.         | '+','-','/' : symbol := operationsy
  215.         END
  216.       END
  217.     END getspecialchar;
  218.  
  219.   BEGIN
  220.     WITH token DO
  221.       length := 0;
  222.       IF doubleperiod THEN
  223.         ReadChar (tin,ch);
  224.         value := '..';
  225.         symbol := dblperiod;
  226.         doubleperiod := FALSE
  227.       ELSE
  228.         symbol := notallowed;
  229.         REPEAT
  230.           ReadChar (tin,ch);
  231.           IF ch = 12C THEN
  232.             crlfseen := TRUE
  233.           END
  234.         UNTIL (ch > ' ') OR EOF;
  235.         IF Letters (ch) THEN
  236.           getidentifier
  237.         ELSIF Numbers (ch) THEN
  238.           getnumber
  239.         ELSIF ch > ' ' THEN
  240.           getspecialchar;
  241.           IF (symbol = opencom) & crlfseen THEN
  242.             value := '  (*';
  243.             value [0] := CHR (13);
  244.             value [1] := CHR (10);
  245.             length := 4
  246.           END
  247.         END;
  248.         crlfseen := FALSE;
  249.         value [length] := 0C;
  250.         ReadAgain
  251.       END
  252.     END
  253.   END GetToken;
  254.  
  255. END PRSCAN.