home *** CD-ROM | disk | FTP | other *** search
/ Hackers Magazine 57 / CdHackersMagazineNr57.iso / Software / Multimedia / k3d-setup-0.7.11.0.exe / lib / site-packages / cgkit / sltokenize.py < prev    next >
Encoding:
Python Source  |  2007-01-11  |  5.4 KB  |  156 lines

  1. # ***** BEGIN LICENSE BLOCK *****
  2. # Version: MPL 1.1/GPL 2.0/LGPL 2.1
  3. #
  4. # The contents of this file are subject to the Mozilla Public License Version
  5. # 1.1 (the "License"); you may not use this file except in compliance with
  6. # the License. You may obtain a copy of the License at
  7. # http://www.mozilla.org/MPL/
  8. #
  9. # Software distributed under the License is distributed on an "AS IS" basis,
  10. # WITHOUT WARRANTY OF ANY KIND, either express or implied. See the License
  11. # for the specific language governing rights and limitations under the
  12. # License.
  13. #
  14. # The Original Code is the Python Computer Graphics Kit.
  15. #
  16. # The Initial Developer of the Original Code is Matthias Baas.
  17. # Portions created by the Initial Developer are Copyright (C) 2004
  18. # the Initial Developer. All Rights Reserved.
  19. #
  20. # Contributor(s):
  21. #
  22. # Alternatively, the contents of this file may be used under the terms of
  23. # either the GNU General Public License Version 2 or later (the "GPL"), or
  24. # the GNU Lesser General Public License Version 2.1 or later (the "LGPL"),
  25. # in which case the provisions of the GPL or the LGPL are applicable instead
  26. # of those above. If you wish to allow use of your version of this file only
  27. # under the terms of either the GPL or the LGPL, and not to allow others to
  28. # use your version of this file under the terms of the MPL, indicate your
  29. # decision by deleting the provisions above and replace them with the notice
  30. # and other provisions required by the GPL or the LGPL. If you do not delete
  31. # the provisions above, a recipient may use your version of this file under
  32. # the terms of any one of the MPL, the GPL or the LGPL.
  33. #
  34. # ***** END LICENSE BLOCK *****
  35. # $Id: sltokenize.py,v 1.3 2006/04/27 16:55:10 mbaas Exp $
  36.  
  37. """RenderMan Shading Language Tokenizer."""
  38.  
  39. import re, os.path
  40.  
  41. WHITESPACE = 0
  42. NAME       = 1
  43. NUMBER     = 2
  44. STRING     = 3
  45. NEWLINE    = 4
  46. OPERATOR   = 5
  47. CHARACTER  = 6
  48. TYPE       = 7
  49.  
  50. # tokenize
  51. def tokenize(readline, tokeater):
  52.     """Reads a Shading Language input stream and creates tokens.
  53.  
  54.     The first parameter, readline, must be a callable object which
  55.     provides the same interface as the readline() method of built-in
  56.     file objects. Each call to the function should return one line of
  57.     input as a string.
  58.  
  59.     The second parameter, tokeneater, must also be a callable object.
  60.     It is called with six parameters: the token type, the token
  61.     string, a tuple (srow, scol) specifying the row and column where
  62.     the token begins in the source, a tuple (erow, ecol) giving the
  63.     ending position of the token, the line on which the token was
  64.     found and the filename of the current file.
  65.  
  66.     By default the filename argument is an empty string. It will only
  67.     be the actual filename if you provide a preprocessed file stream
  68.     as input (so you should first run cpp on any shader). The
  69.     tokenizer actually expects preprocessed data as it doesn't handle
  70.     comments.
  71.     """
  72.     
  73.     types = ["float", "point", "vector", "normal", "matrix", "color"]
  74.  
  75.     regs =  ( (WHITESPACE, re.compile(r"[ \t]+")),
  76.               (NAME,       re.compile(r"[A-Za-z_][A-Za-z_0-9]*")),
  77.               (NUMBER,     re.compile(r"[0-9]+(\.[0-9]+)?(E(\+|-)?[0-9]+)?")),
  78.               (STRING,     re.compile(r"\"[^\"]*\"")),
  79.               (OPERATOR,   re.compile(r"\+|-|!|\.|\*|/|\^|<|>|<=|>=|==|!=|&&|\|\||\?|:|=|\(|\)")),
  80.               (NEWLINE,    re.compile(r"\n"))
  81.             )
  82.  
  83.     linenr   = 0
  84.     filename = ""
  85.     while 1:
  86.         # Read next line
  87.         line = readline()
  88.         # No more lines? then finish
  89.         if line=="":
  90.             break
  91.  
  92.         linenr+=1
  93.         # Base for starting column...
  94.         scolbase = 0
  95.  
  96.         # Process preprocessor lines...
  97.         if line[0]=="#":
  98.             try:
  99.                 f = line.strip().split(" ")
  100.                 linenr = int(f[1])-1
  101.                 filename = f[2][1:-1]
  102.             except:
  103.                 pass
  104.             continue
  105.  
  106.         s = line
  107.  
  108.         # Create tokens...
  109.         while s!="":
  110.             unmatched=1
  111.             # Check all regular expressions...
  112.             for r in regs:
  113.                 m=r[1].match(s)
  114.                 # Does it match? then the token is found
  115.                 if m!=None:
  116.                     scol = m.start()
  117.                     ecol = m.end()
  118.                     tok = s[scol:ecol]
  119.                     s   = s[ecol:]
  120.                     typ = r[0]
  121.                     if typ==NAME:
  122.                         if tok in types:
  123.                             typ = TYPE
  124.                     tokeater(typ, tok, (linenr, scolbase+scol), (linenr, scolbase+ecol), line, filename)
  125.                     scolbase += ecol
  126.                     unmatched=0
  127.                     continue
  128.  
  129.             # No match? then report a single character...
  130.             if unmatched:
  131.                 tok = s[0]
  132.                 tokeater(CHARACTER, tok, (linenr, scolbase), (linenr, scolbase+1), line, filename)
  133.                 s = s[1:]
  134.                 scolbase += 1
  135.             
  136.             
  137.  
  138. def _tokeater(type, s, start, end, line, filename):
  139.     if type==WHITESPACE or type==NEWLINE:
  140.         return
  141.  
  142.     typs = ["WHITESPACE", "NAME", "NUMBER", "STRING", "NEWLINE", "OPERATOR",
  143.             "CHARACTER", "TYPE"]
  144.     
  145. #    print "Token:",type,s, start,end,'\t"%s"'%line.replace("\n",""),filename
  146.     print "%-30s %-10s %s %s %s"%(s, typs[type], start, end, os.path.basename(filename))
  147.  
  148. ######################################################################
  149.  
  150. if __name__=="__main__":
  151.     import sys
  152.     
  153.     f=open(sys.argv[1])
  154.     tokenize(f.readline, _tokeater)
  155.     
  156.