home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #19 / NN_1992_19.iso / spool / comp / lang / rexx / 795 < prev    next >
Encoding:
Text File  |  1992-08-26  |  3.6 KB  |  77 lines

  1. Newsgroups: comp.lang.rexx
  2. Path: sparky!uunet!mcsun!sunic!aun.uninett.no!ugle.unit.no!ugle!anders
  3. From: anders@lise3.lise.unit.no (Anders Christensen)
  4. Subject: Re: Blanks, REXX, and portability...
  5. In-Reply-To: Otto Stolz's message of Wed, 26 Aug 1992 18:41:09 MEZ
  6. Message-ID: <ANDERS.92Aug27004039@lise3.lise.unit.no>
  7. Sender: news@ugle.unit.no (NetNews Administrator)
  8. Organization: /home/flipper/anders/.organization
  9. References: <REXXLIST%92082621432914@DEARN>
  10. Date: 27 Aug 92 00:40:39
  11. Lines: 64
  12.  
  13. I completely agree with Otto Stolz, both on the description of the
  14. current situation, and on what should be done. His list of checkpoints
  15. is very timely and should be addressed in the coming ANSI standard. 
  16. However, on one point I disagree:
  17.  
  18. In article <REXXLIST%92082621432914@DEARN> Otto Stolz <RZOTTO@DKNKURZ1.BITNET> writes:
  19.  
  20. > Note 1: Another recent contribution to REXXLIST stated that REXX source
  21. >       code, and REXX operands, might be represented in different
  22. >       character codes (perhaps including different notions of white
  23. >       space). A cursory scan through TRL did not reveal any support
  24. >       for this statemnt.
  25.  
  26. To quote TRL:
  27.  
  28.   "Programming in the REXX language can be considered to involve the
  29.    use of two character sets. The first is used for expressing the
  30.    REXX program itself, and is the relatively small set of characters
  31.    described in the next section. The second character set is the set
  32.    of characters that can be used as data by a particular
  33.    implementation of a REXX language processor. This character set may
  34.    be limitied in size (often to a limit of 256 different characters,
  35.    which have a convenient 8-bit representation), or it may be much
  36.    larger. Usually, most or all of these characters are also allowed
  37.    within a REXX program, but only within commentary or immediate
  38.    (literal) data."
  39.                            TRL, 2nd ed. 
  40.                            Part 2, section 1, page 18.
  41.                            First paragraph of "Character Sets", 
  42.  
  43. Of course, the term "two character sets" does not mean that the Rexx
  44. script is written in EBCDIC and the data is in ASCII. Rather, it means
  45. that the characters allowed in a rexx script are a subset of the
  46. characters allowed to be handled as data by the interpreter. For
  47. instance, ISO 646 (7-bit ASCII) can be allowed in the rexx script
  48. (except for comments and strings), while ISO 8859-1 is the character
  49. set that forms the data. 
  50.  
  51. Consequently, Rexx may allow a lesser set of whitespace characters for
  52. use in the Rexx script source code (except from comments and strings),
  53. while it may recognize a much broader set of whitespace characters in
  54. the data. The total character set that can be used in the Rexx scripts
  55. can be (including comments and strings) less than the character set
  56. handled by the interpreter. End-Of-Line characters (for the machines
  57. that use such) are allowed in data, but explicitly not allowed in
  58. strings in a Rexx script.
  59.  
  60. For instance, Tab (ascii 9) and Space (ascii 32) could be interpreted
  61. as whitespace in rexx source code, while Tab, Space and Non-breakable
  62. space (ascii 160) could be interpreted as whitespace in data. 
  63.  
  64. Btw, I don't remember saying anything about source code and data (or
  65. operands as you put it) should be represented by different character
  66. codes. What I did say (or least what I did mean) was that source code
  67. and data should be of two character sets.
  68.  
  69. >       To me, this tight coupling suggests that source program and
  70. >       operands should ideally be expressed in the same character
  71. >       code. [...]
  72.  
  73. It is, except that the source program can only use a subset of the
  74. character codes that the data can use. 
  75.  
  76. -anders
  77.