home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1127 < prev    next >
Encoding:
Internet Message Format  |  1993-01-09  |  2.3 KB

  1. Path: sparky!uunet!gatech!usenet.ins.cwru.edu!agate!ames!sun-barr!sh.wide!wnoc-tyo-news!cs.titech!titccy.cc.titech!necom830!mohta
  2. From: mohta@necom830.cc.titech.ac.jp (Masataka Ohta)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Keywords: Unicode ISO10646 CharacterEncoding
  6. Message-ID: <2675@titccy.cc.titech.ac.jp>
  7. Date: 10 Jan 93 03:29:10 GMT
  8. References: <1993Jan7.033153.12133@fcom.cc.utah.edu> <1993Jan8.092754.6344@prl.dec.com> <1993Jan9.024546.26934@fcom.cc.utah.edu> <1in2c8INNmbj@life.ai.mit.edu>
  9. Sender: news@titccy.cc.titech.ac.jp
  10. Organization: Tokyo Institute of Technology
  11. Lines: 41
  12.  
  13. In article <1in2c8INNmbj@life.ai.mit.edu>
  14.     glenn@wheat-chex.ai.mit.edu (Glenn A. Adams) writes:
  15.  
  16. >One should not in general use an interchange code (UTF1 or UTF2) for
  17. >processing.  While one may use a process code for interchange,
  18.  
  19. That is opposite.
  20.  
  21. One can use interchange code for processing if it is convenient.
  22.  
  23. There is no problem in doing so, as each application knows every detail
  24. of how interchange code is.
  25.  
  26. On the other hand, one can't use process code for interchange, unless
  27. you are living in the closed world, because other applications won't
  28. accept it.
  29.  
  30. >(e.g., Unicode and 10646 UCS[24] allow NULL bytes and ISO2022 C0/C1 control
  31. >code bytes in any byte position of their "process codes").
  32.  
  33. That is one of famous fatal design flaw of it.
  34.  
  35. >I can't imagine why anyone in their right mind would want to use UTF[12]
  36. >or any other ostensibe interchange code for processing, given the problems
  37. >of variable length encodings.
  38.  
  39. Maybe, you can't. But, in many cases, variable length is of no problem.
  40.  
  41. >But if one is to create
  42. >an aware application which uses more than the ASCII subset, or if it is
  43. >to memory map files, then use of a fixed-with process code (even for backing
  44. >store) becomes much more sensible.
  45.  
  46. You should be crazy. If you are mapping a file under possibly networked
  47. environment (these days, all environments are so), you can't use multiple
  48. octet fixed width code because of endeaness. Don't say signature, because
  49. it makes everything complex and, thus, slow, and your reasoning to map
  50. files should be for efficiency and for simplicity. BTW, though file mapping
  51. is neither efficient nor simple, it is another topic.
  52.  
  53.                         Masataka Ohta
  54.