home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1019 < prev    next >
Encoding:
Internet Message Format  |  1993-01-04  |  2.1 KB

  1. Path: sparky!uunet!spool.mu.edu!sgiblab!nec-gw!nec-tyo!wnoc-tyo-news!cs.titech!titccy.cc.titech!necom830!mohta
  2. From: mohta@necom830.cc.titech.ac.jp (Masataka Ohta)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Unicoders
  5. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  6. Message-ID: <2608@titccy.cc.titech.ac.jp>
  7. Date: 4 Jan 93 17:17:57 GMT
  8. References: <1hu9v5INNbp1@rodan.UU.NET> <DwqPwB3w165w@blues.kk.sub.org>
  9. Sender: news@titccy.cc.titech.ac.jp
  10. Organization: Tokyo Institute of Technology
  11. Lines: 48
  12.  
  13. In article <DwqPwB3w165w@blues.kk.sub.org>
  14.     kosta@blues.kk.sub.org (Kosta Kostis) writes:
  15.  
  16. >UniCode is limited because everything is squeezed into 16-bit, but
  17. >for latin languages (and the like) it's just fine.
  18.  
  19. >>    In reality it means that Unicode is not a solution for
  20. >>    typesetting.
  21.  
  22. >Come on. What did you expect? A universal character set is not the
  23. >"solution", it's just intended to help you develop it.
  24.  
  25. >I agree that UniCode is not very good for Asian languages, but
  26. >for European languages (and some more) it's really OK.
  27.  
  28. Then, could you get out of here, comp.std.internat?
  29.  
  30. >10 bits? You want to keep Asian languages out of the game, too?  :-)
  31.  
  32. Or, you want to keep Asian languages out of the game, too?  :-|
  33.  
  34. >Should
  35. >we ever decide to use the full 32-bits ISO 10646 intended to
  36. >allocate for character codes, we should be able to cover almost
  37. >all languages (to some extend).
  38.  
  39. Full 32 bit? 18 or 20 bits will be suffice for the real universal
  40. character code set.
  41.  
  42. >Who defines "required"? This is a classical "don't care about the
  43. >users culture/needs" approach that was so harmfull in the past.
  44.  
  45. ISO 8859-1 is not very good for all European languages, but
  46. for central European languages (and some more) it's really OK.
  47.  
  48. Then, you wrote:
  49.  
  50.     I agree that UniCode is not very good for Asian languages, but
  51.     for European languages (and some more) it's really OK.
  52.  
  53. What was so harmful in the past? What you are repeating?
  54.  
  55. >The other languages you stated, like Russian, Greek and English
  56. >seem to be served well by UniCode, I think.
  57.  
  58. But, as for reg-exp pattern, Vadim's suggestion is quite right.
  59.  
  60.                     Masataka Ohta
  61.