home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1084 < prev    next >
Encoding:
Internet Message Format  |  1993-01-07  |  2.5 KB

  1. Path: sparky!uunet!munnari.oz.au!spool.mu.edu!sgiblab!nec-gw!nec-tyo!wnoc-tyo-news!cs.titech!titccy.cc.titech!necom830!mohta
  2. From: mohta@necom830.cc.titech.ac.jp (Masataka Ohta)
  3. Newsgroups: comp.std.internat
  4. Subject: Dumb Terry
  5. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  6. Message-ID: <2639@titccy.cc.titech.ac.jp>
  7. Date: 7 Jan 93 08:55:00 GMT
  8. References: <1hu9v5INNbp1@rodan.UU.NET> <8490@charon.cwi.nl> <1hvu79INN4qf@rodan.UU.NET> <1993Jan7.063116.14846@fcom.cc.utah.edu>
  9. Sender: news@titccy.cc.titech.ac.jp
  10. Organization: Tokyo Institute of Technology
  11. Lines: 45
  12.  
  13. In article <1993Jan7.063116.14846@fcom.cc.utah.edu>
  14.     terry@cs.weber.edu (A Wizard of Earth C) writes:
  15.  
  16. >The
  17. >collation sequences for Japanese, for instance, vary on pronuciation.  If
  18. >it were the intent of Unicode to provide a unified collation mechanism,
  19. >this would be a very strong argument against Chinese/Japanese unification.
  20.  
  21. You completely miss the point. Japanese Kanji does not have a unique
  22. pronouciation, while Japanese word has.
  23.  
  24. >First, Unicode is not the sole definition of 10646; just the only currently
  25. >defined character set within 10646.  There is no reason to throw out 10646
  26. >because of Unicode (although I could make an argument for 32 bits being a
  27. >nifty reason for doing so).
  28.  
  29. 10646 explicitely assign corresponding C/J/K Han in GB, JIS and KCS national
  30. standard to the same code point. Thus, expanding 10646 to 32 bit can't
  31. re-separate the assignment.
  32.  
  33. That is, 10646 is unusable, because it is polluted with Unicode.
  34.  
  35. >Second, Unicode buys more than simply another character set; it buys the
  36. >ability to produce non-conflicting monolingual localizations of software
  37. >systems (as opposed to conflicting ones as a result of a lack of standards
  38. >coordination with existing standards).  It also buys a platform for
  39. >non-conflicting multinationalization (multilingual data processing) given
  40. >a means of compounding documents by language/locale (there may be more than
  41. >one locale per language).
  42.  
  43. For such a purpose, use EUC, which is the moderate subset of ISO 2022.
  44.  
  45. >The Unicode character set solves a number of long standing problems.
  46.  
  47. Unicode is a genuine mixture of past failures:
  48.  
  49.     1) 16 bitness from 8 bitness of ISO 8859/*
  50.     2) statefullness (by signature) from ISO 2022
  51.     3) combining characters from ISO 6937
  52.     4) existence of full/half width character from JIS X0201/0208
  53.  
  54. and more, without solving any problems. And now, you are importing
  55. one more failure: incorrect dependence on locale model.
  56.  
  57.                         Masataka Ohta
  58.