home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1054 < prev    next >
Encoding:
Text File  |  1993-01-06  |  5.0 KB  |  122 lines

  1. Path: sparky!uunet!math.fu-berlin.de!mailgzrz.TU-Berlin.DE!news.netmbx.de!Germany.EU.net!incom!kostis!blues!kosta
  2. From: kosta@blues.kk.sub.org (Kosta Kostis)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Dumb Unicoders
  5. Summary: Hit someone else, please or better don't hit anyone
  6. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  7. Message-ID: <TaaXwB1w165w@blues.kk.sub.org>
  8. Date: Tue, 05 Jan 93 22:16:52 MET
  9. References: <2608@titccy.cc.titech.ac.jp>
  10. Organization: The Blues Family
  11. Lines: 109
  12.  
  13. mohta@necom830.cc.titech.ac.jp (Masataka Ohta) writes:
  14.  
  15. > In article <DwqPwB3w165w@blues.kk.sub.org>
  16. >       kosta@blues.kk.sub.org (Kosta Kostis) writes:
  17. > >I agree that UniCode is not very good for Asian languages, but
  18. > >for European languages (and some more) it's really OK.
  19. > Then, could you get out of here, comp.std.internat?
  20.  
  21. Masataka-san, if you are unable or unwilling to understand my posting,
  22. please refrain from pointing your publicly known flame thrower at me.
  23. Thank you very much, indeed.
  24.  
  25. > >10 bits? You want to keep Asian languages out of the game, too?  :-)
  26. > Or, you want to keep Asian languages out of the game, too?  :-|
  27.  
  28. Iie, soo dewa arimasen.
  29.  
  30. Is it possible that you have become a little "paranoid" during
  31. your "fight" against 16-bit UniCode.  =;^)
  32.  
  33. What makes you believe that I want to keep Asian languages "out, too"?
  34. It's the other round. 
  35.  
  36. My statement was that UniCode supports Latin-like language well while
  37. Asian languages are *not* covered well. Does that imply I *like* UniCode?
  38. No, so please calm down. Arigatoo gozaimasu.  :-)
  39.  
  40. > >Should
  41. > >we ever decide to use the full 32-bits ISO 10646 intended to
  42. > >allocate for character codes, we should be able to cover almost
  43. > >all languages (to some extend).
  44. > Full 32 bit? 18 or 20 bits will be suffice for the real universal
  45. > character code set.
  46.  
  47. Well, at least one that is "universal" enough from a Japanese point
  48. of view  ;-), but maybe you're right. So, just to satisfy my curiousity:
  49. how do you represent 18 or 20 bits with 8-bit octets?
  50. Wouldn't be there be some "wasted" bits?
  51. Please don't let us make the same mistake that was done when SMTP was
  52. designed to cut off the MSB when discussing a "universal" character set.
  53.  
  54. > >Who defines "required"? This is a classical "don't care about the
  55. > >users culture/needs" approach that was so harmfull in the past.
  56. > ISO 8859-1 is not very good for all European languages, but
  57. > for central European languages (and some more) it's really OK.
  58.  
  59. Right, but there are more character sets needed like ISO 8859-7 for
  60. Greek (I am a Greek), ISO 8859-5 for Cyrillic (allthough Vadim doesn't
  61. like it), ISO 8859-8 for Hebrew, ISO 8859-6 for Arabic and many more.
  62.  
  63. I want to be able to compose a document containing all the languages,
  64. many more *including* the Asian languages. That's what leads us to a
  65. "universal" character set. Note, that I have never claimed, that 16-bit
  66. UniCode *is* the "universal" character set I'm looking for.
  67.  
  68. As I stated before, I think 16-bit UniCode is one step "aside" and one
  69. into the "right" direction. Does that sound like "fandom"?
  70.  
  71. > Then, you wrote:
  72. >       I agree that UniCode is not very good for Asian languages, but
  73. >       for European languages (and some more) it's really OK.
  74. > What was so harmful in the past? What you are repeating?
  75.  
  76. Well, the same thing that all non-english speaking people suffered
  77. and still suffer from because of the fact that the U. S. were and
  78. still are leading and ruling the computer industry.
  79. Don't get me wrong, I have no objections against the U. S., they
  80. just ignored the needs of their international customers for much
  81. too long.
  82.  
  83. We suffer(ed) from Systems, that don't support anything other than
  84. ASCII or at least nothing more than *one* 8-bit character set (like
  85. ISO 8859-1, which is better (for me) than US ASCII but not enough).
  86. In Japan you have your own local solution which may be the better
  87. for you than 16-bit UniCode, but that isn't "universal" either.
  88.  
  89. I think we can agree we all should want to have a "universal" character
  90. set. At least as a basis for *international* data/document interchange.
  91.  
  92. > >The other languages you stated, like Russian, Greek and English
  93. > >seem to be served well by UniCode, I think.
  94. > But, as for reg-exp pattern, Vadim's suggestion is quite right.
  95.  
  96. What do you use reg-exp patterns for? I think it's irrelevant or at
  97. least no real problem. Local versions for that will never go, I believe.
  98. Do you know any broadly used computer language that supports more than
  99. US ASCII in qualifiers, names, etc.?   :-)
  100.  
  101. If you want to stay with two "alphabets" fitting in 8-bit, you can
  102. always convert your ISO 10646 data to KOI-8 (or whatever) and use
  103. your old programs. Right, Vadim?   ;-)
  104.  
  105.     Kosta
  106.  
  107. PS: I am *not* a "UniCode"r, but I strongly feel the need for a universal
  108.     character set and I want it *implemented* in *this* century. :-)
  109.  
  110. -- 
  111.   Kosta Kostis, Talstrasse 25, D-6074 Roedermark 3, Germany
  112.   kosta@blues.kk.sub.org                                        (home)
  113.   sw authors: please support ISO 8859-x!      Σ÷ⁿ─╓▄▀ = aeoeueAEOEUEss
  114.