home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / unix / bsd / 10425 < prev    next >
Encoding:
Internet Message Format  |  1992-12-21  |  5.8 KB

  1. Xref: sparky comp.unix.bsd:10425 comp.os.linux:21072
  2. Newsgroups: comp.unix.bsd,comp.os.linux
  3. Path: sparky!uunet!cs.utexas.edu!sdd.hp.com!caen!hellgate.utah.edu!fcom.cc.utah.edu!cs.weber.edu!terry
  4. From: terry@cs.weber.edu (A Wizard of Earth C)
  5. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  6. Message-ID: <1992Dec19.083137.4400@fcom.cc.utah.edu>
  7. Keywords: Han Kanji Katakana Hirugana ISO10646 Unicode Codepages
  8. Sender: news@fcom.cc.utah.edu
  9. Organization: Weber State University  (Ogden, UT)
  10. References: <id.M2XV.VTA@ferranti.com> <1992Dec18.043033.14254@midway.uchicago.edu> <1992Dec18.212323.26882@netcom.com>
  11. Date: Sat, 19 Dec 92 08:31:37 GMT
  12. Lines: 95
  13.  
  14. In article <1992Dec18.212323.26882@netcom.com> messina@netcom.com (Tony Porczyk) writes:
  15. >goer@kimbark.uchicago.edu (Richard L. Goerwitz) writes:
  16. >
  17. >>>> Has anyone in this newsgroup ever heard of the Unicode/ISO10646
  18. >>>> (UCS) standard?
  19. >>>
  20. >>>You know, if 386BSD could be made to support NET-UTF (the Plan 9 version
  21. >>>of the 10646 standard) that would be a major advantage over commercial
  22. >>>Unices...
  23. >
  24. >>One of the big criticism leveled at US Engineers is that they are either
  25. >>too dumb or lazy to build into their software support for non-Western
  26. >>scripts.  Given that Linux originates in Europe, can we look forward to
  27. >>better support for Unicode and ISO10646?  At least for "long" charac-
  28. >>ter definitions?
  29. >
  30. >Yeah, that's probably why NT supports Unicode, it's those dumb US
  31. >Engineers...  Could we lay off idiotic generalizations and stick to
  32. >technical aspects of the software?  It's business that dictates what's
  33. >included in the package.  If it makes economic sense, it will be there.
  34. >Most of the internationalization is done locally anyway, so it has
  35. >nothing to do with dumb engineers.
  36.  
  37. 1)    You have a good point about US Engineer bashing.
  38.  
  39. 2)    "Internationalization done locally" is called localization.
  40.  
  41. 3)    In terms of "economic sense", one wonders why Unicode and ISO10646,
  42.     basically Western standards, are being applied to Far East languages
  43.     like Japanese, Chinese, and Korean, when the XPG4 standard, using
  44.     JIS (an existing Far Eastern standard) as a subset, is being ignored
  45.     by NT?
  46.  
  47.  
  48. To deal with the points in order:
  49.  
  50. US Engineers produce software for the available market; because of the
  51. input difficulties involved in 6000+ glyph sets of symbols, there has been
  52. a marked lack of standardization in Japanese hardware and software.  This
  53. means that the market in Japan consists of mostly "niche" markets, rather
  54. than being a commodity market.  This has changed somewhat with the Nintendo
  55. corporations recent successes in Japan, where standardized hardware is
  56. being used in most homes; this is probably an indicator of where the
  57. Japanese market is heading.  Still, a Nintendo (even with many peripherials
  58. not available in the US) is not a workstation.  Even here, the use of a
  59. custom DMA chip on *each* cartridge instead of *in* the machine, with a
  60. patent on it and a stiff licensing fee outside of Japan tend to imply that
  61. the Japanese software market will not be open any time soon to volume sales
  62. of US originated software.  This combines to make most internationalization
  63. Europe-centric, and therefore limited to 8-bit clean applications/drivers.
  64.  
  65. It is currently possible to localize anything.  Some of the European work
  66. (and some very particular "8 bit clean" code done in Greece) have been done
  67. for 386BSD.  This is called enabling; in particular, enabling for
  68. localization.  What we want is internationalization of 386BSD; this means
  69. providing tools and native (kernel and file system, and in particular, file
  70. system name space) support for it.  Internationalization goes beyond
  71. localization by providing for multinational use without exectable code
  72. changes.  If we assume booting to X on a VGA (640x480) as a default, and
  73. additional setup of the X to support alternate resoloutions, then we can
  74. cover nearly all written human languages, with exceptions for Arabic,
  75. Hebrew, and Tamil (and similar languages) which require "connection rules"
  76. to be drawn (not supported in X) or have differing drawing direction (for
  77. which there is only primitive support).  "Internationalization done locally"
  78. is localization: a seperate source tree is needed.
  79.  
  80. Microsoft has adopted Unicode as a standard.  It will probably be the
  81. prevalent standard because of this -- the software world is too wrapped
  82. up in commodity (read "DOS") hardware for it to be otherwise.  Unicode
  83. has also done something that XPG4 has not: unified the Far Eastern and
  84. all other written character sets in a single font, with room for some
  85. expansion (to the full 16 bits) and a discussion of moving to a full
  86. 32 bit mechanism.  XPG4, by adopting the JIS standard, appears to be
  87. igonoring HAN (Chinese) and many other languages covered by the Unicode
  88. standard.  So even if the Unicode standard ignores backward compatability
  89. with Japanese standards (and specific American and European standards),
  90. it better supports true internationalization.  I think that Japaneese
  91. users (and European and American users, if nothing is done about storage
  92. encoding to 8 bit sets) are going to have to live with the drawbacks of
  93. the standard for a very long time (the primary one being two 16K tables
  94. for input and output for each language representable in 8 bits, and two
  95. 16k tables for runic mapping for languages, like Japaneese, which don't
  96. fit on keyboards without postprocessing).
  97.  
  98.  
  99.                     Terry Lambert
  100.                     terry@icarus.weber.edu
  101. ---
  102. Any opinions in this posting are my own and not those of my present
  103. or previous employers.
  104. -- 
  105. -------------------------------------------------------------------------------
  106.                                         "I have an 8 user poetic license" - me
  107.  Get the 386bsd FAQ from agate.berkeley.edu:/pub/386BSD/386bsd-0.1/unofficial
  108. -------------------------------------------------------------------------------
  109.