home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1036 < prev    next >
Encoding:
Text File  |  1993-01-05  |  2.4 KB  |  75 lines

  1. Newsgroups: comp.std.internat
  2. Path: sparky!uunet!haven.umd.edu!decuac!pa.dec.com!jrdzzz.jrd.dec.com!jrd.dec.com!doi
  3. From: doi@jrd.dec.com (Hitoshi Doi)
  4. Subject: Re: Dumb Americans (was INTERNATIONALIZATION: JAPAN, FAR EAST)
  5. Message-ID: <C0Cyw8.Dn0@jrd.dec.com>
  6. Keywords: ISO10646 Unicode
  7. Sender: usenet@jrd.dec.com (USENET News System)
  8. Nntp-Posting-Host: usagi.jrd.dec.com
  9. Organization: DEC Japan Research and Development Center
  10. References: <8490@charon.cwi.nl> <1hvu79INN4qf@rodan.UU.NET> <1i0oj2INNp4v@life.ai.mit.edu> <1i13rrINNars@rodan.UU.NET> <1993Jan1.163927.20277@prl.dec.com> <2605@titccy.cc.titech.ac.jp> <1993Jan4.214109.8143@prl.dec.com>
  11. Date: Tue, 5 Jan 1993 02:00:08 GMT
  12. Lines: 61
  13.  
  14. In article <1993Jan4.214109.8143@prl.dec.com>, boyd@prl.dec.com (Boyd Roberts) writes:
  15. # In article <2605@titccy.cc.titech.ac.jp>, mohta@necom830.cc.titech.ac.jp (Masataka Ohta) writes:
  16. # > 
  17. # > In Japanese, the only natural sorting is on pronouciation, whose
  18. # > information is missing from character code. Otherwise, any sorting
  19. # > is almost as good as other sorting.
  20. # > 
  21. # Applying your argument to languages that use the glyphs 0, 1, 2, 3, 4, 5,
  22. # 6, 7, 8 and 9 to represent integers then it is only `natural' to sort
  23. # them based on their pronounciation.
  24. # So in Japanese I will find myself sorting them in ascending order:
  25. #     1 ichi
  26. #     9 kyu
  27. #     5 go
  28. #     3 san
  29. #     4 shi
  30. #     7 shichi
  31. #     0 zero
  32. #     2 ni
  33. #     8 hachi
  34.  
  35. true, if that is how the numbers are intended to be read.
  36.  
  37. # But that would be wrong, because I can pronounce:
  38.            ^^^^^ could
  39.  
  40. #     0 as rei
  41. #     4 as yon
  42. #     7 as nana
  43. #     9 as ku
  44.  
  45. # So just how will you sort these glyphs based on `natural' pronounciation?
  46.  
  47. you have to know how it is intended to be read (pronounced).
  48. otherwise you can't sort.
  49.  
  50. an example (sorted in ascending order):
  51.  
  52.  3rd (3 is read 'saa')
  53.  sankaku
  54.  3gatu (3 is read 'san')
  55.  30 (30 is read 'sanjuu')
  56.  4kaku (4 is read 'shi')
  57.  13 (13 is read 'juusan')
  58.  12 (12 is read 'juuni')
  59.  3D (3 is read 'surii')
  60.  3tsu (3 is read 'mi')
  61.  4do (4 is read 'yon')
  62.  123 (123 is read 'wan tsuu surii')
  63.  
  64. silly?
  65.  
  66. sorting Japanese using a mixture of kanji, kana, numbers, alphabets
  67. can be really difficult.
  68. --
  69. Hitoshi Doi, International Open Systems Engineering        doi@jrd.dec.com
  70. Japan Research and Development Center               decwrl!jrd.dec.com!doi
  71. Digital Equipment Corporation Japan      [from JUNET: doi@jrd.dec-j.co.jp]
  72.