home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / sci / lang / japan / 5175 < prev    next >
Encoding:
Text File  |  1993-01-24  |  1.4 KB  |  36 lines

  1. Newsgroups: sci.lang.japan
  2. Path: sparky!uunet!gatech!paladin.american.edu!howland.reston.ans.net!sol.ctr.columbia.edu!The-Star.honeywell.com!umn.edu!csus.edu!netcom.com!kschwarz
  3. From: kschwarz@netcom.com (Kenneth L. Schwarz)
  4. Subject: Sorting Japanese
  5. Message-ID: <1993Jan23.204214.29441@netcom.com>
  6. Organization: Netcom - Online Communication Services  (408 241-9760 guest) 
  7. Date: Sat, 23 Jan 1993 20:42:14 GMT
  8. Lines: 26
  9.  
  10. Does anyone know how sorts are implemented on lists of Japanese words?
  11. For example, let's say we have a database with 10 fields per record, and
  12. these records contain Roman characters, kanji, or kana, or any combination
  13. thereof.  If we want to be able to sort this database with any of the fields as
  14. the sort key, what do we do?
  15.  
  16. I know that in Japan telephone books are sorted by aiueo jun (that is, by the
  17. phonetic order of a kana matrix.)  And CDs are sorted in a similar way
  18. in record stores.  So it seems likely that a phonetic sort is the most 
  19. useful organization for human's to deal with.
  20.  
  21. But that would not be so for computers.  Sorting kanji by stroke count is
  22. easy:  there is one and only one stroke count for any particular glyph.
  23. But to do a phonetic sort would require that the algorithm recognize the
  24. particular reading of the character in context.  This is a bear of a
  25. problem.
  26.  
  27. Still, there must be ways that Japanese databases handle such problems.
  28. Anybody know how it's done?
  29.  
  30.     - Ken
  31.       kschwarz@netcom.com
  32.  
  33.  
  34.  
  35.  
  36.