home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #1 / NN_1993_1.iso / spool / comp / std / internat / 1035 < prev    next >
Encoding:
Internet Message Format  |  1993-01-05  |  2.2 KB

  1. Path: sparky!uunet!gatech!pitt.edu!djbpitt
  2. From: djbpitt+@pitt.edu (David J Birnbaum)
  3. Newsgroups: comp.std.internat
  4. Subject: Re: Language tagging
  5. Message-ID: <1387@blue.cis.pitt.edu>
  6. Date: 5 Jan 93 03:51:12 GMT
  7. References: <1993Jan2.231703.21201@enea.se> <1336@blue.cis.pitt.edu> <2613@titccy.cc.titech.ac.jp>
  8. Sender: news+@pitt.edu
  9. Organization: University of Pittsburgh
  10. Lines: 37
  11.  
  12. >>It is true that Vadim's character set always carries language
  13. >>information along with it, while bare Unicode does not. A Unicode based
  14. >>system, though, will require more than the bare character set (which is
  15. >>why I refer to it as a "Unicode-based system," rather than simply as
  16. >>"Unicode"). 
  17. >
  18. >Until we can figure how to attach the information, we can't use
  19. >Unicode or "Unicode-based system".
  20.  
  21. The acceptance of a standard for attaching this information is important
  22. and what I can do with Unicode in the absence of language tagging is
  23. somewhat limited. I find "we can't use" unnecessarily hyperbolic and
  24. pessimistic: ISO 8859/5 (Latin/Cyrillic) also contains no language
  25. identifiers of any sort, either as higher-level tags or through
  26. language-specific character ranges. That is, the need for language
  27. information in coded texts is real, but their absence from character
  28. sets is representative of many ISO standards and is not unique to Unicode.
  29. I agree that language information will ultimately have to be
  30. standardized, but I do not believe that this information necessarily has
  31. to be an inherent part of the character set itself.
  32.  
  33. As for "figuring out how to attach this information," the problem is
  34. far from solved, at least insofar as there are no widespread
  35. implementations of standardized systems to deal with it, but SGML is
  36. one candidate. I mention this not as a specific endorsement of SGML
  37. (perhaps there are better structures and SGML is hardly in widespread
  38. use), but as a reminder that there are efforts underway to develop a
  39. standard for attaching language information. I, too, impatiently await
  40. their ripening.
  41.  
  42. --David
  43. --
  44. -- 
  45. Professor David J. Birnbaum         djbpitt+@pitt.edu [Internet]
  46. The Royal York Apartments, #802     djbpitt@pittvms   [Bitnet]
  47. 3955 Bigelow Boulevard              voice: 1-412-687-4653
  48. Pittsburgh, PA  15213  USA          fax:   1-412-624-9714
  49.