home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / std / internat / 881 < prev    next >
Encoding:
Text File  |  1992-12-16  |  2.0 KB  |  52 lines

  1. Newsgroups: comp.std.internat
  2. Path: sparky!uunet!elroy.jpl.nasa.gov!swrinde!cs.utexas.edu!torn!watserv2.uwaterloo.ca!watserv1!mks.com!giga!eric
  3. From: eric@giga.mks.com (Eric Gisin)
  4. Subject: Summary of the 8 bit problem
  5. Message-ID: <ERIC.92Dec16172735@giga.mks.com>
  6. Sender: eric@mks.com (Eric Gisin)
  7. Organization: Mortice Kern Systems Inc., Waterloo, Ontario, CANADA
  8. Date: Wed, 16 Dec 1992 22:27:35 GMT
  9. Lines: 41
  10.  
  11. I think I understand what the problems are,
  12. but I haven't seen a summary of what the solutions are.
  13.  
  14. I see two completly different problems, in points 2 and 3.
  15.  
  16. 1. The low level transports.
  17. UUCP, TCP, and ISO protocols are 8 bit. No problem here.
  18.  
  19. 2. The high level transports.
  20. SMTP is 7 bit, but there is a replacement.
  21. But, even with a replacement, we have to deal with old software.
  22.  
  23. So the problem is encoding 8 bit data to deal with 7 bit gateways.
  24. We do not have to deal the particular character sets
  25. or with multi-byte encodings at this level.
  26.  
  27. How does MIME or other solutions deal with this?
  28.  
  29. 3. The applications.
  30. Applications have to be aware of the character set and encoding.
  31. The simplest solution is to handle just the ISO 8859-1 character set.
  32. This should be no problem with most modern software and hardware.
  33. This can be called the "western european solution".
  34.  
  35. The second best solution is to handle all of the ISO 8859-# character sets.
  36. The problem here is displaying the right character set,
  37. and having all the fonts in hardware or software.
  38. Not having all the fonts might be a problem for many people.
  39. This can be called the "indo-european solution".
  40.  
  41. Any programmer can pick up some good books and implement most of this.
  42. The two things that are poorly documented (or non-portable)
  43. are locale naming conventions and selecting display fonts.
  44.  
  45. The best solution is to have full support for multi-byte character sets.
  46. I think this is much more difficult than the previous solution,
  47. because of the lack of library support for developing such applications.
  48.  
  49. How does MIME or other solutions deal with these problems?
  50.  
  51.         Eric Gisin, Mortice Kern Systems.
  52.