home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #30 / NN_1992_30.iso / spool / comp / std / internat / 900 < prev    next >
Encoding:
Internet Message Format  |  1992-12-20  |  1.9 KB

  1. Xref: sparky comp.std.internat:900 news.admin.misc:835
  2. Path: sparky!uunet!pipex!doc.ic.ac.uk!doc.ic.ac.uk!usenet
  3. From: rap@news (Ross Paterson)
  4. Newsgroups: comp.std.internat,news.admin.misc
  5. Subject: Re: 8-bit representation, plus an X problem
  6. Date: 18 Dec 1992 11:00:20 GMT
  7. Organization: Dept. of Computing, Imperial College, University of London, UK.
  8. Lines: 28
  9. Message-ID: <1gsb04INNpqi@frigate.doc.ic.ac.uk>
  10. References: <24433@alice.att.com>
  11. Reply-To: rap@doc.ic.ac.uk
  12. NNTP-Posting-Host: peaberry.doc.ic.ac.uk
  13.  
  14. From article <24433@alice.att.com>, by andrew@alice.att.com (Andrew Hume):
  15. |    UTF-1 does #00-#9f in one byte, #a0-#4015 in two bytes, and
  16. | #4106-#ffff in three bytes. FSS-UTF does #00-#7f in one byte, #80-#7ff
  17. | in two bytes and #800-#ffff in three bytes. [...]
  18. |
  19. |    certainly, the characters between #800 and #4015 will take
  20. | 50% more space in FSS-UTF than UTF-1. from our file command (which
  21. | guesses at languages), this would seem to include Devanagari, Bengali,
  22. | Gurmukhi, Gujarati, Oriya, Tamil, Telugu, Kannada, Malayalam, Thai, Lao,
  23. | Tibetan, Georgian, Japanese (hiragana etc), chinese (some) and korean.
  24. | (with the exceptions of the CJK scripts and perhaps georgian, there
  25. | is no measureable email traffic in these scripts.)
  26.  
  27. Yes, UTF-1 gets the ALPHABET and SYMBOL zones, and the important part of
  28. the CJK AUXILIARY zone, in 2 bytes.  FSS-UTF goes up to 3 bytes just before
  29. it gets to the alphabets of Asia beyond the Middle East.  For this you get
  30. synchronization, but is it worth it?
  31.  
  32. |    and even for these scripts, i would guess connectivity (in the
  33. | sense of being able to send/receive messages at all) matters more
  34. | to those folks than the increase in space (how much of your disk is
  35. | mail?) or decrease in bandwidth (in most messages i see, headers are
  36. | 30-50% of the message).
  37.  
  38. They can get their connectivity by specifying an existing 7-bit standard
  39. in a MIME header.
  40.  
  41. How much of a Plan 9 disk is text?
  42.