home *** CD-ROM | disk | FTP | other *** search
/ Telecom / 1996-04-telecom-walnutcreek.iso / book.reviews / unicode.standard < prev    next >
Text File  |  1995-01-01  |  6KB  |  128 lines

  1.  
  2. Date: 29 Oct 93 12:20 -0600
  3. From: Rob Slade <roberts@decus.arc.ab.ca>
  4. Subject: Book Review: "The Unicode Standard"
  5.  
  6.  
  7. BKUNICOD.RVW  980921
  8.  
  9. Addison-Wesley Publishing Co.
  10. P.O. Box 520
  11. 26 Prince Andrew Place
  12. Don Mills, Ontario  M3C 2T8
  13. 416-447-5101 fax: 416-443-0948
  14. or
  15. 1 Jacob Way
  16. Reading, MA   01867-9984
  17. 800-527-5210  617-944-3700
  18. 5851 Guion Road
  19. Indianapolis, IN   46254
  20. 800-447-2226
  21. or
  22. Unicode, Inc.
  23. 1965 Charleston Road
  24. Mountain View, CA  94043
  25. (415) 961-4189   Fax: (415) 966-1637
  26.  
  27. "The Unicode Standard", U$32.95/C$42.95
  28. steve@unicode.org unicode-inc@unicode.org rick_mcgowan@next.com 
  29.  
  30. In the dim and distant past, the late, and generally unlamented, SUZY
  31. information system was born in Vancouver.  Rather an oddball as far as
  32. online services went, one "feature" was that the programmer had tried
  33. to allow for the use of all of the IBM graphics characters.  This lead
  34. to an entirely new field of "smiley" or "emoticon" (emotional icon)
  35. endeavours.  Instead of the usual sideways happy face of the colon,
  36. hyphen and right parenthesis; ":-)"; we were able to use the "Ctrl-A"
  37. alternative of the IBM PC character set.  Having a decimal value of
  38. one, this character is an upright happy face.  This allowed other
  39. expansions, such as Ctrl-A and the right square bracket, which looks
  40. like a face and a telephone handset, and was used (usually in the
  41. "chat" modes) for "I am on the phone."
  42.  
  43. "How nice," I hear you mutter between clenched teeth.  "Can we now get
  44. on with the review?"  Patience, stout nerds.  This *is* the review.
  45.  
  46. As SUZY users, particularly those who had been introduced to computer
  47. communications on the system, moved on to other services or local
  48. bulletin boards, they were usually quite shocked to find that their
  49. favourite symbols no longer worked.  The little diamond (Ctrl-C) would
  50. kill a message on a VAX.  Fidonet users might find that the cute
  51. tagline they had formed from graphics characters completely
  52. disappeared when they sent the message through an Internet gateway.
  53.  
  54. ASCII (the American Standard Code for Information Interchange) is
  55. widely, and mistakenly, believed to define two hundred and fifty-six
  56. characters.  It doesn't.  Furthermore, of the hundred and twenty-eight
  57. characters it does define, many are "control" rather than printable
  58. characters.  (The "card suit" symbols on the IBM PC graphics set are
  59. defined as "end of text", "end of transmission", "enquiry" and
  60. "acknowledgement" under the real ASCII standard.)  In addition, many
  61. believe ASCII to be a universal standard; also not true.  An octet
  62. with the decimal value thirty-five, for example, is the number sign
  63. (sometimes called an "octothorpe") in the United States, but a pound
  64. sign (the British currency) in Britain.  As with most fields of
  65. computer endeavor, the nice thing about standards is that there are so
  66. many to choose from.  Many vary only slightly -- but they vary.
  67.  
  68. The point is that there are a number of symbols which we commonly
  69. know, but which cannot be consistently displayed on terminals or
  70. printers.  Certain terminals will have certain "international"
  71. character sets, but not all are identical.  Accents and other phonetic
  72. modifiers may be difficult to handle: entire character sets are given
  73. over strictly to accented characters.  (In Canada we are acutely aware
  74. of the problems, with "French" keyboards used at many sites.  On one,
  75. I was having difficulty finding some necessary punctuation marks for
  76. network addressing, and asked a Francophone programmer for help.  "Who
  77. knows," he growled, "I never use the ____ things!")
  78.  
  79. Unicode seeks to address this problem.  Including not only the
  80. variations on the Latin alphabet, Unicode incorporates Greek,
  81. Cyrillic, Hebrew and other alphabets.  It also includes punctuation,
  82. diacriticals, mathematical and scientific symbols and miscellaneous
  83. graphics.  Asian ideographs are also assigned codes.  This is no
  84. longer suitable, of course, for a seven-bit code, and Unicode is based
  85. on a sixteen-bit address space.
  86.  
  87. The book gives some background and plans (chapter one), general
  88. principles and rules for conformance (chapter two).  To comment on
  89. these in any meaningful way would be to rewrite these chapters.  This
  90. is technical material, though not the same technology that computer
  91. types are used to.  Some background study in linguistics would be a
  92. good idea, although it is not strictly necessary to understand and use
  93. the Unicode standard.  There are, however, a wealth of symbols,
  94. punctuation marks and typesetting codes which Unicode gives
  95. standardized access to.  On the other hand, any application which used
  96. the standard in a significant way would likely require a linguistics
  97. background in any case.
  98.  
  99. The bulk of the books (two volumes) is, of course, taken up with the
  100. actual code charts.  (Volume two, in fact, is almost completely
  101. concerned with Han ideographs.  In spite of the recent widespread use
  102. of the English alphabet, this is still the standard written language
  103. of Chinese, Japanese and Korean: CJK in Unicode terminology.)  The
  104. charts are augmented with verbal definitions of the symbols, and with
  105. cross references to similar forms.
  106.  
  107. The Unicode standard is recent.  In comparative terms its current
  108. usage is negligible.  However, it is the defacto standard for broadly
  109. based international character sets.  With the recent rejection of the
  110. proposed ISO thirty-two bit standard, and the recasting of that
  111. standard to follow Unicode's lead, Unicode is a significant factor in
  112. the development of any international applications.
  113.  
  114. copyright Robert M. Slade, 1993   BKUNICOD.RVW  980921
  115.  
  116. (Postscriptum - Unicode Inc. maintains an FTP site at unicode.org
  117. (192.195.185.2).  Some of the mapping tables, and the Han cross
  118. reference lists are available.  Some tables are also available on IBM
  119. PC or Mac compatible floppy disks.)
  120.  
  121. Permission granted to distribute only with unedited copies of TELECOM
  122. Digest and associated newsgroups/mailing lists.
  123.  
  124.  
  125. DECUS Canada Communications, Desktop, Education and Security group newsletters
  126. Editor and/or reviewer ROBERTS@decus.ca, RSlade@sfu.ca, Rob Slade at 1:153/733
  127. DECUS Symposium '94, Vancouver, BC, Mar 1-3, 1994, contact: rulag@decus.ca
  128.