home *** CD-ROM | disk | FTP | other *** search
/ Columbia Kermit / kermit.zip / archives / ucsterminal.zip / ucsterminal.txt < prev   
Text File  |  2002-04-11  |  37KB  |  880 lines

  1. SUPPLEMENTAL TERMINAL GRAPHICS FOR UNICODE
  2.  
  3.   Frank da Cruz
  4.   The Kermit Project
  5.   Columbia University
  6.   New York City USA
  7.   fdc@columbia.edu
  8.   http://www.columbia.edu/kermit/
  9.  
  10.   31 March 2000
  11.  
  12. Format:   Plain text with line breaks.
  13. Encoding: ISO 8859-1 (1)
  14.  
  15. (1) So accents look right when viewed through a Web browser.
  16.     There is no way to announce UTF-8 in a plain-text file.
  17.  
  18.  
  19. STATUS
  20.  
  21.   UTC Document L2/00-159
  22.   ISO WG2 Document N2265
  23.  
  24.   May 2000: UTC Motion [83-M24]: Move to Accept (for Unicode 3.2).
  25.  
  26.   Sep 2000: Approved by ISO WG2 for ISO/IEC ISO 10646-1:2000/Amd.1 at Athens;
  27.             Resolution M39.20 (Terminal Graphic Symbols): Unanimous.
  28.  
  29.   Assigned Codes:
  30.  
  31.     2071  SUPERSCRIPT LATIN SMALL LETTER I
  32.     23B7  RADICAL SYMBOL BOTTOM
  33.     23B8  LEFT VERTICAL BOX LINE
  34.     23B9  RIGHT VERTICAL BOX LINE
  35.     23BA  HORIZONTAL SCAN LINE-1
  36.     23BB  HORIZONTAL SCAN LINE-3
  37.     23BC  HORIZONTAL SCAN LINE-7
  38.     23BD  HORIZONTAL SCAN LINE-9
  39.     2596  QUADRANT LL
  40.     2597  QUADRANT LR
  41.     2598  QUADRANT UL
  42.     2599  QUADRANT UL AND LL AND LR
  43.     259A  QUADRANT UL AND LR
  44.     259B  QUADRANT UL AND UR AND LL
  45.     259C  QUADRANT UL AND UR AND LR
  46.     259D  QUADRANT UR
  47.     259E  QUADRANT UR AND LL
  48.     259F  QUADRANT UR AND LL AND LR
  49.  
  50.   Added in Unicode 3.2, 27 March 2002:
  51.  
  52.     http://www.unicode.org/unicode/reports/tr28/#12_5_technical_symbols
  53.     http://www.unicode.org/charts/
  54.  
  55.   In Unicode 3.0, the control picture glyphs at U+2400-2421 were revised
  56.   to have a diagonal presentation, as recommended in earlier versions of
  57.   this proposal.
  58.  
  59.  
  60. ABSTRACT
  61.  
  62. A selection of terminal graphics characters is proposed to allow
  63. Unicode-based terminal emulation software to display glyphs that are
  64. found on popular types of terminals but that are not currently available
  65. in Unicode, and to exchange these characters with other Unicode-based
  66. applications.  Approval of this proposal will promote the migration of
  67. terminal-based technical and forms-filling applications from physical
  68. terminals or emulators with custom fonts to standard Unicode-based
  69. emulators, and it will promote interoperability of terminal emulators
  70. with other Unicode applications and with each other.
  71.  
  72.  
  73. INTRODUCTION
  74.  
  75. This is an update of the November 1998 proposal, which was composed of
  76. the following pieces:
  77.  
  78.   TERMINAL GRAPHICS FOR UNICODE (plain text)
  79.     ftp://kermit.columbia.edu/kermit/ucsterminal/ucsterminal_03.txt
  80.     The full November 1998 proposal.
  81.     STATUS: Revised and resubmitted as the present document.
  82.  
  83.   HEX BYTE PICTURES FOR UNICODE (plain text)
  84.     ftp://kermit.columbia.edu/kermit/ucsterminal/hex.txt
  85.     STATUS: Rejected by UTC, December 1998.
  86.  
  87.   ADDITIONAL CONTROL PICTURES FOR UNICODE (plain text)
  88.     ftp://kermit.columbia.edu/kermit/ucsterminal/control.txt
  89.     STATUS: Rejected by UTC, December 1998.
  90.  
  91.   Glyph Map (PDF, contributed by Michael Everson)
  92.     ftp://kermit.columbia.edu/kermit/ucsterminal/terminal-emulation.pdf
  93.  
  94.   Exhibits (PDF, contributed by Markus Kuhn)
  95.     ftp://kermit.columbia.edu/kermit/ucsterminal/terminal-exhibits.pdf
  96.  
  97.   Clarification of SNI Glyphs (Microsoft Word 7.0)
  98.     ftp://kermit.columbia.edu/kermit/ucsterminal/sni-charsets.doc
  99.  
  100.   Discussion (plain text e-mail)
  101.     ftp://kermit.columbia.edu/kermit/ucsterminal/mail.txt
  102.  
  103. Since the original proposal in 1998, Unicode 3.0 was released and after that
  104. an extended set of mathematics and technical symbols, STIX [35], was
  105. accepted in principle by the UTC and WG2, pending forthcoming ballots.  And
  106. SHARE (the IBM mainframe users society) indicated no interest in the IBM
  107. 3270 operator status glyphs.
  108.  
  109. Therefore, the terminal graphics proposal is revised as follows:
  110.  
  111.  . 15 glyphs now available in the STIX Math Set have been withdrawn.
  112.  
  113.  . 11 glyphs unique to Data General terminals have been withdrawn, since
  114.    all remnants of Data General host-terminal culture seem to have
  115.    disappeared from the planet.
  116.  
  117.  . 8 glyphs for IBM 3270 Terminal Operator Status Indicators have been
  118.    withdrawn.
  119.  
  120.  . 2 characters currently available in Unicode 3.0 have been withdrawn.
  121.  
  122. The total number of characters now proposed is 23 (18 with suggested
  123. unifications).  They are from the non-IBM-3270 terminal types that are still
  124. widely used or emulated: DEC, Wyse, Siemens-Nixdorf, Televideo, IBM,
  125. Heath/Zenith.  This is down from 59 in the 1998 proposal.
  126.  
  127. Some of the characters proposed are candidates for unification with existing
  128. Unicode characters, but only if the Unicode Standard is modified to specify
  129. their "semantics" with respect to terminal-emulation (monospace or duospace)
  130. font cell boundaries, line weights, and so on, as indicated in the
  131. discussion of each character.  The Unicode Standard leaves much unsaid about
  132. box-drawing characters, block elements, and geometric shapes; one assumes
  133. that they all have the same width, but this is nowhere stated and it becomes
  134. a more serious issue with the approval of the STIX group, in which
  135. continuation lines must match in weight, angle, and position, and in which
  136. brace, bracket, and other symbol pieces must line up to be joined properly,
  137. a development not anticipated by the statement in 12.6[24] that the "Unicode
  138. Standard does not encourage this kind of character-based graphics model".
  139. Perhaps a new notion of "Connecting Class" or "Alignment Class" would be
  140. helpful for the characters in the 2300 (STIX) and 2500 blocks.
  141.  
  142. Since the number of proposed characters is small, I will simply list each
  143. character and its properties, with a brief discussion.  The U+Exxx reference
  144. numbers remain unaltered from the original proposal, and are retained to key
  145. with the original glyph map.  The final Unicode values for these characters
  146. should be assigned in the appropriate blocks of Plane 0 (so they can be used
  147. in Windows 95 and 98).
  148.  
  149. Grateful acknowledgements to those whose comments on previous drafts are
  150. reflected in this one: Kevin Bracey, Michael Everson, Doug Ewell, Asmus
  151. Freytag, Christine Gianone, Tony Harminc, Elliotte Rusty Harold, Edwin Hart,
  152. Kent Karlsson, Paul Keinanen, Markus Kuhn, Alain LaBontΘ, Heinz Lohse, Rick
  153. McGowan, Sean O'Leary, Jonathan Rosenne, Otto Stolz, Geoffrey Waigh, Kenneth
  154. Whistler, and Paul Williams.  Special thanks to Michael Everson for his
  155. rendition of the proposed glyphs and to Markus Kuhn for scanning the
  156. exhibits.
  157.  
  158. The text of this proposal is available on the Internet as:
  159.  
  160.   ftp://kermit.columbia.edu/kermit/ucsterminal/ucsterminal.txt
  161.  
  162.  
  163. MOTIVATION
  164.  
  165.   NOTE: This section is unchanged from the first proposal.
  166.  
  167. Terminal-host communication was the dominant form of interaction between
  168. human and computer from about 1974 (when CRTs became affordable)(1) to about
  169. 1994 (when the Web and Windows took over the mass market).  Terminal-host
  170. communication is still widespread, especially in large organizations, and
  171. is expected to remain so for decades to come, playing an important part in
  172. organizations like universities, hospitals, government agencies, and
  173. corporations with central computing facilities, for use in applications
  174. ranging from sofware development and system/network administration, to email
  175. and text-based Web access, to data entry and inquiry, to transaction
  176. processing, and it is also important to people who use speech or Braille
  177. devices and Telecommunications Devices for the Deaf (TDDs).
  178.  
  179. A text terminal, for purposes of this document, is a device for entry and
  180. display of text in a fixed-pitch font on a screen (or on paper) in which
  181. graphic characters are displayed as glyph images in rows and columns of
  182. "cells" of fixed and uniform size, one glyph image per cell.  Text terminals
  183. generally display (or otherwise handle) the characters of ASCII [1] or
  184. EBCDIC [13], and often also accented or non-Roman letters (or ideograms),
  185. and often also "graphics" (2) (non-alphabetic, non-digit, non-punctuation)
  186. characters for purposes of line- and box-drawing, mathematics, or other
  187. special effects, and they also accept control characters or escape sequences
  188. for formatting.
  189.  
  190. In recent years, physical terminals have largely disappeared from the scene,
  191. their functions subsumed into PCs running terminal-emulation software
  192. alongside other applications.  Unicode (viewed as a process) has effectively
  193. met the need for encoding the earth's writing systems, but so far it is not
  194. as well suited to terminal emulation as it might be since it lacks some of
  195. the required graphics characters.
  196.  
  197. Without a standard encoding for the missing glyphs, each maker of terminal
  198. emulation software must create or contract for custom fonts with private
  199. encodings.  Such fonts are not compatible with other (otherwise compatible)
  200. fonts on the same platform (e.g. when copying from a terminal window and
  201. pasting to a word processor), nor with each other.  Furthermore, should
  202. Unicode printers become standard equipment on PCs, terminal graphics
  203. characters will not print correctly on them (e.g. when used with the
  204. terminal's transparent printing, autoprinting, or dump-screen features).
  205.  
  206. This document proposes a modest repertoire of terminal graphics characters
  207. to be added to Unicode and ISO 10646, to supplement those already there
  208. (e.g. the line and box drawing characters at U+2500) to which all makers of
  209. fonts, code pages, and printers can refer when designing their products, and
  210. upon which all makers of terminal emulation and/or debugging software can
  211. base their screen displays.
  212.  
  213. To state the motivation for this proposal as clearly as I can:
  214.  
  215.  1. There are numerous terminal emulation products on the market, with a user
  216.     base numbering in the millions.
  217.  
  218.  2. Increasingly, these products are designed for and used on systems --
  219.     like Windows NT -- that have Unicode fonts.
  220.  
  221.  3. Many terminal based applications take full advantage of the features and
  222.     glyph repertoires of the terminals they are designed for (far beyond the
  223.     simple models supported, e.g. by termcap/terminfo).
  224.  
  225.  4. The glyph repertoire of many common terminals -- VT100/VT220, Wyse,
  226.     Siemens Nixdorf, Data General, etc, include glyphs that are not presently
  227.     in Unicode.
  228.  
  229.  5. Customers of terminal emulation products often demand complete and 
  230.     accurate emulation.
  231.  
  232.  6. In order to succeed, makers of terminal emulation software must create
  233.     private fonts containing the missing glyphs (which, as an aside,
  234.     unnecessarily drives up the cost of the product for the end user) in
  235.     the Private Use area.
  236.  
  237.  7. Because of the closed and proprietary nature of this process, each
  238.     terminal emulation product potentially (and in fact) encodes the same
  239.     characters at different places.
  240.  
  241.  8. Other applications use the Private Use Area for other purposes (and other
  242.     glyphs).
  243.  
  244.  9. The result is that terminal emulation products do not interoperate with
  245.     each other or with other applications on the same platform.
  246.  
  247. For example, a VT100 or HP forms-based screen can not be pasted into a word
  248. processing document without changing the forms borders (etc, depending on
  249. exactly how they are encoded) into whatever other glyphs happen to be defined
  250. at the same code points in the font used by the other application.  Ditto for
  251. mathematical formulae displayed on DEC or Siemens Nixdorf screens.  Ditto for
  252. character-cell illustrations or tables in numerous online texts intended for
  253. display on any of the widespread terminals.
  254.  
  255. Notes:
  256.  (1) Strictly speaking, terminals predate electronic computers by some
  257.      decades; the Teletype (used as the control terminal on many mainframes
  258.      and most minicomputers in the 1950s through 1970s) dates back to 1929.
  259.  (2) Note the distinction between "graphic" meaning "printing" (as in
  260.      "ISO 8859-1 is a graphic character set") versus "graphics" meaning
  261.      having something to do with pictures.  Graphics terminals (such as the
  262.      Tektronix 4010) also exist, but are not relevant to this proposal.
  263.  
  264.  
  265. SCOPE
  266.  
  267.   NOTE: This section is unchanged from the first proposal.
  268.  
  269. This document represents a survey of the following terminals:
  270.  
  271.   Data General D210,215,217,413,463 [2]
  272.   Digital Equipment Corporation VT100 through VT520 [3-9]
  273.   Heath / Zenith 19 [10]
  274.   Hewlett Packard HP-2621 and HP-2648 [11,12]
  275.   IBM 3164 and 3270 [15,16,27]
  276.   Siemens Nixdorf 97801 [21]
  277.   Televideo 922 and 965 [22,23]
  278.   Wyse 60 and 370 [25,26]
  279.  
  280. as well as:
  281.  
  282.   IBM PC code page 437 [14]
  283.  
  284. which is the basis for numerous PC-oriented so-called ANSI emulations.
  285.  
  286. Even within this fairly narrow scope, arriving at a sufficient set of
  287. character-cell terminal graphics for Unicode is complicated by the
  288. well-known problems that affect other preexisting character sets to varying
  289. degrees:
  290.  
  291.  1. Lack of official names for the characters of some of the sets.
  292.  2. Lack of definitive, high-quality pictures of the glyphs in some cases.
  293.  3. Lack of descriptions of the purpose and intended use of the glyphs.
  294.  4. Lack of a current registration authority or owner in some cases.
  295.  5. Questions of unification of glyphs from different terminal makers.
  296.  6. End-user demand for specific characters or sets.
  297.  
  298. The issue of unification is complicated by the fact that some of the
  299. terminal graphics characters are designed to join at cell boundaries to form
  300. "pictures" (such as boxes or forms to be filled out) or large characters
  301. (such as big math symbols) spanning multiple rows and/or columns.  The
  302. relationship of similar-looking glyphs for different terminals is difficult
  303. to determine -- e.g. exactly where does a line touch an edge, and at what
  304. angle, and does it make a difference?
  305.  
  306. The question of unification should be considered not only in the GUI
  307. environment but also for platforms where only one font is available -- a
  308. fixed-pitch "console" font -- and in "DOS"-like windows or fullscreen
  309. sessions, where only one fixed-pitch font may be used; this sort of
  310. environment is often host to terminal applications.  Examples: a full-screen
  311. Windows NT session; the new Unicode-based Linux console driver and font.
  312.  
  313. This proposal does not require any action for well-known terminal
  314. presentation forms such as double-high and/or double-wide characters, bold,
  315. blinking, inverse, italic, underlining, color, etc, since these are not
  316. encoding issues.  In particular, no special code points are needed for
  317. double-high or double-wide characters, such as those seen on the DEC VT100
  318. family of terminals, nor for compressed characters as seen on Data General
  319. and DEC terminals.
  320.  
  321. This proposal also does not cover true graphics terminals, such as Tektronix
  322. vector graphics units, DEC ReGIS or Sixel graphics, BBN Bitgraph, etc, since
  323. these graphics regimes are not character-cell based.
  324.  
  325. No attempt was made to account for the many Viewdata, Videotex, Minitel,
  326. NAPLPS, or similar character sets.  These should be tackled, if at all, by
  327. someone who knows something about them.
  328.  
  329. Note that the graphic characters listed in this proposal rarely, if ever,
  330. appear on keyboard key labels.  In general, these characters are never
  331. typed, not even on real terminals, but are displayed when the terminal is
  332. commanded into a special mode by the host; for example, with ISO 2022 [17]
  333. character-set designation and invocation escape sequences.
  334.  
  335. The characters proposed in this document are assigned temporary Unicode
  336. values from the Private Use area, strictly for reference within (or to)
  337. this document only.  Final values should be assigned outside of the Private
  338. Use range.  The temporary allocations are:
  339.  
  340.   E0A0-E0BF Math Symbols
  341.   E0D0-E0EF Line and Box Drawing
  342.  
  343. There are many holes in the sequence; this reflects the withdrawal of
  344. numerous characters during the evolution of this proposal (see Appendix).
  345.  
  346.  Legend:
  347.   UL = Upper Left
  348.   LL = Lower Left
  349.   UR = Upper Right
  350.   LR = Lower Right
  351.  
  352.  Reference key:
  353.   DGL = Data General Line Drawing Character Set [D3]
  354.   DGM = Data General Word-Processing, Greek, and Math Character Set [D2]
  355.   DSG = The DEC Special Graphics Character Set [A3]
  356.   DTC = The DEC Technical Character Set [C2]
  357.   H19 = The Heath/Zenith 19 Graphics Character Set [L1]
  358.   IBM = IBM Graphic Character Global Identifier (GCGID) [14]
  359.   SNI = Siemens Nixdorf Mathematisch [E5], SNI 97801.
  360.   TVI = The Televideo 965 Multinational Character Set [23]
  361.   WG3 = The Wyse Graphics 3 Character Set [F2]
  362.   WYA = Wyse 60 "Standard ANSI", "UK ANSI", and "ANSI Graphics" [F3]
  363.  
  364.  
  365. PROPOSED NEW CHARACTERS
  366.  
  367. Proposed character names should be changed as needed to conform to UTC and
  368. WG2 naming rules or conventions.  References to STIX U+23xx values are based
  369. on L2/00-033R, and are subject to change.  Suggested encodings in the
  370. appropriate blocks are given in case it is helpful, but these are in no way
  371. indicative of what the final encodings, if any, might be.
  372.  
  373. 1. RADICAL SYMBOL BOTTOM
  374.  
  375.   Code: U+E0B0 (reference key to original November 1998 proposal)
  376.   Suggested encoding: U+23B7
  377.   General Category: Symbol, math (Sm)
  378.   Combining Class: None
  379.   Bidirectional Category: Other Neutral (ON)
  380.   Decomposition Mapping: None
  381.   Decimal Digit Value: None
  382.   Digit Value: None
  383.   Numeric Value: None
  384.   Mirrored: Yes (1)
  385.  
  386. Discussion: This character is from the DEC Technical Character Set, position
  387. 02/01 (column/row notation), used on VT330 and higher terminals and in
  388. DECterm windows to form large radicals.  The vertical stroke extends to the
  389. top of the cell and connects with a centered vertical line (DEC Technical
  390. 02/06 = U+2502 or STIX U+23AE, whichever is appropriate (2)) or Upper Left
  391. Box Corner (DEC Technical 02/02 = U+250C), which in turn can be extended to
  392. the right with centered horizontal lines (DEC Technical 02/03 = U+2500 or
  393. STIX U+23AF as appropriate).
  394.  
  395. (1) Mirrored because (a) the radical signs at U+221A-C are mirrored, and
  396.     (b) the Integral pieces at U+2320-1 are mirrored.  Or not, if the
  397.     STIX brace and bracket pieces are not mirrored.
  398.  
  399. (2) If the STIX extensions are appropriate but the U+25xx lines are not,
  400.     then a STIX equivalent of Upper Left Box corner might also be needed.
  401.  
  402. Also note: The glyph shown for this character in the glyph table is not the
  403. right shape; the vertical stroke must be truly vertical and centered, not
  404. slanted.
  405.  
  406. 2. SUPERSCRIPT LATIN SMALL LETTER i
  407.  
  408.   Code: U+E0B2
  409.   Suggested encoding: U+208F, U+209F, or U+2071
  410.   General Category: Symbol, math (Sm)
  411.   Combining Class: None
  412.   Bidirectional Category: Other Neutral (ON)
  413.   Decomposition Mapping: None
  414.   Decimal Digit Value: None
  415.   Digit Value: None
  416.   Numeric Value: None
  417.   Mirrored: No
  418.  
  419. References: IBM GCID [29] LI011000 and Siemens-Nixdorf SNI 97801 [21] Math
  420. Character 03/00.
  421.  
  422. Discussion: In the GUI environment, one would argue that the rendering
  423. software should change the size and baseline of the regular small "i" at
  424. U+0069 to create the small superscript letter, and therefore a new character
  425. would not be needed.  But this can not be done on a character-cell terminal or
  426. in (e.g.) a Windows NT Console screen; thus a new character is required if the
  427. terminal is to be emulated accurately and the meaning of the display not
  428. altered (does "3i" mean "3 times i" or "3 to the ith power"?).  An objection
  429. to this character might be: "If we encode superscript i, then what about all
  430. the other letters (etc) in all the other scripts of the world?".  The answer
  431. would be that none of the character-cell terminals surveyed include any
  432. superscript letter but "i" and "n", and "n" is already encoded at U+207F.
  433.  
  434. 3. LEFT VERTICAL BOX LINE
  435.  
  436.   Code: U+E0D0
  437.   Suggested Encoding: U+23B8
  438.   General Category: Symbol, other (So)
  439.   Combining Class: None
  440.   Bidirectional Category: Other Neutral (ON)
  441.   Decomposition Mapping: None
  442.   Decimal Digit Value: None
  443.   Digit Value: None
  444.   Numeric Value: None
  445.   Mirrored: No
  446.  
  447. Discussion: This line goes along the left edge of the cell, extending to the
  448. top and bottom cell boundaries.  Used with the Horizontal Line Scan 9
  449. character (item 9 below) or the Low Line character, U+005F, to make square
  450. corners.  Should have the same weight as the Box Drawings Light lines in the
  451. U+2500 block.  Should abut with U+2500 to form a sideways T shape.
  452. References: IBM GCID SF640000 and SV330000, Heath/Zenith 19 Graphics
  453. Character Set 07/12.
  454.  
  455. Note: The glyph shown for this character in the glyph table is not in the
  456. correct position.  It should be all the way to the left in the cell, not
  457. near the center.
  458.  
  459. 4. RIGHT VERTICAL BOX LINE
  460.  
  461.   Code: U+E0D1
  462.   Suggested Encoding: U+23B9
  463.   General Category: Symbol, other (So)
  464.   Combining Class: None
  465.   Bidirectional Category: Other Neutral (ON)
  466.   Decomposition Mapping: None
  467.   Decimal Digit Value: None
  468.   Digit Value: None
  469.   Numeric Value: None
  470.   Mirrored: No
  471.  
  472. Discussion: Like (3) but on the right.  References: IBM GCID SF650000,
  473. Heath/Zenith 19 Graphics Character Set 07/13.
  474.  
  475. 5-9. HORIZONTAL LINES
  476.  
  477.   Codes: U+E0D6-E0DA
  478.   Suggested Encodings: (see discussion)
  479.   General Category: Symbol, other (So)
  480.   Combining Class: None
  481.   Bidirectional Category: Other Neutral (ON)
  482.   Decomposition Mapping: None
  483.   Decimal Digit Value: None
  484.   Digit Value: None
  485.   Numeric Value: None
  486.   Mirrored: No
  487.  
  488.  Code   Name      References
  489.   E0D6   Scan 1    DSG 06/15, H19 07/10, WG3 05/00, TVI 09/00, IBM SV300400
  490.   E0D7   Scan 3    DSG 07/00, WYA 01/01, WG3 05/00, IBM SV300200
  491.   E0D8   Scan 5    DSG 07/01, WYA 02/02, IBM SV300300, IBM SM920000
  492.   E0D9   Scan 7    DSG 07/02, WYA 01/03, WG3 05/01, IBM SV300100
  493.   E0DA   Scan 9    DSG 07/03, H19 07/11, WG3 05/01, TVI 09/01, IBM SV300600
  494.  
  495. Discussion: These are horizontal lines at different heights, designed to be
  496. joined to lines in adjacent cells that terminate at the same height and
  497. therefore extending the full width of the character cell.  They should have
  498. the same weight as the Box Drawings Light lines in the U+2500 block.  The
  499. Scan numbers refer to the pixels of the VT100 character cell; these are the
  500. names given in the VT terminal manuals; similar terminology ("Horizontal
  501. Line 7/9ths Height") is used in the IBM GCID.
  502.  
  503. Scan 1 is at the top of the cell; Scan 5 is vertically centered; Scan 9 is
  504. at the bottom.  Scans 1 and 9 should make square corners with Left and Right
  505. Vertical Box Lines (items 3 and 4 above).  Scans 3, 5, and 7 should abut
  506. squarely against the Vertical Box Lines, forming a sideways T shape.
  507.  
  508. Note: The glyphs shown for these characters in the glyph table are not
  509. wide enough; they should extend the full width of the charcter cell.
  510.  
  511. Unification: Since Scan 5 is centered vertically in the cell, it corresponds
  512. to U+2500 if the latter (a) extends to the edges of the cell and (b) is
  513. centered vertically in the cell.  These properties are unstated, but obtain
  514. in currently available monospace Unicode fonts such as Lucida Console and
  515. Courier New.  The same might be true of STIX U+23AF, Horizontal Line
  516. Extension, and if so, this would be the more appropriate unification.
  517.  
  518. Suggested encodings:
  519.  
  520.   Scan 1: U+23BA
  521.   Scan 3: U+23BB
  522.   Scan 5: Unify with U+23AF or U+2500
  523.   Scan 7: U+23BD
  524.   Scan 9: U+23BD
  525.  
  526. 10-13. WEDGES
  527.  
  528.   Codes: U+E0D2-E0D5
  529.   Suggested Encodings: (see discussion)
  530.   General Category: Symbol, other (So)
  531.   Combining Class: None
  532.   Bidirectional Category: Other Neutral (ON)
  533.   Decomposition Mapping: None
  534.   Decimal Digit Value: None
  535.   Digit Value: None
  536.   Numeric Value: None
  537.   Mirrored: No
  538.  
  539.  Code    Name         References
  540.   E0D2    UL Wedge     H19 07/02, IBM SF870000
  541.   E0D3    UR Wedge     H19 05/14, IBM SF860000
  542.   E0D4    LL Wedge     IBM SF850000
  543.   E0D5    LR Wedge     IBM SF840000
  544.  
  545. Discussion: A wedge is a character cell with a diagonal line connecting
  546. opposite corners, dividing the entire cell into two triangles: one dark, the
  547. other light; the wedge is the dark part.  These characters are used for
  548. mosaic graphics in the Heath/Zenith-19 Graphics and IBM character sets.
  549.  
  550. Unification: An Upper Left Wedge is similar to U+25E4, except it fills the
  551. entire character cell.  It can be inferred from the Unicode 2.0 and 3.0
  552. books that U+25E4 does NOT extend to the edges of the cell, since its
  553. vertical and horizontal edges are the same length as Black Square, U+25A0,
  554. which is contrasted with (and smaller than) Full Block, U+2588.  If this
  555. inference is not true, then the wedges do not need to be encoded.  However,
  556. in that case, the Unicode Standard should state that U+25E4-25E7 extend to
  557. the edges of the cell when implemented in a terminal-emulation font.
  558.  
  559. Suggested encoding: Unify with U+25E4-25E7.
  560.  
  561. 14-23. QUADRANTS
  562.  
  563.   Codes: U+E0DB-E0E4
  564.   Suggested Encodings: U+2596-259F.
  565.   General Category: Symbol, other (So)
  566.   Combining Class: None
  567.   Bidirectional Category: Other Neutral (ON)
  568.   Decomposition Mapping: None
  569.   Decimal Digit Value: None
  570.   Digit Value: None
  571.   Numeric Value: None
  572.   Mirrored: No
  573.  
  574.  Code  Name                         References
  575.   E0DB  Quadrant LL                  H19 06/13,WG3 05/05, TVI 09/05
  576.   E0DC  Quadrant LR                  H19 06/12,WG3 05/04, TVI 09/04
  577.   E0DD  Quadrant UL                  H19 06/14,WG3 05/06, TVI 09/06
  578.   E0DE  Quadrant UL and LL and LR    WG3 05/11,TVI 09/11
  579.   E0DF  Quadrant UL and LR           H19 06/10 (3)
  580.   E0E0  Quadrant UL and UR and LL    WG3 05/12, TVI 09/12
  581.   E0E1  Quadrant UL and UR and LR    WG3 05/13, TVI 09/13
  582.   E0E2  Quadrant UR                  H19 111, WG3 83, TVI 09/03
  583.   E0E3  Quadrant UR and LL
  584.   E0E4  Quadrant UR and LL and LR    WG3 05/14, TVI 09/14
  585.  
  586. Discussion: A character cell can be divided into four equal quadrants by a
  587. horizontal and vertical line that intersect in the center.  Each quadrant
  588. can be light or dark.  There are 16 possible combinations, of which six are
  589. already encoded: all white (U+0020 or U+00A0), all dark (U+2588), the left
  590. and right half blocks at U+258C and U+2590, and the top and bottom half
  591. blocks at U+2580 and U+2584.  Nine of the ten remaining combinations are
  592. used on the terminals listed above for mosaic graphics; the tenth (E0E3)
  593. should be included for completeness.
  594.  
  595.  
  596. SUMMARY
  597.  
  598. The following supplemental terminal graphic characters are proposed:
  599.  
  600.   1. E0B0  Small Radical Symbol
  601.   2. E0B2  Superscript Latin Small Letter i
  602.   3. E0D0  Left Vertical Box Line
  603.   4. E0D1  Right Vertical Box Line
  604.   5. E0D6  Horizontal Line - Scan 1
  605.   6. E0D7  Horizontal Line - Scan 3
  606.   7. E0D8  Horizontal Line - Scan 5
  607.   8. E0D9  Horizontal Line - Scan 7
  608.   9. E0DA  Horizontal Line - Scan 9
  609.  10. E0D2  Upper Left Wedge
  610.  11. E0D3  Upper Right Wedge
  611.  12. E0D4  Lower Left Wedge
  612.  13. E0D5  Lower Right Wedge
  613.  14. E0DB  Quadrant LL
  614.  15. E0DC  Quadrant LR
  615.  16. E0DD  Quadrant UL
  616.  17. E0DE  Quadrant UL and LL and LR
  617.  18. E0DF  Quadrant UL and LR
  618.  19. E0E0  Quadrant UL and UR and LL
  619.  20. E0E1  Quadrant UL and UR and LR
  620.  21. E0E2  Quadrant UR
  621.  22. E0E3  Quadrant UR and LL
  622.  23. E0E4  Quadrant UR and LL and LR
  623.  
  624. Of these, the following are candidates for unification:
  625.  
  626.     7.  Horizontal scan line 5 could be unified with U+2500, Box Drawings
  627.         Light Horizontal, or with U+23AF, Horizontal Line Extension, if
  628.         if either of these is centered vertically in the cell, extends to
  629.         the right and left cell boundaries, and is the same weight as the
  630.         other scan lines.
  631.  
  632.  10-13. The wedges can be unified with U+25E2-25E5 if the latter are
  633.         guaranteed to extend to the edges of the cell in terminal emulation
  634.         fonts.
  635.  
  636.  
  637. APPENDIX: DISPOSITION OF WITHDRAWN CHARACTERS
  638.  
  639. The following characters from the original proposal have been withdrawn for
  640. the reasons shown:
  641.  
  642.  Code  Description                                Reason
  643.   E080  Human stick figure                         Withdrawn (3270)
  644.   E081  Human stick figure in box                  Withdrawn (3270)
  645.   E082  Clock at 6:10 (or 1:30)                    Withdrawn (3270)
  646.   E083  White rectangle with stroke                Withdrawn (3270)
  647.   E084  Black rectangle with stroke                Withdrawn (3270)
  648.   E085  Lighting with stroke                       Withdrawn (3270)
  649.   E086  Security key                               Withdrawn (3270)
  650.   E087  Black and White Right-Pointing Triangles   Withdrawn (3270)
  651.  
  652.   E0A0  Extensible left brace middle               STIX U+23A8
  653.   E0A1  Extensible left parenthesis bottom         STIX U+239D
  654.   E0A2  Extensible left parenthesis top            STIX U+239B
  655.   E0A3  Extensible left SB bottom                  STIX U+23A3
  656.   E0A4  Extensible left SB top                     STIX U+23A1
  657.   E0A5  Extensible right brace middle              STIX U+23AC
  658.   E0A6  Extensible UR or LL brace section          STIX U+23B1
  659.   E0A7  Extensible LR or UL brace section          STIX U+23B0
  660.   E0A8  Extensible right parenthesis bottom        STIX U+23A0
  661.   E0A9  Extensible right parenthesis top           STIX U+239E
  662.   E0AA  Extensible right SB bottom                 STIX U+23A6
  663.   E0AB  Extensible right SB top                    STIX U+23A4
  664.   E0AC  Summation symbol bottom                    STIX U+23B3
  665.   E0AD  Summation symbol top                       STIX U+23B2
  666.   E0AE  Right ceiling corner                       U+2309 (1)
  667.   E0AF  Right floor corner                         U+230B (1)
  668.   E0B1  Radical symbol with stroke                 Withdrawn (DG)
  669.  
  670.   E0E5  Full black diamond                         STIX U+29EB
  671.   E0E6  Black framus (2)                           Withdrawn (DG), STIX U+29D7
  672.   E0E7  Black framus + H center bar                Withdrawn (DG)
  673.   E0E8  White framus                               Withdrawn (DG), STIX U+29D6
  674.   E0E9  White framus + H center bar                Withdrawn (DG)
  675.   E0EA  R & L arrow to V center bar                Withdrawn (DG)
  676.   E0EB  Up arrow to H center line                  Withdrawn (DG)
  677.   E0EC  R arrow to V center line                   Withdrawn (DG)
  678.   E0ED  L arrow to V center line                   Withdrawn (DG)
  679.   E0EE  Down arrow to H center line                Withdrawn (DG)
  680.   E0EF  Box drawing double dash H                  Withdrawn (DG)
  681.  
  682.   E000-E09C  Additional Control Pictures           Rejected by UTC
  683.   E100-E1FF  Hex byte pictures                     Rejected by UTC
  684.  
  685. (1) These characters were in Unicode all along, but the shape shown in the
  686.     Unicode book was different from the shape on the terminal.  However,
  687.     this is not sufficient reason to have two versions of the same symbol.
  688.  
  689. (2) STIX uses the term Hourglass for this shape.
  690.  
  691.  
  692. REFERENCES
  693.  
  694. Note: The references are preserved from the original proposal, even though
  695. some of them apply only to portions of it that were rejected or withdrawn.
  696. Reference [24] is updated.  Reference [35] is new.
  697.  
  698.  [1] American National Standards Institute, ANSI X3.4-1986, Code for
  699.      Information Interchange (ASCII), 1986.
  700.  
  701.  [2] Data General, Programming the Display Terminal: Models D217, D413, and
  702.      D463, Westboro, MA, 1991.
  703.  
  704.  [3] Digital Equipment Corporation, VT100 User Guide, EK-VT100-UG-002,
  705.      Maynard, MA, 1979.
  706.  
  707.  [4] Digital Equipment Corporation, VT102 Video Terminal User Guide,
  708.      EK-VT102-UG-003, Maynard, MA, 1982.
  709.  
  710.  [5] Digital Equipment Corporation, VT220 Owner's Manual, EK-VT220-UG-003,
  711.      Maynard, MA, 1984.
  712.  
  713.  [6] Digital Equipment Corporation, VT220 Series Programmer Reference
  714.      Manual, EK-VT240-RM-002, Maynard, MA, 1984.
  715.  
  716.  [7] Digital Equipment Corporation, VT330/VT340 Programmer Reference Manual,
  717.      Volume 1: Text Programming, ED-VT3XX-TP-002, Maynard, MA, 1988.
  718.  
  719.  [8] Digital Equipment Corporation, Installing and Using the VT420 Video
  720.      Terminal EK-VT420-UG.002, Maynard, MA, 1988.
  721.  
  722.  [9] Digital Equipment Corporation, VT520/VT525 Video Terminal Programmer
  723.      Information, EK-VT520-RM.A01, Maynard, MA, 1994.
  724.  
  725. [10] Heathkit Manual for the Video Terminal Model H19, The Heath Company,
  726.      Benton Harbor, MI, 1979.
  727.  
  728. [11] Hewlett Packard 2621A/P Interactive Terminal Owner's Manual, 1978.
  729.  
  730. [12] Hewlett Packard 2648A Graphics Terminal Reference Manual, 1977.
  731.  
  732. [13] IBM System/360 Principles of Operation, GA22-6821-8, Poughkeepsie,
  733.      NY, 1970.
  734.  
  735. [14] IBM National Language Design Guide, Volume 2:  National Language
  736.      Support Reference Manual, 4th Edition, SE09-8002-03, North York ON,
  737.      1994.
  738.  
  739. [15] IBM 3270 Information Display System, Component Description,
  740.      GA27-2749-10, 1980.
  741.  
  742. [16] IBM 3164 ASCII Color Display Station Description, GA18-2317-1, 1986.
  743.  
  744. [17] ISO International Standard 2022, Information processing -- ISO
  745.      7-bit and 8-bit coded character sets -- Code extension techniques,
  746.      Third Edition, Geneva, 1986.
  747.  
  748. [18] ISO/IEC International Standard 6429, Information technology --
  749.      Control functions for coded character sets, Third Edition, Geneva, 1992.
  750.  
  751. [19] ISO/IEC 10646-1, International Standard 10646,
  752.      Information Processing -- Multiple-Octet Coded Character Set,
  753.      1993-now.
  754.  
  755. [20] Perkin Elmer Model 1100 User's Manual, Randolph, NJ, 1978.
  756.  
  757. [21] Siemens Nixdorf, Bildschirmeinheit 97801-5xx Schnittstellen,
  758.      Benutzerhandbuch, Mⁿnchen, 1991.
  759.  
  760. [22] Televideo 922 Video Terminal Display Operator's Manual, Sunnyvale, CA,
  761.      1984.
  762.  
  763. [23] Televideo 965 Video Terminal Display Operator's Manual, Sunnyvale, CA,
  764.      1988.
  765.  
  766. [24] The Unicode Standard, Version 3.0, Addison-Wesley, 2000.
  767.  
  768. [25] Wyse WY-60 Programmer's Guide, Wyse Technology, San Jose, CA, 1987.
  769.  
  770. [26] Wyse WY-370 Programmer's Guide, Wyse Technology, San Jose, CA, 1990.
  771.  
  772. [27] IBM 3270 Information Display System, Data Stream Programmer's Reference,
  773.      GA23-0059-06, 1991.
  774.  
  775. [28] ISO International Register of Coded Characters to Be Used with Escape
  776.      Sequences, European Computer Manufacturers Association (ECMA), Geneva,
  777.      1985-present.
  778.  
  779. [29] IBM Character Data Representation Architecture, Level 1 Registry, IBM
  780.      Canada Ltd., National Language Technical Centre, Ontario, SC09-1391-00,
  781.      1990 (superseded by: IBM Character Data Representation Architecture,
  782.      Registration and Registry, IBM Canada Ltd., Toronto, SC09-2190-00, 1995).
  783.  
  784. [30] Knuth, Donald, "TeX and METAFONT, New Directions in Typesetting",
  785.      American Mathematical Society / Digital Press, Bedford MA, 1979.
  786.  
  787. [31] Apple Computer Corporation, Inside Macintosh, 1984.
  788.  
  789. [32] HDS-3200 Terminal Series Owner's Manual, Philadelphia PA, 1987.
  790.  
  791. [33] Zenith Data Systems Video Terminal Z-19-CN Operation Manual, Saint
  792.      Joseph, MI, 1981. 
  793.  
  794. [34] Interview 30A/40A Operator's Field Reference Guide, Atlantic Research
  795.      Corporation, ATLC-107-919-101, Alexandria, VA, 1982.
  796.  
  797. [35] Unicode Consortium Document L2/00-033R, STIX Math Symbols, 9 Feb 2000.
  798.  
  799.  
  800. EXHIBITS
  801.  
  802. The following exhibits, which may be viewed at:
  803.  
  804.   ftp://kermit.columbia.edu/kermit/ucsterminal/terminal-exhibits.pdf
  805.  
  806. are reproduced from the terminal manuals indicated by the numeric reference
  807. number.  Each exhibit is 1 page unless otherwise indicated.
  808.  
  809. [A1] VT220 Display Controls Font (Left Half) [5].
  810.  
  811. [A2] VT220 Display Controls Font (Right Half) [5].
  812.  
  813. [A3] VT220 DEC Special Graphics Character Set [5].
  814.  
  815. [B1] VT320 Display Controls Font (Left Half) [7].
  816.  
  817. [B2] VT320 Display Controls Font (Right Half) [7].
  818.  
  819. [C1] VT420 Display Controls Font (Both Halves) [8].
  820.  
  821. [C2] VT420 DEC Technical Character Set [8].
  822.  
  823. [C3] HDS-3200 DEC Technical Character Set [32].
  824.  
  825. [D1] Data General US ASCII Character Set [2].
  826.  
  827. [D2] Data General Word-Processing, Greek, and Math Character Set [2].
  828.  
  829. [D3] Data General Line Drawing Character Set [2].
  830.  
  831. [D4] Data General Special Graphics Character Set [2].
  832.  
  833. [D5] Data General VT Multinational Character Set [2].
  834.  
  835. [D6] Data General VT Special Graphics Character Set [2].
  836.  
  837. [D7] Data General ISO 8859/1.2 Character Set [2].
  838.  
  839. [E1] Siemens Nixdorf 97801 ISO 8859-1 Character Set [21].
  840.  
  841. [E2] Siemens Nixdorf 97801 Klammern (Brackets) Character Set [21].
  842.  
  843. [E3] Siemens Nixdorf 97801 Facet Character Set [21].
  844.  
  845. [E4] Siemens Nixdorf 97801 IBM Character Set [21].
  846.  
  847. [E5] Siemens Nixdorf 97801 Math Character Set [21].
  848.  
  849. [E6] Siemens Nixdorf 97801 Character Generator (8 pages) [21].
  850.  
  851. [F1] Wyse 60 Native, Multinational, PC, and ASCII Character Sets [25].
  852.  
  853. [F2] Wyse 60 Graphics 1, 2, and 3 Character Sets [25].
  854.  
  855. [F3] Wyse 60 Standard ANSI, ANSI Graphics, and UK ANSI Character Sets [25].
  856.  
  857. [G1] Wyse 370 Controls Display Mode (74Hz) [26].
  858.  
  859. [G2] Wyse 370 Controls Display Mode (60Hz) [26].
  860.  
  861. [G3] Wyse 370 C0, ASCII, and Special Graphics Character Sets [26].
  862.  
  863. [G4] Wyse 370 C1, Multinational, and Latin-1 Character Sets [26].
  864.  
  865. [H1] IBM 3270 Operator Information Area Symbols (10 pages) [15].
  866.  
  867. [I1] TeX Standard Extension Font [30].
  868.  
  869. [J1] Apple Symbol Font (2 pages) [31].
  870.  
  871. [K1] Hewlett Packard 2621A/P National Terminal Character Set [11].
  872.  
  873. [L1] Heath/Zenith-19 Graphic Symbols (2 pages) [33].
  874.  
  875. [M1] Televideo 922 ASCII, Supplemental, Special Character Sets (4 pages) [22].
  876.  
  877. [N1] Sample screen from a data analyzer showing hex display [34].
  878.  
  879. (End)
  880.