home *** CD-ROM | disk | FTP | other *** search
/ kermit.columbia.edu / kermit.columbia.edu.tar / kermit.columbia.edu / ucsterminal / mail.txt < prev    next >
Text File  |  1998-12-07  |  307KB  |  7,108 lines

  1.  1-Oct-98  7:14:07-GMT,3775;000000000001
  2. Return-Path: <gpw@cybersurf.net>
  3. Received: from mailrelay1.cc.columbia.edu (mailrelay1.cc.columbia.edu [128.59.35.143])
  4.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id DAA20582
  5.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 03:14:05 -0400 (EDT)
  6. Received: from sagitta.cia.com (sagitta.cybersurf.net [206.186.113.4])
  7.     by mailrelay1.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id DAA11389
  8.     for <fdc@columbia.edu>; Thu, 1 Oct 1998 03:14:04 -0400 (EDT)
  9. Received: from cybersurf.net (anzu.cybersurf.net [206.186.111.67])
  10.     by sagitta.cia.com (8.8.5/8.8.5) with ESMTP id AAA29349
  11.     for <fdc@columbia.edu>; Thu, 1 Oct 1998 00:13:47 -0700
  12. Message-ID: <36132BC6.D5494815@cybersurf.net>
  13. Date: Thu, 01 Oct 1998 00:14:14 -0700
  14. From: Geoffrey Waigh <gpw@cybersurf.net>
  15. X-Mailer: Mozilla 4.06 [en] (Win95; U)
  16. MIME-Version: 1.0
  17. To: fdc@columbia.edu
  18. Subject: Re: Terminal Graphics Proposal
  19. References: <9810010139.AA14114@unicode.org>
  20. Content-Type: text/plain; charset=us-ascii
  21. Content-Transfer-Encoding: 7bit
  22.  
  23. I was going to send this to offline@unicode.org (the list for offline
  24. unicode discussions,) but assumed from your request for private
  25. correspondence you were not aware of the forum.
  26.  
  27. Frank da Cruz wrote:
  28. >   D R A F T  #  1
  29.  
  30. > ABSTRACT
  31. > A selection of terminal graphics characters is proposed for Unicode [24]
  32. > and ISO 10646 [19] to allow Unicode-based terminal emulation software to
  33. > (a) display glyphs that are found on popular types of terminals but
  34. > currently are not available in Unicode, and (b) interoperate with other
  35. > Unicode applications.
  36.  
  37. I can see clear merit in handling b), but I'm leary of the code space
  38. consumption that a) is having here.  In general, my feeling is that
  39. if 98% emulation does the job in an adequate fashion for
  40. non-perfectionists, then that is the way to go.
  41.  
  42. [On control character display]
  43.  
  44. I don't think that the existing C0 control code graphics being
  45. indicated as horizontal and a preference for diagonal glyphs
  46. warrants disunification.  I think that is a font variation and
  47. so long as the control code is represented with one of it's
  48. standard names (2 or 3 letters, horizontal or diagonal,) the
  49. information is being properly conveyed and the user can understand
  50. what is going on.  However, I think it would be useful to
  51. complete the control code set.
  52.  
  53. [On Hex code display]
  54.  
  55. That seems kind of wasteful for a debugging mode.  Do the terminals
  56. that produce this output have escape sequences for enabling this
  57. mode, or is it strictly a terminal configuration option?  (Of course
  58. by that measure the control character codes come under scrutiny...)
  59.  
  60. [On math symbols]
  61.  
  62. I cannot comment on these since our customers had 0 interest in the
  63. technical symbols, and so aside from glancing at the code pages and
  64. realizing they wouldn't map to Unicode very well I didn't work with
  65. them.  
  66.  
  67. [On Line and Blocks]
  68.  
  69. Again, I didn't have to deal with the terminals that form the bulk
  70. of these codes and cannot comment.
  71.  
  72. > 9. UNFINISHED BUSINESS
  73. > The selection of characters presented in this draft is far from
  74. > comprehensive.  Hundreds of other terminals from the past 30+ years are
  75. > likely to have glyphs or entire character sets covered neither here nor
  76. > in Unicode, and these might or might not be important in some application
  77. > somewhere.  Readers are invited, therefore, to propose any needed
  78. > additions, bearing in mind that Unicode code space is not unlimited.
  79.  
  80. And hopefully the compleatists out there will let sleeping dogs lie.
  81. Which is not to say that some other terminals might be worth
  82. supporting, but I suspect that the cost to the rest of the world
  83. in terms of codepoint space for most of them means that doing the
  84. emulation with alternate glyphs or custom fonts is appropriate.
  85.  
  86. Geoffrey Waigh
  87. gpw@cybersurf.net
  88.  
  89.  1-Oct-98 11:27:35-GMT,3161;000000000001
  90. Return-Path: <unicode@unicode.org>
  91. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  92.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id HAA23098
  93.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 07:27:34 -0400 (EDT)
  94. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  95.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id EAA59550
  96.     ; Thu, 1 Oct 1998 04:24:53 -0700
  97. Received: by unicode.org (NX5.67g/NX3.0S)
  98.     id AA15098; Thu, 1 Oct 98 04:16:20 -0700
  99. Message-Id: <9810011116.AA15098@unicode.org>
  100. Errors-To: uni-bounce@unicode.org
  101. Mime-Version: 1.0
  102. Content-Type: text/plain; charset=us-ascii
  103. X-Uml-Sequence: 6029 (1998-10-01 11:15:47 GMT)
  104. From: Kevin Bracey <kbracey@acorn.com>
  105. Reply-To: unicode@unicode.org
  106. To: Unicode List <unicode@unicode.org>
  107. Date: Thu, 1 Oct 1998 04:15:46 -0700 (PDT)
  108. Subject: Re: Terminal Graphics Proposal
  109.  
  110. In message <9810010143.AA14122@unicode.org>
  111.           Frank da Cruz <fdc@watsun.cc.columbia.edu> wrote:
  112.  
  113. > Sorry for the length of the following; if you're not interested,
  114. > skip it.  The intention is to bring likeminded parties out of the woodwork;
  115. > if you are one, please contact me and we can continue the topic offline.
  116. > - Frank
  117.  
  118. Very well put together proposal - I like it. A few comments (on the mailing
  119. list, so keeping it short):
  120.  
  121. > Unicode already has a block of Control Pictures at U+2400 through U+2421,
  122. > but (except for "NL" at U+2424) these go horizontally across the character
  123. > cell, rather than diagonally, thus making them difficult to distinguish
  124. > from normal alphanumeric text.  A new, parallel block of C0 control
  125. > pictures is needed in which the abbreviations are displayed diagonally.
  126.  
  127. That's a glyph variation - the Unicode Standard explicitly states that
  128. you can use whatever preferred glyph you like for these. Indeed, IIRC,
  129. ISO 10646-1 has considerably different suggested glyphs for these characters.
  130.  
  131. >   E080  SP    Space (like U+2420 but arranged diagonally)
  132. >   E081  DEL   Delete (Rubout) (2-character name: DT)
  133.  
  134. These two are glyph variants of U+2420 and U+2421.
  135.  
  136. >   E082  LS1   Locking Shift 1 (ISO name for SO)
  137. >   E083  LS0   Locking Shift 0 (ISO name for SI)
  138.  
  139. Maybe these two could be considered glyph variants of U+240E and u+240F?
  140. Probably not, I suppose.
  141.  
  142. > Hexadecimal byte values, 2 hex digits each.  Like display controls, but for
  143. > all 256 8-bit byte values, showing the byte code in hexadecimal, rather
  144. > than the (context-dependent) name.  For hex debugging (in terminal
  145. > emulators, line monitors, protocol analyzers, etc).  Should be arranged
  146. > diagonally within the character cell as shown in Figure 5.1:
  147.  
  148. Fair enough - but who are you to specify diagonality? These are just
  149. characters with the semantic meaning "Graphic representation of octet value
  150. xx".
  151.  
  152. >   E0F0  Reverse Question Mark         DEC VTxxx, Wyse, Televideo (1)
  153.  
  154. I would suggest U+FFFD for this.
  155.  
  156. -- 
  157. Kevin Bracey, Senior Software Engineer
  158. Acorn Computers Ltd                           Tel: +44 (0) 1223 725228
  159. Acorn House, 645 Newmarket Road               Fax: +44 (0) 1223 725328
  160. Cambridge, CB5 8PB, United Kingdom            WWW: http://www.acorn.co.uk/
  161.  
  162.  1-Oct-98 14:43:20-GMT,2442;000000000001
  163. Return-Path: <unicode@unicode.org>
  164. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  165.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id KAA04241
  166.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 10:43:19 -0400 (EDT)
  167. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  168.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id HAA47416
  169.     ; Thu, 1 Oct 1998 07:41:57 -0700
  170. Received: by unicode.org (NX5.67g/NX3.0S)
  171.     id AA15592; Thu, 1 Oct 98 07:35:05 -0700
  172. Message-Id: <9810011435.AA15592@unicode.org>
  173. Errors-To: uni-bounce@unicode.org
  174. X-Uml-Sequence: 6030 (1998-10-01 14:34:45 GMT)
  175. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  176. Reply-To: unicode@unicode.org
  177. To: Unicode List <unicode@unicode.org>
  178. Date: Thu, 1 Oct 1998 07:34:43 -0700 (PDT)
  179. Subject: Re: Terminal Graphics Proposal
  180.  
  181. > > Unicode already has a block of Control Pictures at U+2400 through U+2421,
  182. > > but (except for "NL" at U+2424) these go horizontally across the character
  183. > > cell, rather than diagonally, thus making them difficult to distinguish
  184. > > from normal alphanumeric text.  A new, parallel block of C0 control
  185. > > pictures is needed in which the abbreviations are displayed diagonally.
  186. > That's a glyph variation - the Unicode Standard explicitly states that
  187. > you can use whatever preferred glyph you like for these. Indeed, IIRC,
  188. > ISO 10646-1 has considerably different suggested glyphs for these characters.
  189. My concern is that the pictures in the Unicode book go horizontally.  Although
  190. I do not claim to be an expert on Unicode fonts, I have never seen one that
  191. implemented this block, so I don't actually know how it looks.  However, I'd
  192. say that the horizontal arrangement would make it extremely difficult for the
  193. viewer to discern the cell boundaries, as in:
  194.  
  195.   NULSOHSTXETXEOTENQACKBELDELNAKSYNETBCANSUBESCCANACKSSASS3SPAEPACSISCI
  196.  
  197. And thus, at minumum, the table in the book should be altered to show all
  198. control pictures arranged diagonally, and all future control picture additions
  199. should also be arranged that way.
  200.  
  201. > >   E0F0  Reverse Question Mark         DEC VTxxx, Wyse, Televideo (1)
  202. > I would suggest U+FFFD for this.
  203. U+FFFD means "this character is not in Unicode" (or in this font), which is
  204. not quite the same meaning as "this character is illegal in this context"
  205. on the VT terminals.  Anyway, reverse question mark is a regular glyph
  206. character on the Wyse and Televideo models.
  207.  
  208. - Frank
  209.  
  210.  1-Oct-98 16:24:10-GMT,921;000000000011
  211. Return-Path: <nelson@pinotnoir.media.mit.edu>
  212. Received: from aleve.media.mit.edu (aleve.media.mit.edu [18.85.2.171])
  213.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id MAA03674
  214.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 12:24:05 -0400 (EDT)
  215. Received: from pinotnoir.media.mit.edu (nelson@pinotnoir.media.mit.edu [18.85.16.104])
  216.     by aleve.media.mit.edu (8.8.7/ML970927) with ESMTP id MAA00747;
  217.     Thu, 1 Oct 1998 12:23:52 -0400 (EDT)
  218. Received: (from nelson@localhost)
  219.     by pinotnoir.media.mit.edu (8.8.5/8.8.5) id MAA04913;
  220.     Thu, 1 Oct 1998 12:23:52 -0400
  221. Date: Thu, 1 Oct 1998 12:23:52 -0400
  222. Message-Id: <199810011623.MAA04913@pinotnoir.media.mit.edu>
  223. From: nelson@media.mit.edu (Nelson Minar)
  224. To: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  225. Subject: Re: Terminal Graphics Proposal
  226. In-Reply-To: <9810010143.AA14122@unicode.org>
  227. References: <9810010143.AA14122@unicode.org>
  228.  
  229. Wow, that was an impressive proposal.
  230.  
  231.  1-Oct-98 16:59:50-GMT,2868;000000000001
  232. Return-Path: <unicode@unicode.org>
  233. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  234.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id MAA14961
  235.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 12:59:49 -0400 (EDT)
  236. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  237.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id JAA32536
  238.     ; Thu, 1 Oct 1998 09:58:25 -0700
  239. Received: by unicode.org (NX5.67g/NX3.0S)
  240.     id AA16971; Thu, 1 Oct 98 09:48:27 -0700
  241. Message-Id: <9810011648.AA16971@unicode.org>
  242. Errors-To: uni-bounce@unicode.org
  243. Mime-Version: 1.0
  244. Content-Type: text/plain; charset=us-ascii
  245. Content-Transfer-Encoding: 7bit
  246. X-Uml-Sequence: 6034 (1998-10-01 16:48:08 GMT)
  247. From: John Cowan <cowan@locke.ccil.org>
  248. Reply-To: unicode@unicode.org
  249. To: Unicode List <unicode@unicode.org>
  250. Date: Thu, 1 Oct 1998 09:48:07 -0700 (PDT)
  251. Subject: Re: Terminal Graphics Proposal
  252. Content-Transfer-Encoding: 7bit
  253.  
  254. Frank da Cruz wrote:
  255.  
  256. > More useful in a terminal emulator, however, is the ability to display the
  257. > the official abbreviation [1,18], or "name", of the control character in a
  258. > single cell. [...]
  259. >
  260. > Some control characters have two-character abbreviations (such as CR, LF,
  261. > HT, FF), while others are three characters (NUL, SOH, DC1, DLE).  Some
  262. > terminals compress three-letter abbreviations to the two-character forms
  263. > shown in Table 4.2.  All terminals, however, display the abbreviations
  264. > diagonally in the character cell, as shown in Figure 4.1. [...]
  265. >
  266. > Unicode already has a block of Control Pictures at U+2400 through U+2421,
  267. > but (except for "NL" at U+2424) these go horizontally across the character
  268. > cell, rather than diagonally, thus making them difficult to distinguish from
  269. > normal alphanumeric text.  A new, parallel block of C0 control pictures is
  270. > needed in which the abbreviations are displayed diagonally.
  271.  
  272. This reflects a failure to understand the semantics of the
  273. Control Pictures block, specifically the range U+2400 - U+214F,
  274. which is documented on page 6-84 of the Unicode Standard 2.0.
  275.  
  276. # [F]or the control code graphics U+2400 -> U+241F only the
  277. # semantic is encoded in the Unicode Standard.  This allwos a particular
  278. # application to use the graphic representation it prefers.
  279. # [...] The [code points U+2400 to U+241F] are not associated with
  280. # specific glyphs, but rather are available to encode <em>any</em>
  281. # desired pictorial representation of the given control code.
  282.  
  283. The horizontal representations printed on page 7-188, therefore,
  284. are not standardized in any way.  Diagonal representations would
  285. be entirely equivalent; the distinction is one of font only.
  286.  
  287. -- 
  288. John Cowan    http://www.ccil.org/~cowan        cowan@ccil.org
  289.     You tollerday donsk?  N.  You tolkatiff scowegian?  Nn.
  290.     You spigotty anglease?  Nnn.  You phonio saxo?  Nnnn.
  291.         Clear all so!  'Tis a Jute.... (Finnegans Wake 16.5)
  292.  
  293.  1-Oct-98 17:15:40-GMT,2779;000000000001
  294. Return-Path: <unicode@unicode.org>
  295. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  296.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id NAA19770
  297.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 13:15:38 -0400 (EDT)
  298. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  299.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id KAA28598
  300.     ; Thu, 1 Oct 1998 10:11:05 -0700
  301. Received: by unicode.org (NX5.67g/NX3.0S)
  302.     id AA17056; Thu, 1 Oct 98 09:53:13 -0700
  303. Message-Id: <9810011653.AA17056@unicode.org>
  304. Errors-To: uni-bounce@unicode.org
  305. X-Uml-Sequence: 6035 (1998-10-01 16:51:54 GMT)
  306. From: Rick McGowan <rmcgowan@apple.com>
  307. Reply-To: unicode@unicode.org
  308. To: Unicode List <unicode@unicode.org>
  309. Date: Thu, 1 Oct 1998 09:51:51 -0700 (PDT)
  310. Subject: Re: Terminal Graphics Proposal
  311.  
  312. Frank da Cruz sent a long proposal.  It looks like a pretty thorough  
  313. analysis, though I've not made it all the way through.  One thing leapt out  
  314. that I thought I'd mention...
  315.  
  316. >  Unicode already has a block of Control Pictures at U+2400 through U+2421,
  317. >  but (except for "NL" at U+2424) these go horizontally across the character
  318. >  cell, rather than diagonally, thus making them difficult to distinguish
  319. >  from normal alphanumeric text.  A new, parallel block of C0 control
  320. >  pictures is needed in which the abbreviations are displayed diagonally
  321.  
  322. I think rather that the current control pictures are a SUGGESTION of the  
  323. possible glyphs for particular functions.  The glyphs for them even changed  
  324. between Unicode 1.0 and 2.0!  So I would have to seriously question adding a  
  325. parallel set of pictures.  Unless there is some need for having multiple,  
  326. parallel representations for THE SAME CODE on the SAME TERMINAL, I don't see  
  327. any point to adding several glyphic variations.  Pick your glyphs and use the  
  328. existing control pix for existing controls.
  329.  
  330. Of course, there are a *lot* of controls, many control sets, and some degree  
  331. of overlap, as Frank's proposal points out rather dramatically.  I would  
  332. suggest that he take up an attempt at serious unification of these things,  
  333. and collect all of the wonderful data he's gathered into a "white paper" on  
  334. how to use control pictures for what terminals, etc.  With mapping tables,  
  335. and a list of the minimum required additions to support full cross-mappings.
  336.  
  337. This proposal contains a lot of data.  It would be best to do as much  
  338. unification work as possible up-front, rather than relying on UTC and/or WG2  
  339. to take it up.  The proposal would stand a greater chance of success.  If the  
  340. committees look at it and say that it needs much work to clarify what can  
  341. and cannot be unified, then they're less likely to act quickly.  In my  
  342. opinion.
  343.  
  344. And the bibliography is impressive.
  345.  
  346.     Rick
  347.  
  348.  1-Oct-98 17:24:04-GMT,1128;000000000001
  349. Return-Path: <unicode@unicode.org>
  350. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  351.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id NAA21767
  352.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 13:24:03 -0400 (EDT)
  353. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  354.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id KAA60476
  355.     ; Thu, 1 Oct 1998 10:20:31 -0700
  356. Received: by unicode.org (NX5.67g/NX3.0S)
  357.     id AA17189; Thu, 1 Oct 98 10:03:08 -0700
  358. Message-Id: <9810011703.AA17189@unicode.org>
  359. Errors-To: uni-bounce@unicode.org
  360. X-Uml-Sequence: 6036 (1998-10-01 17:00:19 GMT)
  361. From: Rick McGowan <rmcgowan@apple.com>
  362. Reply-To: unicode@unicode.org
  363. To: Unicode List <unicode@unicode.org>
  364. Date: Thu, 1 Oct 1998 10:00:18 -0700 (PDT)
  365. Subject: Re: Terminal Graphics Proposal
  366.  
  367. > I do not claim to be an expert on Unicode fonts, I have never seen one that
  368. > implemented this block, so I don't actually know how it looks.
  369.  
  370. Frank -- Go out to
  371.     http://www.indigo.ie/egt/celtscript/
  372. and look for Everson Mono.  There's a PS font that implements these, with  
  373. completely different glyphs.
  374.  
  375.  
  376.     Rick
  377.  
  378.  1-Oct-98 18:29:33-GMT,6717;000000000011
  379. Return-Path: <unicode@unicode.org>
  380. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  381.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id OAA09734
  382.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 14:29:31 -0400 (EDT)
  383. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  384.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id LAA54084
  385.     ; Thu, 1 Oct 1998 11:19:28 -0700
  386. Received: by unicode.org (NX5.67g/NX3.0S)
  387.     id AA17232; Thu, 1 Oct 98 10:06:03 -0700
  388. Message-Id: <9810011706.AA17232@unicode.org>
  389. Errors-To: uni-bounce@unicode.org
  390. Mime-Version: 1.0
  391. Content-Type: text/plain; charset="us-ascii"
  392. X-Uml-Sequence: 6037 (1998-10-01 17:03:51 GMT)
  393. From: Paul Keinanen <keinanen@sci.fi>
  394. Reply-To: unicode@unicode.org
  395. To: Unicode List <unicode@unicode.org>
  396. Date: Thu, 1 Oct 1998 10:03:50 -0700 (PDT)
  397. Subject: Re: Terminal Graphics Proposal
  398.  
  399.  
  400.  
  401. Kevin Bracey said most that I was planning to say about this interesting
  402. proposal, but here are some more observations.
  403.  
  404. Frank da Cruz <fdc@watsun.cc.columbia.edu> wrote:
  405.  
  406. >Table 4.2: C0 Control Pictures
  407. >
  408. >  Code  Name  2X         Code  Name  2X
  409. >  E000  NUL   NU         E010  DLE   DL
  410. >  E001  SOH   SH         E011  DC1   D1
  411. >  E002  STX   SX         E012  DC2   D2
  412. >  E003  ETX   EX         E013  DC3   D3
  413. >  E004  EOT   ET         E014  DC4   D4
  414. >  E005  ENQ   EQ         E015  NAK   NK
  415. >  E006  ACK   AK         E016  SYN   SY
  416. >  E007  BEL   BL         E017  ETB   EB
  417. >  E009  BS    BS         E018  CAN   CN
  418. >  E009  HT    HT         E019  EM    EM
  419. >  E00A  LF    LF         E01A  SUB   SU
  420. >  E00B  VT    VT         E01B  ESC   EC
  421. >  E00C  FF    FF         E01C  FS    FS
  422. >  E00D  CR    CR         E01D  GS    GS
  423. >  E00E  SO    SO         E01E  RS    RS
  424. >  E00F  SI    SI         E01F  US    US
  425. >
  426. >There is little to gain by defining separate 2- and 3-character glyphs for
  427. >control characters that have 3-character names; therefore it is suggested
  428. >that the full abbreviation (from the Name column) be used, with the
  429. >characters arranged diagonally within each cell (rather than horizontally as
  430. >in the U+2400 block), and that the 2X column be ignored.
  431.  
  432. As far as I know, the Unicode standard does not specify the writing
  433. direction or actual representation of these characters. I would think that
  434. the two or three character forms are just variations of the same glyph. To
  435. me, it would make perfectly sense for readability point of view to use e.g.
  436. AK (horisontally, diagonally or vertically spaced) for a very small font and
  437. use ACK for larger fonts with more available pixels. 
  438.  
  439. If all octet values (00 .. FF) are also going to be displayed, there might
  440. be some ambiguity with some of the two letter codes, e.g. FF, D1, D2, D3,
  441. D4, EB and EC, which should be noted in the actual font design.
  442.  
  443.  
  444. >C1 Control characters are specified in ISO-6429 and used in the VT220
  445. >family of terminals [5] and the Wyse 370 [26], where they are represented
  446. >in the right half of the "display controls" font as shown in Table 4.3 (DEC
  447. >terminals use the full name, Wyse terminals use the 2X name).  As with C0
  448. >controls, the "name" is displayed diagonally within the character cell.
  449. >Unicode presently includes no C1 control pictures.
  450.  
  451. Looking through various EBCDIC code pages (e.g. IBM278, IBM880) and other
  452. unnumbered sets it appears that these control codes are all also available
  453. in EBCDIC, but of course at different positions (e.g. IND at 0x24). Some
  454. references to these sets are "IBM NLS RM Vol2 SE09-8002-01, March 1990" and
  455. "IBM 3270 Char Set Ref Ch 10, GA27-2837-9, April 1987". 
  456.  
  457. Based on this observation, it is strange that the C0 control pictures are in
  458. the Unicode standard, but not the C1 control pictures.
  459.  
  460. >Table 4.3: C1 Control Pictures
  461.  
  462.  
  463. >Note that three of the C1 control pictures are unassigned (the ones marked
  464. >by "(1)", that would be at U+E020, U+E021, and U+E039 if these were
  465. >assigned).  These positions should be left vacant in case names are assigned
  466. >to these characters in a future revision of ISO 6429.
  467.  
  468. In ISO 8859-1 these are listed as
  469.  
  470. 80  PADDING CHARACTER (PAD)
  471. 81  HIGH OCTET PRESET (HOP)
  472.  
  473. 99  SINGLE GRAPHIC CHARACTER INTRODUCER (SGCI)
  474.  
  475.  
  476. >Table 4.4 shows the names of control characters unique to EBCDIC (that is,
  477. >the ones it does not share with ASCII).
  478.  
  479. There seems to be different names for the same EBCDIC control characters and
  480. some of these names are equivalent to the ASCII names. Just wondering what
  481. should be done to these control pictures ? Some examples below.
  482.  
  483.  
  484. >  E082  LS1   Locking Shift 1 (ISO name for SO)
  485. >  E083  LS0   Locking Shift 0 (ISO name for SI)
  486. >  E084  IS4   ISO Name for FS: Information Separator 4
  487. >  E085  IS3   ISO Name for GS: Information Separator 3
  488. >  E086  IS2   ISO Name for RS: Information Separator 2
  489. >  E087  IS1   ISO Name for US: Information Separator 1
  490.  
  491.  
  492. >5. HEX BYTES
  493. >
  494. >Hexadecimal byte values, 2 hex digits each.  Like display controls, but for
  495. >all 256 8-bit byte values, showing the byte code in hexadecimal, rather than
  496. >the (context-dependent) name.  For hex debugging (in terminal emulators,
  497. >line monitors, protocol analyzers, etc).  Should be arranged diagonally
  498. >within the character cell as shown in Figure 5.1:
  499.  
  500. These would be very nice :-). Note the possible ambiguity with some two
  501. character control pictures r.g. FF, EB etc. So special precautions should be
  502. taken when designing the fonts.
  503.  
  504.  
  505.  
  506.  
  507. >8. MISCELLANEOUS SINGLE-CELL GLYPHS
  508.  
  509.  
  510. >Notes:
  511. > (1) The reverse question is essential in VT terminal emulation, where it
  512. >     indicates that an invalid code was received, or a parity or other
  513. >     error was detected. It also stands for SUB and/or RS in Wyse display
  514. >     controls mode, and is the glyph for 0xFF in the Televideo Multinational
  515. >     Character Set [23].  And it it is also a glyph in the DG Special
  516. >     Graphics Character Set [2].
  517.  
  518.  
  519. Even ISO-Latin1 contains the reverse question mark at 0xBF, so it is no need
  520. to re-invent it.
  521.  
  522.  
  523. >9. UNFINISHED BUSINESS
  524.  
  525.  
  526. >No attempt was made to account for the many Viewdata, Videotex, Minitel,
  527. >NAPLPS, or other mosaic graphics character sets.  These should be tackled,
  528. >if appropriate, by someone who knows something about them.
  529.  
  530. And not forgetting the tele-text block characters on European TVs. With the
  531. introduction of TV cards for PCs that also contains a teletext decoder, so
  532. there is a need to display the text and block graphics on PC. As far as I
  533. remember, the block graphic format is more or less the same as Viewdata with
  534. 2 columns and 3 rows per character cell, thus requiring 64 glyphs.
  535.  
  536. All in all a very interesting proposal. By using as much existing characters
  537. from current Unicode standard, i guess there would be a greater likelyhood
  538. of getting thing officially approved.
  539.  
  540. Paul
  541.  
  542.  
  543.  1-Oct-98 19:21:23-GMT,4957;000000000001
  544. Return-Path: <fdc>
  545. Received: (from fdc@localhost)
  546.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id PAA23982;
  547.     Thu, 1 Oct 1998 15:20:06 -0400 (EDT)
  548. Date: Thu, 1 Oct 98 15:20:04 EDT
  549. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  550. To: unicode@unicode.org
  551. Subject: Re: Terminal Graphics Proposal
  552. In-Reply-To: Your message of Thu, 1 Oct 1998 10:03:50 -0700 (PDT)
  553. Message-ID: <CMM.0.90.4.907269604.fdc@watsun.cc.columbia.edu>
  554.  
  555. > As far as I know, the Unicode standard does not specify the writing
  556. > direction or actual representation of [control pictures]. I would think that
  557. > the two or three character forms are just variations of the same glyph.
  558. >
  559. This seems to be the consensus, and the most prominent reaction to the
  560. proposal.  Still, if I were a font maker working from the Unicode book, I'd
  561. probably copy the pictures in it, so again, I'd suggest the next edition
  562. show the characters diagonally within the cell, and the accompanying text
  563. (which if I can overlook, so can a font maker :-) point out the importance
  564. of visually preserving the character-cell boundaries by some means.  The
  565. diagonal arrangement is used on all terminals I have seen that support
  566. display controls, so this would be the most obvious method.
  567.  
  568. > If all octet values (00 .. FF) are also going to be displayed, there might
  569. > be some ambiguity with some of the two letter codes, e.g. FF, D1, D2, D3,
  570. > D4, EB and EC, which should be noted in the actual font design.
  571. >  
  572. Good point.  One path to disambiguation would be to show hex digits A-F in
  573. lower case.  Sounds OK?
  574.  
  575. > >C1 Control characters are specified in ISO-6429 and used in the VT220
  576. > >family of terminals [5] and the Wyse 370 [26], where they are represented
  577. > >in the right half of the "display controls" font as shown in Table 4.3 (DEC
  578. > >terminals use the full name, Wyse terminals use the 2X name).  As with C0
  579. > >controls, the "name" is displayed diagonally within the character cell.
  580. > >Unicode presently includes no C1 control pictures.
  581. > Looking through various EBCDIC code pages (e.g. IBM278, IBM880) and other
  582. > unnumbered sets it appears that these control codes are all also available
  583. > in EBCDIC, but of course at different positions (e.g. IND at 0x24). Some
  584. > references to these sets are "IBM NLS RM Vol2 SE09-8002-01, March 1990" and
  585. > "IBM 3270 Char Set Ref Ch 10, GA27-2837-9, April 1987". 
  586. Thanks for pointing this out -- I'll be sure to unify all duplicates in the
  587. next go-round.
  588.  
  589. > In ISO 8859-1 these are listed as
  590. > 80  PADDING CHARACTER (PAD)
  591. > 81  HIGH OCTET PRESET (HOP)
  592. > 99  SINGLE GRAPHIC CHARACTER INTRODUCER (SGCI)
  593. I suppose that's a good enough source, though I wonder why they are not
  594. named in ISO 6429!
  595.  
  596. > >Table 4.4 shows the names of control characters unique to EBCDIC (that
  597. > >is, the ones it does not share with ASCII).
  598. > There seems to be different names for the same EBCDIC control characters
  599. > and some of these names are equivalent to the ASCII names. Just wondering
  600. > what should be done to these control pictures ? Some examples below.
  601. In the spirit of unification, I would venture that if two different control
  602. characters have the same name, only one control picture is needed.
  603.  
  604. > >Notes:
  605. > > (1) The reverse question is essential in VT terminal emulation...
  606. > Even ISO-Latin1 contains the reverse question mark at 0xBF, so it is no
  607. > need to re-invent it.
  608. But that one is upside down.  The one I'm talking about is upright but
  609. flipped on its vertical axis.
  610.  
  611. Clearly an important component of this proposal, before it reaches its final
  612. stage, is a collection of pictures of the proposed characters.  I'll do my
  613. best to scan in the relevant pages from the many terminal manuals, for what
  614. it's worth -- many of them are crude and unclear to begin with, some of them
  615. are even hand-drawn.  Others are wedded to dot matrices of specific
  616. dimensions and, in fact, are shown as large tty graphics.
  617.  
  618. I wonder how one proceeds from such elusive sources to create a definitive
  619. picture of each character, and then to translate this into the style of a
  620. particular font.  Oh well, not my problem :-)
  621.  
  622. > All in all a very interesting proposal. By using as much existing characters
  623. > from current Unicode standard, i guess there would be a greater likelyhood
  624. > of getting thing officially approved.
  625. And of course, many characters in many of these sets are indeed well covered
  626. by existing Unicode characters and so never appeared in the proposal in the
  627. first place.  I considered fully enumerating each character set and noting
  628. which characters already did and did not have suitable Unicode equivalents,
  629. but that would have made the proposal much too long.
  630.  
  631. Thanks to you and everyone else for the helpful and supportive comments.  I
  632. think the next step will be to run a new draft (updated according to comments
  633. from this list) past the broad constituencies of some of the terminals it
  634. treats, for which there are several well-suited newsgroups.
  635.  
  636. Thanks again!
  637.  
  638. - Frank
  639.  
  640.  1-Oct-98 19:58:53-GMT,5362;000000000001
  641. Return-Path: <unicode@unicode.org>
  642. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  643.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id PAA06792
  644.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 15:58:51 -0400 (EDT)
  645. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  646.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id MAA36108
  647.     ; Thu, 1 Oct 1998 12:59:01 -0700
  648. Received: by unicode.org (NX5.67g/NX3.0S)
  649.     id AA19623; Thu, 1 Oct 98 12:35:11 -0700
  650. Message-Id: <9810011935.AA19623@unicode.org>
  651. Errors-To: uni-bounce@unicode.org
  652. X-Uml-Sequence: 6042 (1998-10-01 19:32:37 GMT)
  653. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  654. Reply-To: unicode@unicode.org
  655. To: Unicode List <unicode@unicode.org>
  656. Date: Thu, 1 Oct 1998 12:32:36 -0700 (PDT)
  657. Subject: Re: Terminal Graphics Proposal
  658.  
  659. > As far as I know, the Unicode standard does not specify the writing
  660. > direction or actual representation of [control pictures]. I would think that
  661. > the two or three character forms are just variations of the same glyph.
  662. >
  663. This seems to be the consensus, and the most prominent reaction to the
  664. proposal.  Still, if I were a font maker working from the Unicode book, I'd
  665. probably copy the pictures in it, so again, I'd suggest the next edition
  666. show the characters diagonally within the cell, and the accompanying text
  667. (which if I can overlook, so can a font maker :-) point out the importance
  668. of visually preserving the character-cell boundaries by some means.  The
  669. diagonal arrangement is used on all terminals I have seen that support
  670. display controls, so this would be the most obvious method.
  671.  
  672. > If all octet values (00 .. FF) are also going to be displayed, there might
  673. > be some ambiguity with some of the two letter codes, e.g. FF, D1, D2, D3,
  674. > D4, EB and EC, which should be noted in the actual font design.
  675. >  
  676. Good point.  One path to disambiguation would be to show hex digits A-F in
  677. lower case.  Sounds OK?
  678.  
  679. > >C1 Control characters are specified in ISO-6429 and used in the VT220
  680. > >family of terminals [5] and the Wyse 370 [26], where they are represented
  681. > >in the right half of the "display controls" font as shown in Table 4.3 (DEC
  682. > >terminals use the full name, Wyse terminals use the 2X name).  As with C0
  683. > >controls, the "name" is displayed diagonally within the character cell.
  684. > >Unicode presently includes no C1 control pictures.
  685. > Looking through various EBCDIC code pages (e.g. IBM278, IBM880) and other
  686. > unnumbered sets it appears that these control codes are all also available
  687. > in EBCDIC, but of course at different positions (e.g. IND at 0x24). Some
  688. > references to these sets are "IBM NLS RM Vol2 SE09-8002-01, March 1990" and
  689. > "IBM 3270 Char Set Ref Ch 10, GA27-2837-9, April 1987". 
  690. Thanks for pointing this out -- I'll be sure to unify all duplicates in the
  691. next go-round.
  692.  
  693. > In ISO 8859-1 these are listed as
  694. > 80  PADDING CHARACTER (PAD)
  695. > 81  HIGH OCTET PRESET (HOP)
  696. > 99  SINGLE GRAPHIC CHARACTER INTRODUCER (SGCI)
  697. I suppose that's a good enough source, though I wonder why they are not
  698. named in ISO 6429!
  699.  
  700. > >Table 4.4 shows the names of control characters unique to EBCDIC (that
  701. > >is, the ones it does not share with ASCII).
  702. > There seems to be different names for the same EBCDIC control characters
  703. > and some of these names are equivalent to the ASCII names. Just wondering
  704. > what should be done to these control pictures ? Some examples below.
  705. In the spirit of unification, I would venture that if two different control
  706. characters have the same name, only one control picture is needed.
  707.  
  708. > >Notes:
  709. > > (1) The reverse question is essential in VT terminal emulation...
  710. > Even ISO-Latin1 contains the reverse question mark at 0xBF, so it is no
  711. > need to re-invent it.
  712. But that one is upside down.  The one I'm talking about is upright but
  713. flipped on its vertical axis.
  714.  
  715. Clearly an important component of this proposal, before it reaches its final
  716. stage, is a collection of pictures of the proposed characters.  I'll do my
  717. best to scan in the relevant pages from the many terminal manuals, for what
  718. it's worth -- many of them are crude and unclear to begin with, some of them
  719. are even hand-drawn.  Others are wedded to dot matrices of specific
  720. dimensions and, in fact, are shown as large tty graphics.
  721.  
  722. I wonder how one proceeds from such elusive sources to create a definitive
  723. picture of each character, and then to translate this into the style of a
  724. particular font.  Oh well, not my problem :-)
  725.  
  726. > All in all a very interesting proposal. By using as much existing characters
  727. > from current Unicode standard, i guess there would be a greater likelyhood
  728. > of getting thing officially approved.
  729. And of course, many characters in many of these sets are indeed well covered
  730. by existing Unicode characters and so never appeared in the proposal in the
  731. first place.  I considered fully enumerating each character set and noting
  732. which characters already did and did not have suitable Unicode equivalents,
  733. but that would have made the proposal much too long.
  734.  
  735. Thanks to you and everyone else for the helpful and supportive comments.  I
  736. think the next step will be to run a new draft (updated according to comments
  737. from this list) past the broad constituencies of some of the terminals it
  738. treats, for which there are several well-suited newsgroups.
  739.  
  740. Thanks again!
  741.  
  742. - Frank
  743.  
  744.  1-Oct-98 19:58:53-GMT,1419;000000000001
  745. Return-Path: <unicode@unicode.org>
  746. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  747.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id PAA06793
  748.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 15:58:51 -0400 (EDT)
  749. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  750.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id MAA16728
  751.     ; Thu, 1 Oct 1998 12:57:48 -0700
  752. Received: by unicode.org (NX5.67g/NX3.0S)
  753.     id AA19780; Thu, 1 Oct 98 12:42:14 -0700
  754. Message-Id: <9810011942.AA19780@unicode.org>
  755. Errors-To: uni-bounce@unicode.org
  756. Mime-Version: 1.0
  757. Content-Type: text/plain; charset=us-ascii
  758. Content-Transfer-Encoding: 7bit
  759. X-Uml-Sequence: 6043 (1998-10-01 19:39:42 GMT)
  760. From: John Cowan <cowan@locke.ccil.org>
  761. Reply-To: unicode@unicode.org
  762. To: Unicode List <unicode@unicode.org>
  763. Date: Thu, 1 Oct 1998 12:39:38 -0700 (PDT)
  764. Subject: Re: Terminal Graphics Proposal
  765. Content-Transfer-Encoding: 7bit
  766.  
  767. Paul Keinanen wrote:
  768.  
  769. > Even ISO-Latin1 contains the reverse question mark at 0xBF, so it is no need
  770. > to re-invent it.
  771.  
  772. No, that is the inverted (head over heels) question mark.  What is
  773. being described here is a reversed (left-to-right) question mark.
  774.  
  775. -- 
  776. John Cowan    http://www.ccil.org/~cowan        cowan@ccil.org
  777.     You tollerday donsk?  N.  You tolkatiff scowegian?  Nn.
  778.     You spigotty anglease?  Nnn.  You phonio saxo?  Nnnn.
  779.         Clear all so!  'Tis a Jute.... (Finnegans Wake 16.5)
  780.  
  781.  1-Oct-98 21:32:59-GMT,2116;000000000001
  782. Return-Path: <unicode@unicode.org>
  783. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  784.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id RAA03320
  785.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 17:32:57 -0400 (EDT)
  786. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  787.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id OAA17196
  788.     ; Thu, 1 Oct 1998 14:28:31 -0700
  789. Received: by unicode.org (NX5.67g/NX3.0S)
  790.     id AA20910; Thu, 1 Oct 98 13:56:11 -0700
  791. Message-Id: <9810012056.AA20910@unicode.org>
  792. Errors-To: uni-bounce@unicode.org
  793. X-Uml-Sequence: 6046 (1998-10-01 20:54:15 GMT)
  794. From: Rick McGowan <rmcgowan@apple.com>
  795. Reply-To: unicode@unicode.org
  796. To: Unicode List <unicode@unicode.org>
  797. Date: Thu, 1 Oct 1998 13:54:14 -0700 (PDT)
  798. Subject: Re: Terminal Graphics Proposal
  799.  
  800. > Still, if I were a font maker working from the Unicode book, I'd
  801. > probably copy the pictures in it, so again, I'd suggest the next edition
  802. > show the characters diagonally within the cell, and the accompanying text
  803. > (which if I can overlook, so can a font maker :-)
  804.  
  805. Yes, yes, but... People should read, Grasshopper.  It is that for which we write.
  806.  
  807. People who do not "R.T.F.M." waste everyone else's time asking questions  
  808. that are answered in "T.F.M."  The Internet is absolutely RAMPANT with that  
  809. behavior and it always has been.  (Well, society itself, for that matter, is  
  810. full of such behavior, so I shouldn't knock the net...)
  811.  
  812. It would be a poor, poor font designer indeed who, having NOT Read The  
  813. Formidable Manual, tried to implement a font for the control pictures.  I  
  814. would not pity such a person, only the victims of the resulting "font".
  815.  
  816. > I wonder how one proceeds from such elusive sources to create a definitive
  817. > picture of each character, and then to translate this into the style of a
  818. > particular font.  Oh well, not my problem :-)
  819.  
  820. Actually, Grasshopper... it *is* your problem.  Nobody else is going to do  
  821. this for you.  I suggest you gird your loins and heave to.  This is a chance  
  822. for you to make a useful and lasting contribution to History.
  823.  
  824. Cheerily,
  825.     Rick
  826.  
  827.  1-Oct-98 21:53:31-GMT,1581;000000000001
  828. Return-Path: <unicode@unicode.org>
  829. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  830.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id RAA06957
  831.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 17:53:30 -0400 (EDT)
  832. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  833.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id OAA11468
  834.     ; Thu, 1 Oct 1998 14:53:30 -0700
  835. Received: by unicode.org (NX5.67g/NX3.0S)
  836.     id AA21562; Thu, 1 Oct 98 14:41:30 -0700
  837. Message-Id: <9810012141.AA21562@unicode.org>
  838. Errors-To: uni-bounce@unicode.org
  839. Mime-Version: 1.0
  840. Content-Type: text/plain; charset="us-ascii"
  841. X-Uml-Sequence: 6047 (1998-10-01 21:40:59 GMT)
  842. From: Asmus Freytag <asmusf@ix.netcom.com>
  843. Reply-To: unicode@unicode.org
  844. To: Unicode List <unicode@unicode.org>
  845. Date: Thu, 1 Oct 1998 14:40:56 -0700 (PDT)
  846. Subject: Re: Terminal Graphics Proposal
  847.  
  848. >And thus, at minumum, the table in the book should be altered to show all
  849. >control pictures arranged diagonally, and all future control picture
  850. additions
  851. >should also be arranged that way.
  852.  
  853. We are looking into this for Unicode 3.0. Although the mail discussion makes 
  854. clear that the distinction between characters and glyphs is widely known, it
  855. makes no sense to depart from the established use in the one area the
  856. characters are intended for!
  857.  
  858. Since the two glyph forms are equivalent (i.e. there's no question of changing
  859. the identity of the characters) such a change is editorial in nature. For
  860. what it's worth, ISO 10646 uses the diagonal forms (although incorrectly in
  861. a roman type face).
  862.  
  863. A./
  864.  
  865.  
  866.  1-Oct-98 22:06:05-GMT,1299;000000000001
  867. Return-Path: <unicode@unicode.org>
  868. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  869.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id SAA08132
  870.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 18:06:03 -0400 (EDT)
  871. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  872.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id PAA40338
  873.     ; Thu, 1 Oct 1998 15:05:50 -0700
  874. Received: by unicode.org (NX5.67g/NX3.0S)
  875.     id AA21781; Thu, 1 Oct 98 14:52:06 -0700
  876. Message-Id: <9810012152.AA21781@unicode.org>
  877. Errors-To: uni-bounce@unicode.org
  878. Mime-Version: 1.0
  879. Content-Type: text/plain; charset="us-ascii"
  880. X-Uml-Sequence: 6048 (1998-10-01 21:50:21 GMT)
  881. From: Asmus Freytag <asmusf@ix.netcom.com>
  882. Reply-To: unicode@unicode.org
  883. To: Unicode List <unicode@unicode.org>
  884. Date: Thu, 1 Oct 1998 14:50:20 -0700 (PDT)
  885. Subject: Re: Terminal Graphics Proposal
  886.  
  887. >> >Notes:
  888. >> > (1) The reverse question is essential in VT terminal emulation...
  889. >> 
  890. >> Even ISO-Latin1 contains the reverse question mark at 0xBF, so it is no
  891. >> need to re-invent it.
  892. >> 
  893. >But that one is upside down.  The one I'm talking about is upright but
  894. >flipped on its vertical axis.
  895. >
  896.  
  897. This important character is already on the list of characters to be added
  898. in one the coming amendments in ISO 10646. 
  899.  
  900. A./
  901.  
  902.  1-Oct-98 23:12:25-GMT,1652;000000000001
  903. Return-Path: <unicode@unicode.org>
  904. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  905.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id TAA15789
  906.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 19:12:24 -0400 (EDT)
  907. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  908.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id QAA65550
  909.     ; Thu, 1 Oct 1998 16:11:33 -0700
  910. Received: by unicode.org (NX5.67g/NX3.0S)
  911.     id AA22944; Thu, 1 Oct 98 16:06:19 -0700
  912. Message-Id: <9810012306.AA22944@unicode.org>
  913. Errors-To: uni-bounce@unicode.org
  914. X-Uml-Sequence: 6049 (1998-10-01 23:05:56 GMT)
  915. From: kenw@sybase.com (Kenneth Whistler)
  916. Reply-To: unicode@unicode.org
  917. To: Unicode List <unicode@unicode.org>
  918. Cc: kenw@sybase.com
  919. Date: Thu, 1 Oct 1998 16:05:51 -0700 (PDT)
  920. Subject: Re: Terminal Graphics Proposal (reverse QMark)
  921.  
  922.  
  923. > >> >Notes:
  924. > >> > (1) The reverse question is essential in VT terminal emulation...
  925. > >> 
  926. > >> Even ISO-Latin1 contains the reverse question mark at 0xBF, so it is no
  927. > >> need to re-invent it.
  928. > >> 
  929. > >But that one is upside down.  The one I'm talking about is upright but
  930. > >flipped on its vertical axis.
  931. > >
  932. > This important character is already on the list of characters to be added
  933. > in one the coming amendments in ISO 10646. 
  934.  
  935. As Asmus mentioned, this one is already on its way. It is encoded in
  936. Amendment 18 to 10646, which is just entering its last round of ballotting:
  937.  
  938. U+2426 SYMBOL FOR SUBSTITUTE FORM TWO
  939.  
  940. with the requisite shape of the reversed question mark.
  941.  
  942. This character is derived from ISO 2047, also shows up in DIN 66 213,
  943. and in various terminal emulations.
  944.  
  945. --Ken
  946.  
  947.  2-Oct-98  0:27:41-GMT,1442;000000000001
  948. Return-Path: <unicode@unicode.org>
  949. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  950.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id UAA23786
  951.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 20:27:41 -0400 (EDT)
  952. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  953.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id RAA31536
  954.     ; Thu, 1 Oct 1998 17:27:33 -0700
  955. Received: by unicode.org (NX5.67g/NX3.0S)
  956.     id AA24011; Thu, 1 Oct 98 17:17:58 -0700
  957. Message-Id: <9810020017.AA24011@unicode.org>
  958. Errors-To: uni-bounce@unicode.org
  959. Mime-Version: 1.0
  960. Content-Type: text/plain; charset=us-ascii
  961. X-Uml-Sequence: 6054 (1998-10-02 00:16:05 GMT)
  962. From: Markus Kuhn <Markus.Kuhn@cl.cam.ac.uk>
  963. Reply-To: unicode@unicode.org
  964. To: Unicode List <unicode@unicode.org>
  965. Date: Thu, 1 Oct 1998 17:16:04 -0700 (PDT)
  966. Subject: Re: Terminal Graphics Proposal 
  967.  
  968. Paul Keinanen wrote on 1998-10-01 17:03 UTC:
  969. > In ISO 8859-1 these are listed as
  970. > 80  PADDING CHARACTER (PAD)
  971. > 81  HIGH OCTET PRESET (HOP)
  972. > 99  SINGLE GRAPHIC CHARACTER INTRODUCER (SGCI)
  973.  
  974. Are you sure about the source? Last time I looked into
  975. ISO/IEC 8859-1:1986(E), it was certainly free of any control
  976. characters. ISO 8859 defines only graphical characters.
  977. What exactly is your source on this?
  978.  
  979. Markus
  980.  
  981. -- 
  982. Markus G. Kuhn, Security Group, Computer Lab, Cambridge University, UK
  983. email: mkuhn at acm.org,  home page: <http://www.cl.cam.ac.uk/~mgk25/>
  984.  
  985.  2-Oct-98  0:48:25-GMT,2800;000000000001
  986. Return-Path: <unicode@unicode.org>
  987. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  988.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id UAA27172
  989.     for <fdc@watsun.cc.columbia.edu>; Thu, 1 Oct 1998 20:48:24 -0400 (EDT)
  990. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  991.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id RAA11956
  992.     ; Thu, 1 Oct 1998 17:48:34 -0700
  993. Received: by unicode.org (NX5.67g/NX3.0S)
  994.     id AA23953; Thu, 1 Oct 98 17:15:49 -0700
  995. Message-Id: <9810020015.AA23953@unicode.org>
  996. Errors-To: uni-bounce@unicode.org
  997. Mime-Version: 1.0
  998. Content-Type: text/plain; charset=us-ascii
  999. X-Uml-Sequence: 6053 (1998-10-02 00:15:13 GMT)
  1000. From: Markus Kuhn <Markus.Kuhn@cl.cam.ac.uk>
  1001. Reply-To: unicode@unicode.org
  1002. To: Unicode List <unicode@unicode.org>
  1003. Date: Thu, 1 Oct 1998 17:15:12 -0700 (PDT)
  1004. Subject: Re: Terminal Graphics Proposal 
  1005.  
  1006. Frank da Cruz wrote on 1998-10-01 14:34 UTC:
  1007. > My concern is that the pictures in the Unicode book go horizontally.
  1008.  
  1009. Not much love went into the U+24XX glyphs used to print Unicode 2.0.
  1010. The OCR symbols look quite strange as well.
  1011.  
  1012. Unicode is a character set, not a font. Keeping things readable is the
  1013. duty of the font designer. Of course most good fonts will have the Control
  1014. Pictures with diagonal letters. The ISO 10646-1 standard shows them
  1015. all nicely diagonally. It is a good idea for font designers to have
  1016. BOTH the Unicode 2.0 and the ISO 10646 standard on their desk, to see a few
  1017. glyph variations as the two standards were printed using different fonts.
  1018.  
  1019. > Although
  1020. > I do not claim to be an expert on Unicode fonts, I have never seen one that
  1021. > implemented this block, so I don't actually know how it looks.
  1022.  
  1023. One X11 ISO 10646-1 font that implements this block is available from
  1024.  
  1025. http://www.cl.cam.ac.uk/~mgk25/download/ucs-fonts.tar.gz
  1026.  
  1027. See the included README file for instructions on how to have a quick
  1028. look at it with xfd. I don't claim that the control pictures in there
  1029. are extremely beautiful (doing ENQ in a 6x13 matrix is quite
  1030. challenging), but I think it is quite readable.
  1031.  
  1032. > However, I'd
  1033. > say that the horizontal arrangement would make it extremely difficult for the
  1034. > viewer to discern the cell boundaries, as in:
  1035. >   NULSOHSTXETXEOTENQACKBELDELNAKSYNETBCANSUBESCCANACKSSASS3SPAEPACSISCI
  1036. > And thus, at minumum, the table in the book should be altered to show all
  1037. > control pictures arranged diagonally, and all future control picture additions
  1038. > should also be arranged that way.
  1039.  
  1040. I agree that the glyphs used to print the ISO 10646-1 standard are
  1041. much better here than those used in the Unicode 2.0 standard for the U+24XX
  1042. range.
  1043.  
  1044. Markus
  1045.  
  1046. -- 
  1047. Markus G. Kuhn, Security Group, Computer Lab, Cambridge University, UK
  1048. email: mkuhn at acm.org,  home page: <http://www.cl.cam.ac.uk/~mgk25/>
  1049.  
  1050.  2-Oct-98  5:47:14-GMT,2024;000000000001
  1051. Return-Path: <unicode@unicode.org>
  1052. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  1053.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id BAA03026
  1054.     for <fdc@watsun.cc.columbia.edu>; Fri, 2 Oct 1998 01:47:13 -0400 (EDT)
  1055. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  1056.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id WAA11502
  1057.     ; Thu, 1 Oct 1998 22:47:21 -0700
  1058. Received: by unicode.org (NX5.67g/NX3.0S)
  1059.     id AA25821; Thu, 1 Oct 98 22:41:05 -0700
  1060. Message-Id: <9810020541.AA25821@unicode.org>
  1061. Errors-To: uni-bounce@unicode.org
  1062. Mime-Version: 1.0
  1063. Content-Type: text/plain; charset="us-ascii"
  1064. X-Uml-Sequence: 6056 (1998-10-02 05:40:41 GMT)
  1065. From: Paul Keinanen <keinanen@sci.fi>
  1066. Reply-To: unicode@unicode.org
  1067. To: Unicode List <unicode@unicode.org>
  1068. Date: Thu, 1 Oct 1998 22:40:39 -0700 (PDT)
  1069. Subject: Re: Terminal Graphics Proposal
  1070.  
  1071. At 12:32 1.10.1998 -0700,  Frank da Cruz wrote:
  1072.  
  1073. >> If all octet values (00 .. FF) are also going to be displayed, there might
  1074. >> be some ambiguity with some of the two letter codes, e.g. FF, D1, D2, D3,
  1075. >> D4, EB and EC, which should be noted in the actual font design.
  1076. >>  
  1077. >Good point.  One path to disambiguation would be to show hex digits A-F in
  1078. >lower case.  Sounds OK?
  1079.  
  1080. I weas also thinking about that, but since the characters are really small
  1081. to begin with, trying to make them lower case on a low resolution matrix
  1082. would make them even harder to read.
  1083.  
  1084.  
  1085. >> >Notes:
  1086. >> > (1) The reverse question is essential in VT terminal emulation...
  1087. >> 
  1088. >> Even ISO-Latin1 contains the reverse question mark at 0xBF, so it is no
  1089. >> need to re-invent it.
  1090. >> 
  1091. >But that one is upside down.  The one I'm talking about is upright but
  1092. >flipped on its vertical axis.
  1093.  
  1094. Sorry about that, I did not read your text thoroughly enough.
  1095.  
  1096. In all those DEC and other systems I have used, the inverted question mark
  1097. (nmot the reverse question mark) has been used for (parity etc.) error
  1098. indication. I assumed, incorrectly, that you were refering to this usage.
  1099.  
  1100. Paul
  1101.  
  1102.  
  1103.  2-Oct-98  5:53:42-GMT,2125;000000000001
  1104. Return-Path: <unicode@unicode.org>
  1105. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  1106.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id BAA03730
  1107.     for <fdc@watsun.cc.columbia.edu>; Fri, 2 Oct 1998 01:53:42 -0400 (EDT)
  1108. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  1109.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id WAA09530
  1110.     ; Thu, 1 Oct 1998 22:53:47 -0700
  1111. Received: by unicode.org (NX5.67g/NX3.0S)
  1112.     id AA25825; Thu, 1 Oct 98 22:41:06 -0700
  1113. Message-Id: <9810020541.AA25825@unicode.org>
  1114. Errors-To: uni-bounce@unicode.org
  1115. Mime-Version: 1.0
  1116. Content-Type: text/plain; charset="us-ascii"
  1117. X-Uml-Sequence: 6057 (1998-10-02 05:40:51 GMT)
  1118. From: Paul Keinanen <keinanen@sci.fi>
  1119. Reply-To: unicode@unicode.org
  1120. To: Unicode List <unicode@unicode.org>
  1121. Date: Thu, 1 Oct 1998 22:40:50 -0700 (PDT)
  1122. Subject: Re: Terminal Graphics Proposal 
  1123.  
  1124. At 17:16 1.10.1998 -0700, Markus Kuhn wrote:
  1125. >Paul Keinanen wrote on 1998-10-01 17:03 UTC:
  1126. >> In ISO 8859-1 these are listed as
  1127. >> 
  1128. >> 80  PADDING CHARACTER (PAD)
  1129. >> 81  HIGH OCTET PRESET (HOP)
  1130. >> 
  1131. >> 99  SINGLE GRAPHIC CHARACTER INTRODUCER (SGCI)
  1132. >
  1133. >Are you sure about the source? Last time I looked into
  1134. >ISO/IEC 8859-1:1986(E), it was certainly free of any control
  1135. >characters. ISO 8859 defines only graphical characters.
  1136. >What exactly is your source on this?
  1137.  
  1138. So that explains why
  1139.  
  1140. ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-1.TXT
  1141.  
  1142. list no code points in the C0 and C1 range.
  1143.  
  1144.  
  1145.  
  1146. Then I am just wondering why
  1147.  
  1148. ftp://dkuug.dk/i18n/charmaps/CP819 (alias Latin1 alias ISO_8859-1:1987) lists
  1149.  
  1150. <PA>                   /x80   <U0080> PADDING CHARACTER (PAD)
  1151. <HO>                   /x81   <U0081> HIGH OCTET PRESET (HOP)
  1152.  
  1153. <GC>                   /x99   <U0099> SINGLE GRAPHIC CHARACTER
  1154. INTRODUCER (SGCI)
  1155.  
  1156. and ftp://dkuug.dk/i18n/charmaps.646/ISO_8859-1:1987 
  1157. lists the same code point values for these control characters
  1158.  
  1159. <PA>     /d128
  1160. <HO>     /d129
  1161.  
  1162. <GC>     /d153
  1163.  
  1164. So I just wonder, where they at dkuug.dk/i18n have taken these C0 and C1
  1165. codes from, unfortunately these tables did not contain any references (as
  1166. did most EBCDIC tables).
  1167.  
  1168. Paul
  1169.  
  1170.  2-Oct-98  9:37:48-GMT,1880;000000000001
  1171. Return-Path: <unicode@unicode.org>
  1172. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  1173.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id FAA07143
  1174.     for <fdc@watsun.cc.columbia.edu>; Fri, 2 Oct 1998 05:37:47 -0400 (EDT)
  1175. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  1176.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id CAA14408
  1177.     ; Fri, 2 Oct 1998 02:37:14 -0700
  1178. Received: by unicode.org (NX5.67g/NX3.0S)
  1179.     id AA26800; Fri, 2 Oct 98 01:54:04 -0700
  1180. Message-Id: <9810020854.AA26800@unicode.org>
  1181. Errors-To: uni-bounce@unicode.org
  1182. Mime-Version: 1.0
  1183. Content-Type: text/plain; charset="iso-8859-1"
  1184. X-Uml-Sequence: 6061 (1998-10-02 08:51:08 GMT)
  1185. From: Michael Everson <everson@indigo.ie>
  1186. Reply-To: unicode@unicode.org
  1187. To: Unicode List <unicode@unicode.org>
  1188. Date: Fri, 2 Oct 1998 01:51:01 -0700 (PDT)
  1189. Subject: Re: Terminal Graphics Proposal
  1190. Content-Transfer-Encoding: 8bit
  1191. X-MIME-Autoconverted: from quoted-printable to 8bit by watsun.cc.columbia.edu id FAA07143
  1192.  
  1193. Ar 17:16 -0700 1998-10-01, scrφobh Markus Kuhn:
  1194. >Paul Keinanen wrote on 1998-10-01 17:03 UTC:
  1195. >> In ISO 8859-1 these are listed as
  1196. >>
  1197. >> 80  PADDING CHARACTER (PAD)
  1198. >> 81  HIGH OCTET PRESET (HOP)
  1199. >>
  1200. >> 99  SINGLE GRAPHIC CHARACTER INTRODUCER (SGCI)
  1201. >
  1202. >Are you sure about the source? Last time I looked into
  1203. >ISO/IEC 8859-1:1986(E), it was certainly free of any control
  1204. >characters. ISO 8859 defines only graphical characters.
  1205. >What exactly is your source on this?
  1206.  
  1207. I am not following the Terminal Graphics Proposal thread in great detail
  1208. because I think Elvish more relevant to my work :-) but I would like to say
  1209. that I hope lots of hardcopy examples will be forwarded to WG2 so that we
  1210. who are not so expert in the field can evaluate it appropriately.
  1211.  
  1212. Cf. the Western Musical Symbols or Syriac proposals.
  1213.  
  1214. Michael Everson
  1215.  
  1216. PS. Yes, I would make TTFs for them if necessary.
  1217.  
  1218.  
  1219.  2-Oct-98 11:58:41-GMT,1798;000000000001
  1220. Return-Path: <unicode@unicode.org>
  1221. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  1222.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id HAA15340
  1223.     for <fdc@watsun.cc.columbia.edu>; Fri, 2 Oct 1998 07:58:41 -0400 (EDT)
  1224. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  1225.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id EAA13470
  1226.     ; Fri, 2 Oct 1998 04:53:01 -0700
  1227. Received: by unicode.org (NX5.67g/NX3.0S)
  1228.     id AA29143; Fri, 2 Oct 98 04:44:36 -0700
  1229. Message-Id: <9810021144.AA29143@unicode.org>
  1230. Errors-To: uni-bounce@unicode.org
  1231. Mime-Version: 1.0
  1232. Content-Type: text/plain; charset=us-ascii
  1233. X-Uml-Sequence: 6067 (1998-10-02 11:44:14 GMT)
  1234. From: Kevin Bracey <kbracey@acorn.com>
  1235. Reply-To: unicode@unicode.org
  1236. To: Unicode List <unicode@unicode.org>
  1237. Date: Fri, 2 Oct 1998 04:44:12 -0700 (PDT)
  1238. Subject: Re: Terminal Graphics Proposal 
  1239.  
  1240. In message <9810020026.AA24186@unicode.org>
  1241.           Markus Kuhn <Markus.Kuhn@cl.cam.ac.uk> wrote:
  1242.  
  1243. > Unicode is a character set, not a font. Keeping things readable is the
  1244. > duty of the font designer. Of course most good fonts will have the Control
  1245. > Pictures with diagonal letters. The ISO 10646-1 standard shows them
  1246. > all nicely diagonally. It is a good idea for font designers to have
  1247. > BOTH the Unicode 2.0 and the ISO 10646 standard on their desk, to see a few
  1248. > glyph variations as the two standards were printed using different fonts.
  1249.  
  1250. I heartily concur with this. IMHO, most of ISO 10646-1's glyphs are a lot
  1251. better than the Unicode Standard's.
  1252.  
  1253. -- 
  1254. Kevin Bracey, Senior Software Engineer
  1255. Acorn Computers Ltd                           Tel: +44 (0) 1223 725228
  1256. Acorn House, 645 Newmarket Road               Fax: +44 (0) 1223 725328
  1257. Cambridge, CB5 8PB, United Kingdom            WWW: http://www.acorn.co.uk/
  1258.  
  1259.  2-Oct-98 15:07:41-GMT,2466;000000000001
  1260. Return-Path: <keka@im.se>
  1261. Received: from www.im.se (fw.im.se [193.14.22.222])
  1262.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id LAA25411
  1263.     for <fdc@watsun.cc.columbia.edu>; Fri, 2 Oct 1998 11:07:37 -0400 (EDT)
  1264. Received: from imhps.im.se (imhps.im.se [192.36.35.5])
  1265.     by www.im.se (8.8.7/8.8.7) with ESMTP id QAA28984;
  1266.     Fri, 2 Oct 1998 16:48:31 +0200 (METDST)
  1267. Received: from msxsth1.im.se by imhps.im.se (1.37.109.16/IM-3.12)
  1268.     id AA088490748; Fri, 2 Oct 1998 17:05:48 +0200
  1269. Received: by msxsth1 with Internet Mail Service (5.5.2232.9)
  1270.     id <TX2WHJ04>; Fri, 2 Oct 1998 17:03:39 +0200
  1271. Message-Id: <C110A2268F8DD111AA1A00805F85E58D57DC2F@ntgbg1>
  1272. From: Karlsson Kent - keka <keka@im.se>
  1273. To: "'Paul Keinanen'" <keinanen@sci.fi>, "'Rick McGowan'" <rmcgowan@apple.com>,
  1274.         "'Frank da Cruz'" <fdc@watsun.cc.columbia.edu>,
  1275.         "'Markus Kuhn'"
  1276.      <Markus.Kuhn@cl.cam.ac.uk>,
  1277.         "'Ken Whistler'" <kenw@sybase.com>
  1278. Cc: "'Asmus Freytag'" <asmusf@ix.netcom.com>,
  1279.         "'Kevin Bracey'"
  1280.      <kbracey@acorn.com>,
  1281.         "'John Cowan'" <cowan@locke.ccil.org>
  1282. Subject: RE: Terminal Graphics Proposal 
  1283. Date: Fri, 2 Oct 1998 17:03:15 +0200 
  1284. Mime-Version: 1.0
  1285. X-Mailer: Internet Mail Service (5.5.2232.9)
  1286. Content-Type: text/plain;
  1287.     charset="iso-8859-1"
  1288.  
  1289.  
  1290.  
  1291. I'm ***not*** REALLY interested in the control code display-instead-of-do
  1292. characters, since I find them to be a thing of the past* (no flames, please,
  1293. I alredy know that some of you disagree).  And I know TUS says one can use
  1294. ANY (in some way appropriate) glyps for them.
  1295.  
  1296. It still disturbs me that thay have no compatibility decompositions.
  1297. (Compare the <square> decompositons for some characters.)  The glyphs for
  1298. these (nonce, imho) symbol characters are still fairly fixed to actually be
  1299. a short (2-3) sequence of letters/digits.  I think it would be reasonable to
  1300. have compatibility decompositions for these characters too.  This would
  1301. affect collation also: they would be sorted according to the constituent
  1302. letters (which is what I, at least, would expect).
  1303.  
  1304. I probably should not say this, but...  If you are abolutely hardbent on
  1305. having symbols for control codes, there should be some for the Unicode
  1306. control codes too (like paragraph separator, left-to-right-mark, etc.)  They
  1307. need not be constructed from letters...
  1308.  
  1309.         R.
  1310.         /kent k
  1311.  
  1312. *(though the newly suggested hexadecimal-digit-pair display ones might
  1313. continue to be useful; though hexadecimal digit quadruples would fill an
  1314. entier plane and more! ;-)
  1315.  
  1316.  2-Oct-98 16:42:26-GMT,2281;000000000001
  1317. Return-Path: <fdc>
  1318. Received: (from fdc@localhost)
  1319.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id MAA23664;
  1320.     Fri, 2 Oct 1998 12:41:04 -0400 (EDT)
  1321. Date: Fri, 2 Oct 1998 12:41:04 -0400 (EDT)
  1322. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  1323. Message-Id: <199810021641.MAA23664@watsun.cc.columbia.edu>
  1324. To: unicode@unicode.org
  1325. Subject: Re: Terminal Graphics Proposal
  1326. In-Reply-To: Your message of Fri, 2 Oct 1998 01:51:01 -0700 (PDT)
  1327.  
  1328. Ar Fri, 2 Oct 1998 01:51:01 -0700 (PDT) scrφobh Michael Everson:
  1329. > ... I hope lots of hardcopy examples will be forwarded to WG2 so that we
  1330. > who are not so expert in the field can evaluate it appropriately.
  1331. >
  1332. I'll be happy to provide copies of the character set table from all the
  1333. relevant manuals.  How do I forward them to WG2?
  1334.  
  1335. > PS. Yes, I would make TTFs for them if necessary.
  1336. What's a TTF?  You mean Web-viewable glyph tables like on your website?
  1337.  
  1338. Thanks!
  1339.  
  1340. - Frank
  1341.  
  1342. P.S. By the way, I realize some people find this focus on arcane,
  1343. "obsolete", ""legacy"" technology amusing, but it might have certain
  1344. unanticipated benefits.  For historic or scholarly purposes, the UTC has an
  1345. interest in encoding scripts that are no longer in active use; one might
  1346. view these glyphs in the same way.  I am always amazed by the vigor with
  1347. which the history of computing is discarded and wiped out on a continuing
  1348. basis.  Computing is quite likely to dominate human life from now on; some
  1349. day everyone will look around and wonder how it all happened, and nobody
  1350. will know.  At least now (I hope) we'll be able to publish works --
  1351. electronic or otherwise -- in a Unicode font, illustrating how people used
  1352. computers in ancient times (the 1970s and 80s), for the continued
  1353. amusement of generations to come.
  1354.  
  1355. P.P.S. Those interested in preserving the signs and symbols of bygone eras
  1356. of computing might also want to take a look at Fred Hoyle's book, The Black
  1357. Cloud, circa 1954, which I read a long time ago but don't have any more.  As
  1358. I recall, it included fragments of computer programs written in the strange
  1359. punch-card symbols of the time -- lozenges, etc -- which I dimly recall from
  1360. my youthful experiences with IBM EAM equipment.  Does anyone have a copy
  1361. handy?  I wonder if it can be printed in Unicode; perhaps here is fodder for
  1362. another fun proposal...
  1363.  
  1364.  2-Oct-98 17:29:14-GMT,2329;000000000001
  1365. Return-Path: <kenw@sybase.com>
  1366. Received: from inergen.sybase.com (inergen.sybase.com [192.138.151.43])
  1367.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id NAA07088
  1368.     for <fdc@watsun.cc.columbia.edu>; Fri, 2 Oct 1998 13:29:12 -0400 (EDT)
  1369. Received: from smtp1.sybase.com (sybgate.sybase.com [130.214.220.35])
  1370.           by inergen.sybase.com (8.8.4/8.8.4) with SMTP
  1371.       id KAA10504; Fri, 2 Oct 1998 10:26:44 -0700 (PDT)
  1372. Received: from birdie.sybase.com by smtp1.sybase.com (4.1/SMI-4.1/SybH3.5-030896)
  1373.     id AA25742; Fri, 2 Oct 98 10:25:29 PDT
  1374. Received: by birdie.sybase.com (5.x/SMI-SVR4/SybEC3.5)
  1375.     id AA16847; Fri, 2 Oct 1998 10:25:23 -0700
  1376. Date: Fri, 2 Oct 1998 10:25:23 -0700
  1377. From: kenw@sybase.com (Kenneth Whistler)
  1378. Message-Id: <9810021725.AA16847@birdie.sybase.com>
  1379. To: keka@im.se
  1380. Subject: RE: Terminal Graphics Proposal
  1381. Cc: keinanen@sci.fi, rmcgowan@apple.com, fdc@watsun.cc.columbia.edu,
  1382.         Markus.Kuhn@cl.cam.ac.uk, kenw@sybase.com, asmusf@ix.netcom.com,
  1383.         kbracey@acorn.com, cowan@locke.ccil.org
  1384. X-Sun-Charset: US-ASCII
  1385.  
  1386. Kent said:
  1387.  
  1388. > I'm ***not*** REALLY interested in the control code display-instead-of-do
  1389. > characters, since I find them to be a thing of the past* (no flames, please,
  1390. > I alredy know that some of you disagree).  And I know TUS says one can use
  1391. > ANY (in some way appropriate) glyps for them.
  1392. > It still disturbs me that thay have no compatibility decompositions.
  1393. > (Compare the <square> decompositons for some characters.)  
  1394.  
  1395. I disagree completely on this. Proposing compatibility decompositions
  1396. for glyphs which have arbitrary content (such as these) confuses
  1397. apples and oranges. These 32 glyphs for control codes could contain
  1398. 3-letter acronyms, or 2-letter acronyms, or could be substituted out
  1399. for something completely different, such as the ISO 2047 set. Compatibility
  1400. decompositions in that context would be completely misleading.
  1401.  
  1402. > The glyphs for
  1403. > these (nonce, imho) symbol characters are still fairly fixed to actually be
  1404. > a short (2-3) sequence of letters/digits.  I think it would be reasonable to
  1405. > have compatibility decompositions for these characters too.  This would
  1406. > affect collation also: they would be sorted according to the constituent
  1407. > letters (which is what I, at least, would expect).
  1408.  
  1409. Again, I disagree. These should *not* sort as "NUL", "SOH", etc.
  1410.  
  1411. --Ken
  1412.  
  1413.  2-Oct-98 19:42:24-GMT,854;000000000001
  1414. Return-Path: <jon@kanji.com>
  1415. Received: from lotus.kanji.com (lotus.kanji.com [206.230.42.4])
  1416.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id PAA20222
  1417.     for <fdc@watsun.cc.columbia.edu>; Fri, 2 Oct 1998 15:42:17 -0400 (EDT)
  1418. Received: by kanji.com
  1419.     via sendmail from stdin
  1420.     id <m0zPAuc-002Aq4C@lotus.kanji.com> (Debian Smail3.2.0.101)
  1421.     for fdc@watsun.cc.columbia.edu; Fri, 2 Oct 1998 13:30:46 -0600 (MDT) 
  1422. Message-Id: <m0zPAuc-002Aq4C@lotus.kanji.com>
  1423. Date: Fri, 2 Oct 1998 13:30:46 -0600 (MDT)
  1424. From: Jon Babcock <jon@kanji.com>
  1425. To: fdc@watsun.cc.columbia.edu
  1426. Subject: The Black Hole
  1427.  
  1428.  
  1429. _The Black Hole_ by Fred Hoyle(ISBN: 0899683444) is available on
  1430. www.amazon.com for $26.96 plus shipping.
  1431.  
  1432. Just noticed your note in a unicode ML msg and thought you might be
  1433. interested. (I've no connection with Amazon, btw.)
  1434.  
  1435. Jon
  1436.  
  1437. --
  1438. Jon Babcock <jon@kanji.com>
  1439.  
  1440.  2-Oct-98 20:25:29-GMT,1979;000000000011
  1441. Return-Path: <unicode@unicode.org>
  1442. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  1443.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id QAA02116
  1444.     for <fdc@watsun.cc.columbia.edu>; Fri, 2 Oct 1998 16:25:25 -0400 (EDT)
  1445. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  1446.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id MAA08278
  1447.     ; Fri, 2 Oct 1998 12:15:57 -0700
  1448. Received: by unicode.org (NX5.67g/NX3.0S)
  1449.     id AA02257; Fri, 2 Oct 98 11:15:01 -0700
  1450. Message-Id: <9810021815.AA02257@unicode.org>
  1451. Errors-To: uni-bounce@unicode.org
  1452. Mime-Version: 1.0
  1453. Content-Type: text/plain; charset="iso-8859-1"
  1454. X-Uml-Sequence: 6079 (1998-10-02 18:13:04 GMT)
  1455. From: Michael Everson <everson@indigo.ie>
  1456. Reply-To: unicode@unicode.org
  1457. To: Unicode List <unicode@unicode.org>
  1458. Date: Fri, 2 Oct 1998 11:13:03 -0700 (PDT)
  1459. Subject: Re: Terminal Graphics Proposal
  1460. Content-Transfer-Encoding: 8bit
  1461. X-MIME-Autoconverted: from quoted-printable to 8bit by watsun.cc.columbia.edu id QAA02116
  1462.  
  1463. Ar 09:54 -0700 1998-10-02, scrφobh Frank da Cruz:
  1464.  
  1465. >What's a TTF?  You mean Web-viewable glyph tables like on your website?
  1466.  
  1467. A True Type Font.
  1468. >- Frank
  1469. >
  1470. >P.S. By the way, I realize some people find this focus on arcane,
  1471. >"obsolete", ""legacy"" technology amusing, but it might have certain
  1472. >unanticipated benefits.  For historic or scholarly purposes, the UTC has an
  1473. >interest in encoding scripts that are no longer in active use; one might
  1474. >view these glyphs in the same way.  I am always amazed by the vigor with
  1475. >which the history of computing is discarded and wiped out on a continuing
  1476. >basis.
  1477.  
  1478. I for my part do NOT!!!! want to see these terminal graphic things in the
  1479. BMP. They belong in Plane 1.
  1480.  
  1481. --
  1482. Michael Everson, Everson Gunn Teoranta ** http://www.indigo.ie/egt
  1483. 15 Port Chaeimhghein ═ochtarach; Baile ┴tha Cliath 2; ╔ire/Ireland
  1484. Guthßn: +353 1 478-2597 ** Facsa: +353 1 478-2597 (by arrangement)
  1485. 27 Pßirc an FhΘithlinn;  Baile an Bh≤thair;  Co. ┴tha Cliath; ╔ire
  1486.  
  1487.  
  1488.  2-Oct-98 22:55:26-GMT,1768;000000000001
  1489. Return-Path: <unicode@unicode.org>
  1490. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  1491.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id SAA02054
  1492.     for <fdc@watsun.cc.columbia.edu>; Fri, 2 Oct 1998 18:55:24 -0400 (EDT)
  1493. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  1494.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id PAA19284
  1495.     ; Fri, 2 Oct 1998 15:48:52 -0700
  1496. Received: by unicode.org (NX5.67g/NX3.0S)
  1497.     id AA04658; Fri, 2 Oct 98 14:30:05 -0700
  1498. Message-Id: <9810022130.AA04658@unicode.org>
  1499. Errors-To: uni-bounce@unicode.org
  1500. X-Uml-Sequence: 6084 (1998-10-02 21:24:10 GMT)
  1501. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  1502. Reply-To: unicode@unicode.org
  1503. To: Unicode List <unicode@unicode.org>
  1504. Date: Fri, 2 Oct 1998 14:24:06 -0700 (PDT)
  1505. Subject: Re: Terminal Graphics Proposal
  1506.  
  1507. > I for my part do NOT!!!! want to see these terminal graphic things in the
  1508. > BMP. They belong in Plane 1.
  1509. Perhaps, but as the lawyers say, the door was opened by the characters
  1510. already included in blocks at U+2400, U+2500, U+2600, and U+2700.  In any
  1511. case, the intention here is to help Unicode become somewhat more
  1512. "technology-neutral".  Terminal emulation is a fact of life, and important
  1513. to a significant number of serious and productive computer users; why should
  1514. its special glyphs be excluded from the same status enjoyed by dingbats and
  1515. astrological signs?  Seriously, I think terminal emulation is far more
  1516. mainstream than many Unicoders seem to think, and I hope it is a worthy goal
  1517. to welcome this consituency into the fold, thus allowing them to continue
  1518. their work in their accustomed manner, rather than according to the dictates
  1519. of haute couture, with the added bonus of uniform access to the world's
  1520. writing systems.
  1521.  
  1522. - Frank
  1523.  
  1524.  2-Oct-98 23:32:19-GMT,4256;000000000001
  1525. Return-Path: <tzha0@amdahl.com>
  1526. Received: from orpheus.amdahl.com (orpheus.amdahl.com [159.199.101.3])
  1527.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with SMTP id TAA05771
  1528.     for <fdc@watsun.cc.columbia.edu>; Fri, 2 Oct 1998 19:32:18 -0400 (EDT)
  1529. Received: from minerva.amdahl.com([129.212.33.25]) (3880 bytes) by orpheus.amdahl.com
  1530.     via sendmail with P:smtp/R:match-mx-hosts/T:smtp
  1531.     (sender: <tzha0@amdahl.com>) 
  1532.     id <m0zPEd8-0004qxC@orpheus.amdahl.com>
  1533.     for <fdc@watsun.cc.columbia.edu>; Fri, 2 Oct 1998 16:28:58 -0700 (PDT)
  1534.     (Smail-3.2.0.102 1998-Aug-2 #1 built 1998-Aug-14)
  1535. Received: from libra by minerva.amdahl.com with smtp
  1536.     (Smail3.1.29.1 #5) id m0zPEc1-0001AFC; Fri, 2 Oct 98 16:27 PDT
  1537. Message-Id: <m0zPEc1-0001AFC@minerva.amdahl.com>
  1538. From: "Tony Harminc" <tzha0@amdahl.com>
  1539. To: Frank da Cruz <fdc@watsun.cc.columbia.edu>, unicode@unicode.org
  1540. Date: Fri, 2 Oct 1998 19:29:05 -0400
  1541. MIME-Version: 1.0
  1542. Content-type: text/plain; charset=US-ASCII
  1543. Content-transfer-encoding: 7BIT
  1544. Subject: Re: Terminal Graphics Proposal
  1545. Priority: normal
  1546. In-reply-to: <9810010137.AA14105@unicode.org>
  1547. X-mailer: Pegasus Mail for Win32 (v3.01a)
  1548.  
  1549. On 30 Sep 98, at 18:35, Frank da Cruz  wrote:
  1550.  
  1551. > 8. MISCELLANEOUS SINGLE-CELL GLYPHS
  1552. > Table 8.1: Miscellaneous Single-Cell Terminal Glyphs
  1553. >   Code  Description                   Reference
  1554. >   E0F0  Reverse Question Mark         DEC VTxxx, Wyse, Televideo (1)
  1555. >   E0F1  Box with X inside             DG Math 06/07, GCGID SP500000
  1556. >   E0F2  Human stick figure with hat   SNI Facet 04/14
  1557. >   E0F3  Clock (with hands at 3:00)    SNI Klammern 05/01
  1558. >   E0F4  Overscore asterisk            IBM 3270
  1559. >   E0F5  Overscore semicolon           IBM 3270
  1560. >   E0F6  Padlock (keyboard locked)     IBM 3270 
  1561.  
  1562. This last one introduces a bit of a problem, I think.  It differs 
  1563. from all other characters mentioned in that it is never displayed in 
  1564. the data portion of a 3270 screen, but rather occurs "below the line" 
  1565. as an indication of keyboard status.  If it is to be included, then 
  1566. there are several more uniquely 3270 characters that can be seen 
  1567. below the line; I don't know formal names for them, and indeed they 
  1568. generally don't appear in IBM's CDRA documents.  Roughly, they are:
  1569.  
  1570. Outline up arrow   (indication of upshifted condition)
  1571. Outline down arrow (indication of downshifted (override) condition)
  1572. Key                (indication of terminal physically locked (I think
  1573.                     this may be what is meant by E0F6 above)
  1574. Stick figure       (terminal is connected to "operator" (really to a 
  1575.                     supervisory program))
  1576. Solid block        (terminal is connected to "application program")
  1577. 4 in square box    (terminal is connected to 3274-type control unit)
  1578. 6 in square box    (terminal is connected to 3276-type control unit)
  1579. Lightning bolt     (communication failure)
  1580. Rectangle with slash (machine check)
  1581. Printer symbol with slash (associated printer has an error condition)
  1582.  
  1583. and most problematic:
  1584.  
  1585. Left half of clock (these two form a doublewidth clock (set at 6:10   
  1586. Right half of clock or 2:30, though I'm sure the time would be        
  1587.                     considered a matter of glyph - indeed at least    
  1588.                     one non-IBM manufacturer's clock symbol was 5:50  
  1589.                     or 10:30)
  1590.  
  1591. Now it's entirely reasonable to argue that all the above (and I may 
  1592. have forgotten a couple) have no business being encoded at all.  
  1593. Indeed some terminal emulators use graphical means to produce the 
  1594. symbols.  In any case there is nothing in the 3270 architecture that 
  1595. specifies use of any of them, and an emulator program can use other 
  1596. means to communicate the same information to the user.  However a 
  1597. number of Windows-based emulators I know do use glyphs encoded in a 
  1598. font that they supply to produce at least a subset of the symbols.  
  1599. (It should be pointed out that a number of "ordinary" glyphs can also 
  1600. appear below the line, but I can think of no reason not to unify them 
  1601. with the upper case letters, numbers, and so on.)
  1602.  
  1603. That IBM doesn't include them in CDRA may be a good reason to exclude 
  1604. them from this proposal.  But they can be genuinely useful for 
  1605. writers of emulators.  What to do ?  And how many clocks and stick 
  1606. figures is it reasonable to encode ?
  1607.  
  1608. Tony Harminc
  1609.  
  1610.  3-Oct-98  9:44:33-GMT,2720;000000000001
  1611. Return-Path: <unicode@unicode.org>
  1612. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  1613.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id FAA27978
  1614.     for <fdc@watsun.cc.columbia.edu>; Sat, 3 Oct 1998 05:44:32 -0400 (EDT)
  1615. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  1616.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id CAA46594
  1617.     ; Sat, 3 Oct 1998 02:44:30 -0700
  1618. Received: by unicode.org (NX5.67g/NX3.0S)
  1619.     id AA07667; Sat, 3 Oct 98 02:33:15 -0700
  1620. Message-Id: <9810030933.AA07667@unicode.org>
  1621. Errors-To: uni-bounce@unicode.org
  1622. Mime-Version: 1.0
  1623. Content-Type: text/plain; charset="iso-8859-1"
  1624. X-Uml-Sequence: 6089 (1998-10-03 09:32:58 GMT)
  1625. From: Michael Everson <everson@indigo.ie>
  1626. Reply-To: unicode@unicode.org
  1627. To: Unicode List <unicode@unicode.org>
  1628. Date: Sat, 3 Oct 1998 02:32:57 -0700 (PDT)
  1629. Subject: Re: Terminal Graphics Proposal
  1630. Content-Transfer-Encoding: 8bit
  1631. X-MIME-Autoconverted: from quoted-printable to 8bit by watsun.cc.columbia.edu id FAA27978
  1632.  
  1633. Ar 14:24 -0700 1998-10-02, scrφobh Frank da Cruz:
  1634. >> I for my part do NOT!!!! want to see these terminal graphic things in the
  1635. >> BMP. They belong in Plane 1.
  1636. >>
  1637. >Perhaps, but as the lawyers say, the door was opened by the characters
  1638. >already included in blocks at U+2400, U+2500, U+2600, and U+2700.
  1639.  
  1640. I will not support their inclusion in the BMP unless there is a really good
  1641. reason. (I'd still make TTFs if necessary though, because I am a loon.) The
  1642. list of characters I saw was rather long.
  1643.  
  1644. >In any
  1645. >case, the intention here is to help Unicode become somewhat more
  1646. >"technology-neutral".
  1647.  
  1648. The UCS is going to be used for centuries. Do we really think VT100
  1649. emulation will be needed via BMP support?
  1650.  
  1651. >Terminal emulation is a fact of life, and important
  1652. >to a significant number of serious and productive computer users; why should
  1653. >its special glyphs be excluded from the same status enjoyed by dingbats and
  1654. >astrological signs?
  1655.  
  1656. Because the dingbats are used in typography, and astrological signs have a
  1657. definite semantic.
  1658.  
  1659. >Seriously, I think terminal emulation is far more
  1660. >mainstream than many Unicoders seem to think, and I hope it is a worthy goal
  1661. >to welcome this consituency into the fold, thus allowing them to continue
  1662. >their work in their accustomed manner, rather than according to the dictates
  1663. >of haute couture, with the added bonus of uniform access to the world's
  1664. >writing systems.
  1665.  
  1666. I don't see the argument for BMP here.
  1667.  
  1668. --
  1669. Michael Everson, Everson Gunn Teoranta ** http://www.indigo.ie/egt
  1670. 15 Port Chaeimhghein ═ochtarach; Baile ┴tha Cliath 2; ╔ire/Ireland
  1671. Guthßn: +353 1 478-2597 ** Facsa: +353 1 478-2597 (by arrangement)
  1672. 27 Pßirc an FhΘithlinn;  Baile an Bh≤thair;  Co. ┴tha Cliath; ╔ire
  1673.  
  1674.  
  1675.  3-Oct-98 21:07:30-GMT,1792;000000000001
  1676. Return-Path: <unicode@unicode.org>
  1677. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  1678.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id RAA02053
  1679.     for <fdc@watsun.cc.columbia.edu>; Sat, 3 Oct 1998 17:07:29 -0400 (EDT)
  1680. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  1681.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id OAA55830
  1682.     ; Sat, 3 Oct 1998 14:02:52 -0700
  1683. Received: by unicode.org (NX5.67g/NX3.0S)
  1684.     id AA09212; Sat, 3 Oct 98 13:52:08 -0700
  1685. Message-Id: <9810032052.AA09212@unicode.org>
  1686. Errors-To: uni-bounce@unicode.org
  1687. Mime-Version: 1.0
  1688. Content-Type: text/plain; charset="us-ascii"
  1689. X-Uml-Sequence: 6091 (1998-10-03 20:51:56 GMT)
  1690. From: Elliotte Rusty Harold <elharo@sunsite.unc.edu>
  1691. Reply-To: unicode@unicode.org
  1692. To: Unicode List <unicode@unicode.org>
  1693. Date: Sat, 3 Oct 1998 13:51:54 -0700 (PDT)
  1694. Subject: Re: Terminal Graphics Proposal
  1695.  
  1696.  
  1697. >  E0B4  Latin capital letter H with bar       SNI Math 04/05 (2)
  1698. >  E0B5  Latin small letter h with bar         SNI Math 04/06 (2)
  1699.  
  1700. Is E0B5 supposed to be Planck's constant over 2*PI?  If so, it's encoded at
  1701. 210F, 0127, and 045B.  And your E0B4 is at 0126.
  1702.  
  1703.  
  1704.  
  1705. +-----------------------+------------------------+-------------------+
  1706. | Elliotte Rusty Harold | elharo@sunsite.unc.edu | Writer/Programmer |
  1707. +-----------------------+------------------------+-------------------+
  1708. |        XML: Extensible Markup Language (IDG Books 1998)            |
  1709. |   http://www.amazon.com/exec/obidos/ISBN=0764531999/cafeaulaitA/   |
  1710. +----------------------------------+---------------------------------+
  1711. |  Read Cafe au Lait for Java News:  http://sunsite.unc.edu/javafaq/ |
  1712. |  Read Cafe con Leche for XML News: http://sunsite.unc.edu/xml/     |
  1713. +----------------------------------+---------------------------------+
  1714.  
  1715.  
  1716.  4-Oct-98 21:50:26-GMT,3358;000000000001
  1717. Return-Path: <keka@im.se>
  1718. Received: from www.im.se (fw.im.se [193.14.22.222])
  1719.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id RAA11663
  1720.     for <fdc@watsun.cc.columbia.edu>; Sun, 4 Oct 1998 17:50:19 -0400 (EDT)
  1721. Received: from imhps.im.se (imhps.im.se [192.36.35.5])
  1722.     by www.im.se (8.8.7/8.8.7) with ESMTP id XAA24796;
  1723.     Sun, 4 Oct 1998 23:33:11 +0200 (METDST)
  1724. Received: from msxsth1.im.se by imhps.im.se (1.37.109.16/IM-3.12)
  1725.     id AA239507835; Sun, 4 Oct 1998 23:50:35 +0200
  1726. Received: by msxsth1 with Internet Mail Service (5.5.2232.9)
  1727.     id <TX2WHN8C>; Sun, 4 Oct 1998 23:48:37 +0200
  1728. Message-Id: <C110A2268F8DD111AA1A00805F85E58D57DC34@ntgbg1>
  1729. From: Karlsson Kent - keka <keka@im.se>
  1730. To: "'kenw@sybase.com'" <kenw@sybase.com>
  1731. Cc: keinanen@sci.fi, rmcgowan@apple.com, fdc@watsun.cc.columbia.edu,
  1732.         Markus.Kuhn@cl.cam.ac.uk, asmusf@ix.netcom.com, kbracey@acorn.com,
  1733.         cowan@locke.ccil.org
  1734. Subject: RE: Terminal Graphics Proposal
  1735. Date: Sun, 4 Oct 1998 23:47:53 +0200 
  1736. Mime-Version: 1.0
  1737. X-Mailer: Internet Mail Service (5.5.2232.9)
  1738. Content-Type: text/plain
  1739.  
  1740.  
  1741.  
  1742. > ----------
  1743. > From:     kenw@sybase.com
  1744. > Sent:     fredag 2 oktober 1998 19:25
  1745. > To:     keka@im.se
  1746. > Cc:     keinanen@sci.fi; rmcgowan@apple.com; fdc@watsun.cc.columbia.edu;
  1747. > Markus.Kuhn@cl.cam.ac.uk; kenw@sybase.com; asmusf@ix.netcom.com;
  1748. > kbracey@acorn.com; cowan@locke.ccil.org
  1749. > Subject:     RE: Terminal Graphics Proposal
  1750. > Kent said:
  1751. > > I'm ***not*** REALLY interested in the control code
  1752. > display-instead-of-do
  1753. > > characters, since I find them to be a thing of the past* (no flames,
  1754. > please,
  1755. > > I alredy know that some of you disagree).  And I know TUS says one can
  1756. > use
  1757. > > ANY (in some way appropriate) glyps for them.
  1758. > > 
  1759. > > It still disturbs me that thay have no compatibility decompositions.
  1760. > > (Compare the <square> decompositons for some characters.)  
  1761. > I disagree completely on this. Proposing compatibility decompositions
  1762. > for glyphs which have arbitrary content (such as these) confuses
  1763. > apples and oranges. These 32 glyphs for control codes could contain
  1764. > 3-letter acronyms, or 2-letter acronyms, or could be substituted out
  1765. > for something completely different, such as the ISO 2047 set.
  1766. > Compatibility
  1767. > decompositions in that context would be completely misleading.
  1768. > > The glyphs for
  1769. > > these (nonce, imho) symbol characters are still fairly fixed to actually
  1770. > be
  1771. > > a short (2-3) sequence of letters/digits.  I think it would be
  1772. > reasonable to
  1773. > > have compatibility decompositions for these characters too.  This would
  1774. > > affect collation also: they would be sorted according to the constituent
  1775. > > letters (which is what I, at least, would expect).
  1776. > Again, I disagree. These should *not* sort as "NUL", "SOH", etc.
  1777. > --Ken
  1778. When looking in an index for a terminal emulator say, which is somethign I
  1779. actually do sometimes (still), both I and I expect the average reader would
  1780. expect to find NL under N, FF under F and so on, rather than quite
  1781. unexpectedly before A.
  1782.  
  1783.     In practice the "content" (glyphs) for these characters do not
  1784. appear to be arbitrary.  They appear to be rather fixed, and not much
  1785. intended for future arbitrary glyph invention.  The only variation I have
  1786. seen, correct me if I am wrong, is between two and three letter acronyms,
  1787. for which a differing code positions  would be tolarable.
  1788.  
  1789.             Kind regards
  1790.             /kent k
  1791.  
  1792.  5-Oct-98 16:34:10-GMT,6749;000000000001
  1793. Return-Path: <fdc>
  1794. Received: (from fdc@localhost)
  1795.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id MAA25339;
  1796.     Mon, 5 Oct 1998 12:32:44 -0400 (EDT)
  1797. Date: Mon, 5 Oct 98 12:32:43 EDT
  1798. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  1799. To: unicode@unicode.org
  1800. Subject: Re: Terminal Graphics Proposal
  1801. In-Reply-To: Your message of Sat, 3 Oct 1998 02:32:57 -0700 (PDT)
  1802. Message-ID: <CMM.0.90.4.907605163.fdc@watsun.cc.columbia.edu>
  1803.  
  1804. > Ar 14:24 -0700 1998-10-02, scrmobh Frank da Cruz:
  1805. > >> I for my part do NOT!!!! want to see these terminal graphic things in the
  1806. > >> BMP. They belong in Plane 1.
  1807. > >>
  1808. > >Perhaps, but as the lawyers say, the door was opened by the characters
  1809. > >already included in blocks at U+2400, U+2500, U+2600, and U+2700.
  1810. > I will not support their inclusion in the BMP unless there is a really good
  1811. > reason. (I'd still make TTFs if necessary though, because I am a loon.) The
  1812. > list of characters I saw was rather long.
  1813. Hurray for Loons!
  1814.  
  1815. > >Terminal emulation is a fact of life, and important
  1816. > >to a significant number of serious and productive computer users; why should
  1817. > >its special glyphs be excluded from the same status enjoyed by dingbats and
  1818. > >astrological signs?
  1819. >
  1820. > Because the dingbats are used in typography, and astrological signs have a
  1821. > definite semantic.
  1822. >
  1823. But what about the block at U+2500?  It was included to allow for
  1824. character-cell graphics that are possible on the PC -- and the so-called ANSI
  1825. emulations that based on it -- but they exclude other types of terminals that
  1826. are just as important ("existing standards").  The blocks at U+2580 and
  1827. U+25A0 are also clearly intended for character-cell graphic applications, but
  1828. they are incomplete.  This proposal aims to fill some holes in existing
  1829. categories.
  1830.  
  1831. The argument for including the missing characters (not necessarily all of
  1832. them), stated as clearly as I can, is:
  1833.  
  1834.  1. There are numerous terminal emulation products on the market, with a user
  1835.     base numbering in the millions.
  1836.  
  1837.  2. Increasingly, these products are used on systems -- like Windows NT --
  1838.     that have Unicode fonts.
  1839.  
  1840.  3. Many terminal based applications take full advantage of the features and
  1841.     glyph repertoires of the terminals they are designed for.
  1842.  
  1843.  4. The glyph repertoire of many common terminals -- VT100/VT220, Wyse,
  1844.     Siemens Nixdorf, Data General, etc, include glyphs that are not presently
  1845.     in Unicode.
  1846.  
  1847.  5. Customers of terminal emulation products demand complete and accurate
  1848.     emulation.
  1849.  
  1850.  6. In order to succeed, makers of terminal emulation software must create
  1851.     private fonts containing the missing glyphs (which, as an aside,
  1852.     unnecessarily drives up the cost of the product for the end user) in
  1853.     the Private Use area.
  1854.  
  1855.  7. Because of the closed an proprietary nature of this process, each terminal
  1856.     emulation product potentially (and in fact) encodes the same characters
  1857.     at different places.
  1858.  
  1859.  8. Other applications use the Private Use Area for other purposes (and other
  1860.     glyphs).
  1861.  
  1862.  9. The result is that terminal emulation products do not interoperate with
  1863.     each other (who cares), or (the real point) with other applications on the
  1864.     same platform.
  1865.  
  1866. For example, a VT100 or HP forms-based screen can not be pasted into a word
  1867. processing document without changing the forms borders (etc, depending on
  1868. exactly how they are encoded) into whatever other glyphs happen to be defined
  1869. at the same code points in the font used by the other application.  Ditto for
  1870. mathematical formulae displayed on DEC or Siemens Nixdorf screen.  Ditto for
  1871. character-cell illustrations or tables in numerous online texts intended for
  1872. display on any of the widespread terminals.
  1873.  
  1874. > >In any
  1875. > >case, the intention here is to help Unicode become somewhat more
  1876. > >"technology-neutral".
  1877. > The UCS is going to be used for centuries. Do we really think VT100
  1878. > emulation will be needed via BMP support?
  1879. How does one answer a question like this?  Should it be based purely on
  1880. numbers?  For example, if there are currently millions of users of terminal
  1881. emulators (there are), is it right to turn our backs on them while at the
  1882. same time we encode writing systems that are used by only a handful of
  1883. scholars?
  1884.  
  1885. Or, to turn the question on its head, what is wrong with VT100 emulation?
  1886. The fact that the popular trade press would like us all to live in a GUI
  1887. world that we all know is unreliable, mysterious, proprietary, and constantly
  1888. in flux, rather than in a proven, productive, stable, dependable, and
  1889. cost-effective open environment should not be a factor in this discussion,
  1890. any more than it should be in deciding whether to encode Linear B.
  1891.  
  1892. Here in New York City we have thousands of people whose jobs are to sit in
  1893. front of a 3270 (or other) terminal all day and respond to telephone calls.
  1894. These include 911 (police/fire emergency) operators, EMS dispatchers,
  1895. heat-complaint bureau and poison control agents, and car rental and airline
  1896. reservation clerks (to name a few).  These are what we like to call "mission
  1897. critical" applications, and they must be (what we like to call) "rock solid".
  1898. These people use a particular application all day, every day.  They are
  1899. trained on it, they must be able to use it effectively.  At some point, the
  1900. aging terminals will be replaced by PCs, because the terminals wear out and
  1901. almost nobody makes them any more, but the applications themselves will not
  1902. go away, nor should they.
  1903.  
  1904. The new PCs will need to do exactly what the terminals did.  We don't want
  1905. our 911 operators to become needlessly confused when some strange symbol
  1906. shows up on their screen in place of the one they expect.  Taking this a step
  1907. further, the people who write the training, operations, and procedures
  1908. manuals for these systems need to be able to show the terminal screens and
  1909. quote individual glyphs in the text.  This is legitimate, real-world,
  1910. nuts-and-bolts stuff that might not grab headlines in PC Week (but then I
  1911. think that's an excellent indicator its importance :-)
  1912.  
  1913. The original proposal included:
  1914.  
  1915.   Math symbols:            34
  1916.   Line/Box/Block symbols:  31
  1917.   Misc symbols:             7
  1918.   Control pictures:       115
  1919.   Hex bytes:              256
  1920.   TOTAL:                  443
  1921.  
  1922. The single biggest category is hex bytes, which so far seems to have received
  1923. a warm reception.  Thus the greatest controversy seems to swirl around the
  1924. smallest number of characters.
  1925.  
  1926. We begin by unifying the proposed diagonal C0 control pictures with the ones
  1927. already at U+2400:
  1928.  
  1929.   Math symbols:            34
  1930.   Line/Box/Block symbols:  31
  1931.   Misc symbols:             7
  1932.   Control pictures:        81
  1933.   Hex bytes:              256
  1934.   TOTAL:                  409
  1935.  
  1936. If we eliminate the hex bytes, this brings the total down to 153.
  1937.  
  1938. - Frank
  1939.  
  1940.  5-Oct-98 19:07:40-GMT,2001;000000000001
  1941. Return-Path: <asmusf@ix.netcom.com>
  1942. Received: from dfw-ix10.ix.netcom.com (dfw-ix10.ix.netcom.com [206.214.98.10])
  1943.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id PAA13364
  1944.     for <fdc@watsun.cc.columbia.edu>; Mon, 5 Oct 1998 15:07:39 -0400 (EDT)
  1945. Received: (from smap@localhost)
  1946.           by dfw-ix10.ix.netcom.com (8.8.4/8.8.4)
  1947.       id OAA18941; Mon, 5 Oct 1998 14:03:12 -0500 (CDT)
  1948. Received: from stl-wa51-59.ix.netcom.com(207.220.40.187) by dfw-ix10.ix.netcom.com via smap (V1.3)
  1949.     id rma018829; Mon Oct  5 14:02:24 1998
  1950. Message-Id: <3.0.5.32.19981005120405.00a62a20@popd.ix.netcom.com>
  1951. X-Sender: asmusf@popd.ix.netcom.com
  1952. X-Mailer: QUALCOMM Windows Eudora Light Version 3.0.5 (32)
  1953. Date: Mon, 05 Oct 1998 12:04:05 -0700
  1954. To: Karlsson Kent - keka <keka@im.se>, "'kenw@sybase.com'" <kenw@sybase.com>
  1955. From: Asmus Freytag <asmusf@ix.netcom.com>
  1956. Subject: RE: Terminal Graphics Proposal
  1957. Cc: keinanen@sci.fi, rmcgowan@apple.com, fdc@watsun.cc.columbia.edu,
  1958.         Markus.Kuhn@cl.cam.ac.uk, kbracey@acorn.com, cowan@locke.ccil.org
  1959. In-Reply-To: <C110A2268F8DD111AA1A00805F85E58D57DC34@ntgbg1>
  1960. Mime-Version: 1.0
  1961. Content-Type: text/plain; charset="us-ascii"
  1962.  
  1963. >> 
  1964. >> Again, I disagree. These should *not* sort as "NUL", "SOH", etc.
  1965. >> 
  1966. >> --Ken
  1967. >> 
  1968. >When looking in an index for a terminal emulator say, which is somethign I
  1969. >actually do sometimes (still), both I and I expect the average reader would
  1970. >expect to find NL under N, FF under F and so on, rather than quite
  1971. >unexpectedly before A.
  1972. >
  1973. I would side with Ken. If the emulator manual used the character codes that
  1974. correspond to the 'Control code Pictures', I would in fact expect them to
  1975. sort with all the other control code pictures and special symbols. If the
  1976. index wanted to focus on the names for the control functions, it would use
  1977. the charcter codes for the Latin letters and spell out FF etc.
  1978.  
  1979. There is no need to burdern *every* single implementation of the standard
  1980. sort with the table entries since such simple solutions are possible.
  1981.  
  1982. A./
  1983.  
  1984.  6-Oct-98 17:58:19-GMT,1532;000000000001
  1985. Return-Path: <unicode@unicode.org>
  1986. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  1987.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id NAA10835
  1988.     for <fdc@watsun.cc.columbia.edu>; Tue, 6 Oct 1998 13:58:17 -0400 (EDT)
  1989. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  1990.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id KAA09096
  1991.     ; Tue, 6 Oct 1998 10:57:23 -0700
  1992. Received: by unicode.org (NX5.67g/NX3.0S)
  1993.     id AA04434; Tue, 6 Oct 98 10:43:08 -0700
  1994. Message-Id: <9810061743.AA04434@unicode.org>
  1995. Errors-To: uni-bounce@unicode.org
  1996. Mime-Version: 1.0
  1997. Content-Type: text/plain;
  1998.     charset="iso-8859-1"
  1999. Content-Transfer-Encoding: 7bit
  2000. X-Uml-Sequence: 6096 (1998-10-06 17:42:51 GMT)
  2001. From: "Julie Doll Allen" <adollen@ix.netcom.com>
  2002. Reply-To: unicode@unicode.org
  2003. To: Unicode List <unicode@unicode.org>
  2004. Date: Tue, 6 Oct 1998 10:42:50 -0700 (PDT)
  2005. Subject: RE: Terminal Graphics Proposal
  2006. Content-Transfer-Encoding: 7bit
  2007.  
  2008. Asmus wrote:
  2009.  
  2010. Finally, once you feel that your proposal is pretty stable, there are brand
  2011. new instructions on how to submit proposals to Unicode on the web site (the
  2012. page should be called proposals.html, but I'm not sure where you will find
  2013. it). It would be useful to assemble the kinds of information that are
  2014. needed, esp. the answers to the form.
  2015. ---------[end snip]-------
  2016.  
  2017. The new page is at:
  2018. http://www.unicode.org/pending/proposals.html
  2019. I am still adding links to get to it, but it can be accessed from What's New
  2020. or, of course, directly.
  2021.  
  2022. Julie Allen
  2023. Editor
  2024. Unicode, Inc.
  2025.  
  2026.  6-Oct-98 19:09:10-GMT,1153;000000000001
  2027. Return-Path: <unicode@unicode.org>
  2028. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  2029.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id PAA02708
  2030.     for <fdc@watsun.cc.columbia.edu>; Tue, 6 Oct 1998 15:09:09 -0400 (EDT)
  2031. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  2032.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id MAA53736
  2033.     ; Tue, 6 Oct 1998 12:07:35 -0700
  2034. Received: by unicode.org (NX5.67g/NX3.0S)
  2035.     id AA05236; Tue, 6 Oct 98 12:01:06 -0700
  2036. Message-Id: <9810061901.AA05236@unicode.org>
  2037. Errors-To: uni-bounce@unicode.org
  2038. Mime-Version: 1.0
  2039. Content-Type: text/plain; charset=US-ASCII
  2040. Content-Transfer-Encoding: 7BIT
  2041. X-Uml-Sequence: 6097 (1998-10-06 19:00:47 GMT)
  2042. From: "Tony Harminc" <tzha0@amdahl.com>
  2043. Reply-To: unicode@unicode.org
  2044. To: Unicode List <unicode@unicode.org>
  2045. Date: Tue, 6 Oct 1998 12:00:46 -0700 (PDT)
  2046. Subject: Re: Terminal Graphics Proposal
  2047. Content-Transfer-Encoding: 7BIT
  2048.  
  2049. On 5 Oct 98, at 13:57, Frank da Cruz  wrote:
  2050.  
  2051. > The single biggest category is hex bytes, which so far seems to have received
  2052. > a warm reception.
  2053.  
  2054. Btw, should the hex bytes have the Number property ?
  2055.  
  2056. Tony Harminc
  2057.  
  2058.  6-Oct-98 20:11:20-GMT,955;000000000001
  2059. Return-Path: <unicode@unicode.org>
  2060. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  2061.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id QAA20909
  2062.     for <fdc@watsun.cc.columbia.edu>; Tue, 6 Oct 1998 16:11:19 -0400 (EDT)
  2063. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  2064.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id NAA67062
  2065.     ; Tue, 6 Oct 1998 13:10:21 -0700
  2066. Received: by unicode.org (NX5.67g/NX3.0S)
  2067.     id AA05696; Tue, 6 Oct 98 13:04:37 -0700
  2068. Message-Id: <9810062004.AA05696@unicode.org>
  2069. Errors-To: uni-bounce@unicode.org
  2070. X-Uml-Sequence: 6098 (1998-10-06 20:04:23 GMT)
  2071. From: Rick McGowan <rmcgowan@apple.com>
  2072. Reply-To: unicode@unicode.org
  2073. To: Unicode List <unicode@unicode.org>
  2074. Date: Tue, 6 Oct 1998 13:04:21 -0700 (PDT)
  2075. Subject: Re: Terminal Graphics Proposal
  2076.  
  2077. > The single biggest category is hex bytes, which so far seems to have received
  2078. > a warm reception.
  2079.  
  2080. What does "warm reception" mean?
  2081.  
  2082.     Rick
  2083.  
  2084.  6-Oct-98 20:49:45-GMT,1073;000000000001
  2085. Return-Path: <unicode@unicode.org>
  2086. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  2087.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id QAA03497
  2088.     for <fdc@watsun.cc.columbia.edu>; Tue, 6 Oct 1998 16:49:41 -0400 (EDT)
  2089. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  2090.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id NAA10010
  2091.     ; Tue, 6 Oct 1998 13:45:33 -0700
  2092. Received: by unicode.org (NX5.67g/NX3.0S)
  2093.     id AA05911; Tue, 6 Oct 98 13:31:48 -0700
  2094. Message-Id: <9810062031.AA05911@unicode.org>
  2095. Errors-To: uni-bounce@unicode.org
  2096. X-Uml-Sequence: 6099 (1998-10-06 20:30:21 GMT)
  2097. From: kenw@sybase.com (Kenneth Whistler)
  2098. Reply-To: unicode@unicode.org
  2099. To: Unicode List <unicode@unicode.org>
  2100. Date: Tue, 6 Oct 1998 13:30:20 -0700 (PDT)
  2101. Subject: Re: Terminal Graphics Proposal
  2102.  
  2103. > On 5 Oct 98, at 13:57, Frank da Cruz  wrote:
  2104. > > The single biggest category is hex bytes, which so far seems to have received
  2105. > > a warm reception.
  2106. > Btw, should the hex bytes have the Number property ?
  2107.  
  2108. Clearly not.
  2109.  
  2110. --Ken
  2111.  
  2112. > Tony Harminc
  2113.  
  2114.  6-Oct-98 21:10:51-GMT,1278;000000000001
  2115. Return-Path: <unicode@unicode.org>
  2116. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  2117.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id RAA08700
  2118.     for <fdc@watsun.cc.columbia.edu>; Tue, 6 Oct 1998 17:10:49 -0400 (EDT)
  2119. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  2120.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id OAA53574
  2121.     ; Tue, 6 Oct 1998 14:09:56 -0700
  2122. Received: by unicode.org (NX5.67g/NX3.0S)
  2123.     id AA06001; Tue, 6 Oct 98 13:37:31 -0700
  2124. Message-Id: <9810062037.AA06001@unicode.org>
  2125. Errors-To: uni-bounce@unicode.org
  2126. Mime-Version: 1.0
  2127. Content-Type: text/plain; charset=us-ascii
  2128. Content-Transfer-Encoding: 7bit
  2129. X-Uml-Sequence: 6100 (1998-10-06 20:37:07 GMT)
  2130. From: John Cowan <cowan@locke.ccil.org>
  2131. Reply-To: unicode@unicode.org
  2132. To: Unicode List <unicode@unicode.org>
  2133. Date: Tue, 6 Oct 1998 13:37:05 -0700 (PDT)
  2134. Subject: Re: Terminal Graphics Proposal
  2135. Content-Transfer-Encoding: 7bit
  2136.  
  2137. Tony Harminc wrote:
  2138.  
  2139. > Btw, should the hex bytes have the Number property ?
  2140.  
  2141. IMHO no.  They are "Symbol, other".
  2142.  
  2143. -- 
  2144. John Cowan    http://www.ccil.org/~cowan        cowan@ccil.org
  2145.     You tollerday donsk?  N.  You tolkatiff scowegian?  Nn.
  2146.     You spigotty anglease?  Nnn.  You phonio saxo?  Nnnn.
  2147.         Clear all so!  'Tis a Jute.... (Finnegans Wake 16.5)
  2148.  
  2149.  8-Oct-98  0:08:32-GMT,16887;000000000401
  2150. Return-Path: <fdc>
  2151. Received: (from fdc@localhost)
  2152.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id UAA27987;
  2153.     Wed, 7 Oct 1998 20:07:16 -0400 (EDT)
  2154. Date: Wed, 7 Oct 98 20:07:15 EDT
  2155. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  2156. To: unicode@unicode.org
  2157. Subject: Collected Comments on Terminal Graphics Proposal
  2158. Message-ID: <CMM.0.90.4.907805235.fdc@watsun.cc.columbia.edu>
  2159.  
  2160. Thanks to all who commented on the Terminal Graphics proposal.  Here are
  2161. some collected responses to particular points.
  2162.  
  2163. Geoffrey Waigh <gpw@cybersurf.net> wrote:
  2164. > > A selection of terminal graphics characters is proposed for Unicode [24]
  2165. > > and ISO 10646 [19] to allow Unicode-based terminal emulation software to
  2166. > > (a) display glyphs that are found on popular types of terminals but
  2167. > > currently are not available in Unicode, and (b) interoperate with other
  2168. > > Unicode applications.
  2169. >
  2170. > I can see clear merit in handling b), but I'm leary of the code space
  2171. > consumption that a) is having here.  In general, my feeling is that
  2172. > if 98% emulation does the job in an adequate fashion for
  2173. > non-perfectionists, then that is the way to go.
  2174. >
  2175. When a company is in the market for a terminal emulator, one of the factors
  2176. affecting their choice is the quality of the emulation, which includes the
  2177. ability to display all the same glyphs the terminal displays.  If product A
  2178. can do this (but has to use a custom font to do so) and product B is a good
  2179. citizen and sticks with Unicode -- which prevents it from displaying the same
  2180. glyphs properly -- many companies will choose product A because its emulation
  2181. is better, even though they might suffer down the road with its nonstandard
  2182. encodings -- and maybe even total lack of Unicode support.
  2183.  
  2184. > [On Hex code display]
  2185. > That seems kind of wasteful for a debugging mode.  Do the terminals
  2186. > that produce this output have escape sequences for enabling this
  2187. > mode, or is it strictly a terminal configuration option?  (Of course
  2188. > by that measure the control character codes come under scrutiny...)
  2189. >
  2190. This is the largest biggest block in the proposal, and it can be dispensed
  2191. with.  I do believe, however, that many developers, help-desk people, network
  2192. managers, etc, will find it handy in debugging not only terminal sessions but
  2193. Web pages, word processors, network protocols, and files using Unicode-based
  2194. tools.
  2195.  
  2196. Kevin Bracey <kbracey@acorn.com> wrote:
  2197. > > Unicode already has a block of Control Pictures at U+2400 through
  2198. > > U+2421, but (except for "NL" at U+2424) these go horizontally across the
  2199. > > character cell, rather than diagonally, thus making them difficult to
  2200. > > distinguish from normal alphanumeric text.  A new, parallel block of C0
  2201. > > control pictures is needed in which the abbreviations are displayed
  2202. > > diagonally.
  2203. > That's a glyph variation - the Unicode Standard explicitly states that you
  2204. > can use whatever preferred glyph you like for these. Indeed, IIRC, ISO
  2205. > 10646-1 has considerably different suggested glyphs for these characters.
  2206. >
  2207. (And many others concurred.)  OK, this block is removed from Draft 2 of the
  2208. proposal, but some suggestions added for the next edition of the Unicode
  2209. Standard.
  2210.  
  2211. Asmus Freytag <asmusf@ix.netcom.com> wrote [On the same topic...]:
  2212. > And thus, at minumum, the table in the book should be altered to show all
  2213. > control pictures arranged diagonally, and all future control picture
  2214. > additions should also be arranged that way.
  2215.  
  2216. We are looking into this for Unicode 3.0. Although the mail discussion makes
  2217. clear that the distinction between characters and glyphs is widely known, it
  2218. makes no sense to depart from the established use in the one area the
  2219. characters are intended for!  Since the two glyph forms are equivalent
  2220. (i.e. there's no question of changing the identity of the characters) such a
  2221. change is editorial in nature. For what it's worth, ISO 10646 uses the
  2222. diagonal forms (although incorrectly in a roman type face).
  2223.  
  2224. Kevin Bracey <kbracey@acorn.com> wrote:
  2225. > >   E080  SP    Space (like U+2420 but arranged diagonally)
  2226. > >   E081  DEL   Delete (Rubout) (2-character name: DT)
  2227. > These two are glyph variants of U+2420 and U+2421.
  2228. >
  2229. OK, these are removed too.
  2230.  
  2231. > >   E082  LS1   Locking Shift 1 (ISO name for SO)
  2232. > >   E083  LS0   Locking Shift 0 (ISO name for SI)
  2233. > Maybe these two could be considered glyph variants of U+240E and u+240F?
  2234. > Probably not, I suppose.
  2235. >
  2236. I've left them in, along with IS1 through IS4.
  2237.  
  2238. > >   E0F0  Reverse Question Mark         DEC VTxxx, Wyse, Televideo (1)
  2239. >
  2240. > I would suggest U+FFFD for this.
  2241. >
  2242. This was discussed at some length, but I've left it in, since many terminals
  2243. display this glyph, and for different purposes.  It does not always mean
  2244. "unknown character received".
  2245.  
  2246. > Even ISO-Latin1 contains the reverse question mark at 0xBF, so it is no 
  2247. > need to re-invent it.
  2248. >
  2249. As noted in previous postings, the ISO one is upside down, whereas this one
  2250. is upright.
  2251.  
  2252. Asmus Freytag <asmusf@ix.netcom.com> wrote:
  2253. > This important character [reverse question mark] is already on the list of
  2254. > characters to be added in one the coming amendments in ISO 10646.
  2255.  
  2256. kenw@sybase.com (Kenneth Whistler) wrote:
  2257. > As Asmus mentioned, this one is already on its way. It is encoded in
  2258. > Amendment 18 to 10646, which is just entering its last round of ballotting:
  2259. >
  2260. > U+2426 SYMBOL FOR SUBSTITUTE FORM TWO
  2261. >
  2262. > with the requisite shape of the reversed question mark.
  2263. >
  2264. Thanks; draft 2 amended accordingly.
  2265.  
  2266. Rick McGowan <rmcgowan@apple.com> wrote:
  2267. > Of course, there are a *lot* of controls, many control sets, and some
  2268. > degree of overlap, as Frank's proposal points out rather dramatically.  I
  2269. > would suggest that he take up an attempt at serious unification of these
  2270. > things, and collect all of the wonderful data he's gathered into a "white
  2271. > paper" on how to use control pictures for what terminals, etc.  With
  2272. > mapping tables, and a list of the minimum required additions to support
  2273. > full cross-mappings.
  2274. >
  2275. I have tried to do this in Draft 2.
  2276.  
  2277. Paul Keinanen <keinanen@sci.fi> wrote:
  2278. > If all octet values (00 .. FF) are also going to be displayed, there might
  2279. > be some ambiguity with some of the two letter codes, e.g. FF, D1, D2, D3,
  2280. > D4, EB and EC, which should be noted in the actual font design.
  2281. >
  2282. Thanks for noticing!  A caution to this effect has been added to Draft 2.
  2283.  
  2284. > > C1 Control characters are specified in ISO-6429 and used in the VT220
  2285. > > family of terminals [5] and the Wyse 370 [26], where they are
  2286. > > represented in the right half of the "display controls" font as shown in
  2287. > > Table 4.3 (DEC terminals use the full name, Wyse terminals use the 2X
  2288. > > name).  As with C0 controls, the "name" is displayed diagonally within
  2289. > > the character cell.  Unicode presently includes no C1 control pictures.
  2290. >
  2291. > Looking through various EBCDIC code pages (e.g. IBM278, IBM880) and other
  2292. > unnumbered sets it appears that these control codes are all also available
  2293. > in EBCDIC, but of course at different positions (e.g. IND at 0x24). Some
  2294. > references to these sets are "IBM NLS RM Vol2 SE09-8002-01, March 1990" 
  2295. > and "IBM 3270 Char Set Ref Ch 10, GA27-2837-9, April 1987". 
  2296. Thanks for the reference.  I found a complete listing of modern EBCDIC
  2297. (which has changed considerable since the System/360 days!) in the CDRA
  2298. Registry, and have totally revised the EBCDIC controls section in Draft 2.
  2299.  
  2300. > >Note that three of the C1 control pictures are unassigned (the ones
  2301. > >marked by "(1)", that would be at U+E020, U+E021, and U+E039 if these
  2302. > >were assigned).  These positions should be left vacant in case names are
  2303. > >assigned to these characters in a future revision of ISO 6429.
  2304. > In ISO 8859-1 these are listed as
  2305. > 80  PADDING CHARACTER (PAD)
  2306. > 81  HIGH OCTET PRESET (HOP)
  2307. > 99  SINGLE GRAPHIC CHARACTER INTRODUCER (SGCI)
  2308. I have both the ISO and ECMA versions of this standard and find no reference
  2309. to these or any other control characters.  Nor can I find these characters
  2310. ISO 6429 or any of the control sets in the ISO Registry.  Can you give a
  2311. more precise source?
  2312.  
  2313. > Then I am just wondering why:
  2314. >
  2315. > ftp://dkuug.dk/i18n/charmaps/CP819 (alias Latin1 alias ISO_8859-1:1987) 
  2316. > lists:
  2317. > <PA> /x80   <U0080> PADDING CHARACTER (PAD)
  2318. > <HO> /x81   <U0081> HIGH OCTET PRESET (HOP)
  2319. > <GC> /x99   <U0099> SINGLE GRAPHIC CHARACTER INTRODUCER (SGCI)
  2320. > and ftp://dkuug.dk/i18n/charmaps.646/ISO_8859-1:1987 
  2321. > lists the same code point values for these control characters
  2322. > <PA> /d128
  2323. > <HO> /d129
  2324. > <GC> /d153
  2325. > So I just wonder, where they at dkuug.dk/i18n have taken these C0 and C1
  2326. > codes from, unfortunately these tables did not contain any references (as
  2327. > did most EBCDIC tables).
  2328.  
  2329. > > 5. HEX BYTES
  2330. > >
  2331. > > Hexadecimal byte values, 2 hex digits each.  Like display controls, but
  2332. > > for all 256 8-bit byte values...
  2333. >
  2334. > These would be very nice :-). Note the possible ambiguity with some two
  2335. > character control pictures r.g. FF, EB etc. So special precautions should be
  2336. > taken when designing the fonts.
  2337. >
  2338. Noted in Draft 2.
  2339.  
  2340. Karlsson Kent - keka <keka@im.se> wrote:
  2341. > ... (though the newly suggested hexadecimal-digit-pair display ones might
  2342. > continue to be useful; though hexadecimal digit quadruples would fill an
  2343. > entier plane and more! ;-)
  2344.  
  2345. Rick McGowan <rmcgowan@apple.com> wrote:
  2346. > > The single biggest category is hex bytes, which so far seems to have
  2347. > > received a warm reception.
  2348. >
  2349. > What does "warm reception" mean?
  2350. >
  2351. Some nice comments (like the ones just above).
  2352.  
  2353. Paul Keinanen <keinanen@sci.fi> wrote:
  2354. > > No attempt was made to account for the many Viewdata, Videotex, Minitel,
  2355. > > NAPLPS, or other mosaic graphics character sets.  These should be
  2356. > > tackled, if appropriate, by someone who knows something about them.
  2357. > And not forgetting the tele-text block characters on European TVs. With
  2358. > the introduction of TV cards for PCs that also contains a teletext
  2359. > decoder, so there is a need to display the text and block graphics on
  2360. > PC. As far as I remember, the block graphic format is more or less the
  2361. > same as Viewdata with 2 columns and 3 rows per character cell, thus
  2362. > requiring 64 glyphs.
  2363. >
  2364. There are numerous mosaic graphics, Teletex, and similar character sets in
  2365. the ISO Register.  Quite honestly, I have never even seen such a terminal
  2366. and do not feel qualified to propose how/if/when/whether this class of glyphs
  2367. should be handled in Unicode.
  2368.  
  2369. > All in all a very interesting proposal. By using as much existing
  2370. > characters from current Unicode standard, i guess there would be a greater
  2371. > likelyhood of getting thing officially approved.
  2372. >
  2373. In most places, the proposal does not bother enumerate all of the characters
  2374. used by these terminals that are already in Unicode -- and this evidently
  2375. leaves the false impression that they were not researched.  Indeed they
  2376. were!  If it is necessary to get the proposal passed, of course it can be
  2377. done.
  2378.  
  2379. Rick McGowan <rmcgowan@apple.com> wrote:
  2380. > > Still, if I were a font maker working from the Unicode book, I'd
  2381. > > probably copy the pictures in it, so again, I'd suggest the next edition
  2382. > > show the characters diagonally within the cell, and the accompanying text
  2383. > > (which if I can overlook, so can a font maker :-)
  2384. >
  2385. > Yes, yes, but... People should read, Grasshopper.  It is that for which we
  2386. > write.
  2387. >
  2388. Yes, I should know this as well as anyone, having written several books
  2389. myself, which serve to varying degrees as software manuals, and which, if
  2390. users of the software would only read them, would save me my daily 6-8 hours
  2391. of question answering -- hence the smiley :-)
  2392.  
  2393. Karlsson Kent - keka <keka@im.se> wrote:
  2394. > I probably should not say this, but...  If you are abolutely hardbent on
  2395. > having symbols for control codes, there should be some for the Unicode
  2396. > control codes too (like paragraph separator, left-to-right-mark, etc.)  
  2397. > They need not be constructed from letters...
  2398. >
  2399. I have added a section on these to Draft 2.  They are not needed for
  2400. terminal emulators (at least not yet), but might be handy in other contexts.
  2401.  
  2402. Tony Harminc <tzha0@amdahl.com> wrote:
  2403. > >   E0F6  Padlock (keyboard locked)     IBM 3270 
  2404. >
  2405. > This last one introduces a bit of a problem, I think.  It differs 
  2406. > from all other characters mentioned in that it is never displayed in 
  2407. > the data portion of a 3270 screen, but rather occurs "below the line" 
  2408. > as an indication of keyboard status.  If it is to be included, then 
  2409. > there are several more uniquely 3270 characters that can be seen 
  2410. > below the line; I don't know formal names for them, and indeed they 
  2411. > generally don't appear in IBM's CDRA documents.  Roughly, they are:
  2412. >
  2413. > Outline up arrow   (indication of upshifted condition)
  2414. > Outline down arrow (indication of downshifted (override) condition)
  2415. > Key                (indication of terminal physically locked (I think
  2416. >                     this may be what is meant by E0F6 above)
  2417. > Stick figure       (terminal is connected to "operator" (really to a 
  2418. >                     supervisory program))
  2419. > Solid block        (terminal is connected to "application program")
  2420. > 4 in square box    (terminal is connected to 3274-type control unit)
  2421. > 6 in square box    (terminal is connected to 3276-type control unit)
  2422. > Lightning bolt     (communication failure)
  2423. > Rectangle with slash (machine check)
  2424. > Printer symbol with slash (associated printer has an error condition)
  2425. >
  2426. These have been added in Draft 2 -- but just the ones not already in
  2427. Unicode (such as outline arrows, "4 in square box" which is really just
  2428. an inverse video "4" as far as a terminal is concerned, etc).
  2429.  
  2430. > and most problematic:
  2431. > Left half of clock (these two form a doublewidth clock (set at 6:10   
  2432. > Right half of clock or 2:30, though I'm sure the time would be        
  2433. >                    considered a matter of glyph - indeed at least    
  2434. >                    one non-IBM manufacturer's clock symbol was 5:50  
  2435. >                    or 10:30)
  2436. >
  2437. I don't have an actual 3270 terminal to look at just now, but I did manage
  2438. to scrape up the IBM 3270 Component Description manual, which lists (and
  2439. illustrates) all the special glyphs shown in the Operator Information Area,
  2440. in which there is nothing to suggest that the clock is made from two
  2441. character cells.  In fact, it looks quite round to me :-)
  2442.  
  2443. Even if it is made from pieces, I assume there is no way to see them in
  2444. isolation, and so there should be no harm in encoding the clock as a single
  2445. glyph (and then, if necessary, show it in double size).
  2446.  
  2447. > Now it's entirely reasonable to argue that all the above (and I may 
  2448. > have forgotten a couple) have no business being encoded at all.  
  2449. > Indeed some terminal emulators use graphical means to produce the 
  2450. > symbols.  In any case there is nothing in the 3270 architecture that 
  2451. > specifies use of any of them, and an emulator program can use other 
  2452. > means to communicate the same information to the user.  However a 
  2453. > number of Windows-based emulators I know do use glyphs encoded in a 
  2454. > font that they supply to produce at least a subset of the symbols.  
  2455. > (It should be pointed out that a number of "ordinary" glyphs can also 
  2456. > appear below the line, but I can think of no reason not to unify them 
  2457. > with the upper case letters, numbers, and so on.)
  2458. >
  2459. Right.  The reason for including the special glyphs appears at the top of
  2460. this message.
  2461.  
  2462. > That IBM doesn't include them in CDRA may be a good reason to exclude 
  2463. > them from this proposal.  But they can be genuinely useful for 
  2464. > writers of emulators.  What to do ?  And how many clocks and stick 
  2465. > figures is it reasonable to encode ?
  2466. >
  2467. In Draft 2, I'm listing one of each (I retired the SNI 3:00 clock and 
  2468. stick figure with hat).
  2469.  
  2470. (Yes, I know that on the RS/6000 there is a little animated "running man"
  2471. who can stop, fall down, etc, as an indicator of the system status, but
  2472. that's above and beyond...)
  2473.  
  2474. Elliotte Rusty Harold <elharo@sunsite.unc.edu> wrote:
  2475. > >  E0B4  Latin capital letter H with bar       SNI Math 04/05 (2)
  2476. > >  E0B5  Latin small letter h with bar         SNI Math 04/06 (2)
  2477. >
  2478. > Is E0B5 supposed to be Planck's constant over 2*PI?  If so, it's encoded at
  2479. > 210F, 0127, and 045B.  And your E0B4 is at 0126.
  2480. >
  2481. Who knows what it's supposed to be!  In any case, I looked harder and found
  2482. barred H's and T's, dotted L's, etc (which look just right for the SNI
  2483. character set), as well as some Engs, in Latin Extended A (U+0100..) and so
  2484. removed them from the proposal.
  2485.  
  2486. As a result of all your comments, and further research, Draft 2 should be
  2487. much tighter in terms of unifications, but also more complete -- win some,
  2488. lose some :-)
  2489.  
  2490. It's coming up in the next message.  NOTE: If it is the sense of the readers
  2491. that these proposals should no longer be posted here, but rather just
  2492. pointers to them, I'm happy to comply.  In case you want to skip the next
  2493. draft in email, the pointer is:
  2494.  
  2495.   ftp://kermit.columbia.edu/kermit/charsets/ucsterminal.txt
  2496.  
  2497. Thanks again!
  2498.  
  2499. - Frank
  2500.  
  2501.  8-Oct-98  1:12:12-GMT,1571;000000000011
  2502. Return-Path: <rmcgowan@scv4.apple.com>
  2503. Received: from mail-out1.apple.com (mail-out1.apple.com [17.254.0.52])
  2504.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id VAA08504
  2505.     for <fdc@watsun.cc.columbia.edu>; Wed, 7 Oct 1998 21:12:11 -0400 (EDT)
  2506. Received: from mailgate.apple.com (A17-128-100-225.apple.com [17.128.100.225])
  2507.     by mail-out1.apple.com (8.8.5/8.8.5) with ESMTP id SAA40798
  2508.     for <fdc@watsun.cc.columbia.edu>; Wed, 7 Oct 1998 18:06:40 -0700
  2509. Received: from scv4.apple.com (scv4.apple.com) by mailgate.apple.com
  2510.  (mailgate.apple.com - SMTPRS 2.0.15) with ESMTP id <B0002724774@mailgate.apple.com> for <fdc@watsun.cc.columbia.edu>;
  2511.  Wed, 07 Oct 1998 18:06:30 -0700
  2512. Received: from rangda (rangda.apple.com [17.202.14.171])
  2513.     by scv4.apple.com (8.8.5/8.8.5) with SMTP id SAA56586
  2514.     for <fdc@watsun.cc.columbia.edu>; Wed, 7 Oct 1998 18:06:29 -0700
  2515. Message-Id: <199810080106.SAA56586@scv4.apple.com>
  2516. To: fdc@watsun.cc.columbia.edu
  2517. Subject: Re: Terminal Graphics Draft 2
  2518. Date: Wed, 7 Oct 1998 18:06:29 -0700
  2519. From: Rick McGowan <rmcgowan@apple.com>
  2520. Reply-To: rmcgowan@apple.com
  2521. Received: by Apple.Mailer (2.95.2)
  2522.  
  2523. Thanks Frank for working on the next draft.  But PLEASE, in future *DO NOT*  
  2524. post 59.1k worth of draft document to the Unicode list!!!  I get enough  
  2525. megabytes of e-mail per day.  And some people pay for downloading and  
  2526. connect-time.
  2527.  
  2528. A pointer to:
  2529.  
  2530.     ftp://kermit.columbia.edu/kermit/charsets/ucsterminal.txt
  2531.  
  2532. is sufficient. Anyone out there without access to either a web browser OR  
  2533. ftp should ask for a copy of the draft via private e-mail.
  2534.  
  2535.     Rick
  2536.  
  2537.  8-Oct-98  6:44:07-GMT,2499;000000000001
  2538. Return-Path: <unicode@unicode.org>
  2539. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  2540.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id CAA22615
  2541.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 02:44:06 -0400 (EDT)
  2542. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  2543.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id XAA08294
  2544.     ; Wed, 7 Oct 1998 23:43:45 -0700
  2545. Received: by unicode.org (NX5.67g/NX3.0S)
  2546.     id AA14555; Wed, 7 Oct 98 23:39:36 -0700
  2547. Message-Id: <9810080639.AA14555@unicode.org>
  2548. Errors-To: uni-bounce@unicode.org
  2549. Mime-Version: 1.0
  2550. Content-Type: text/plain; charset=ISO-8859-1
  2551. Content-Transfer-Encoding: 8bit
  2552. X-Uml-Sequence: 6106 (1998-10-08 06:39:23 GMT)
  2553. From: brox@corena.no (Bjorn Brox)
  2554. Reply-To: unicode@unicode.org
  2555. To: Unicode List <unicode@unicode.org>
  2556. Date: Wed, 7 Oct 1998 23:39:21 -0700 (PDT)
  2557. Subject: Re: Collected Comments on Terminal Graphics Proposal
  2558. Content-Transfer-Encoding: 8bit
  2559.  
  2560. Frank da Cruz wrote this:
  2561. > Thanks to all who commented on the Terminal Graphics proposal.  Here are
  2562. > some collected responses to particular points.
  2563. ...
  2564. > > And not forgetting the tele-text block characters on European TVs. With
  2565. > > the introduction of TV cards for PCs that also contains a teletext
  2566. > > decoder, so there is a need to display the text and block graphics on
  2567. > > PC. As far as I remember, the block graphic format is more or less the
  2568. > > same as Viewdata with 2 columns and 3 rows per character cell, thus
  2569. > > requiring 64 glyphs.
  2570. > >
  2571. > There are numerous mosaic graphics, Teletex, and similar character sets in
  2572. > the ISO Register.  Quite honestly, I have never even seen such a terminal
  2573. > and do not feel qualified to propose how/if/when/whether this class of glyphs
  2574. > should be handled in Unicode.
  2575.  
  2576. The national norwegian teletext service on WWW is using a
  2577. Teletex-font (nrkttv.ttf) when properly configured.
  2578.     http://www.nrk.no/teksttv    (sorry, it's in Norwegian)
  2579. Wouldn't it be nice to be able to cut and paste from such a window?
  2580.  
  2581. You should also take a look on the corporate use subarea defined by Adobe
  2582. Systems.
  2583.  http://www.adobe.com/supportservice/devrelations/typeforum/corporateuse.txt
  2584.  http://www.adobe.com/supportservice/devrelations/typeforum/unicodegn.html
  2585. Some of your maths symbols, and probably others is covered by this range..
  2586.  
  2587.  
  2588. -- 
  2589. Bjorn Brox, CORENA Norge AS, http://www.corena.no/
  2590. Kirkegaardsvn. 45, P.O.Box 1024, N-3601 Kongsberg, NORWAY
  2591. Phone: +47 32737435, Fax: +47 32736877, Mobile: +47 92638590
  2592.  
  2593.  8-Oct-98  8:55:12-GMT,5092;000000000001
  2594. Return-Path: <keka@im.se>
  2595. Received: from www.im.se (fw.im.se [193.14.22.222])
  2596.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id EAA14769
  2597.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 04:55:07 -0400 (EDT)
  2598. Received: from imhps.im.se (imhps.im.se [192.36.35.5])
  2599.     by www.im.se (8.9.1/8.9.1) with ESMTP id KAA07148;
  2600.     Thu, 8 Oct 1998 10:36:53 +0200 (METDST)
  2601. Received: from msxsth1.im.se by imhps.im.se (1.37.109.16/IM-3.12)
  2602.     id AA106666867; Thu, 8 Oct 1998 10:54:27 +0200
  2603. Received: by msxsth1 with Internet Mail Service (5.5.2232.9)
  2604.     id <TX2W2GSD>; Thu, 8 Oct 1998 10:52:29 +0200
  2605. Message-Id: <C110A2268F8DD111AA1A00805F85E58D57DC41@ntgbg1>
  2606. From: Karlsson Kent - keka <keka@im.se>
  2607. To: "'Frank da Cruz'" <fdc@watsun.cc.columbia.edu>
  2608. Cc: "'kenw@sybase.com'" <kenw@sybase.com>,
  2609.         "'rmcgowan@apple.com'"
  2610.      <rmcgowan@apple.com>,
  2611.         "'asmusf@ix.netcom.com'" <asmusf@ix.netcom.com>,
  2612.         "'kbracey@acorn.com'" <kbracey@acorn.com>,
  2613.         "'Markus.Kuhn@cl.cam.ac.uk'"
  2614.      <Markus.Kuhn@cl.cam.ac.uk>,
  2615.         "'cowan@locke.ccil.org'"
  2616.      <cowan@locke.ccil.org>
  2617. Subject: RE: Terminal Graphics Draft 2
  2618. Date: Thu, 8 Oct 1998 10:52:00 +0200 
  2619. Mime-Version: 1.0
  2620. X-Mailer: Internet Mail Service (5.5.2232.9)
  2621. Content-Type: text/plain;
  2622.     charset="iso-8859-1"
  2623.  
  2624.  
  2625. > Rusty Harold, Paul Keinanen, Karlsson Kent, Rick McGowan, Kenneth
  2626. > Whistler.
  2627. Well, it is Kent Karlsson (but so what...).
  2628.  
  2629. > Math Symbols
  2630. >   Although most math symbols found on terminals are already in Unicode,
  2631. >   certain terminal-based applications rely on the ability to construct
  2632. > large
  2633. >   symbols (integral and summation signs, braces, brackets) from smaller
  2634. >   character-cell-sized pieces.  Section 6.
  2635. Some of these are used INTERNALLY in Knuth's TeX (and INTERNALLY in the now
  2636. hopefully retired troff).  Users CANNOT access these glyph pieces directly
  2637. in these systems, if I remember correctly (nor would they want to).  I don't
  2638. know to what extent they may be considered to be "characters" in dvi files
  2639. (which are never written by humans).
  2640.  
  2641. > 4. HEX BYTES
  2642. > Hexadecimal byte values, 2 hex digits each, allow any 8-bit byte to be
  2643. > displayed in hexadecimal in a single character cell (and therefore allow
  2644. > any
  2645. > Unicode character value to be displayed in two cells),
  2646. Well, if in UTF-16 one would need 2 OR 4 such per character.  If in UTF-8
  2647. one would need from 1 to 4 such per character (assuming only UTF-16 space is
  2648. used, otherwise UTF-8 can have up to 6 octets per character).
  2649.  
  2650. > Table 5.0: Unicode Control Characters
  2651. >   Code  Val   Name     Description
  2652. >   E000  2000  NQ SP    Symbol for En Quad
  2653. >   E001  2001  MQ SP    Symbol for Em Quad
  2654. >   E002  2002  EN SP    Symbol for En Space
  2655. >   E003  2003  EM SP    Symbol for Em Space
  2656. >   E004  2004  3/M SP   Symbol for Three-Per-Em-Space
  2657. >   E005  2005  4/M SP   Symbol for Four-Per-Em-Space
  2658. >   E006  2006  6/M SP   Symbol for Six-Per-Em-Space
  2659. >   E007  2007  F SP     Symbol for Figure Space
  2660. >   E008  2008  P SP     Symbol for Punctuation Space
  2661. >   E009  2009  TH SP    Symbol for Thin Space
  2662. >   E00A  200A  H SP     Symbol for Hair Space
  2663. >   E00B  200B  ZW SP    Symbol for Zero-Width Space
  2664. >   E00C  200C  ZW NJ    Symbol for Zero-Width Non-Joiner
  2665. >   E00D  200D  ZW J     Symbol for Zero-Width Joiner
  2666. >   E00E  200E  LRM      Symbol for Left-to-Right Mark
  2667. >   E00F  200F  RLM      Symbol for Right-to-Left Mark
  2668. >   E010  2028  L SEP    Symbol for Line Separator
  2669. >   E011  2029  P SEP    Symbol for Paragraph Separator
  2670. >   E012  202A  LRE      Symbol for Left-to-Right Embedding
  2671. >   E013  202B  RLE      Symbol for Right-to-Left Embedding
  2672. >   E014  202C  PDF      Symbol for Pop Directional Formatting
  2673. >   E015  202D  LRO      Symbol for Left-to-Right Override
  2674. >   E016  202E  RLO      Symbol for Right-to-Left Override
  2675. >   E017  206A  I SS     Symbol for Inhibit Symmetric Swapping
  2676. >   E018  206B  A SS     Symbol for Activate Symmetric Swapping
  2677. >   E019  206C  I AFS    Symbol for Inhibit Arabic Form Shaping
  2678. >   E01A  206D  A AFS    Symbol for Activate Arabic Form Shaping
  2679. >   E01B  206E  NA DS    Symbol for National Digit Shapes
  2680. >   E01C  206F  NO DS    Symbol for Nominal Digit Shapes
  2681. >   E01D  FEFF  ZWN BSP  Symbol for Zero Width No Break Space
  2682. >   E01E  FFFE  FF FE    Symbol for Not A Character (Byte Order) (2)
  2683. >   E01F  FFFE  FF FF    Symbol for Not A Character (2)
  2684. I think these have more room for glyph invention, since there is no need to
  2685. be at all compatible with existing terminals.  Like grey(ish) arrows,
  2686. grey(ish) section mark or pilcrow, grey(ish) 'space box with annotation',
  2687. etc., rather than letters.
  2688.  
  2689. > Table 5.2: C1 Control Characters
  2690. >   Code  Val   Name 2X    Description
  2691. >          80    80        (1)
  2692. >          81    81        (1)
  2693. >   E022   82   BPH        Symbol for Break Permitted Here (2)
  2694. >   E023   83   NBH        Symbol for No Break Here (2)
  2695. Aren't these two 'control codes' the same as the Unicode characters Zero
  2696. Width Space and Zero Width No-Break Space?
  2697.  
  2698. >   E024   84   IND   IN   Symbol for Index (3)
  2699. >   E025   85   NEL   NL   Symbol for Next Line
  2700. newline??? again?
  2701.  
  2702.  
  2703.             Regards
  2704.             /kent k
  2705.  
  2706.  8-Oct-98 13:09:08-GMT,2066;000000000001
  2707. Return-Path: <unicode@unicode.org>
  2708. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  2709.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id JAA11405
  2710.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 09:09:07 -0400 (EDT)
  2711. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  2712.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id GAA30778
  2713.     ; Thu, 8 Oct 1998 06:08:22 -0700
  2714. Received: by unicode.org (NX5.67g/NX3.0S)
  2715.     id AA15702; Thu, 8 Oct 98 06:03:47 -0700
  2716. Message-Id: <9810081303.AA15702@unicode.org>
  2717. Errors-To: uni-bounce@unicode.org
  2718. Mime-Version: 1.0
  2719. Content-Type: text/plain;
  2720.     charset="iso-8859-1"
  2721. X-Uml-Sequence: 6107 (1998-10-08 13:02:16 GMT)
  2722. From: "Hart, Edwin F." <Ed.Hart@jhuapl.edu>
  2723. Reply-To: unicode@unicode.org
  2724. To: Unicode List <unicode@unicode.org>
  2725. Date: Thu, 8 Oct 1998 06:02:15 -0700 (PDT)
  2726. Subject: RE: Terminal Graphics Proposal
  2727.  
  2728. I can see value for encoding the paired hex digits (00 to FF) in the
  2729. proposal.  However with appropriate rendering software, I could also see
  2730. having them merely as a glyph variant for rendering.  I might compare this
  2731. to encoding the Braille script.
  2732.  
  2733. 1.    Two of the glyphs could be used to display a 16-bit Unicode
  2734. character (e.g., for debugging or for displaying an unknown character)
  2735.  
  2736. 2.    Protocol analyzers for communications and LANs use these glyphs to
  2737. display captured data.  (Today, the Network Associates (formerly, Network
  2738. General) Sniffer is perhaps the most widely recognized device.  20 years
  2739. ago, it was the Spectron DataScope.  Both of these are likely trademarks.)
  2740. They have 2 display modes, hex and text (typically ASCII, EBCDIC).  In my
  2741. youth, these devices used hardware fonts in ROM and TV-resolution CRTs.
  2742. Now, these devices tend to be PCs or computers with embedded software.  If
  2743. the manufacturers of such equipment want to display characters beyond the
  2744. 7-bit ASCII set, Unicode is the natural choice.
  2745.  
  2746. 3.    The glyphs are used for debugging communication problems and
  2747. software problems with the "real" terminals (rather than PCs emulating the
  2748. terminals).
  2749.  
  2750.  
  2751. Ed Hart
  2752.  
  2753.  8-Oct-98 13:27:17-GMT,1078;000000000001
  2754. Return-Path: <fdc>
  2755. Received: (from fdc@localhost)
  2756.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id JAA15084;
  2757.     Thu, 8 Oct 1998 09:27:15 -0400 (EDT)
  2758. Date: Thu, 8 Oct 98 9:27:15 EDT
  2759. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  2760. To: rmcgowan@apple.com
  2761. Subject: Re: Terminal Graphics Draft 2
  2762. In-Reply-To: Your message of Wed, 7 Oct 1998 18:06:29 -0700
  2763. Message-ID: <CMM.0.90.4.907853235.fdc@watsun.cc.columbia.edu>
  2764.  
  2765. > Thanks Frank for working on the next draft.  But PLEASE, in future *DO NOT*  
  2766. > post 59.1k worth of draft document to the Unicode list!!!  I get enough  
  2767. > megabytes of e-mail per day.  And some people pay for downloading and  
  2768. > connect-time.
  2769. > A pointer to:
  2770. >     ftp://kermit.columbia.edu/kermit/charsets/ucsterminal.txt
  2771. > is sufficient. Anyone out there without access to either a web browser OR  
  2772. > ftp should ask for a copy of the draft via private e-mail.
  2773. OK.  That was my original idea (I suggested keeping the discussion private
  2774. to spare the bulk of Unicode readers, but nobody seemed to want it that way).
  2775.  
  2776. I'll post pointers from now on.
  2777.  
  2778. - Frank
  2779.  
  2780.  8-Oct-98 16:28:04-GMT,1105;000000000001
  2781. Return-Path: <kenw@sybase.com>
  2782. Received: from inergen.sybase.com (inergen.sybase.com [192.138.151.43])
  2783.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id MAA08787
  2784.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 12:28:03 -0400 (EDT)
  2785. Received: from smtp1.sybase.com (sybgate.sybase.com [130.214.220.35])
  2786.           by inergen.sybase.com (8.8.4/8.8.4) with SMTP
  2787.       id JAA17259; Thu, 8 Oct 1998 09:29:17 -0700 (PDT)
  2788. Received: from birdie.sybase.com by smtp1.sybase.com (4.1/SMI-4.1/SybH3.5-030896)
  2789.     id AA16596; Thu, 8 Oct 98 09:28:05 PDT
  2790. Received: by birdie.sybase.com (5.x/SMI-SVR4/SybEC3.5)
  2791.     id AA19822; Thu, 8 Oct 1998 09:27:56 -0700
  2792. Date: Thu, 8 Oct 1998 09:27:56 -0700
  2793. From: kenw@sybase.com (Kenneth Whistler)
  2794. Message-Id: <9810081627.AA19822@birdie.sybase.com>
  2795. To: keka@im.se
  2796. Subject: RE: Terminal Graphics Draft 2
  2797. Cc: fdc@watsun.cc.columbia.edu, kenw@sybase.com
  2798. X-Sun-Charset: US-ASCII
  2799.  
  2800.  
  2801. > >   E024   84   IND   IN   Symbol for Index (3)
  2802. > >   E025   85   NEL   NL   Symbol for Next Line
  2803. > > 
  2804. > newline??? again?
  2805.  
  2806. I agree with Kent. Shouldn't this simply be:
  2807.  
  2808. U+2424 SYMBOL FOR NEWLINE
  2809.  
  2810. ?
  2811.  
  2812. --Ken
  2813.  
  2814.  8-Oct-98 18:33:27-GMT,2068;000000000001
  2815. Return-Path: <unicode@unicode.org>
  2816. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  2817.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id OAA18263
  2818.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 14:33:25 -0400 (EDT)
  2819. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  2820.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id KAA43790
  2821.     ; Thu, 8 Oct 1998 10:10:50 -0700
  2822. Received: by unicode.org (NX5.67g/NX3.0S)
  2823.     id AA16630; Thu, 8 Oct 98 09:57:59 -0700
  2824. Message-Id: <9810081657.AA16630@unicode.org>
  2825. Errors-To: uni-bounce@unicode.org
  2826. X-Uml-Sequence: 6109 (1998-10-08 16:57:33 GMT)
  2827. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  2828. Reply-To: unicode@unicode.org
  2829. To: Unicode List <unicode@unicode.org>
  2830. Date: Thu, 8 Oct 1998 09:57:32 -0700 (PDT)
  2831. Subject: RE: Terminal Graphics Draft 2
  2832.  
  2833. > > >   E024   84   IND   IN   Symbol for Index (3)
  2834. > > >   E025   85   NEL   NL   Symbol for Next Line
  2835. > > >
  2836. > > newline??? again?
  2837. >
  2838. > I agree with Kent. Shouldn't this simply be:
  2839. >
  2840. > U+2424 SYMBOL FOR NEWLINE
  2841. >
  2842. That depends on what the (unstated) semantics are for U+2424.
  2843. I expect it simply represents a "line terminator", like LF in
  2844. UNIX, CR on the Macintosh, or CRLF in DOS.
  2845.  
  2846. NEL stands for Next Line (not Newline).  The definition of NEL
  2847. in ISO 6429 [8.3.87] is rather complex: "The effect of NEL
  2848. depends on the setting of the DEVICE COMPONENT SELECT MODE
  2849. (DCSM) and on the parameter value of SELECT IMPLICIT MOVEMENT
  2850. DIRECTION (SIMD)."  Several paragraphs go on to explain this.
  2851.  
  2852. Confusingly, terminals that support C1 controls and that also
  2853. use 2-character abbreviations for them abbreviate NEL as NL.
  2854. However, the VT220 class of terminals actually puts "NEL" on
  2855. the screen in display-controls mode.  All this in contrast to
  2856. EBCDIC, which defines an actual NL character, which I doubt
  2857. carries the ISO NEL semantics.
  2858.  
  2859. - Frank
  2860.  
  2861. P.S. Sorry for getting your name backwards, Kent.  And for
  2862. omitting Geoffrey Waigh from the acknowledgements.  Both errors
  2863. fixed in my working copy.  Also, no more posting long drafts;
  2864. just pointers from now on.
  2865.  
  2866.  8-Oct-98 18:55:44-GMT,765;000000000001
  2867. Return-Path: <Ed.Hart@jhuapl.edu>
  2868. Received: from aples2.jhuapl.edu (aples2.jhuapl.edu [128.244.26.86])
  2869.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id OAA24567
  2870.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 14:55:40 -0400 (EDT)
  2871. Received: by aples2.jhuapl.edu with Internet Mail Service (5.5.2232.9)
  2872.     id <41YQFQF6>; Thu, 8 Oct 1998 14:55:38 -0400
  2873. Message-ID: <91D1D51C2955D111B82B00805F19989501CD7119@aples2.jhuapl.edu>
  2874. From: "Hart, Edwin F." <Ed.Hart@jhuapl.edu>
  2875. To: "'Frank da Cruz'" <fdc@watsun.cc.columbia.edu>
  2876. Subject: RE: Terminal Graphics Draft 2
  2877. Date: Thu, 8 Oct 1998 14:55:36 -0400 
  2878. MIME-Version: 1.0
  2879. X-Mailer: Internet Mail Service (5.5.2232.9)
  2880. Content-Type: text/plain
  2881.  
  2882. Thanks for championing this effort.
  2883.  
  2884. It seems to be going very well.
  2885.  
  2886. Ed
  2887.  
  2888.  8-Oct-98 19:01:11-GMT,751;000000000001
  2889. Return-Path: <fdc>
  2890. Received: (from fdc@localhost)
  2891.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id PAA26296;
  2892.     Thu, 8 Oct 1998 15:01:05 -0400 (EDT)
  2893. Date: Thu, 8 Oct 98 15:01:05 EDT
  2894. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  2895. To: "Hart, Edwin F." <Ed.Hart@jhuapl.edu>
  2896. Subject: RE: Terminal Graphics Draft 2
  2897. In-Reply-To: Your message of Thu, 8 Oct 1998 14:55:36 -0400
  2898. Message-ID: <CMM.0.90.4.907873265.fdc@watsun.cc.columbia.edu>
  2899.  
  2900. > Thanks for championing this effort.
  2901. > It seems to be going very well.
  2902. Thanks for saying so, Ed (and good to hear from you).
  2903.  
  2904. Yup, we old timers have to stick up for what's right :-)
  2905.  
  2906. Maybe a few more USS Yorktown incidents will get more
  2907. people longing for the good old days when things actually
  2908. worked...
  2909.  
  2910. - Frank
  2911.  
  2912.  8-Oct-98 19:23:24-GMT,2765;000000000001
  2913. Return-Path: <fdc>
  2914. Received: (from fdc@localhost)
  2915.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id PAA03172;
  2916.     Thu, 8 Oct 1998 15:23:22 -0400 (EDT)
  2917. Date: Thu, 8 Oct 98 15:23:22 EDT
  2918. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  2919. To: "Hart, Edwin F." <Ed.Hart@jhuapl.edu>
  2920. Subject: RE: Terminal Graphics Draft 2
  2921. In-Reply-To: Your message of Thu, 8 Oct 1998 15:11:38 -0400
  2922. Message-ID: <CMM.0.90.4.907874602.fdc@watsun.cc.columbia.edu>
  2923.  
  2924. > This is how the work really gets done.  Someone with the need and the
  2925. > expertise gets the ball rolling.  I must say that I was impressed by the
  2926. > depth of your first draft.  Doing Kermit did not hurt.
  2927. Yes, I learned long ago that the person who cares -- and can write it down --
  2928. can usually get it done.
  2929.  
  2930. > This seems like an issue that SHARE needs to support given all of the legacy
  2931. > systems in use by our organizational members.
  2932. >
  2933. Don't say "legacy"!  I hate that.  It means "Not Microsoft Windows and so
  2934. deserves to be ground into fine powder at the earliest opportunity but because
  2935. we are so stupid and lazy we can't do it yet, please don't hate us, we are
  2936. so ashamed."  (Seriously, my personal mission is to expunge that word from
  2937. the computing lexicon.)
  2938.  
  2939. > Since we swapped our
  2940. > mainframe for lots of VMS and NT systems, I don't go to SHARE anymore.  It's
  2941. > nice to have an issue where I know that SHARE has a definite interest in the
  2942. > outcome.  I believe that you have made the point about the need for terminal
  2943. > emulation and the key players on the UTC accept the argument.  If you can
  2944. > sell Rick McGowan, Ken Whistler, and Asmus Freytag, the rest of the UTC will
  2945. > accept the proposal.
  2946. Then I guess looks good, since they are mainly quibbling about individual
  2947. characters and not the entire idea.
  2948.  
  2949. > BTW, pardon my ignorance, but what was the Yorktown incident?
  2950. The US Navy has a "smart ship" program, meaning everything is controlled by
  2951. computer.  The USS Yorktown is a guided missile frigate entirely controlled
  2952. by a network PCs running Windows NT (installed, naturally, over the vigorous
  2953. objections of the technical people).  According to a front page article in
  2954. Government Computer News, the network froze and the ship turned itself off,
  2955. engine, rudder, and all.  No amount of prodding would bring it back to life.
  2956. It had to be ignomiously towed back to port.  Evidently this has happened more
  2957. than once.  The fact that no no missiles were launched is a pretty lucky break.
  2958.  
  2959. Sigh.  Microsoft evidently has a pretty cozy deal with US government -- NT
  2960. is the only platform that any government installation can just buy, without
  2961. any sort of approval.  Anything else -- mainframes, UNIX, VMS, etc -- requires
  2962. mountains of paperwork, RFPs, RFQs, sealed bids, etc etc.
  2963.  
  2964. Oh well, don't get me started :-)
  2965.  
  2966. - Frank
  2967.  
  2968.  8-Oct-98 19:27:09-GMT,834;000000000001
  2969. Return-Path: <Ed.Hart@jhuapl.edu>
  2970. Received: from aples2.jhuapl.edu (aples2.jhuapl.edu [128.244.26.86])
  2971.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id PAA04303
  2972.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 15:27:09 -0400 (EDT)
  2973. Received: by aples2.jhuapl.edu with Internet Mail Service (5.5.2232.9)
  2974.     id <41YQFQK2>; Thu, 8 Oct 1998 15:27:02 -0400
  2975. Message-ID: <91D1D51C2955D111B82B00805F19989501CD711C@aples2.jhuapl.edu>
  2976. From: "Hart, Edwin F." <Ed.Hart@jhuapl.edu>
  2977. To: "'Frank da Cruz'" <fdc@watsun.cc.columbia.edu>
  2978. Subject: RE: Terminal Graphics Draft 2
  2979. Date: Thu, 8 Oct 1998 15:27:01 -0400 
  2980. MIME-Version: 1.0
  2981. X-Mailer: Internet Mail Service (5.5.2232.9)
  2982. Content-Type: text/plain;
  2983.     charset="iso-8859-1"
  2984.  
  2985. Thanks for the feedback.  I had not heard of the Yorktown.
  2986.  
  2987. I'll try to avoid the term, legacy.  : )
  2988.  
  2989. Best regards,
  2990. Ed
  2991.  
  2992.  8-Oct-98 19:42:48-GMT,6418;000000000001
  2993. Return-Path: <unicode@unicode.org>
  2994. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  2995.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id PAA10390
  2996.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 15:42:34 -0400 (EDT)
  2997. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  2998.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id LAA23382
  2999.     ; Thu, 8 Oct 1998 11:24:11 -0700
  3000. Received: by unicode.org (NX5.67g/NX3.0S)
  3001.     id AA17365; Thu, 8 Oct 98 10:52:54 -0700
  3002. Message-Id: <9810081752.AA17365@unicode.org>
  3003. Errors-To: uni-bounce@unicode.org
  3004. X-Uml-Sequence: 6112 (1998-10-08 17:51:24 GMT)
  3005. From: Rick McGowan <rmcgowan@apple.com>
  3006. Reply-To: unicode@unicode.org
  3007. To: Unicode List <unicode@unicode.org>
  3008. Date: Thu, 8 Oct 1998 10:51:23 -0700 (PDT)
  3009. Subject: Re: Terminal Graphics Draft 2
  3010.  
  3011. Frank -- I reviewed the latest draft and have more comments...
  3012.  
  3013. > ...  All proposed characters have Combining Class 0 (although
  3014. > some of the characters are designed to "combine" (connect) with other
  3015. > characters in adjacent cells).
  3016.  
  3017. You might re-word the above a bit:
  3018.   ... (although some of the corresponding glyphs must be designed to
  3019.   "combine" (connect) with other glyphs in adjacent display cells).
  3020.  
  3021. > Digital VT220 and higher terminals, as well as Televideo, Wyse, HP, Perkin
  3022. > Elmer, and other models, allow the user to select whether control characters
  3023. > are acted upon or displayed graphically.  Unicode itself includes its own
  3024.  
  3025. Well, to my mind that indicates that these aren't NEEDED to be encoded at  
  3026. all!  Just set the terminal emulator into the "display controls" mode and let  
  3027. it display the glyphs that the emulator has for the control codes.  They  
  3028. should not need to be encoded, since they're merely a variant representation  
  3029. that the terminal does internally.  It's unfortunate that my argument is  
  3030. weakend by the fact that we already have a bunch of control pix encoded...
  3031.  
  3032. I do have a problem generally with adding "picture" characters to correspond  
  3033. to existing things that are Unicode-specific.  For instance, I see it as  
  3034. just pointless to add "Symbol for En Quad" or "Symbol for Right-to-Left  
  3035. Override" or other such things, unless you can show that this and other such  
  3036. codes are absolutely necessary for supporting the emulation of these Actual  
  3037. Physical Terminals.  Of course you say:
  3038.  
  3039. > (1) There is no known need for these symbols when emulating current
  3040. >     terminals.  In the future, if/when terminals are based on Unicode, they
  3041. >     might be useful in that context.  In the meantime, makers of word
  3042. >     processors, Web browsers, etc, might have a use for these glyphs.
  3043.  
  3044. So, it's my opinion that we should note the possible use, and move on.   
  3045. I.e., don't propose adding them now on the off chance the *someone* might  
  3046. have a user for them.  Wait for a use.  It's perfectly possible in  
  3047. implementations to have a "show control" mode that shows controls as glyphs,  
  3048. without having the pictures for them encoded as characters.  So if characters  
  3049. aren't in support of the graphical requirements for Actual Physical  
  3050. Terminals, they should not be proposed.  Or should be proposed separately.   
  3051. ((Here's a  little side-bar... It's sometimes desirable to separate things  
  3052. into independent proposals so that characters which appear to be  
  3053. "non-controversial" or less controversial can be put into one proposal and  
  3054. the controversial stuff in another.  That way, when committees look at them  
  3055. "formally" and vote, things move more quickly.  In practice, this can lead to  
  3056. forward progress in pieces rather than multiple rounds back into the draft  
  3057. stage for an entire set of stuff.  This happened recently with Tibetan  
  3058. extensions that were recently approved for addition.  The ad-hoc group of  
  3059. experts removed everything controversial and quickly came to consensus on an  
  3060. agreed set for immediate proposal.  If they had waited until the last bit of  
  3061. controversy were resolved for a few items, they would still not have a  
  3062. proposal today.))
  3063.  
  3064. I guess it would be nice to see this document broken into two really major  
  3065. sections -- one is an analysis of the existing controls, with recommendations  
  3066. about usage and mappings to character sets for popular Actual Physical  
  3067. Terminals, as best you're able to determine.  The other section would be  
  3068. proposed additions.
  3069.  
  3070. > Table 5.2: C1 Control Characters
  3071.  
  3072. Table 5.2 is particularly valuable information of the "here's what exists"  
  3073. variety... and given the widespread use of ISO-6249 controls, it is probably  
  3074. worth adding these.  You also say in the notes "ISO-6428".  Is that different  
  3075. from 6429?  Or just a typo?
  3076.  
  3077. > 5.3. EBCDIC Control Pictures
  3078.  
  3079. Likewise, this is valuable information.  It would be good to somehow call  
  3080. out the proposed additions, perhaps by putting an asterisk before or after  
  3081. the names.  Because they're in EBCDIC order I found it a bit hard to discern  
  3082. precisely which are proposed additions.
  3083.  
  3084. Someone from IBM should look at the 3270 stuff... I suppose someone will do so.
  3085.  
  3086. Another thing that should be discussed is when adding "symbol for foo" one  
  3087. should also add "foo" itself.  For instance, there is no "Start of Field"  
  3088. control character; but a picture of it is being proposed.  Probably UTC needs  
  3089. to hash through *that* issue...
  3090.  
  3091. > Table 6.1: Math Symbols for Terminals
  3092.  
  3093. You should look at the glyph pieces in the Adobe Symbol font, which is a  
  3094. widely used font.  Many of these are contained in the Symbol font (0xE6 to  
  3095. 0xFE inclusive).
  3096.  
  3097. I believe the following two characters are just masculine and feminine  
  3098. ordinal indicators, and are already encoded between 0x80 and 0xFF, as part of  
  3099. ISO Latin 1.  They are probably just variant glyphs... unless the  
  3100. documentation distinguishes them and they occur in pairs with lower-case.  Do  
  3101. you mean "small" or "capital"?  Or are they really different?
  3102.  
  3103. >   E0B3  Latin small letter a with underbar    SNI Math 04/04 (2)
  3104. >   E0B4  Latin capital letter O with underbar  SNI Math 04/09 (2)
  3105.  
  3106. By the way, I'm opposed quite strongly to adding the 256 "hex bytes" under  
  3107. any circumstances.  Good thing they're an indepenedent proposal.  The total  
  3108. proposed, including Hex Bytes is 448.  Without Hex Bytes, it's a modest 192,  
  3109. and I think it could be reduced with a little more unification.  Of course  
  3110. reduction will offset the expected increase due to other terminals clamoring  
  3111. to be included...
  3112.  
  3113.     Rick
  3114.  
  3115.  8-Oct-98 20:29:17-GMT,1895;000000000001
  3116. Return-Path: <unicode@unicode.org>
  3117. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  3118.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id QAA23231
  3119.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 16:29:16 -0400 (EDT)
  3120. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  3121.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id MAA06860
  3122.     ; Thu, 8 Oct 1998 12:55:10 -0700
  3123. Received: by unicode.org (NX5.67g/NX3.0S)
  3124.     id AA18332; Thu, 8 Oct 98 12:46:59 -0700
  3125. Message-Id: <9810081946.AA18332@unicode.org>
  3126. Errors-To: uni-bounce@unicode.org
  3127. Mime-Version: 1.0
  3128. Content-Type: text/plain;
  3129.     charset="iso-8859-1"
  3130. X-Uml-Sequence: 6114 (1998-10-08 19:46:44 GMT)
  3131. From: "Hart, Edwin F." <Ed.Hart@jhuapl.edu>
  3132. Reply-To: unicode@unicode.org
  3133. To: Unicode List <unicode@unicode.org>
  3134. Cc: "'Unicode List'" <unicode@unicode.org>
  3135. Date: Thu, 8 Oct 1998 12:46:43 -0700 (PDT)
  3136. Subject: RE: Terminal Graphics Draft 2
  3137.  
  3138. What should the "customary and familiar mnemonic" be?
  3139.  
  3140. One of my concerns is that the names for the EBCDIC controls seemed to vary
  3141. from device to device and with different editions of the IBM "green card"
  3142. (System/360 Reference Summary) (and "yellow card" and "pink card").  I'm
  3143. unsure how much of this has solidified and/or disappeared with IBM's SNA
  3144. devices because I have not looked at any of this in over 10 years.
  3145.  
  3146. Ed Hart
  3147.  
  3148.  
  3149.     ----------
  3150.     From:  Frank da Cruz [SMTP:fdc@watsun.cc.columbia.edu]
  3151.     Sent:  08 October, 1998 13:37
  3152.     To:  Unicode List
  3153.     Subject:  RE: Terminal Graphics Draft 2
  3154.  
  3155.     . . .
  3156.  
  3157.     I'm sure we could also find other examples of control characters
  3158.     in the C1 and EBCDIC sets whose semantics are the same or close
  3159.     but whose names differ; I don't think that means we should unify
  3160.     them.  The purpose of "display controls" is to show the customary
  3161.     and familiar mnemonic for each control character in its context so
  3162.     people can read them easily.
  3163.  
  3164.     - Frank
  3165.  
  3166.  8-Oct-98 20:52:59-GMT,1934;000000000001
  3167. Return-Path: <unicode@unicode.org>
  3168. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  3169.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id QAA01890
  3170.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 16:52:58 -0400 (EDT)
  3171. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  3172.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id NAA30836
  3173.     ; Thu, 8 Oct 1998 13:18:15 -0700
  3174. Received: by unicode.org (NX5.67g/NX3.0S)
  3175.     id AA18816; Thu, 8 Oct 98 13:09:10 -0700
  3176. Message-Id: <9810082009.AA18816@unicode.org>
  3177. Errors-To: uni-bounce@unicode.org
  3178. X-Uml-Sequence: 6115 (1998-10-08 20:09:01 GMT)
  3179. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  3180. Reply-To: unicode@unicode.org
  3181. To: Unicode List <unicode@unicode.org>
  3182. Cc: unicode@unicode.org
  3183. Date: Thu, 8 Oct 1998 13:09:00 -0700 (PDT)
  3184. Subject: RE: Terminal Graphics Draft 2
  3185.  
  3186. > What should the "customary and familiar mnemonic" be?
  3187. > One of my concerns is that the names for the EBCDIC controls seemed to vary
  3188. > from device to device and with different editions of the IBM "green card"
  3189. > (System/360 Reference Summary) (and "yellow card" and "pink card").  I'm
  3190. > unsure how much of this has solidified and/or disappeared with IBM's SNA
  3191. > devices because I have not looked at any of this in over 10 years.
  3192. I took the EBCDIC names from the current reference, and do indeed note the
  3193. fact that the names have changed over the years, and include a table of
  3194. original names for reference.  Is there any sentiment in favor of actually
  3195. encoding the old names?
  3196.  
  3197. By the way, I also omitted the mnemonics of numerous special-purpose control
  3198. sets found in the ISO Register since, to my knowledge, no terminal ever
  3199. displays these mnemonics in "display controls" mode, nor does any kind of
  3200. protocol analyzer or data scope.  I think people who look at "display
  3201. controls" screens will be satisfied with the proposed familiar set of
  3202. mnemonics.  But I could be wrong.
  3203.  
  3204. - Frank
  3205.  
  3206.  8-Oct-98 21:19:51-GMT,6421;000000000001
  3207. Return-Path: <unicode@unicode.org>
  3208. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  3209.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id RAA09529
  3210.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 17:19:47 -0400 (EDT)
  3211. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  3212.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id OAA10974
  3213.     ; Thu, 8 Oct 1998 14:18:08 -0700
  3214. Received: by unicode.org (NX5.67g/NX3.0S)
  3215.     id AA19370; Thu, 8 Oct 98 14:07:51 -0700
  3216. Message-Id: <9810082107.AA19370@unicode.org>
  3217. Errors-To: uni-bounce@unicode.org
  3218. X-Uml-Sequence: 6117 (1998-10-08 21:07:34 GMT)
  3219. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  3220. Reply-To: unicode@unicode.org
  3221. To: Unicode List <unicode@unicode.org>
  3222. Date: Thu, 8 Oct 1998 14:07:31 -0700 (PDT)
  3223. Subject: Re: Terminal Graphics Draft 2
  3224.  
  3225. Rick McGowan wrote:
  3226.  
  3227. > Frank -- I reviewed the latest draft and have more comments...
  3228. I appreciate it, thanks.
  3229.  
  3230. > I do have a problem generally with adding "picture" characters to
  3231. > correspond to existing things that are Unicode-specific.  
  3232. > ...
  3233. > So, it's my opinion that we should note the possible use, and move on.
  3234. > I.e., don't propose adding them now on the off chance the *someone* might
  3235. > have a user for them.  Wait for a use.
  3236. >
  3237. Fine with me!
  3238.  
  3239. > Table 5.2 is particularly valuable information of the "here's what exists"
  3240. > variety... and given the widespread use of ISO-6249 controls, it is probably
  3241. > worth adding these.  You also say in the notes "ISO-6428".  Is that
  3242. > different from 6429?  Or just a typo?
  3243. It's a typo; thanks for spotting it.
  3244.  
  3245. > > 5.3. EBCDIC Control Pictures
  3246. > Likewise, this is valuable information.  It would be good to somehow call
  3247. > out the proposed additions, perhaps by putting an asterisk before or after
  3248. > the names.  Because they're in EBCDIC order I found it a bit hard to discern
  3249. > precisely which are proposed additions.
  3250. I suppose the proposal is rather dense -- the inevitabal tug-of-war between
  3251. saying everything everywhere, thus making it so long nobody will read it, or
  3252. presuming it is read from top to bottom so everything is explained in advance
  3253. but must be remembered (the topological sort).  The marking of new additions
  3254. is in the left ("Code") column.  If the code is Exxx it is to be added;
  3255. otherwise it is already in Unicode (usually in the U+2xxx's).
  3256.  
  3257. But OK, I'll try to highlight them better.
  3258.  
  3259. > Someone from IBM should look at the 3270 stuff... I suppose someone will 
  3260. > do so.
  3261. I was hoping for some feedback from the IBM mainframe camp too; not just
  3262. 3270 users, but also those who analyze and debug 3270 data streams.  If any
  3263. readers happen to know people outside this group who might be interested,
  3264. please feel free to forward the proposal to them.
  3265.  
  3266. > Another thing that should be discussed is when adding "symbol for foo" one
  3267. > should also add "foo" itself.  For instance, there is no "Start of Field"
  3268. > control character; but a picture of it is being proposed.  Probably UTC
  3269. > needs to hash through *that* issue...
  3270. Oh what a tangled web we weave...  I think in this case we have an exception
  3271. to the rule.  I think we can say that Unicode is ISO/ASCII based rather than
  3272. EBCDIC based.  The structure of U+0000 through U+00FF is identical with
  3273. ASCII (= ISO 646 International Reference Version) + ISO 8859-1, with the
  3274. layout of ISO 4873 (C0, GL, C1, GR).  The C0 control set is, indeed, the 
  3275. ASCII C0 set (and that of ISO 646; ISO Registry number #001).  Granted, the
  3276. C1 area is left unspecified, but what else could it be but that of ISO 6429?
  3277.  
  3278. I think it would be pretty weird (note: this is how we spell "weird" this
  3279. week...) to add EBCDIC controls to an ISO/ASCII based character set.
  3280.  
  3281. Personally, I'd rather leave them out and use the positions they would
  3282. occupy for something more useful.  But the *symbols* for them do need
  3283. encoding, since we will be using Unicode-based software to analyze EBCDIC
  3284. and/or 3270 data streams (wire bearing EBCDIC comes into PC, which uses
  3285. Unicode internally).  However, I would heartily welcome review by IBM or
  3286. other EBCDIC/3270-centric party of the specific repertoire of glyphs in the
  3287. proposal.
  3288.  
  3289. > You should look at the glyph pieces in the Adobe Symbol font, which is a  
  3290. > widely used font.  Many of these are contained in the Symbol font (0xE6 to  
  3291. > 0xFE inclusive).
  3292. All the more reason to add them to Unicode.  Another, as Kent Karlsson
  3293. pointed out earlier today, is that they are used in TeX (see the original
  3294. TeX and METAFONT book, p.175: TeX Standard Extension Fonts).
  3295.  
  3296. > I believe the following two characters are just masculine and feminine
  3297. > ordinal indicators, and are already encoded between 0x80 and 0xFF, as part
  3298. > of ISO Latin 1.  They are probably just variant glyphs... unless the
  3299. > documentation distinguishes them and they occur in pairs with lower-case.
  3300. > Do you mean "small" or "capital"?  Or are they really different?
  3301. > >   E0B3  Latin small letter a with underbar    SNI Math 04/04 (2)
  3302. > >   E0B4  Latin capital letter O with underbar  SNI Math 04/09 (2)
  3303. Well, "small" means lowercase; "capital" actually means "big" -- who can
  3304. tell with an "O"!  Hopefully I'll be able to post GIFs of scanned pages
  3305. soon; that'll be a day's work!  The reason these need to be encoded
  3306. separately from feminine/masculine ordinals are their size -- they fill the
  3307. whole cell, like a regular letter.  Since terminal emulators and data
  3308. analyzers use fixed-pitch fonts, we can't just switch to another point size
  3309. to display these characters, since that will wreck the matrix arrangement
  3310. of the screen.
  3311.  
  3312. > By the way, I'm opposed quite strongly to adding the 256 "hex bytes" under
  3313. > any circumstances.  Good thing they're an indepenedent proposal.
  3314. >
  3315. I certainly would not want to see them hold up the rest.
  3316.  
  3317. > The total proposed, including Hex Bytes is 448.  Without Hex Bytes, it's a
  3318. > modest 192, and I think it could be reduced with a little more unification.
  3319. > Of course reduction will offset the expected increase due to other
  3320. > terminals clamoring to be included...
  3321. Yes, I see the mobs starting to form on the street below, waving placards
  3322. emblazoned with vertical lightnings with solidi; diagonal lightnings with
  3323. horizontal bars; European no-parking signs; Canadian moose-crossing signs...
  3324.  
  3325. Seriously, the hex bytes are entirely separable from the rest.  I'll be
  3326. glad to cut them loose unless somebody speaks up strongly in their favor.
  3327.  
  3328. Thanks again!
  3329.  
  3330. - Frank
  3331.  
  3332.  8-Oct-98 21:31:49-GMT,6665;000000000011
  3333. Return-Path: <tzha0@amdahl.com>
  3334. Received: from orpheus.amdahl.com (orpheus.amdahl.com [159.199.101.3])
  3335.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with SMTP id RAA13325
  3336.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 17:31:47 -0400 (EDT)
  3337. Received: from minerva.amdahl.com([129.212.33.25]) (6252 bytes) by orpheus.amdahl.com
  3338.     via sendmail with P:smtp/R:match-mx-hosts/T:smtp
  3339.     (sender: <tzha0@amdahl.com>) 
  3340.     id <m0zRNeu-0008eGC@orpheus.amdahl.com>
  3341.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 14:31:40 -0700 (PDT)
  3342.     (Smail-3.2.0.102 1998-Aug-2 #1 built 1998-Aug-14)
  3343. Received: from libra by minerva.amdahl.com with smtp
  3344.     (Smail3.1.29.1 #5) id m0zRNdh-0001THC; Thu, 8 Oct 98 14:30 PDT
  3345. Message-Id: <m0zRNdh-0001THC@minerva.amdahl.com>
  3346. From: "Tony Harminc" <tzha0@amdahl.com>
  3347. To: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  3348. Date: Thu, 8 Oct 1998 17:31:54 -0400
  3349. MIME-Version: 1.0
  3350. Content-type: text/plain; charset=US-ASCII
  3351. Content-transfer-encoding: 7BIT
  3352. Subject: Re: Terminal Graphics Draft 2
  3353. Priority: normal
  3354. In-reply-to: <9810080053.AA13270@unicode.org>
  3355. X-mailer: Pegasus Mail for Win32 (v3.01a)
  3356.  
  3357. Just a few very minor comments.  In general my comments are not meant 
  3358. to be inserted as text - they're for your information.  I've left 
  3359. headings in to help identify the places.
  3360.  
  3361. > This document represents a survey of the following terminals:
  3362.  
  3363. >   IBM 3164 and 3270 [15,16,27]
  3364.  
  3365. Really, "3270" is not a terminal, i.e. there has never been a device 
  3366. made by IBM with that model number.  Rather, 3270 is an architecture, 
  3367. with a large number of IBM terminals having been made that conform in 
  3368. varying degrees to its specifications.  Typical 3270 model numbers 
  3369. are 3277 (the earliest implementation c. 1971), 3278 (the thing that 
  3370. most people think of when they think of a "real" 3270, c. 1977), and 
  3371. 3178 (a simpler, cheaper version c. 1982).
  3372.  
  3373.  
  3374. > 3.1. Temporary Reference Code Assignments
  3375. > The characters proposed in this document are assigned temporary Unicode
  3376. > values from the Private Use area, strictly for reference within (or to)
  3377. > this document only.  Final values should be assigned out of the Private
  3378.                                                        ^^^^^^
  3379. Should probably read "outside of" to avoid ambiguity
  3380.  
  3381.  
  3382. > 5.3. EBCDIC Control Pictures
  3383.  
  3384. > Table 5.3 shows the EBCDIC control characters [29], in EBCDIC order.  The
  3385. > Code column shows the Unicode value; those starting with 24 are already in
  3386. > Unicode block U+2400; those starting with E need to be added.  The Val
  3387. > column shows the EBCDIC value (hex).  The Name column shows the EBCDIC
  3388. > abbreviation for the code, and the description lists "Symbol for" plus the
  3389. > EBCDIC name.  There are no known "2X" forms in use.
  3390.                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  3391. I don't understand what this means.  Are you saying that none of the 
  3392. EBCDIC control characters in the range X'20'-X'2F' are in use ?  This 
  3393. is certainly not true.  It probably means something else, but it's 
  3394. not obvious to me.
  3395.  
  3396.  
  3397. > 5.5. 3270 Terminal Operator Status Indicators
  3398. > The IBM 3270 terminal displays a variety of unique glyphs in its Operator
  3399. > Information Area [15, Figure A-4].  Although they are not encoded in any IBM
  3400. > character set (known to me), they nevertheless appear on the screen, and are
  3401. > therefore required for accurate terminal emulation.  These glyphs are listed
  3402. > in Table 5.5.
  3403.  
  3404. In particular, they are not assigned GCGIDs in [29 as updated].
  3405.  
  3406. > Table 5.5: 3270 Terminal Operator Status Indicators
  3407. >   Code  Description
  3408. >   E080  Human stick figure
  3409. >   E081  Human stick figure in box
  3410. >   E082  Clock at 6:10 (or 1:30)
  3411.  
  3412. Oops - I think I meant 2:30. :-)  The hands are the same length.
  3413. As for the double vs single width issue, I did look at some "real" 
  3414. 3270s today, unfortunately made by Memorex/Telex (who were never 
  3415. known for great faithfulness to the IBM model).  They have a very 
  3416. tall, thin, squished looking clock that is clearly a single cell.  
  3417. One PC-based terminal emulator I have is TCP3270 from McGill 
  3418. University (since sold to Hummingbird Communications), and it ships a 
  3419. font with the two clock halves in separate characters in order to get 
  3420. a satisfactorily round clock face of legible size.  It winds up being 
  3421. a 1 1/2 width character.
  3422.  
  3423. >   E083  White rectangle with stroke (1)
  3424. >   E084  Black rectangle with stroke (2)
  3425. >   E085  Lighting with stroke (3)
  3426. >   E086  Security key (4)
  3427. >   E087  Black and White Right-Pointing Triangles (5)
  3428.  
  3429. Elsewhere it was suggested that the 4 and 6 in boxes were just 
  3430. inverse video characters; I think they are different.  In particular, 
  3431. if we have a "white" numeral, then the surrounding box is also 
  3432. "white", and the background inside the box is "black".
  3433.  
  3434. > Notes:
  3435. >  (1) A rectangle like the one at U+25AD with an oblique stroke through it.
  3436. >      Note that "white" and "black" are used in the sense of the Unicode
  3437. >      standard, and do not imply any particular colors or measure of goodness.
  3438. >  (2) A rectangle like the one at U+25AC with an oblique stroke through it.
  3439. >  (3) A horizontal lightning symbol with an oblique stroke through it.
  3440. >  (4) A picture of a key (indicating the keyboard is locked).
  3441.  
  3442. This should not be unified with other lock or key-like symbols, in 
  3443. particular with the locked padlock commonly used to indicate shift 
  3444. lock.  (This isn't in Unicode, I believe, but I think is part of Alan 
  3445. LaBonte's keyboard standards, and so might get in via that route.) 
  3446. This one is a key (rather than a lock) to show that a (physical) key 
  3447. is needed to use the terminal.
  3448.  
  3449.  
  3450. > 10. REFERENCES
  3451.  
  3452. > [13] IBM System/360 Principles of Operation, GA22-6821-8, Poughkeepsie,
  3453. >      NY, 1970.
  3454.  
  3455. I would ditch the reference to the S/360 POO - it's been pretty much 
  3456. obsolete since 1970 or so.  Fine for a historic reference, but I 
  3457. think [29] (as updated) is the better ref.
  3458.  
  3459. > [14] IBM National Language Design Guide, Volume 2:  National Language
  3460. >      Support Reference Manual, 4th Edition, North York, ON, 1994.
  3461.  
  3462.        (Order number SE09-8002-03)
  3463.       
  3464.  
  3465. > [29] IBM Character Data Representation Architecture, Level 1 Registry,
  3466. >      IBM Canada Ltd., National Language Technical Centre, Ontario,
  3467. >      SC09-1391-00, 1990.
  3468.  
  3469. The above publication is obsolete, and is replaced by:
  3470.  
  3471.        IBM Character Data Representation Architecture, Registration
  3472.        and Registry, IBM Canada Ltd., Toronto, SC09-2190-00, 1995.
  3473. (This is a 300 page book also containing two CD-ROMs.)
  3474.        
  3475.  
  3476. Thanks for doing all this work.  I hope the views of the likes of 
  3477. Michael Everson ("Unicode will be in use for centuries" with the 
  3478. implication that all these silly terminal emulations are just 
  3479. dinosaurs) will not prevail.
  3480.  
  3481. Cheers... Tony H.
  3482.  
  3483.  8-Oct-98 21:52:29-GMT,2360;000000000001
  3484. Return-Path: <unicode@unicode.org>
  3485. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  3486.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id RAA20099
  3487.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 17:52:27 -0400 (EDT)
  3488. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  3489.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id OAA41846
  3490.     ; Thu, 8 Oct 1998 14:48:19 -0700
  3491. Received: by unicode.org (NX5.67g/NX3.0S)
  3492.     id AA19672; Thu, 8 Oct 98 14:28:58 -0700
  3493. Message-Id: <9810082128.AA19672@unicode.org>
  3494. Errors-To: uni-bounce@unicode.org
  3495. X-Uml-Sequence: 6118 (1998-10-08 21:27:30 GMT)
  3496. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  3497. Reply-To: unicode@unicode.org
  3498. To: Unicode List <unicode@unicode.org>
  3499. Date: Thu, 8 Oct 1998 14:27:29 -0700 (PDT)
  3500. Subject: Re: Terminal Graphics Draft 2
  3501.  
  3502. I neglected to answer this one...
  3503.  
  3504. > > Digital VT220 and higher terminals, as well as Televideo, Wyse, HP, Perkin
  3505. > > Elmer, and other models, allow the user to select whether control
  3506. > > characters are acted upon or displayed graphically.  Unicode itself
  3507. > > includes its own ...
  3508. > Well, to my mind that indicates that these aren't NEEDED to be encoded at
  3509. > all!  Just set the terminal emulator into the "display controls" mode and
  3510. > let it display the glyphs that the emulator has for the control codes.
  3511. >
  3512. Good point.  Indeed, this character set, unlike others in the VT220 (and
  3513. higher) can not be selected by the host using ISO 2022 escape sequences, which
  3514. makes sense -- the familiar "transparent mode" conundrum -- once entered, how
  3515. then to exit, since everything is transparent?
  3516.  
  3517. However, this is not to say that other terminals, such as the Wyse 60, which
  3518. do not comply with ISO 2022 rules, do allow the host to command them into
  3519. "display controls" mode.
  3520.  
  3521. In any case, the control-picture symbols must be encoded because we're
  3522. concerned not only about the terminal emulator but also the applications it
  3523. must interact with, as in:
  3524.  
  3525.   User: "Help, my screen is messed up!"
  3526.  
  3527.   Help desk: "OK, click on Debug in the Terminal window menu bar
  3528.     and repeat what you did before."
  3529.  
  3530.   User: "Now my screen is REALLY messed up!"
  3531.  
  3532.   Help desk: "Let's have a look.  Please use your mouse to copy it
  3533.     and paste it into your email window and send it to us."
  3534.  
  3535. This is, of course, looking forward to the day when All Is Unicode...
  3536.  
  3537. - Frank
  3538.  
  3539.  8-Oct-98 22:14:17-GMT,2992;000000000001
  3540. Return-Path: <unicode@unicode.org>
  3541. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  3542.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id SAA25881
  3543.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 18:14:16 -0400 (EDT)
  3544. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  3545.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id PAA15352
  3546.     ; Thu, 8 Oct 1998 15:11:49 -0700
  3547. Received: by unicode.org (NX5.67g/NX3.0S)
  3548.     id AA19887; Thu, 8 Oct 98 14:44:41 -0700
  3549. Message-Id: <9810082144.AA19887@unicode.org>
  3550. Errors-To: uni-bounce@unicode.org
  3551. X-Uml-Sequence: 6119 (1998-10-08 21:43:01 GMT)
  3552. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  3553. Reply-To: unicode@unicode.org
  3554. To: Unicode List <unicode@unicode.org>
  3555. Date: Thu, 8 Oct 1998 14:43:00 -0700 (PDT)
  3556. Subject: Re: Terminal Graphics Draft 2
  3557.  
  3558. John Cowan wrote:
  3559.  
  3560. > I agree with Rick: don't propose characters that someone might need
  3561. > someday.  There are quite enough characters, and indeed whole
  3562. > scripts, that are not yet available!
  3563. > >   2421   7F   DEL   DT   Symbol for Delete (3)
  3564. > [...]
  3565. > >   (3) Not, strictly speaking, a control character, but not a visible
  3566. > >       one either.
  3567. > DEL is a control character in every sense, despite its position at 7F.
  3568. >  
  3569. It depends who you ask.  ISO 6429, 3rd Edition, 1992, says (in Annex F,
  3570. section 8.1) "The character DELETE..., not being a control function in the
  3571. strict sense, has been removed from the body of this International Standard."
  3572.  
  3573. DELETE and SPACE are special to ISO 4873 and ISO 2022, in which "character
  3574. sets" (as we think of them, monolithically) are actually composed of a control
  3575. portion (C0 or C1), SPACE (or not), a graphics portion, and DELETE (or not).
  3576.  
  3577. SPACE is a character set unto itself, and so is DELETE.  If one is present,
  3578. the other must be too, in which case the graphics set is a 94-byte character
  3579. set (with a little "byte" taken out of the northwest and southeast corner),
  3580. and this is crucial to its identification.  When SPACE and DELETE are not
  3581. present, it is a 96-byte set (such as "the right half of ISO-8859 Latin
  3582. Alphabet 1").
  3583.  
  3584. > > 5.3. EBCDIC Control Pictures
  3585. > Note: the EBCDIC/Unicode mapping tables at the Unicode FTP site
  3586. > map the EBCDIC-specific controls onto the C1 space, but the mapping
  3587. > seems to make no sense.  For example, EBCDIC 09 (Superscript)
  3588. > is mapped to Unicode 008D (Reverse Line Feed).  Why?
  3589. IBM provides its own EBCDIC / ASCII control-character mapping in the CDRA.
  3590. Of course it is inadequate as there are 64 EBCDIC control characters (three
  3591. undefined), but there are only 32 in ASCII.
  3592.  
  3593. In any case, we don't care about ASCII/EBCDIC mapping here.  The need is
  3594. for glyphs for visual representation of each EBCDIC control character,
  3595. by name so people who live in the EBCDIC / 3270 world who must debug EBCDIC
  3596. and/or 3270 data streams using Unicode-based software will be able to see
  3597. these control characters represented by the names they are known by in
  3598. the EBCDIC/3270 world.
  3599.  
  3600. - Frank
  3601.  
  3602.  8-Oct-98 23:08:25-GMT,7301;000000000001
  3603. Return-Path: <unicode@unicode.org>
  3604. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  3605.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id TAA10645
  3606.     for <fdc@watsun.cc.columbia.edu>; Thu, 8 Oct 1998 19:08:24 -0400 (EDT)
  3607. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  3608.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id QAA41818
  3609.     ; Thu, 8 Oct 1998 16:02:17 -0700
  3610. Received: by unicode.org (NX5.67g/NX3.0S)
  3611.     id AA20721; Thu, 8 Oct 98 15:56:45 -0700
  3612. Message-Id: <9810082256.AA20721@unicode.org>
  3613. Errors-To: uni-bounce@unicode.org
  3614. X-Uml-Sequence: 6120 (1998-10-08 22:56:30 GMT)
  3615. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  3616. Reply-To: unicode@unicode.org
  3617. To: Unicode List <unicode@unicode.org>
  3618. Date: Thu, 8 Oct 1998 15:56:28 -0700 (PDT)
  3619. Subject: Re: Terminal Graphics Draft 2
  3620.  
  3621. "Tony Harminc" <tzha0@amdahl.com> wrote:
  3622.  
  3623. > Just a few very minor comments.  In general my comments are not meant 
  3624. > to be inserted as text - they're for your information.  I've left 
  3625. > headings in to help identify the places.
  3626. I appreciate them, many thanks!
  3627.  
  3628. > > This document represents a survey of the following terminals:
  3629. > > 
  3630. > >   IBM 3164 and 3270 [15,16,27]
  3631. > Really, "3270" is not a terminal, i.e. there has never been a device 
  3632. > made by IBM with that model number.  Rather, 3270 is an architecture...
  3633. >
  3634. Right -- sloppy wording again.
  3635.  
  3636. > with a large number of IBM terminals having been made that conform in 
  3637. > varying degrees to its specifications.  Typical 3270 model numbers 
  3638. > are 3277 (the earliest implementation c. 1971), 3278 (the thing that 
  3639. > most people think of when they think of a "real" 3270, c. 1977)
  3640. >
  3641. The one that weighs about 700 pounds :-) (318 Kg)
  3642.  
  3643. (Actually it's not so heavy compared to the 2741...)
  3644.  
  3645. > > 5.3. EBCDIC Control Pictures
  3646. > ...
  3647. > > EBCDIC name.  There are no known "2X" forms in use.
  3648. >                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  3649. > I don't understand what this means.  Are you saying that none of the 
  3650. > EBCDIC control characters in the range X'20'-X'2F' are in use ?  This 
  3651. > is certainly not true.  It probably means something else, but it's 
  3652. > not obvious to me.
  3653. Sorry, sequential reading required again :-)  You probably skipped directly
  3654. to the EBCDIC sections.  "2X" was my shorthand for 2-character abbreviations
  3655. for 3-character mnemonics, such as used in the Display Controls font of
  3656. Wyse and Televideo terminals (see Section 5.1).
  3657.  
  3658. > > Table 5.5: 3270 Terminal Operator Status Indicators
  3659. > > 
  3660. > >   Code  Description
  3661. > >   E080  Human stick figure
  3662. > >   E081  Human stick figure in box
  3663. > >   E082  Clock at 6:10 (or 1:30)
  3664. > Oops - I think I meant 2:30. :-)
  3665. >
  3666. Oops, right.
  3667.  
  3668. > As for the double vs single width issue, I did look at some "real" 
  3669. > 3270s today, unfortunately made by Memorex/Telex (who were never 
  3670. > known for great faithfulness to the IBM model).  They have a very 
  3671. > tall, thin, squished looking clock that is clearly a single cell.  
  3672. > One PC-based terminal emulator I have is TCP3270 from McGill 
  3673. > University (since sold to Hummingbird Communications), and it ships a 
  3674. > font with the two clock halves in separate characters in order to get 
  3675. > a satisfactorily round clock face of legible size.  It winds up being 
  3676. > a 1 1/2 width character.
  3677. Do you think this is worth worrying about?  We certainly have a lot of
  3678. glyphs in Unicode that are more complex than this but, presumably, fit
  3679. in a single cell.
  3680.  
  3681. > >   E083  White rectangle with stroke (1)
  3682. > >   E084  Black rectangle with stroke (2)
  3683. > >   E085  Lighting with stroke (3)
  3684. > >   E086  Security key (4)
  3685. > >   E087  Black and White Right-Pointing Triangles (5)
  3686. > Elsewhere it was suggested that the 4 and 6 in boxes were just 
  3687. > inverse video characters; I think they are different.  In particular, 
  3688. > if we have a "white" numeral, then the surrounding box is also 
  3689. > "white", and the background inside the box is "black".
  3690. Do you think it matters?  We need to conserve code points whenever possible;
  3691. in this case it would seem to me that no information is lost by displaying
  3692. full-cell inverse video digits.  I should probably have a look at a real
  3693. 327x...
  3694.  
  3695. > >  (4) A picture of a key (indicating the keyboard is locked).
  3696. > This should not be unified with other lock or key-like symbols, in 
  3697. > particular with the locked padlock commonly used to indicate shift 
  3698. > lock.  (This isn't in Unicode, I believe, but I think is part of Alan 
  3699. > LaBonte's keyboard standards, and so might get in via that route.) 
  3700. > This one is a key (rather than a lock) to show that a (physical) key 
  3701. > is needed to use the terminal.
  3702. Noted.  And I do remember seeing a padlock on an IBM 327x terminal screen,
  3703. don't I?  It was a long time ago, maybe I dreamed it.  Anyway, I can't find
  3704. any reference to it now.
  3705.  
  3706. > > [13] IBM System/360 Principles of Operation, GA22-6821-8, Poughkeepsie,
  3707. > >      NY, 1970.
  3708. > I would ditch the reference to the S/360 POO - it's been pretty much
  3709. > obsolete since 1970 or so.  Fine for a historic reference, but I think
  3710. > [29] (as updated) is the better ref.
  3711. >
  3712. This is my reference for Table 5.3A.  Thanks for the other updated 
  3713. references.
  3714.  
  3715. > Thanks for doing all this work.  I hope the views of the likes of 
  3716. > Michael Everson ("Unicode will be in use for centuries" with the 
  3717. > implication that all these silly terminal emulations are just 
  3718. > dinosaurs) will not prevail.
  3719. Michael's views are mainstream.  In any case, Michael is a passionate
  3720. advocate of some of my favorite scripts :-)  I certainly would not want
  3721. to see (say) hex bytes squeezing out (say) Nordic or Irish runes.
  3722.  
  3723. Terminals (or emulators -- including xterms and the like), protocol
  3724. analyzers, escape sequences, termcaps, timesharing systems, mainframes, etc,
  3725. are approximately as widespread now as they ever were, but around them has
  3726. grown an entirely new world of Windows and GUIs and Web browsers, and this
  3727. is all we hear about in the mass market.
  3728.  
  3729. Younger people are not even aware of this older world, quietly doing its job
  3730. in its unglamorous "machine rooms", just as passengers on an ocean liner
  3731. could be unaware of what went on below decks.  I have seen Columbia students
  3732. drop their jaws in amazement upon first seeing a terminal emulation screen
  3733. -- let alone an actual terminal -- "What's THAT????  It's so UGLY!".  But
  3734. that world is there; we all depend on it, and it's not going anywhere.
  3735.  
  3736. (Really.  Nothing ever quite disappears.  I have heard of a payroll system
  3737. that was originally written in the early 1960s for an IBM ... OK, I forget
  3738. the exact model number -- 1104 or something like that.  When that machine
  3739. was replaced by a 7094 (?), the same payroll system ran under an 1104
  3740. emulator.  When the 7094 was replaced by a 360, it still ran on the 1104
  3741. emulator, which itself ran on a 7094 emulator.  And so on and so on, legend
  3742. has it, to this day.)
  3743.  
  3744. - Frank
  3745.  
  3746. P.S. This is coming to you from the original IBM Thomas J Watson Research
  3747. Laboratory, where IBM developed much of its 1940s and 50s technology before
  3748. turning the building over to Columbia University in 1955 and moving to
  3749. Yorktown Heights (no, I wasn't here then).  "THIMK" :-)
  3750.  
  3751. P.P.S. A slightly updated draft (2.5), based on today's discussion, is in
  3752. the usual place (get out your clickers): 
  3753.  
  3754.   ftp://kermit.columbia.edu/kermit/charsets/ucsterminal.txt
  3755.  
  3756. (End)
  3757.  
  3758.  9-Oct-98  5:28:10-GMT,2059;000000000001
  3759. Return-Path: <unicode@unicode.org>
  3760. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  3761.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id BAA01525
  3762.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 01:28:09 -0400 (EDT)
  3763. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  3764.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id WAA47442
  3765.     ; Thu, 8 Oct 1998 22:27:49 -0700
  3766. Received: by unicode.org (NX5.67g/NX3.0S)
  3767.     id AA21907; Thu, 8 Oct 98 22:19:52 -0700
  3768. Message-Id: <9810090519.AA21907@unicode.org>
  3769. Errors-To: uni-bounce@unicode.org
  3770. Mime-Version: 1.0
  3771. Content-Type: text/plain; charset=us-ascii
  3772. Content-Transfer-Encoding: 7bit
  3773. X-Uml-Sequence: 6121 (1998-10-09 05:19:27 GMT)
  3774. From: Geoffrey Waigh <gpw@cybersurf.net>
  3775. Reply-To: unicode@unicode.org
  3776. To: Unicode List <unicode@unicode.org>
  3777. Date: Thu, 8 Oct 1998 22:19:25 -0700 (PDT)
  3778. Subject: Re: Terminal Graphics Draft 2
  3779. Content-Transfer-Encoding: 7bit
  3780.  
  3781. To interject a small point on the matter of high-fidelity terminal
  3782. emulation; the vast majority of emulation users are not going to
  3783. quibble over the exact appearance or dimensions of the status area
  3784. indicators.  When I worked for a company doing terminal emulation,
  3785. the customers only wanted it to run their applications correctly
  3786. and support a bizarre array of kludges^H^H^H^H^H^H^Hfeatures that
  3787. let them improve performance/functionality of their system.  Quite
  3788. a few terminal features were missing until a new customer needed
  3789. it and I was appalled at how divergent some of the character code
  3790. to glyph mappings that customers ended up with were.  [When I was
  3791. migrating the system to Unicode the fonts, character sets and
  3792. character -> glyph mappings were cleaned up.]
  3793.  
  3794. Also on the matter of debugging 5250/3270 streams our developers
  3795. always used an ASCII text representation.  There wasn't any desire
  3796. that I can recall for fancy debugging fonts from either our
  3797. technical staff or our customers.  (Then again the customers
  3798. usually left terminal protocol analysis to our support group.)
  3799.  
  3800. Geoffrey Waigh
  3801. gpw@cybersurf.net
  3802.  
  3803.  9-Oct-98  7:25:55-GMT,2599;000000000001
  3804. Return-Path: <unicode@unicode.org>
  3805. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  3806.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id DAA20023
  3807.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 03:25:53 -0400 (EDT)
  3808. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  3809.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id AAA43726
  3810.     ; Fri, 9 Oct 1998 00:24:28 -0700
  3811. Received: by unicode.org (NX5.67g/NX3.0S)
  3812.     id AA22250; Fri, 9 Oct 98 00:12:21 -0700
  3813. Message-Id: <9810090712.AA22250@unicode.org>
  3814. Errors-To: uni-bounce@unicode.org
  3815. Mime-Version: 1.0
  3816. Content-Type: text/plain; charset="iso-8859-1"
  3817. X-Uml-Sequence: 6122 (1998-10-09 07:12:10 GMT)
  3818. From: Paul Keinanen <keinanen@sci.fi>
  3819. Reply-To: unicode@unicode.org
  3820. To: Unicode List <unicode@unicode.org>
  3821. Date: Fri, 9 Oct 1998 00:12:09 -0700 (PDT)
  3822. Subject: Re: Terminal Graphics Draft 2
  3823. Content-Transfer-Encoding: 8bit
  3824. X-MIME-Autoconverted: from quoted-printable to 8bit by watsun.cc.columbia.edu id DAA20023
  3825.  
  3826. At 13:44 8.10.1998 -0700, John Cowan wrote:
  3827. >Frank da Cruz wrote:
  3828. >
  3829.  
  3830. >>   2421   7F   DEL   DT   Symbol for Delete (3)
  3831. >
  3832. >[...]
  3833. >
  3834. >>   (3) Not, strictly speaking, a control character, but not a visible
  3835. >>       one either.
  3836. >
  3837. >DEL is a control character in every sense, despite its position at 7F.
  3838.  
  3839. The situation with Delete/Rubout is a bit complicated, depending on usage.
  3840. In the VTxxx environment it is clearly a control function (erasing the
  3841. previous character), but originally the code for Delete/Rubout was chosen
  3842. for Teletype style paper tape manual entry. If you hit the wrong key, you
  3843. manually stepped back the tape one character and overpunched all 7 holes (7F
  3844. in 7 bit+odd parity) or all 8 holes (FF in 7 bit+even parity) and the
  3845. reader/computer would then ignore the character. In that sense it is a dummy
  3846. nonspaced character. When using a Teletype with a paper tape reader, you had
  3847. to be careful to have the computer in correct mode for manual resp. paper
  3848. tape reader input.
  3849.  
  3850. Due to this duality,  should Rubout and Delete be concidered to be two
  3851. separate characters,  although they seem to have the same code point in all
  3852. ASCII based character sets ? Probably not, as we try to unify other
  3853. characters as well, but at least the Rubout functionality should also be
  3854. included in the description. You could of course argue that the Rubout
  3855. functionality is either a nonspaced dummy character just in the same way as
  3856. NUL, but as NUL is concidered a control character, thus the Rubout should
  3857. also be concidered a control character. 
  3858.  
  3859. So indeed, there can be many interpretations.
  3860.  
  3861.  
  3862. Paul KeinΣnen
  3863.  
  3864.  9-Oct-98 13:40:53-GMT,1567;000000000001
  3865. Return-Path: <Paul.Williams@rrds.co.uk>
  3866. Received: from mailrelay1.cc.columbia.edu (mailrelay1.cc.columbia.edu [128.59.35.143])
  3867.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id JAA02739
  3868.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 09:40:52 -0400 (EDT)
  3869. Received: from cyber (gate1.rrds.co.uk [195.166.41.35])
  3870.     by mailrelay1.cc.columbia.edu (8.8.5/8.8.5) with SMTP id JAA00654
  3871.     for <fdc@columbia.edu>; Fri, 9 Oct 1998 09:40:48 -0400 (EDT)
  3872. Sender: pawillia@rrds.co.uk
  3873. Message-Id: <361E101C.E3A323C1@rrds.co.uk>
  3874. Date: Fri, 09 Oct 1998 14:31:09 +0100
  3875. From: Paul Williams <Paul.Williams@rrds.co.uk>
  3876. Organization: Racal Radar Defence Systems Ltd
  3877. X-Mailer: Mozilla 4.02 [en] (X11; I; SunOS 5.5.1 sun4m)
  3878. MIME-Version: 1.0
  3879. To: fdc@columbia.edu
  3880. Subject: Terminal Graphics for Unicode. Trainspotter Alert!
  3881. Content-Type: text/plain; charset=us-ascii
  3882. Content-Transfer-Encoding: 7bit
  3883.  
  3884. Frank,
  3885.  
  3886. [Your email inbox must be huge. Please don't feel obliged to reply to
  3887. this.]
  3888.  
  3889. I've just been reading your very interesting proposal to add characters
  3890. found in terminal repertoires to the Unicode standard. Although I expect
  3891. that point 2 in the Problems section doesn't hold true for the VT320,
  3892. i.e. "Lack of definitive, high-quality pictures of the glyphs in some
  3893. cases", you may still like to take a look at:
  3894.  
  3895. http://www.celigne.co.uk/terminal/built-in_glyphs.html
  3896.  
  3897. I do realise that this is the work of a complete anorak, but it is
  3898. part of my project to write a "real" VT320 terminal emulator and
  3899. document it completely.
  3900.  
  3901. Regards,
  3902. Paul
  3903. [not speaking on behalf of my employer]
  3904.  
  3905.  9-Oct-98 13:54:43-GMT,3358;000000000001
  3906. Return-Path: <fdc>
  3907. Received: (from fdc@localhost)
  3908.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id JAA06407;
  3909.     Fri, 9 Oct 1998 09:54:39 -0400 (EDT)
  3910. Sender: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  3911. Date: Fri, 9 Oct 98 9:54:38 EDT
  3912. From: Kermit Software Support <kermit-support@columbia.edu>
  3913. To: Karlsson Kent - keka <keka@im.se>
  3914. Subject: Re: Kermit95
  3915. In-Reply-To: Your message of Fri, 9 Oct 1998 11:52:00 +0200
  3916. Cc: kermit-support@columbia.edu
  3917. Reply-To: kermit-support@columbia.edu
  3918. Message-ID: <CMM.0.90.4.907941278.fdc@watsun.cc.columbia.edu>
  3919.  
  3920. > I have a few questions:
  3921. >
  3922. > 1. Can one use Unicode (UTF-16, either endianism, or UTF-8) on the host
  3923. > side, i.e. 'on the wire' (between the host and Kermit)?=A0 (This would
  3924. > be for a Unicode enabled application on the host.)
  3925. >
  3926. Not yet.  So far nobody has asked for it.  In any case, I have not heard of
  3927. any platform that offers UTF-8 host-terminal sessions.  Well, maybe Plan 9?
  3928.  
  3929. But yes, we do plan to add UTF-8 support, even in advance of user demand.
  3930.  
  3931. > 2. Is the Unicode enabled Kermit available also on Win95/98?
  3932. > it only for NT?
  3933. >
  3934. It's only for NT because, at present, Kermit 95 is a console application,
  3935. and Unicode is not supported in console windows on Windows 95/98.
  3936.  
  3937. > 3. Can one use Kanji/Hangul etc. with Kermit95? Can one use proportional
  3938. > width fonts in general with Kermit95?
  3939. >
  3940. DCBS is problematic in console windows.  Proportional-width fonts don't
  3941. usually make sense in a terminal screen.  However, when K-95 is converted to
  3942. full GUI form, the user should be able to choose any font at all, including a
  3943. proportional one.
  3944.  
  3945. >From the Kermit 95 FAQ:
  3946.  
  3947.   There is no explicit support in Kermit 95 for Chinese, Japanese, or
  3948.   Korean (CJK), but you still might be able to view CJK in a Kermit 95
  3949.   window if (a) your PC is configured to allow it; (b) the CJK character
  3950.   set used on your PC is the same as that on the host; (c) K95 has been
  3951.   told to "set terminal character-set transparent" and "set terminal
  3952.   bytesize 8". However, the ability to view CJK text does not necessarily
  3953.   mean you can also enter it.  According to Microsoft Knowledge Base
  3954.   Article Q156793, CJK Input Method Editors are not available in Console
  3955.   windows under Windows 95, even though they are available in Windows NT
  3956.   3.51 and later.  Explicit support for CJK terminal emulation is planned
  3957.   for future releases of Kermit 95, after release of the GUI.
  3958.  
  3959. We do, however, support translation among the full range of Kanji character
  3960. sets during file transfer.
  3961.  
  3962. > (I.e. can I use, e.g. Bitstreams Cyberbit font to display
  3963. > Latin/Hangul/Kanji/Hiragana/...?)
  3964. >
  3965. Maybe in NT.  Certainly not in Win95/98 at present.
  3966.  
  3967. > 4. Can Kermit95 properly handle (a non-empty subset of) combining
  3968. > characters?  Conjoining Hangul Jamo?
  3969. >
  3970. No.
  3971.  
  3972. > 5. Can Kermit95 interpret ESC-sequences, so that (terminalish) forms
  3973. > can be drawn, and filled in? (ECS-sequence positioning would be to a "cell
  3974. > grid", but text strings should still be displayable via a proportional font).
  3975. >
  3976. Yes, except for the proprortional font part.  All terminals emulated by
  3977. Kermit 95 use fixed-pitch fonts, and so all of Kermit 95's emulations
  3978. assume a regular matrix of screen cells.  Are you aware of any terminal
  3979. that does not follow this model?
  3980.  
  3981. > 6. Can Kermit be used together with an IME (to input, e.g. Kanji).
  3982. > (Just asking...)
  3983. >
  3984. See FAQ quote above.
  3985.  
  3986. - Frank
  3987.  
  3988.  9-Oct-98 14:09:23-GMT,3918;000000000001
  3989. Return-Path: <jaltman>
  3990. Received: (from jaltman@localhost)
  3991.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id KAA10541;
  3992.     Fri, 9 Oct 1998 10:09:21 -0400 (EDT)
  3993. Sender: Jeffrey Altman <jaltman@watsun.cc.columbia.edu>
  3994. Date: Fri, 9 Oct 98 10:09:20 EDT
  3995. From: kermit-support@watsun.cc.columbia.edu
  3996. To: kermit-support@columbia.edu
  3997. Cc: Karlsson Kent - keka <keka@im.se>, kermit-support@columbia.edu
  3998. Subject: Re: Kermit95
  3999. In-Reply-To: Your message of Fri, 9 Oct 98 9:54:38 EDT
  4000. Reply-To: kermit-support@watsun.cc.columbia.edu
  4001. Message-ID: <CMM.0.90.4.907942160.jaltman@watsun.cc.columbia.edu>
  4002.  
  4003. Let me elaborate on some of the responses in more detail.
  4004.  
  4005. > > 2. Is the Unicode enabled Kermit available also on Win95/98?
  4006. > > it only for NT?
  4007. > >
  4008. > It's only for NT because, at present, Kermit 95 is a console application,
  4009. > and Unicode is not supported in console windows on Windows 95/98.
  4010.  
  4011. All versions of K95 use Unicode internally during terminal emulation.
  4012. In other words, all remote character-sets are translated to Unicode
  4013. and stored in the screen buffer.  On NT, Unicode is used for display
  4014. because it is supported by the OS.  On Win95/98 and OS/2 the Unicode
  4015. characters are converted to the equivalent character (if one exists)
  4016. in the code page used on the local system.
  4017.  
  4018. Adding support for host based UTF-7 or UTF-8 in conjunction with an
  4019. existing terminal emulation will not be difficult.  If you have a host
  4020. application that does this, we would like to know about it.
  4021.  
  4022. > > 3. Can one use Kanji/Hangul etc. with Kermit95? Can one use proportional
  4023. > > width fonts in general with Kermit95?
  4024. > >
  4025. > DCBS is problematic in console windows.  Proportional-width fonts don't
  4026. > usually make sense in a terminal screen.  However, when K-95 is converted to
  4027. > full GUI form, the user should be able to choose any font at all, including a
  4028. > proportional one.
  4029. > >From the Kermit 95 FAQ:
  4030. >   There is no explicit support in Kermit 95 for Chinese, Japanese, or
  4031. >   Korean (CJK), but you still might be able to view CJK in a Kermit 95
  4032. >   window if (a) your PC is configured to allow it; (b) the CJK character
  4033. >   set used on your PC is the same as that on the host; (c) K95 has been
  4034. >   told to "set terminal character-set transparent" and "set terminal
  4035. >   bytesize 8". However, the ability to view CJK text does not necessarily
  4036. >   mean you can also enter it.  According to Microsoft Knowledge Base
  4037. >   Article Q156793, CJK Input Method Editors are not available in Console
  4038. >   windows under Windows 95, even though they are available in Windows NT
  4039. >   3.51 and later.  Explicit support for CJK terminal emulation is planned
  4040. >   for future releases of Kermit 95, after release of the GUI.
  4041. > We do, however, support translation among the full range of Kanji character
  4042. > sets during file transfer.
  4043. > > (I.e. can I use, e.g. Bitstreams Cyberbit font to display
  4044. > > Latin/Hangul/Kanji/Hiragana/...?)
  4045. > >
  4046. > Maybe in NT.  Certainly not in Win95/98 at present.
  4047.  
  4048. The primary reason that we have not implemented DBCS support for K95
  4049. is because there are no freely distributed monospaced Unicode fonts
  4050. that populate the CJK areas.  The Bitstream Cyberbit font is
  4051. proportionally spaced and cannot be used in Console windows.
  4052.  
  4053. Monotype does have fully populated versions of Lucida Console and
  4054. Monotype.com fonts that can be purchased.  You would have to contact
  4055. them for pricing info.  These fonts can them be used in Win95/98 and
  4056. NT.  In NT you would now have the ability to display the CJK
  4057. characters. However, as Win95/98 does not have code page support for
  4058. the CJK characters (at least in the Western releases) you would still
  4059. not be able to display the CJK characters.
  4060.  
  4061.  
  4062.     Jeffrey Altman * Sr.Software Designer * Kermit-95 for Win32 and OS/2
  4063.                  The Kermit Project * Columbia University
  4064.               612 West 115th St #716 * New York, NY * 10025
  4065.   http://www.kermit-project.org/k95.html * kermit-support@kermit-project.org
  4066.  
  4067.  
  4068.  9-Oct-98 14:20:35-GMT,3605;000000000001
  4069. Return-Path: <unicode@unicode.org>
  4070. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4071.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id KAA13757
  4072.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 10:20:34 -0400 (EDT)
  4073. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4074.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id HAA45070
  4075.     ; Fri, 9 Oct 1998 07:19:55 -0700
  4076. Received: by unicode.org (NX5.67g/NX3.0S)
  4077.     id AA23282; Fri, 9 Oct 98 07:13:18 -0700
  4078. Message-Id: <9810091413.AA23282@unicode.org>
  4079. Errors-To: uni-bounce@unicode.org
  4080. Mime-Version: 1.0
  4081. Content-Type: text/plain; charset=us-ascii
  4082. X-Uml-Sequence: 6123 (1998-10-09 14:12:43 GMT)
  4083. From: Markus Kuhn <Markus.Kuhn@cl.cam.ac.uk>
  4084. Reply-To: unicode@unicode.org
  4085. To: Unicode List <unicode@unicode.org>
  4086. Date: Fri, 9 Oct 1998 07:12:42 -0700 (PDT)
  4087. Subject: Re: Terminal Graphics Draft 2 
  4088.  
  4089. Frank da Cruz wrote on 1998-10-08 21:27 UTC:
  4090. > In any case, the control-picture symbols must be encoded because we're
  4091. > concerned not only about the terminal emulator but also the applications it
  4092. > must interact with, as in:
  4093. >   User: "Help, my screen is messed up!"
  4094. >   Help desk: "OK, click on Debug in the Terminal window menu bar
  4095. >     and repeat what you did before."
  4096. >   User: "Now my screen is REALLY messed up!"
  4097. >   Help desk: "Let's have a look.  Please use your mouse to copy it
  4098. >     and paste it into your email window and send it to us."
  4099. > This is, of course, looking forward to the day when All Is Unicode...
  4100.  
  4101. The helpdesk can already get the same effect today by much simpler
  4102. asking for a bitmap of the screen or window to be mailed:
  4103.  
  4104.     Help desk: "What GUI are you using?"
  4105.  
  4106.     User: "X11"
  4107.  
  4108.     Help desk: "Excellent choice. Just enter the shell command
  4109.       'xwd | uuencode - | mail helpdesk' and then click on the
  4110.       messed-up window"
  4111.  
  4112.     User: "Done."
  4113.  
  4114.     Help desk: "Ah, now I see your problem. That is easy to fix ..."
  4115.  
  4116. Let's not create unnecessary complicated user requirements.
  4117.  
  4118. I highly welcome attempts to complete Unicode with the various technical
  4119. character set symbols that various terminal types have, after proper
  4120. unification according to the well-proven character/glyph model.
  4121. Also symbols that are not part of the user accessible character set of
  4122. a terminal but that appear as part of the normal look-and-feel of this
  4123. terminal in status lines, etc. should be added to Unicode, in order to allow
  4124. to emulate one terminal inside another terminal emulator (e.g., an IBM 3270
  4125. emulator that runs inside an UTF-8 enhanced xterm). I am sceptical
  4126. however, whether all the many control symbols really need to have a place
  4127. in the BMP. I think that debugging tools can quite easily provide them
  4128. using some other replacement notation, that might or might not bypass the
  4129. usual font mechanisms. I have been used to see ^M in a different color as a
  4130. common replacement symbol for Carriage Return (Ctrl-M) for over 15 years,
  4131. and I never missed a much less readable CR glyph for debugging purposes.
  4132.  
  4133. Debugging is done by experts and experts are used to cope with any replacement
  4134. notation anyway. We can do hexdumps quite nicely with 0-9A-F without having
  4135. to resort to hex-byte-glyphs and control abbreviation glyphs.
  4136.  
  4137. I think the criterion for inclusion of terminal emulator characters
  4138. should be whether the character can ever be seen by a normal user
  4139. in normal (non-debugging, non-configure) operation on the screen of
  4140. the terminal.
  4141.  
  4142. Markus
  4143.  
  4144. -- 
  4145. Markus G. Kuhn, Security Group, Computer Lab, Cambridge University, UK
  4146. email: mkuhn at acm.org,  home page: <http://www.cl.cam.ac.uk/~mgk25/>
  4147.  
  4148.  9-Oct-98 14:49:23-GMT,2248;000000000001
  4149. Return-Path: <unicode@unicode.org>
  4150. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4151.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id KAA22940
  4152.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 10:49:21 -0400 (EDT)
  4153. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4154.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id HAA22448
  4155.     ; Fri, 9 Oct 1998 07:47:47 -0700
  4156. Received: by unicode.org (NX5.67g/NX3.0S)
  4157.     id AA23387; Fri, 9 Oct 98 07:29:59 -0700
  4158. Message-Id: <9810091429.AA23387@unicode.org>
  4159. Errors-To: uni-bounce@unicode.org
  4160. Mime-Version: 1.0
  4161. Content-Type: text/plain; charset=us-ascii
  4162. X-Uml-Sequence: 6124 (1998-10-09 14:29:42 GMT)
  4163. From: Markus Kuhn <Markus.Kuhn@cl.cam.ac.uk>
  4164. Reply-To: unicode@unicode.org
  4165. To: Unicode List <unicode@unicode.org>
  4166. Date: Fri, 9 Oct 1998 07:29:41 -0700 (PDT)
  4167. Subject: Re: Terminal Graphics Draft 2 
  4168.  
  4169. Frank da Cruz wrote on 1998-10-08 22:56 UTC:
  4170. > (Really.  Nothing ever quite disappears.  I have heard of a payroll system
  4171. > that was originally written in the early 1960s for an IBM ... OK, I forget
  4172. > the exact model number -- 1104 or something like that.  When that machine
  4173. > was replaced by a 7094 (?), the same payroll system ran under an 1104
  4174. > emulator.  When the 7094 was replaced by a 360, it still ran on the 1104
  4175. > emulator, which itself ran on a 7094 emulator.  And so on and so on, legend
  4176. > has it, to this day.)
  4177.  
  4178. Another question is which terminals should actually be supported. Many
  4179. of the ones you mentioned have died away already. I am aware of the IBM
  4180. 3270 family and the DEC VT100 family having a long and healthy live (to
  4181. Michael Everson: those might indeed still be around in a hundred years
  4182. from now, we will know after Y2K), but much of the rest is probably not
  4183. sufficiently mainstream enough to deserve consideration in Unicode.
  4184.  
  4185. Do you have any form of data on the terminal emulator market regarding
  4186. more exotic terminal types? Are there really more than a few hundred
  4187. people out there who use applications that depend on a terminal type
  4188. radically different from a DEC VT340 or a IBM 3278?
  4189.  
  4190. Markus
  4191.  
  4192. -- 
  4193. Markus G. Kuhn, Security Group, Computer Lab, Cambridge University, UK
  4194. email: mkuhn at acm.org,  home page: <http://www.cl.cam.ac.uk/~mgk25/>
  4195.  
  4196.  9-Oct-98 15:38:18-GMT,1363;000000000001
  4197. Return-Path: <fdc>
  4198. Received: (from fdc@localhost)
  4199.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id LAA08268;
  4200.     Fri, 9 Oct 1998 11:38:10 -0400 (EDT)
  4201. Date: Fri, 9 Oct 98 11:38:09 EDT
  4202. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  4203. To: Otto Stolz <Otto.Stolz@uni-konstanz.de>
  4204. Subject: Re: Terminal Graphics Draft 2
  4205. In-Reply-To: Your message of Fri, 9 Oct 1998 17:31:21 -0600
  4206. Message-ID: <CMM.0.90.4.907947489.fdc@watsun.cc.columbia.edu>
  4207.  
  4208. > Hello,
  4209. > on 1998-10-09 at 17:19, I have written to the Unicode list:
  4210. > > Cf. figure 3-1 in IBM form GA27-2837-8
  4211. > > "IBM 3270 Information Display System Character Set Reference".
  4212. > If you want this old (Aug 1968), pre-CDRA pamphlet, you can have it
  4213. > for the asking. It contains various keyboard layouts, I/O interface
  4214. > code charts and some ancillary material (including special 3270 controll
  4215. > character assignments, cf. my forthcoming note to the Unicode list).
  4216. I'd love to have it -- as you can guess, I collect such things.
  4217. Thanks!
  4218.  
  4219. Frank da Cruz
  4220. The Kermit Project
  4221. Columbia University
  4222. 612 West 115th Street
  4223. New York NY  10025-7799
  4224. USA
  4225.  
  4226. P.S. Another rare object I was hoping to find was an Siemens (or Nixdorf?)
  4227. BA80 terminal manual.  Nobody at SNI acknowledges there ever was such a thing,
  4228. but I don't believe them.  This is just a "shot in the dark" -- ignore it if
  4229. you don't know what I'm talking about.
  4230.  
  4231. - Frank
  4232.  
  4233.  9-Oct-98 15:43:42-GMT,1745;000000000001
  4234. Return-Path: <unicode@unicode.org>
  4235. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4236.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id LAA09826
  4237.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 11:43:40 -0400 (EDT)
  4238. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4239.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id IAA17762
  4240.     ; Fri, 9 Oct 1998 08:42:00 -0700
  4241. Received: by unicode.org (NX5.67g/NX3.0S)
  4242.     id AA23887; Fri, 9 Oct 98 08:33:42 -0700
  4243. Message-Id: <9810091533.AA23887@unicode.org>
  4244. Errors-To: uni-bounce@unicode.org
  4245. Mime-Version: 1.0
  4246. Content-Type: text/plain; charset=us-ascii
  4247. X-Uml-Sequence: 6125 (1998-10-09 15:33:15 GMT)
  4248. From: Otto Stolz <Otto.Stolz@uni-konstanz.de>
  4249. Reply-To: unicode@unicode.org
  4250. To: Unicode List <unicode@unicode.org>
  4251. Date: Fri, 9 Oct 1998 08:33:14 -0700 (PDT)
  4252. Subject: Re: Terminal Graphics Draft 2
  4253.  
  4254. Am 1998-10-8 um 12:19 hat John Cowan geschrieben:
  4255. > A typical (though not the only)
  4256. > glyph for U+2424 is the one which appears on the Enter key of PC
  4257. > keyboards.
  4258.  
  4259. Please describe.
  4260.  
  4261. On my keyboards (both PC and X-Terminal), the Enter key has the word
  4262. "Enter" engraved, whilst the Return key has a U+21B2 Downwards Arrow
  4263. with Tip Leftwards (or is it a glyph variant of U+21B5?).
  4264.  
  4265. If I remember correctly, my 3270 terminal had the similar engravings
  4266. on these keys, viz. "DatFreig" (Datenfreigabe = German translation of
  4267. "Enter"), and U+21B5, respectively. Cf. figure 3-1 in IBM form GA27-2837-8
  4268. "IBM 3270 Information Display System Character Set Reference".
  4269.  
  4270. Btw., the semantics of these 3270 keys were quite different: the Enter
  4271. key sends data to zhe host, whilst the Return key is just a local cursor
  4272. movement without sending anything.
  4273.  
  4274. Best wishes,
  4275.    Otto Stolz
  4276.  
  4277.  9-Oct-98 16:02:21-GMT,842;000000000001
  4278. Return-Path: <fdc>
  4279. Received: (from fdc@localhost)
  4280.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id MAA14500;
  4281.     Fri, 9 Oct 1998 12:02:17 -0400 (EDT)
  4282. Date: Fri, 9 Oct 98 12:02:17 EDT
  4283. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  4284. To: Otto Stolz <Otto.Stolz@uni-konstanz.de>
  4285. Subject: Re: Terminal Graphics Draft 2
  4286. In-Reply-To: Your message of Fri, 9 Oct 1998 17:58:28 -0600
  4287. Message-ID: <CMM.0.90.4.907948937.fdc@watsun.cc.columbia.edu>
  4288.  
  4289. > Am 1998-10-9 um 17:31 hat Otto Stolz geschrieben:
  4290. > > ancillary material (including special 3270 controll
  4291. > > character assignments, cf. my forthcoming note to the Unicode list).
  4292. > This is only to tell you that no note is forthcoming, as I eventually have
  4293. > found all of those control characters in either table 5.3 or 5.4 of your
  4294. > 2nd draft.
  4295. OK, that will please the minimalists :-)
  4296.  
  4297. Thanks.
  4298.  
  4299. - Frank
  4300.  
  4301.  9-Oct-98 16:25:12-GMT,1442;000000000001
  4302. Return-Path: <unicode@unicode.org>
  4303. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4304.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id MAA20078
  4305.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 12:25:11 -0400 (EDT)
  4306. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4307.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id JAA65830
  4308.     ; Fri, 9 Oct 1998 09:24:47 -0700
  4309. Received: by unicode.org (NX5.67g/NX3.0S)
  4310.     id AA24229; Fri, 9 Oct 98 09:18:58 -0700
  4311. Message-Id: <9810091618.AA24229@unicode.org>
  4312. Errors-To: uni-bounce@unicode.org
  4313. Mime-Version: 1.0
  4314. Content-Type: text/plain; charset=us-ascii
  4315. Content-Transfer-Encoding: 7bit
  4316. X-Uml-Sequence: 6126 (1998-10-09 16:18:46 GMT)
  4317. From: John Cowan <cowan@locke.ccil.org>
  4318. Reply-To: unicode@unicode.org
  4319. To: Unicode List <unicode@unicode.org>
  4320. Date: Fri, 9 Oct 1998 09:18:45 -0700 (PDT)
  4321. Subject: Re: Terminal Graphics Draft 2
  4322. Content-Transfer-Encoding: 7bit
  4323.  
  4324. Otto Stolz wrote:
  4325.  
  4326. > On my keyboards (both PC and X-Terminal), the Enter key has the word
  4327. > "Enter" engraved, whilst the Return key has a U+21B2 Downwards Arrow
  4328. > with Tip Leftwards (or is it a glyph variant of U+21B5?).
  4329.  
  4330. Mm, you're right.  I don't know what I was thinking of.
  4331.  
  4332. -- 
  4333. John Cowan    http://www.ccil.org/~cowan        cowan@ccil.org
  4334.     You tollerday donsk?  N.  You tolkatiff scowegian?  Nn.
  4335.     You spigotty anglease?  Nnn.  You phonio saxo?  Nnnn.
  4336.         Clear all so!  'Tis a Jute.... (Finnegans Wake 16.5)
  4337.  
  4338.  9-Oct-98 17:17:51-GMT,1805;000000000001
  4339. Return-Path: <unicode@unicode.org>
  4340. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4341.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id NAA04954
  4342.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 13:17:50 -0400 (EDT)
  4343. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4344.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id KAA52330
  4345.     ; Fri, 9 Oct 1998 10:17:12 -0700
  4346. Received: by unicode.org (NX5.67g/NX3.0S)
  4347.     id AA24788; Fri, 9 Oct 98 10:04:28 -0700
  4348. Message-Id: <9810091704.AA24788@unicode.org>
  4349. Errors-To: uni-bounce@unicode.org
  4350. X-Uml-Sequence: 6129 (1998-10-09 17:04:14 GMT)
  4351. From: Rick McGowan <rmcgowan@apple.com>
  4352. Reply-To: unicode@unicode.org
  4353. To: Unicode List <unicode@unicode.org>
  4354. Date: Fri, 9 Oct 1998 10:04:12 -0700 (PDT)
  4355. Subject: careless quotation and forwarding
  4356.  
  4357. It's nice to quote a little context when you're replying to some previous  
  4358. message.  People do that a lot by pre-pending ">" to the quoted lines.
  4359.  
  4360. Sometimes, however, people don't take enough care with REMOVING the  
  4361. irrelevant portions of the note they're quoting.
  4362.  
  4363. I get a little tired of scenarios like this:  Someone quotes a few lines of  
  4364. a note, intersperses comments, then just LEAVES the rest of the note.  There  
  4365. was one note yesterday on this list that ended with 717 lines quoted from  
  4366. another note, WITHOUT COMMENT.  This was some 30k of excess garbage that  
  4367. clogged up my inbox, and I had to scroll all the way through it to verify  
  4368. that it was UNCOMMENTED, and hence irrelevant to forward.
  4369.  
  4370. Please take more care in removing excess quoted material -- parts of notes  
  4371. that are irrelevant or upon which you are not commenting.  It doesn't take  
  4372. that much time to do, and saves all of your readers the trouble of  
  4373. fruitlessly wading through the excess.
  4374.  
  4375. Thanks,
  4376.     Rick
  4377.  
  4378.  9-Oct-98 17:37:03-GMT,1854;000000000001
  4379. Return-Path: <unicode@unicode.org>
  4380. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4381.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id NAA11282
  4382.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 13:37:01 -0400 (EDT)
  4383. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4384.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id KAA56198
  4385.     ; Fri, 9 Oct 1998 10:35:01 -0700
  4386. Received: by unicode.org (NX5.67g/NX3.0S)
  4387.     id AA24939; Fri, 9 Oct 98 10:15:15 -0700
  4388. Message-Id: <9810091715.AA24939@unicode.org>
  4389. Errors-To: uni-bounce@unicode.org
  4390. X-Uml-Sequence: 6130 (1998-10-09 17:13:48 GMT)
  4391. From: Rick McGowan <rmcgowan@apple.com>
  4392. Reply-To: unicode@unicode.org
  4393. To: Unicode List <unicode@unicode.org>
  4394. Date: Fri, 9 Oct 1998 10:13:47 -0700 (PDT)
  4395. Subject: Re: Terminal Graphics Draft 2
  4396.  
  4397. Frank wrote...
  4398.  
  4399. > The reason these need to be encoded separately from feminine/masculine
  4400. > ordinals are their size
  4401.  
  4402. Ah, I figured so.  In this case, they should just be unified with the  
  4403. existing codes.
  4404.  
  4405. > Since terminal emulators and data analyzers use fixed-pitch fonts, we can't
  4406. > just switch to another point size to display these characters, since that will
  4407. > wreck the matrix arrangement of the screen.
  4408.  
  4409. Eh?  There are plenty of fixed-pitch fonts that include masculine and  
  4410. feminine ordinal indicators taking up the same size cell as everything else.   
  4411. Big or small, unless you need to distinguish these from small ordinals for  
  4412. the emulation of ONE Actual Physical Terminal, there's no point in encoding  
  4413. them again.
  4414.  
  4415. > Seriously, the hex bytes are entirely separable from the rest.  I'll be
  4416. > glad to cut them loose unless somebody speaks up strongly in their favor.
  4417.  
  4418. I'll repeat myself strongly in their disfavor.  I think you should remove  
  4419. them from this proposal, whether or not you make another proposal for them.
  4420.  
  4421.     Rick
  4422.  
  4423.  9-Oct-98 17:49:15-GMT,1449;000000000001
  4424. Return-Path: <unicode@unicode.org>
  4425. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4426.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id NAA14124
  4427.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 13:49:12 -0400 (EDT)
  4428. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4429.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id KAA57790
  4430.     ; Fri, 9 Oct 1998 10:47:35 -0700
  4431. Received: by unicode.org (NX5.67g/NX3.0S)
  4432.     id AA25247; Fri, 9 Oct 98 10:36:02 -0700
  4433. Message-Id: <9810091736.AA25247@unicode.org>
  4434. Errors-To: uni-bounce@unicode.org
  4435. X-Uml-Sequence: 6131 (1998-10-09 17:35:33 GMT)
  4436. From: kenw@sybase.com (Kenneth Whistler)
  4437. Reply-To: unicode@unicode.org
  4438. To: Unicode List <unicode@unicode.org>
  4439. Date: Fri, 9 Oct 1998 10:35:32 -0700 (PDT)
  4440. Subject: Re: Terminal Graphics Draft 2
  4441.  
  4442. Frank wrote:
  4443.  
  4444. > (Really.  Nothing ever quite disappears.  I have heard of a payroll system
  4445. > that was originally written in the early 1960s for an IBM ... OK, I forget
  4446. > the exact model number -- 1104 or something like that.  When that machine
  4447. > was replaced by a 7094 (?), the same payroll system ran under an 1104
  4448. > emulator.  When the 7094 was replaced by a 360, it still ran on the 1104
  4449. > emulator, which itself ran on a 7094 emulator.  And so on and so on, legend
  4450. > has it, to this day.)
  4451.  
  4452. Somewhat orthogonally, many of these old dinosaurs are about to be
  4453. cleared away by the asteroid known as Y2K on its way to impact.
  4454.  
  4455. --Ken
  4456.  
  4457.  9-Oct-98 18:10:55-GMT,1548;000000000001
  4458. Return-Path: <unicode@unicode.org>
  4459. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4460.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id OAA19499
  4461.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 14:10:53 -0400 (EDT)
  4462. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4463.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id LAA42778
  4464.     ; Fri, 9 Oct 1998 11:09:06 -0700
  4465. Received: by unicode.org (NX5.67g/NX3.0S)
  4466.     id AA25845; Fri, 9 Oct 98 10:55:36 -0700
  4467. Message-Id: <9810091755.AA25845@unicode.org>
  4468. Errors-To: uni-bounce@unicode.org
  4469. X-Uml-Sequence: 6135 (1998-10-09 17:54:18 GMT)
  4470. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  4471. Reply-To: unicode@unicode.org
  4472. To: Unicode List <unicode@unicode.org>
  4473. Date: Fri, 9 Oct 1998 10:54:14 -0700 (PDT)
  4474. Subject: Re: Terminal Graphics Draft 2
  4475.  
  4476. > > The reason these need to be encoded separately from feminine/masculine
  4477. > > ordinals are their size
  4478. > Ah, I figured so.  In this case, they should just be unified with the  
  4479. > existing codes.
  4480. See my response to Otto Stolz on this.  Again, I don't care so much whether
  4481. these particular characters are encoded, but they illustrate a point worth
  4482. making, namely that unifications that work in the GUI world don't
  4483. necessarily work in an environment where we must use a fixed-pitch font.
  4484.  
  4485. If a "big" feminine ordinal arrives, I can't just display the regular one
  4486. at a bigger point size with a lower baseline, because (a) I might not be
  4487. able to (maybe it's a console application), and (b) cells must be fixed
  4488. size.
  4489.  
  4490. - Frank
  4491.  
  4492.  9-Oct-98 18:11:50-GMT,2295;000000000001
  4493. Return-Path: <unicode@unicode.org>
  4494. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4495.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id OAA19718
  4496.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 14:11:47 -0400 (EDT)
  4497. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4498.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id LAA45088
  4499.     ; Fri, 9 Oct 1998 11:09:08 -0700
  4500. Received: by unicode.org (NX5.67g/NX3.0S)
  4501.     id AA25534; Fri, 9 Oct 98 10:47:19 -0700
  4502. Message-Id: <9810091747.AA25534@unicode.org>
  4503. Errors-To: uni-bounce@unicode.org
  4504. X-Uml-Sequence: 6132 (1998-10-09 17:45:54 GMT)
  4505. From: kenw@sybase.com (Kenneth Whistler)
  4506. Reply-To: unicode@unicode.org
  4507. To: Unicode List <unicode@unicode.org>
  4508. Cc: kenw@sybase.com
  4509. Date: Fri, 9 Oct 1998 10:45:47 -0700 (PDT)
  4510. Subject: Re: Terminal Graphics Draft 2
  4511.  
  4512. John Cowan wrote:
  4513.  
  4514. > But the SYMBOL FOR NEWLINE is not tied to U+2424, which is a LINE
  4515. > SEPARATOR, not a line terminator.  A typical (though not the only)
  4516. > glyph for U+2424 is the one which appears on the Enter key of PC
  4517. > keyboards.
  4518.  
  4519. No.
  4520.  
  4521. U+2424 *is* SYMBOL FOR NEWLINE
  4522.  
  4523. It is a graphic symbol for the NEWLINE function.
  4524.  
  4525. U+2424 is *not* a line separator, nor a line terminator. It is not
  4526. a control function or control code at all.
  4527.  
  4528. It *is* the character which should be used when displaying a graphic
  4529. symbol for the control function NEWLINE. And here we are talking
  4530. the EBCDIC NL (etc.), not C `\n'.
  4531.  
  4532. U+21B5 DOWNARDS ARROW WITH CORNER LEFTWARDS is the character which
  4533. can be used to represent that which typically appears on the Enter key
  4534. of PC keyboards (i.e., serving as a graphic symbol for CARRIAGE RETURN).
  4535.  
  4536. Incidentally, there is another pile of graphic symbols for keyboard
  4537. functions coming down the pike in Amendment 22 to 10646 (based on
  4538. ISO 9995-7). These should be checked to verify that there are no
  4539. duplicates against the collection of symbols being proposed for
  4540. terminal emulation. (Examples: symbols for compose, enter, alternate,
  4541. shift lock, undo, print screen, clear screen, delete, etc.)
  4542.  
  4543. --Ken
  4544.  
  4545. > -- 
  4546. > John Cowan    http://www.ccil.org/~cowan        cowan@ccil.org
  4547. >     You tollerday donsk?  N.  You tolkatiff scowegian?  Nn.
  4548. >     You spigotty anglease?  Nnn.  You phonio saxo?  Nnnn.
  4549. >         Clear all so!  'Tis a Jute.... (Finnegans Wake 16.5)
  4550.  
  4551.  9-Oct-98 18:22:26-GMT,2272;000000000001
  4552. Return-Path: <unicode@unicode.org>
  4553. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4554.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id OAA22300
  4555.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 14:22:24 -0400 (EDT)
  4556. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4557.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id LAA40550
  4558.     ; Fri, 9 Oct 1998 11:20:39 -0700
  4559. Received: by unicode.org (NX5.67g/NX3.0S)
  4560.     id AA25711; Fri, 9 Oct 98 10:53:19 -0700
  4561. Message-Id: <9810091753.AA25711@unicode.org>
  4562. Errors-To: uni-bounce@unicode.org
  4563. X-Uml-Sequence: 6133 (1998-10-09 17:51:01 GMT)
  4564. From: kenw@sybase.com (Kenneth Whistler)
  4565. Reply-To: unicode@unicode.org
  4566. To: Unicode List <unicode@unicode.org>
  4567. Cc: kenw@sybase.com
  4568. Date: Fri, 9 Oct 1998 10:51:00 -0700 (PDT)
  4569. Subject: RE: Terminal Graphics Draft 2
  4570.  
  4571. > I can't think of any connections where both NL and NEL would be
  4572. > used in the same data stream, since data streams tend to be
  4573. > either ASCII/ISO or EBCDIC, but not a mixture.
  4574. > However, real terminals (VT220-520) print "NEL" when in display-
  4575. > controls mode, so why make an exception to the rule of printing
  4576. > the actual name in this one case?  I think this would be more
  4577. > confusing than doing what the actual terminal does.  Especially
  4578. > considering the "metareferences" we might make to these characters
  4579. > in Unicode texts; e.g. "An ISO data stream will show the [NEL]
  4580. > character, whereas an EBCDIC data stream will show the [NL]
  4581. > character"...
  4582. > I'm sure we could also find other examples of control characters
  4583. > in the C1 and EBCDIC sets whose semantics are the same or close
  4584. > but whose names differ; I don't think that means we should unify
  4585. > them.  The purpose of "display controls" is to show the customary
  4586. > and familiar mnemonic for each control character in its context so
  4587. > people can read them easily.
  4588.  
  4589. And since your collection of display controls lists both the
  4590. three-letter and two-letter mnemonics for these things, I
  4591. cannot see any argument for disunification. This is the thing meant
  4592. for what in your chart is:
  4593.  
  4594.   E025   85   NEL   NL   Symbol for Next Line
  4595.  
  4596.  
  4597. U+2424 is the correct character for the graphic symbol
  4598. display of "NEL" or "NL Symbol or Next Line (or Symbol for Newline).
  4599.  
  4600. --Ken
  4601.  
  4602. > - Frank
  4603.  
  4604.  9-Oct-98 18:40:04-GMT,3883;000000000001
  4605. Return-Path: <unicode@unicode.org>
  4606. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4607.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id OAA28263
  4608.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 14:40:02 -0400 (EDT)
  4609. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4610.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id LAA40650
  4611.     ; Fri, 9 Oct 1998 11:26:03 -0700
  4612. Received: by unicode.org (NX5.67g/NX3.0S)
  4613.     id AA25671; Fri, 9 Oct 98 10:52:15 -0700
  4614. Message-Id: <9810091752.AA25671@unicode.org>
  4615. Errors-To: uni-bounce@unicode.org
  4616. X-Uml-Sequence: 6134 (1998-10-09 17:51:41 GMT)
  4617. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  4618. Reply-To: unicode@unicode.org
  4619. To: Unicode List <unicode@unicode.org>
  4620. Date: Fri, 9 Oct 1998 10:51:40 -0700 (PDT)
  4621. Subject: Re: Terminal Graphics Draft 2
  4622.  
  4623. > If the Feminine, and Masculine, Ordinal Indicators (U+00AA, and U+00BA,
  4624. > respectively) were written in the same fixed-pitch font as the surrounding
  4625. > text, they also would occupy one cell, each, won't they?
  4626. Yes, but they would be too small.  The SNI glyphs are full-size base
  4627. characters, but the ordinal indicator glyphs are superscripts.
  4628.  
  4629. > As Frank had written in both of his own drafts:
  4630. > > arriving at a sufficient set of character-cell terminal graphics for
  4631. > > Unicode is complicated by the well-known problems that affect other
  4632. > > preexisting character sets to varying degrees:
  4633. > >  1. Lack of official names for the characters of some of the sets.
  4634. > >  2. Lack of definitive, high-quality pictures of the glyphs in some cases.
  4635. > >  3. Lack of descriptions of the purpose and intended use of the glyphs.
  4636. > I think, those are good reasons not to take the glyphs in the Siemens
  4637. > Nixdorf 97801-5xx Benutzerhandbuch too seriously -- good reasons to unify
  4638. > these characters with the above-mentioned U+00AA and U+00BA. The only
  4639. > reason, IMHO, not to unify them would be existence of a character set
  4640. > containing different glyphs both for the proposed characters and the
  4641. > existing ones -- as Rick has already noted.
  4642. I tend to agree.  The "strange" SNI glyphs are not a high priority, to me
  4643. personally at least.  I have, however, posted a message to the Sinix newsgroup
  4644. (of SNI customers) to see if any strong opinions come to the surface.  All I
  4645. can say from my own experience is that there was heavy demand for accurate
  4646. SNI terminal emulation for Windows 95/98/NT, and we met that demand as best
  4647. we could within the limitations of the code pages and fonts available to us.
  4648. For those of you not familiar with SNI 97801, it probably has the most
  4649. advanced ISO 2022 implementation and repertoire of character sets of any
  4650. terminal ever built -- at least in the West (it lacks Hebrew, Arabic, and
  4651. CJK, but includes ISO 8859-1,2,3,4,5,7,9, various ISO 646 versions, plus
  4652. a selection of "strange" private sets, and a wide variety of input methods).
  4653.  
  4654. To answer Otto's point with a question: what is a character set?  I can see
  4655. both a superscript feminine ordinal and a "big" feminine ordinal on the same
  4656. screen simply by sending ISO 2022 escape sequences to switch "character sets".
  4657. So in a sense, all character sets that can be designated and invoked by ISO
  4658. 2022 escape sequences form one big character set :-)  See, for example:
  4659.  
  4660.   http://www.columbia.edu/kermit/kuishots.html
  4661.  
  4662. Go down to Shot 3.  This screen was produced using ISO 2022 escape sequences
  4663. from the host to a VT320 terminal emulator on Windows 95, with Lucida Console
  4664. as the (Unicode) font.  The same screen could be produced by sending the exact
  4665. same data stream to the 97801.  (This screen does not show any of the SNI
  4666. "strange" glyphs, but I hope it illustrates the point.)
  4667.  
  4668. Again, I have no great investment in these characters, and so far our SNI
  4669. users have not complained about their absence, but before striking them I
  4670. hope to hear some additional testimony from them.
  4671.  
  4672. - Frank
  4673.  
  4674.  9-Oct-98 19:46:19-GMT,1944;000000000001
  4675. Return-Path: <fdc>
  4676. Received: (from fdc@localhost)
  4677.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id PAA16362;
  4678.     Fri, 9 Oct 1998 15:46:15 -0400 (EDT)
  4679. Date: Fri, 9 Oct 1998 15:46:15 -0400 (EDT)
  4680. Message-Id: <199810091946.PAA16362@watsun.cc.columbia.edu>
  4681. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  4682. To: Michael Everson <everson@indigo.ie>
  4683. Subject: Re: Terminal Graphics Draft 2
  4684. In-Reply-To: Your message of Fri, 9 Oct 1998 12:20:23 -0700 (PDT)
  4685.  
  4686. > Everson Mono is fixed-pitch font that includes masculine and feminine
  4687. > ordinal indicators taking up the same size cell as everything else.
  4688. Hi Michael.  Did we discuss Everson Mono before?  I mean, the possibility
  4689. of packaging it with Kermit 95?  (Since Microsoft so resolutely and, may I
  4690. say, arrogantly, refuses to decently populate Lucida Console.)
  4691.  
  4692. I assume we would have to license it and pay some money.  Can you give me a
  4693. rough idea of the terms?  And could it be used as a plug-in replacement for
  4694. Lucida Console on Windows NT (but with so many of those huge gaps filled in)?
  4695.  
  4696. - Frank
  4697.  
  4698. P.S. If your offer to make TTF glyphs for them still stands, the local
  4699. photocopier has been fixed so I can start copying from books and manuals to
  4700. sheets of paper.  These, of course, I can send by post or fax, or scan them.
  4701.  
  4702. P.P.S. What did John Cowan mean about Ireland?  I had discussions about
  4703. this with various people last year and learned that the name of the country
  4704. was a somewhat sensitive topic, but the consensus seemed to favor
  4705. "Republic of Ireland" rather than "╔ire" (which is controversial since
  4706. it came from Eamon de Valera (sp?) who agreed with England on the partition)
  4707. or "Ireland" which is confusing to some people (e.g. postal authorities).
  4708.  
  4709. By the way, in case you are interested in the results of that discussion,
  4710. I'd be glad to send it -- it is a discourse on how to address postal mail
  4711. to many lands, the Isles to the north of continental Europe being the most
  4712. interesting case :-)
  4713.  
  4714.  9-Oct-98 19:53:17-GMT,1561;000000000001
  4715. Return-Path: <fdc>
  4716. Received: (from fdc@localhost)
  4717.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id PAA18311
  4718.     for fdc; Fri, 9 Oct 1998 15:53:15 -0400 (EDT)
  4719. Date: Fri, 9 Oct 1998 15:53:15 -0400 (EDT)
  4720. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  4721. Message-Id: <199810091953.PAA18311@watsun.cc.columbia.edu>
  4722. To: fdc@watsun.cc.columbia.edu
  4723.  
  4724. Path: news.columbia.edu!watsun.cc.columbia.edu!fdc
  4725. From: fdc@watsun.cc.columbia.edu (Frank da Cruz)
  4726. Newsgroups: de.comp.os.sinix
  4727. Subject: SNI 97801 Emulation vs Unicode
  4728. Date: 9 Oct 1998 17:55:14 GMT
  4729. Organization: Columbia University
  4730. Lines: 24
  4731. Message-ID: <6vlim2$9s6$1@apakabar.cc.columbia.edu>
  4732. NNTP-Posting-Host: watsun.cc.columbia.edu
  4733. Xref: news.columbia.edu de.comp.os.sinix:1873
  4734.  
  4735.  
  4736. I would like to know if anybody is using applications with SNI 97801
  4737. terminals (or emulators) that require any of the following character sets:
  4738.  
  4739.  1. Klammern (Brackets) -- pieces of brackets, braces, integral signs,
  4740.     little clocks, and other funny symbols.
  4741.  
  4742.  2. Facet -- shapes for drawing pictures (mosaic graphics), but not
  4743.     like Videotex / Teletex.
  4744.  
  4745.  3. "IBM" -- contains some unique symbols not found in any IBM code page,
  4746.     like rotated hex digit-pairs, superscript "proportional-to" symbol,
  4747.     superscript infinity symbol, etc.
  4748.  
  4749. These three character sets contain glyphs that are not in Unicode.
  4750. The question is whether they should be added.
  4751.  
  4752. I don't care about the other 97801 sets (Math, Euro, German, International,
  4753. or the Latin alphabets) because they are already in Unicode.
  4754.  
  4755. Thank you!
  4756.  
  4757. Frank da Cruz
  4758. Columbia University
  4759.  
  4760.  9-Oct-98 21:07:45-GMT,2657;000000000001
  4761. Return-Path: <unicode@unicode.org>
  4762. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4763.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id RAA08937
  4764.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 17:07:44 -0400 (EDT)
  4765. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4766.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id OAA51036
  4767.     ; Fri, 9 Oct 1998 14:06:05 -0700
  4768. Received: by unicode.org (NX5.67g/NX3.0S)
  4769.     id AA29038; Fri, 9 Oct 98 13:53:48 -0700
  4770. Message-Id: <9810092053.AA29038@unicode.org>
  4771. Errors-To: uni-bounce@unicode.org
  4772. Mime-Version: 1.0
  4773. Content-Type: text/plain; charset="iso-8859-1"
  4774. X-Uml-Sequence: 6139 (1998-10-09 20:53:35 GMT)
  4775. From: "Alain" <alb@sct.gouv.qc.ca>
  4776. Reply-To: unicode@unicode.org
  4777. To: Unicode List <unicode@unicode.org>
  4778. Date: Fri, 9 Oct 1998 13:53:33 -0700 (PDT)
  4779. Subject: Re: Terminal Graphics Draft 2
  4780. Content-Transfer-Encoding: 8bit
  4781. X-MIME-Autoconverted: from quoted-printable to 8bit by watsun.cc.columbia.edu id RAA08937
  4782.  
  4783. A 08:33 98-10-09 -0700, Otto Stolz a Θcrit :
  4784. >Am 1998-10-8 um 12:19 hat John Cowan geschrieben:
  4785. >> A typical (though not the only)
  4786. >> glyph for U+2424 is the one which appears on the Enter key of PC
  4787. >> keyboards.
  4788. >
  4789. >Please describe.
  4790. >
  4791. >On my keyboards (both PC and X-Terminal), the Enter key has the word
  4792. >"Enter" engraved, whilst the Return key has a U+21B2 Downwards Arrow
  4793. >with Tip Leftwards (or is it a glyph variant of U+21B5?).
  4794. >
  4795. >If I remember correctly, my 3270 terminal had the similar engravings
  4796. >on these keys, viz. "DatFreig" (Datenfreigabe = German translation of
  4797. >"Enter"), and U+21B5, respectively. Cf. figure 3-1 in IBM form GA27-2837-8
  4798. >"IBM 3270 Information Display System Character Set Reference".
  4799. >
  4800. >Btw., the semantics of these 3270 keys were quite different: the Enter
  4801. >key sends data to zhe host, whilst the Return key is just a local cursor
  4802. >movement without sending anything.
  4803. >
  4804. >Best wishes,
  4805. >   Otto Stolz
  4806.  
  4807. [Alain] :
  4808. According to ISO/IEC 9995-7 (Symbols used for keyboard functions), "Enter"
  4809. (fr: Validation) and "Return" (fr: Retour) are indeed two very different
  4810. functions, with two different international symbols. On 3270's they are
  4811. used simultaneously. On PCs, only the Return function is used *generally*,
  4812. unless you use a terminal emulator, in which case, Enter is also used
  4813. (generally dedicating the same scan code as the righ-hand-side Control key;
  4814. some applications alos use the Return key of the numeric keypad as an Enter
  4815. function).
  4816.  
  4817. Alain LaBontΘ
  4818. QuΘbec
  4819. Project editor, ISO/IEC 9995 series (8 parts)
  4820. Coeditor, ISO/IEC 9995-7 (with Bernard Chauvois and Fred Bealle)
  4821. [and author/designer of several keyboard drivers for PCs]
  4822.  
  4823.  9-Oct-98 21:37:01-GMT,7519;000000000001
  4824. Return-Path: <unicode@unicode.org>
  4825. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  4826.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id RAA17342
  4827.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 17:36:59 -0400 (EDT)
  4828. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  4829.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id OAA43772
  4830.     ; Fri, 9 Oct 1998 14:36:11 -0700
  4831. Received: by unicode.org (NX5.67g/NX3.0S)
  4832.     id AA29631; Fri, 9 Oct 98 14:28:34 -0700
  4833. Message-Id: <9810092128.AA29631@unicode.org>
  4834. Errors-To: uni-bounce@unicode.org
  4835. X-Uml-Sequence: 6142 (1998-10-09 21:25:14 GMT)
  4836. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  4837. Reply-To: unicode@unicode.org
  4838. To: Unicode List <unicode@unicode.org>
  4839. Date: Fri, 9 Oct 1998 14:25:12 -0700 (PDT)
  4840. Subject: Terminal Graphics: Assorted Responses
  4841.  
  4842. Paul Keinanen <keinanen@sci.fi> wrote [About DEL and RUB]:
  4843. > ...
  4844. > Due to this duality,  should Rubout and Delete be concidered to be two
  4845. > separate characters,  although they seem to have the same code point in all
  4846. > ASCII based character sets ? Probably not...
  4847. >
  4848. I don't think they should be separated.  The name Rubout was rubbed out
  4849. decades (literally) ago.  ANSI X3.4-1977 does not contain the word Rubout.
  4850.  
  4851. Markus Kuhn <Markus.Kuhn@cl.cam.ac.uk> wrote:
  4852. >
  4853. > I highly welcome attempts to complete Unicode with the various technical
  4854. > character set symbols that various terminal types have, after proper
  4855. > unification according to the well-proven character/glyph model.
  4856. >
  4857. Good...
  4858.  
  4859. > Also symbols that are not part of the user accessible character set of
  4860. > a terminal but that appear as part of the normal look-and-feel of this
  4861. > terminal in status lines, etc. should be added to Unicode, in order to allow
  4862. > to emulate one terminal inside another terminal emulator (e.g., an IBM 3270
  4863. > emulator that runs inside an UTF-8 enhanced xterm).
  4864. >
  4865. Good...
  4866.  
  4867. > I am sceptical
  4868. > however, whether all the many control symbols really need to have a place
  4869. > in the BMP. I think that debugging tools can quite easily provide them
  4870. > using some other replacement notation, that might or might not bypass the
  4871. > usual font mechanisms.
  4872. >
  4873. Indeed they can, but then will such debugging tools be interoperable
  4874. with other applications?  I think it is a worthy goal to be able to paste
  4875. terminal screens -- even when they contain debugging information -- into
  4876. other applications.  For example, for publication purposes, e.g. by people
  4877. who write networking and data communications textbooks, manuals, and 
  4878. "for dummies" books.  I think there is a nontrivial market there :-)
  4879.  
  4880. I don't think we should go out of our way to anticipate how people will use
  4881. these characters, or what kind of people will use them.
  4882.  
  4883. > Another question is which terminals should actually be supported. Many
  4884. > of the ones you mentioned have died away already.
  4885. >
  4886. Like the Perkin Elmers.  But they are not the basis for any proposed
  4887. characters, only illustrations of features like "display controls".  The
  4888. VT100 family, Wyse, Televideo, IBM, and SNI are all very current.  The
  4889. Heath/Zenith 19 hasn't been manufactured in quite a while, but it remains
  4890. one of the most popular terminals to emulate due to its powerful but simple
  4891. command set and several unique features.  People who were not even born
  4892. until after the last H19s vanished are using emulators for them today, with
  4893. matching termcaps (or 3270 protocol converter terminal types) on the other
  4894. end.  In the IBM world, the H19 is especially popular since it lets the host
  4895. change the cursor shape, and Series/1-based protocol converters use this
  4896. feature to tell the user whether the 3270 is in insert or overwrite mode.
  4897. For this reason alone, countless people stick with this emulation rather
  4898. than "modernize" to VT100 (or beyond).
  4899.  
  4900. > Do you have any form of data on the terminal emulator market regarding
  4901. > more exotic terminal types? Are there really more than a few hundred
  4902. > people out there who use applications that depend on a terminal type
  4903. > radically different from a DEC VT340 or a IBM 3278?
  4904. I can tell you as a maker of terminal emulation software that there is
  4905. indeed a significant and and insistent demand for all sorts of terminals you
  4906. never heard of.  The original list for Kermit 95 was simply VT100, VT220,
  4907. and ANSI.  In the three years since we released it -- that is, here in the
  4908. late 1990s -- quite contrary to our expectations, customer demands have
  4909. compelled us to expand the list as follows:
  4910.  
  4911. [C:\k95\] K-95> set terminal type ? One of the following:
  4912.  aixterm    beterm     hft        qansi      tvi910+    vt100      wy30
  4913.  ansi-bbs   dg200      hp2621a    qnx        tvi925     vt102      wy370
  4914.  at386      dg210      hpterm     scoansi    tvi950     vt220      wy50
  4915.  avatar/0+  dg217      hz1500     sni-97801  vc404      vt320      wy60
  4916.  ba80       heath19    linux      tty        vip7809    vt52
  4917. [C:\k95\] K-95>
  4918.  
  4919. You'll see that some of them are true antiques: the Volker Craig 404, the
  4920. Hazeltine 1500, ...  Customers require these emulations because they have
  4921. applications that are hardwired to use them.  And yes, some of these
  4922. applications are "dinosaurs", but they do not die so easily, and who is
  4923. to say they should?
  4924.  
  4925. kenw@sybase.com (Kenneth Whistler) wrote [of ancient programs]:
  4926. >
  4927. > Somewhat orthogonally, many of these old dinosaurs are about to be
  4928. > cleared away by the asteroid known as Y2K on its way to impact.
  4929. And many won't -- there is a huge industry that installs patches in ancient
  4930. binaries for which source code is lost, or the source language is long
  4931. forgotten (or no longer compilable or assemblable).  And then, whenever the
  4932. "window" rolls around, they'll have to do it again :-)
  4933.  
  4934. > Incidentally, there is another pile of graphic symbols for keyboard
  4935. > functions coming down the pike in Amendment 22 to 10646 (based on
  4936. > ISO 9995-7). These should be checked to verify that there are no
  4937. > duplicates against the collection of symbols being proposed for
  4938. > terminal emulation. (Examples: symbols for compose, enter, alternate,
  4939. > shift lock, undo, print screen, clear screen, delete, etc.)
  4940. For sure.  I assume someone who is party to both proposals will take
  4941. responsbility?  If not, is Amendment 22 in a public place so I can check
  4942. it myself?
  4943.  
  4944. > And since your collection of display controls lists both the
  4945. > three-letter and two-letter mnemonics for these things [NEL and NL],
  4946. > I cannot see any argument for disunification. This is the thing meant
  4947. > for what in your chart is:
  4948. >   E025   85   NEL   NL   Symbol for Next Line
  4949. > U+2424 is the correct character for the graphic symbol
  4950. > display of "NEL" or "NL Symbol or Next Line (or Symbol for Newline).
  4951. Well, we've beaten this one to death, but I would say we should be
  4952. consistent.  Our choices are these:
  4953.  
  4954.  1. Encode the full form and no "2X" forms, i.e. no abbreviations of
  4955.     abbreviations should be encoded.
  4956.  
  4957.  2. Encode both forms (I'm not advocating that).
  4958.  
  4959.  3. List 2X forms as glyph alternatives and allow font designers to use
  4960.     *all* full forms or *all* 2X forms.
  4961.  
  4962.  4. Encode only 2X forms.
  4963.  
  4964. Only in the last case, I think, does it make sense to unify NEL and NL.
  4965. Otherwise NEL is a full C1 form and NL is an EBCDIC form, which
  4966. unfortunately happens to coincide with the "2X" representation of NEL.
  4967.  
  4968. Any other argument for unification would lead us to unify the symbols
  4969. for all controls -- C0, C1, EBCDIC, Unicode, and otherwise -- that have
  4970. similar functions but different names, which would defeat the purpose of
  4971. having these glyphs to begin with.
  4972.  
  4973. - Frank
  4974.  
  4975.  9-Oct-98 22:19:51-GMT,1665;000000000001
  4976. Return-Path: <jaltman>
  4977. Received: (from jaltman@localhost)
  4978.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id SAA26443;
  4979.     Fri, 9 Oct 1998 18:19:46 -0400 (EDT)
  4980. Sender: Jeffrey Altman <jaltman@watsun.cc.columbia.edu>
  4981. Date: Fri, 9 Oct 98 18:19:46 EDT
  4982. From: kermit-support@watsun.cc.columbia.edu
  4983. To: Karlsson Kent - keka <keka@im.se>
  4984. Cc: kermit-support@columbia.edu
  4985. Subject: Re: RE2: Kermit95
  4986. In-Reply-To: Your message of Fri, 9 Oct 1998 20:49:52 +0200
  4987. Reply-To: kermit-support@watsun.cc.columbia.edu
  4988. Message-ID: <CMM.0.90.4.907971586.jaltman@watsun.cc.columbia.edu>
  4989.  
  4990. One more note regarding Unicode UTF-8 and text terminals.  If the text
  4991. terminal is an ANSI X3.64-1979 derivative and the character set is
  4992. UTF-8, all of the terminal command sequences must use the 7-bit
  4993. equivalents to the 8-bit C1 controls.  
  4994.  
  4995. This may be a reason for why UTF-7 might be perferred in an text
  4996. terminal environment.  I do not believe that UTF-7 would interfere
  4997. with the C1 control character range.
  4998.  
  4999. Also, modifications would need to be made to how the terminal responds
  5000. to character-set invocation comamnds.  In general, I believe that all
  5001. of the ISO 2022 rules for character-set handling would need to be
  5002. ignored.   The result is that you would be restricted to using only
  5003. those characters available in Unicode and could not use any of the
  5004. Special Graphics characters available in most terminal emulations for
  5005. box drawing.
  5006.  
  5007.  
  5008.     Jeffrey Altman * Sr.Software Designer * Kermit-95 for Win32 and OS/2
  5009.                  The Kermit Project * Columbia University
  5010.               612 West 115th St #716 * New York, NY * 10025
  5011.   http://www.kermit-project.org/k95.html * kermit-support@kermit-project.org
  5012.  
  5013.  
  5014.  9-Oct-98 17:08:26-GMT,2889;000000000011
  5015. Return-Path: <unicode@unicode.org>
  5016. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5017.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id NAA02699
  5018.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 13:08:24 -0400 (EDT)
  5019. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5020.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id KAA36498
  5021.     ; Fri, 9 Oct 1998 10:05:17 -0700
  5022. Received: by unicode.org (NX5.67g/NX3.0S)
  5023.     id AA24722; Fri, 9 Oct 98 10:01:01 -0700
  5024. Message-Id: <9810091701.AA24722@unicode.org>
  5025. Errors-To: uni-bounce@unicode.org
  5026. Mime-Version: 1.0
  5027. Content-Type: text/plain; charset=us-ascii
  5028. X-Uml-Sequence: 6128 (1998-10-09 17:00:45 GMT)
  5029. From: Otto Stolz <Otto.Stolz@uni-konstanz.de>
  5030. Reply-To: unicode@unicode.org
  5031. To: Unicode List <unicode@unicode.org>
  5032. Date: Fri, 9 Oct 1998 10:00:44 -0700 (PDT)
  5033. Subject: Re: Terminal Graphics Draft 2
  5034.  
  5035. Frank da Cruz had proposed:
  5036. >  E0B3  Latin small letter a with underbar    SNI Math 04/04 (2)
  5037. >  E0B4  Latin capital letter O with underbar  SNI Math 04/09 (2)
  5038.  
  5039. Rick McGowan wrote:
  5040. > I believe [those] two characters are just masculine and feminine
  5041. > ordinal indicators, and are already encoded between 0x80 and 0xFF, as part
  5042. > of ISO Latin 1.  They are probably just variant glyphs... unless the
  5043. > documentation distinguishes them and they occur in pairs with lower-case.
  5044.  
  5045. Am 1998-10-8 um 14:07 hat Frank da Cruz geschrieben:
  5046. > The reason these need to be encoded
  5047. > separately from feminine/masculine ordinals are their size -- they fill the
  5048. > whole cell, like a regular letter.  Since terminal emulators and data
  5049. > analyzers use fixed-pitch fonts, we can't just switch to another point size
  5050. > to display these characters, since that will wreck the matrix arrangement
  5051. > of the screen.
  5052.  
  5053. This is what I cannot understand.
  5054.  
  5055. If the Feminine, and Masculine, Ordinal Indicators (U+00AA, and U+00BA,
  5056. respectively) were written in the same fixed-pitch font as the surrounding
  5057. text, they also would occupy one cell, each, won't they?
  5058.  
  5059. As Frank had written in both of his own drafts:
  5060. > arriving at a sufficient set of character-cell terminal graphics for
  5061. > Unicode is complicated by the well-known problems that affect other
  5062. > preexisting character sets to varying degrees:
  5063. >  1. Lack of official names for the characters of some of the sets.
  5064. >  2. Lack of definitive, high-quality pictures of the glyphs in some cases.
  5065. >  3. Lack of descriptions of the purpose and intended use of the glyphs.
  5066.  
  5067. I think, those are good reasons not to take the glyphs in the Siemens
  5068. Nixdorf 97801-5xx Benutzerhandbuch too seriously -- good reasons to unify
  5069. these characters with the above-mentioned U+00AA and U+00BA. The only
  5070. reason, IMHO, not to unify them would be existence of a character set
  5071. containing different glyphs both for the proposed characters and the
  5072. existing ones -- as Rick has already noted.
  5073.  
  5074. Best wishes,
  5075.   Otto Stolz
  5076.  
  5077.  9-Oct-98 18:40:04-GMT,3883;000000000001
  5078. Return-Path: <unicode@unicode.org>
  5079. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5080.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id OAA28263
  5081.     for <fdc@watsun.cc.columbia.edu>; Fri, 9 Oct 1998 14:40:02 -0400 (EDT)
  5082. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5083.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id LAA40650
  5084.     ; Fri, 9 Oct 1998 11:26:03 -0700
  5085. Received: by unicode.org (NX5.67g/NX3.0S)
  5086.     id AA25671; Fri, 9 Oct 98 10:52:15 -0700
  5087. Message-Id: <9810091752.AA25671@unicode.org>
  5088. Errors-To: uni-bounce@unicode.org
  5089. X-Uml-Sequence: 6134 (1998-10-09 17:51:41 GMT)
  5090. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  5091. Reply-To: unicode@unicode.org
  5092. To: Unicode List <unicode@unicode.org>
  5093. Date: Fri, 9 Oct 1998 10:51:40 -0700 (PDT)
  5094. Subject: Re: Terminal Graphics Draft 2
  5095.  
  5096. > If the Feminine, and Masculine, Ordinal Indicators (U+00AA, and U+00BA,
  5097. > respectively) were written in the same fixed-pitch font as the surrounding
  5098. > text, they also would occupy one cell, each, won't they?
  5099. Yes, but they would be too small.  The SNI glyphs are full-size base
  5100. characters, but the ordinal indicator glyphs are superscripts.
  5101.  
  5102. > As Frank had written in both of his own drafts:
  5103. > > arriving at a sufficient set of character-cell terminal graphics for
  5104. > > Unicode is complicated by the well-known problems that affect other
  5105. > > preexisting character sets to varying degrees:
  5106. > >  1. Lack of official names for the characters of some of the sets.
  5107. > >  2. Lack of definitive, high-quality pictures of the glyphs in some cases.
  5108. > >  3. Lack of descriptions of the purpose and intended use of the glyphs.
  5109. > I think, those are good reasons not to take the glyphs in the Siemens
  5110. > Nixdorf 97801-5xx Benutzerhandbuch too seriously -- good reasons to unify
  5111. > these characters with the above-mentioned U+00AA and U+00BA. The only
  5112. > reason, IMHO, not to unify them would be existence of a character set
  5113. > containing different glyphs both for the proposed characters and the
  5114. > existing ones -- as Rick has already noted.
  5115. I tend to agree.  The "strange" SNI glyphs are not a high priority, to me
  5116. personally at least.  I have, however, posted a message to the Sinix newsgroup
  5117. (of SNI customers) to see if any strong opinions come to the surface.  All I
  5118. can say from my own experience is that there was heavy demand for accurate
  5119. SNI terminal emulation for Windows 95/98/NT, and we met that demand as best
  5120. we could within the limitations of the code pages and fonts available to us.
  5121. For those of you not familiar with SNI 97801, it probably has the most
  5122. advanced ISO 2022 implementation and repertoire of character sets of any
  5123. terminal ever built -- at least in the West (it lacks Hebrew, Arabic, and
  5124. CJK, but includes ISO 8859-1,2,3,4,5,7,9, various ISO 646 versions, plus
  5125. a selection of "strange" private sets, and a wide variety of input methods).
  5126.  
  5127. To answer Otto's point with a question: what is a character set?  I can see
  5128. both a superscript feminine ordinal and a "big" feminine ordinal on the same
  5129. screen simply by sending ISO 2022 escape sequences to switch "character sets".
  5130. So in a sense, all character sets that can be designated and invoked by ISO
  5131. 2022 escape sequences form one big character set :-)  See, for example:
  5132.  
  5133.   http://www.columbia.edu/kermit/kuishots.html
  5134.  
  5135. Go down to Shot 3.  This screen was produced using ISO 2022 escape sequences
  5136. from the host to a VT320 terminal emulator on Windows 95, with Lucida Console
  5137. as the (Unicode) font.  The same screen could be produced by sending the exact
  5138. same data stream to the 97801.  (This screen does not show any of the SNI
  5139. "strange" glyphs, but I hope it illustrates the point.)
  5140.  
  5141. Again, I have no great investment in these characters, and so far our SNI
  5142. users have not complained about their absence, but before striking them I
  5143. hope to hear some additional testimony from them.
  5144.  
  5145. - Frank
  5146.  
  5147. 30-Oct-98 20:53:04-GMT,1988;000000000001
  5148. Return-Path: <unicode@unicode.org>
  5149. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5150.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id PAA29389
  5151.     for <fdc@watsun.cc.columbia.edu>; Fri, 30 Oct 1998 15:53:03 -0500 (EST)
  5152. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5153.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id MAA49598
  5154.     ; Fri, 30 Oct 1998 12:50:52 -0800
  5155. Received: by unicode.org (NX5.67g/NX3.0S)
  5156.     id AA17044; Fri, 30 Oct 98 11:48:35 -0800
  5157. Message-Id: <9810301948.AA17044@unicode.org>
  5158. Errors-To: uni-bounce@unicode.org
  5159. X-Uml-Sequence: 6361 (1998-10-30 19:45:46 GMT)
  5160. From: kenw@sybase.com (Kenneth Whistler)
  5161. Reply-To: unicode@unicode.org
  5162. To: Unicode List <unicode@unicode.org>
  5163. Cc: kenw@sybase.com
  5164. Date: Fri, 30 Oct 1998 11:45:42 -0800 (PST)
  5165. Subject: Re: Terminal Emulation
  5166.  
  5167. Doug commented:
  5168. > Excluding the hex-byte characters (which almost nobody seems to like),
  5169. > we're only talking about 256 characters, aren't we?  I guess I don't
  5170. > understand why the opposition is so vigorous.
  5171.  
  5172. As *glyphs*, nobody cares. They're fine. Anybody who wants to use
  5173. glyphs like these to represent hex byte values may feel free to do
  5174. so, and nobody will object.
  5175.  
  5176. As *characters*, they are useless dreck. There is no reason to
  5177. introduce into a text stream a *character*--say U+2841--to serve
  5178. as a visible symbolic placeholder for the byte value 0x41. What
  5179. purpose does this serve? Debuggers translate *byte values* into
  5180. visibly displayed glyphs (either unitary, as proposed here, or
  5181. simply as sequences of glyphs for the hex digits, i.e. "41").
  5182. Adding an arbitrary layer of textual *characters* in between
  5183. just gets in the way of what the debugger should be doing.
  5184.  
  5185. Unicode is a *character* encoding standard. It is not a glyph
  5186. registry. People who want a registry of well-defined glyphs that
  5187. font vendors can use to produce common collections of displayable
  5188. glyphs (for terminal emulations or whatever) should be talking
  5189. to AFII, instead.
  5190.  
  5191. --Ken
  5192.  
  5193. 30-Oct-98 22:51:33-GMT,1287;000000000001
  5194. Return-Path: <unicode@unicode.org>
  5195. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5196.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id RAA17156
  5197.     for <fdc@watsun.cc.columbia.edu>; Fri, 30 Oct 1998 17:51:32 -0500 (EST)
  5198. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5199.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id OAA35960
  5200.     ; Fri, 30 Oct 1998 14:44:39 -0800
  5201. Received: by unicode.org (NX5.67g/NX3.0S)
  5202.     id AA18475; Fri, 30 Oct 98 13:06:37 -0800
  5203. Message-Id: <9810302106.AA18475@unicode.org>
  5204. Errors-To: uni-bounce@unicode.org
  5205. X-Uml-Sequence: 6366 (1998-10-30 21:01:33 GMT)
  5206. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  5207. Reply-To: unicode@unicode.org
  5208. To: Unicode List <unicode@unicode.org>
  5209. Date: Fri, 30 Oct 1998 13:01:30 -0800 (PST)
  5210. Subject: Re: Terminal Emulation
  5211.  
  5212. Michael Everson wrote:
  5213.  
  5214. > > 2. The letterlike characters from the SNI Math set that I had in the
  5215. > >    first draft but later withdrew are in fact from ISO Registration
  5216. > >    103: Teletex Supplementary Set of Graphic Characters from CCITT
  5217. > >    (ITU-T) T.61.  These include Lappish Eng...
  5218. > Sami eng.
  5219. Right, I knew that, sorry.  (I was hurriedly copying the names from the 
  5220. Teletex standard, which says "Lappish"...)
  5221.  
  5222. Revisions coming up momentarily.
  5223.  
  5224. - Frank
  5225.  
  5226. 30-Oct-98 23:12:33-GMT,2135;000000000001
  5227. Return-Path: <unicode@unicode.org>
  5228. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5229.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id SAA18729
  5230.     for <fdc@watsun.cc.columbia.edu>; Fri, 30 Oct 1998 18:12:33 -0500 (EST)
  5231. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5232.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id PAA25438
  5233.     ; Fri, 30 Oct 1998 15:10:28 -0800
  5234. Received: by unicode.org (NX5.67g/NX3.0S)
  5235.     id AA18765; Fri, 30 Oct 98 13:16:27 -0800
  5236. Message-Id: <9810302116.AA18765@unicode.org>
  5237. Errors-To: uni-bounce@unicode.org
  5238. X-Uml-Sequence: 6367 (1998-10-30 21:14:12 GMT)
  5239. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  5240. Reply-To: unicode@unicode.org
  5241. To: Unicode List <unicode@unicode.org>
  5242. Date: Fri, 30 Oct 1998 13:14:11 -0800 (PST)
  5243. Subject: Terminal Charsets Proposal
  5244.  
  5245. Well, I ran out of time -- gotta go now, probably won't be back till
  5246. Monday, so there's no way to get these to the appropriate parties on
  5247. paper by Fedex on November 2nd.  Maybe November 3rd?...
  5248.  
  5249. Anyway, the proposal is now split into 3: regular glyphs, control pics,
  5250. and hex bytes.
  5251.  
  5252. Michael Everson's glyph map is included, as well as an archive of the
  5253. email discussion and a document from SNI about their glyphs.
  5254.  
  5255. I would have liked to spend more time polishing -- and will do so before
  5256. I send them in for real.  In the meantime, any comments will be
  5257. appreciated (but not responded to for a few days).
  5258.  
  5259.   HEX BYTE PICTURES FOR UNICODE (plain text)
  5260.     ftp://kermit.columbia.edu/kermit/ucsterminal/hex.txt
  5261.  
  5262.   ADDITIONAL CONTROL PICTURES FOR UNICODE (plain text)
  5263.     ftp://kermit.columbia.edu/kermit/ucsterminal/control
  5264.  
  5265.   TERMINAL GRAPHICS FOR UNICODE (plain text)
  5266.     ftp://kermit.columbia.edu/kermit/ucsterminal/ucsterminal.txt
  5267.  
  5268.   Glyph Map (PDF, binary, contributed by Michael Everson)
  5269.     ftp://kermit.columbia.edu/kermit/ucsterminal/terminal-emulation.pdf
  5270.  
  5271.   Clarification of SNI Glyphs (Microsoft Word 7.0, binary, from SNI)
  5272.     ftp://kermit.columbia.edu/kermit/ucsterminal/sni-charsets.doc
  5273.  
  5274.   Discussion (Unicode list e-mail, plain text)
  5275.     ftp://kermit.columbia.edu/kermit/ucsterminal/mail.txt
  5276.  
  5277. - Frank
  5278.  
  5279. 30-Oct-98 23:43:13-GMT,1360;000000000001
  5280. Return-Path: <unicode@unicode.org>
  5281. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5282.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id SAA23024
  5283.     for <fdc@watsun.cc.columbia.edu>; Fri, 30 Oct 1998 18:43:12 -0500 (EST)
  5284. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5285.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id PAA36380
  5286.     ; Fri, 30 Oct 1998 15:34:42 -0800
  5287. Received: by unicode.org (NX5.67g/NX3.0S)
  5288.     id AA19518; Fri, 30 Oct 98 13:48:53 -0800
  5289. Message-Id: <9810302148.AA19518@unicode.org>
  5290. Errors-To: uni-bounce@unicode.org
  5291. X-Uml-Sequence: 6370 (1998-10-30 21:45:39 GMT)
  5292. From: Rick McGowan <rmcgowan@apple.com>
  5293. Reply-To: unicode@unicode.org
  5294. To: Unicode List <unicode@unicode.org>
  5295. Date: Fri, 30 Oct 1998 13:45:38 -0800 (PST)
  5296. Subject: Re: Terminal Emulation
  5297.  
  5298. Doug Ewell wrote and Everson commented...
  5299.  
  5300. > > ... to include characters of debatable usefulness
  5301. > > rather than excluding them.
  5302. >
  5303. > No way! Include characters of limited usefulness, perhaps. But not of
  5304. > debatable usefulness.
  5305.  
  5306. I missed this one.  Good call, Michael!  Nobody wants things of debatable  
  5307. usefulness.  Either the committees as a whole are convinced of some utility,  
  5308. and the characters go IN, or they're not convinced of utility, and the  
  5309. characters stay OUT.  (Luckily, nobody has to use or like every single  
  5310. character...)
  5311.  
  5312.     Rick
  5313.  
  5314. 31-Oct-98  2:30:27-GMT,1649;000000000001
  5315. Return-Path: <unicode@unicode.org>
  5316. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5317.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id VAA08939
  5318.     for <fdc@watsun.cc.columbia.edu>; Fri, 30 Oct 1998 21:30:27 -0500 (EST)
  5319. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5320.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id SAA27418
  5321.     ; Fri, 30 Oct 1998 18:27:33 -0800
  5322. Received: by unicode.org (NX5.67g/NX3.0S)
  5323.     id AA00927; Fri, 30 Oct 98 16:46:07 -0800
  5324. Message-Id: <9810310046.AA00927@unicode.org>
  5325. Errors-To: uni-bounce@unicode.org
  5326. X-Uml-Sequence: 6382 (1998-10-31 00:45:41 GMT)
  5327. From: "Joan Aliprand"   <BR.JMA@rlg.org>
  5328. Reply-To: unicode@unicode.org
  5329. To: Unicode List <unicode@unicode.org>
  5330. Date: Fri, 30 Oct 1998 16:45:40 -0800 (PST)
  5331. Subject:  Re: Terminal Charsets Proposal - alternative deadlines
  5332.  
  5333. REPLY TO 10/30/98 15:25 FROM UNICODE@UNICODE.ORG: Terminal Charsets Proposal
  5334.  
  5335. Frank:
  5336.  
  5337. > Well, I ran out of time -- gotta go now, probably won't be back till
  5338. > Monday, so there's no way to get these to the appropriate parties on
  5339. > paper by Fedex on November 2nd.  Maybe November 3rd?...
  5340.  
  5341. You have two chances:
  5342.  
  5343. (a) Yes, I guess Arnold could hold off for one day.  (I'll leave a message
  5344.     for him.)
  5345.  
  5346. (b) But if you get your proposal to the Unicode Office by Monday, November
  5347.     16, there is enough time to make copies for distribution at the UTC/L2
  5348.     meeting (even with the Thanksgiving holiday intervening).
  5349.  
  5350. And it is possible for us to pull a copy from a site.  (However, then you
  5351. are trusting that software and connections work correctly.)
  5352.  
  5353. -- Joan Aliprand
  5354.    Chair, UTC
  5355.  
  5356. To:  UNICODE@UNICODE.ORG
  5357.  
  5358.  1-Nov-98  9:01:20-GMT,2440;000000000001
  5359. Return-Path: <unicode@unicode.org>
  5360. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5361.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id EAA11750
  5362.     for <fdc@watsun.cc.columbia.edu>; Sun, 1 Nov 1998 04:01:19 -0500 (EST)
  5363. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5364.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id BAA19848
  5365.     ; Sun, 1 Nov 1998 01:00:40 -0800
  5366. Received: by unicode.org (NX5.67g/NX3.0S)
  5367.     id AA06934; Sun, 1 Nov 98 00:42:50 -0800
  5368. Message-Id: <9811010842.AA06934@unicode.org>
  5369. Errors-To: uni-bounce@unicode.org
  5370. Mime-Version: 1.0
  5371. Content-Type: text/plain; charset=ISO-8859-1
  5372. Content-Disposition: inline
  5373. X-Uml-Sequence: 6387 (1998-11-01 08:42:33 GMT)
  5374. From: Doug Ewell <dewell@compuserve.com>
  5375. Reply-To: unicode@unicode.org
  5376. To: Unicode List <unicode@unicode.org>
  5377. Date: Sun, 1 Nov 1998 00:42:31 -0800 (PST)
  5378. Subject: Re: Terminal Emulation
  5379. Content-Transfer-Encoding: 8bit
  5380. X-MIME-Autoconverted: from quoted-printable to 8bit by watsun.cc.columbia.edu id EAA11750
  5381.  
  5382. Kenneth Whistler <kenw@sybase.com> wrote:
  5383.  
  5384. > Doug commented:
  5385. >
  5386. >> Excluding the hex-byte characters (which almost nobody seems to
  5387. >> like), we're only talking about 256 characters, aren't we?  I
  5388. >> guess I don't understand why the opposition is so vigorous.
  5389. >
  5390. > As *glyphs*, nobody cares. They're fine. Anybody who wants to use
  5391. > glyphs like these to represent hex byte values may feel free to do
  5392. > so, and nobody will object.
  5393. >
  5394. > As *characters*, they are useless dreck.
  5395. ...
  5396.  
  5397. Sorry, I guess my use of the word "excluding" was somehow misleading.
  5398. I did not mean to appear to be supporting addition of the hex bytes
  5399. into Unicode.  I meant to say that, IF the hex bytes were removed
  5400. from the proposal, we would be left with a single 256-character block
  5401. (which is not even fully populated) and that I wouldn't have guessed
  5402. that its addition would have caused so much controversy.
  5403.  
  5404. I should also point out for the benefit of Michael, Rick, and others
  5405. that I nearly used the phrase "limited usefulness" instead of
  5406. "debatable usefulness," and in retrospect should have.  I meant
  5407. "debatable" from the perspective of individual users, but "limited"
  5408. from the perspective of the committees.  All character sets have at
  5409. least one character that SOMEBODY might think is not necessary, as
  5410. evidenced by the case of the gentleman who wanted to replace the
  5411. supposedly useless vertical bar in ASCII with the Euro symbol.
  5412.  
  5413. Cheers,
  5414.  
  5415. -Doug
  5416.  
  5417.  1-Nov-98 11:24:09-GMT,2545;000000000001
  5418. Return-Path: <unicode@unicode.org>
  5419. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5420.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id GAA20339
  5421.     for <fdc@watsun.cc.columbia.edu>; Sun, 1 Nov 1998 06:24:08 -0500 (EST)
  5422. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5423.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id DAA63194
  5424.     ; Sun, 1 Nov 1998 03:23:26 -0800
  5425. Received: by unicode.org (NX5.67g/NX3.0S)
  5426.     id AA07272; Sun, 1 Nov 98 03:17:44 -0800
  5427. Message-Id: <9811011117.AA07272@unicode.org>
  5428. Errors-To: uni-bounce@unicode.org
  5429. Mime-Version: 1.0
  5430. Content-Type: text/plain; charset="iso-8859-1"
  5431. X-Uml-Sequence: 6388 (1998-11-01 11:17:31 GMT)
  5432. From: Michael Everson <everson@indigo.ie>
  5433. Reply-To: unicode@unicode.org
  5434. To: Unicode List <unicode@unicode.org>
  5435. Date: Sun, 1 Nov 1998 03:17:30 -0800 (PST)
  5436. Subject: Re: Terminal Emulation
  5437. Content-Transfer-Encoding: 8bit
  5438. X-MIME-Autoconverted: from quoted-printable to 8bit by watsun.cc.columbia.edu id GAA20339
  5439.  
  5440. Ar 00:42 -0800 1998-11-01, scrφobh Doug Ewell:
  5441.  
  5442. >Sorry, I guess my use of the word "excluding" was somehow misleading.
  5443. >I did not mean to appear to be supporting addition of the hex bytes
  5444. >into Unicode.  I meant to say that, IF the hex bytes were removed
  5445. >>from the proposal, we would be left with a single 256-character block
  5446. >(which is not even fully populated) and that I wouldn't have guessed
  5447. >that its addition would have caused so much controversy.
  5448.  
  5449.  
  5450. >I should also point out for the benefit of Michael, Rick, and others
  5451. >that I nearly used the phrase "limited usefulness" instead of
  5452. >"debatable usefulness," and in retrospect should have.  I meant
  5453. >"debatable" from the perspective of individual users, but "limited"
  5454. >from the perspective of the committees.
  5455.  
  5456. Any character the users aren't sure they want should not be proposed to the
  5457. committees.
  5458.  
  5459. >All character sets have at
  5460. >least one character that SOMEBODY might think is not necessary, as
  5461. >evidenced by the case of the gentleman who wanted to replace the
  5462. >supposedly useless vertical bar in ASCII with the Euro symbol.
  5463.  
  5464. >>>Shhhhh!<<< One oughtn't want say this too loudly. Best not encourage
  5465. >>>people to think of such things. (In ASCII one writes "EUR " or "E" if
  5466. >>>one cannot otherwise represent the EURO SIGN.)
  5467.  
  5468. --
  5469. Michael Everson, Everson Gunn Teoranta ** http://www.indigo.ie/egt
  5470. 15 Port Chaeimhghein ═ochtarach; Baile ┴tha Cliath 2; ╔ire/Ireland
  5471. Guthßn: +353 1 478-2597 ** Facsa: +353 1 478-2597 (by arrangement)
  5472. 27 Pßirc an FhΘithlinn;  Baile an Bh≤thair;  Co. ┴tha Cliath; ╔ire
  5473.  
  5474.  
  5475.  2-Nov-98 14:35:21-GMT,2873;000000000011
  5476. Return-Path: <oleary@msmail.awii.com>
  5477. Received: from timone.hac.awii.com (nat17.awii.com [208.133.247.17])
  5478.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id JAA22408
  5479.     for <fdc@watsun.cc.columbia.edu>; Mon, 2 Nov 1998 09:35:21 -0500 (EST)
  5480. Received: by timone with Internet Mail Service (5.0.1460.8)
  5481.     id <4D96PAWD>; Mon, 2 Nov 1998 09:36:05 -0500
  5482. Message-ID: <D2815B3074C2D1118F2B0060975B95283E3E8D@timone>
  5483. From: "O'Leary, Sean (NJ)" <oleary@msmail.awii.com>
  5484. To: "'Frank da Cruz'" <fdc@watsun.cc.columbia.edu>
  5485. Subject: RE: Terminal Charsets Proposal
  5486. Date: Mon, 2 Nov 1998 09:36:03 -0500 
  5487. MIME-Version: 1.0
  5488. X-Mailer: Internet Mail Service (5.0.1460.8)
  5489. Content-Type: text/plain
  5490.  
  5491. Frank,
  5492.  
  5493. I have found cases where a hex bytes area would be extremely useful. To me,
  5494. the hex bytes are at least as useful as the Braille or control character
  5495. encodings. It does not seem likely that the hex bytes will make it into
  5496. Unicode's BMP, but I am still interested in tracking which directions this
  5497. proposal goes.
  5498.  
  5499. I would be interested in reviewing your site at:
  5500.     ftp://kermit.columbia.edu/kermit/ucsterminal/hex.txt
  5501.  
  5502. but the site rejected my login attempts. Is this site for public viewing?
  5503.  
  5504. Thanks,
  5505.  
  5506. Sean O'Leary
  5507. Software Internationalization
  5508. Automated Wagering International
  5509. (201) 489-5950
  5510. email: oleary@awii.com
  5511.  
  5512.  
  5513.  
  5514. > -----Original Message-----
  5515. > From:    Frank da Cruz [SMTP:fdc@watsun.cc.columbia.edu]
  5516. > Sent:    Friday, October 30, 1998 4:14 PM
  5517. > To:    Unicode List
  5518. > Subject:    Terminal Charsets Proposal
  5519. > Well, I ran out of time -- gotta go now, probably won't be back till
  5520. > Monday, so there's no way to get these to the appropriate parties on
  5521. > paper by Fedex on November 2nd.  Maybe November 3rd?...
  5522. > Anyway, the proposal is now split into 3: regular glyphs, control pics,
  5523. > and hex bytes.
  5524. > Michael Everson's glyph map is included, as well as an archive of the
  5525. > email discussion and a document from SNI about their glyphs.
  5526. > I would have liked to spend more time polishing -- and will do so before
  5527. > I send them in for real.  In the meantime, any comments will be
  5528. > appreciated (but not responded to for a few days).
  5529. >   HEX BYTE PICTURES FOR UNICODE (plain text)
  5530. >     ftp://kermit.columbia.edu/kermit/ucsterminal/hex.txt
  5531. >   ADDITIONAL CONTROL PICTURES FOR UNICODE (plain text)
  5532. >     ftp://kermit.columbia.edu/kermit/ucsterminal/control
  5533. >   TERMINAL GRAPHICS FOR UNICODE (plain text)
  5534. >     ftp://kermit.columbia.edu/kermit/ucsterminal/ucsterminal.txt
  5535. >   Glyph Map (PDF, binary, contributed by Michael Everson)
  5536. >     ftp://kermit.columbia.edu/kermit/ucsterminal/terminal-emulation.pdf
  5537. >   Clarification of SNI Glyphs (Microsoft Word 7.0, binary, from SNI)
  5538. >     ftp://kermit.columbia.edu/kermit/ucsterminal/sni-charsets.doc
  5539. >   Discussion (Unicode list e-mail, plain text)
  5540. >     ftp://kermit.columbia.edu/kermit/ucsterminal/mail.txt
  5541. > - Frank
  5542.  
  5543.  2-Nov-98 19:30:37-GMT,2884;000000000001
  5544. Return-Path: <unicode@unicode.org>
  5545. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5546.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id OAA11073
  5547.     for <fdc@watsun.cc.columbia.edu>; Mon, 2 Nov 1998 14:30:29 -0500 (EST)
  5548. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5549.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id LAA69238
  5550.     ; Mon, 2 Nov 1998 11:27:30 -0800
  5551. Received: by unicode.org (NX5.67g/NX3.0S)
  5552.     id AA14632; Mon, 2 Nov 98 11:10:50 -0800
  5553. Message-Id: <9811021910.AA14632@unicode.org>
  5554. Errors-To: uni-bounce@unicode.org
  5555. Mime-Version: 1.0
  5556. Content-Type: text/plain; charset=iso-8859-1
  5557. X-Uml-Sequence: 6401 (1998-11-02 19:10:25 GMT)
  5558. From: Mark Davis <medavis2@us.ibm.com>
  5559. Reply-To: unicode@unicode.org
  5560. To: Unicode List <unicode@unicode.org>
  5561. Date: Mon, 2 Nov 1998 11:10:24 -0800 (PST)
  5562. Subject: New draft Unicode technical reports available for review
  5563. Content-Transfer-Encoding: 8bit
  5564. X-MIME-Autoconverted: from quoted-printable to 8bit by watsun.cc.columbia.edu id OAA11073
  5565.  
  5566. Unicode Technical Committee (UTC) meeting #78 will be held the first week of
  5567. December. As at every meeting, technical reports on
  5568. http://www.unicode.org/unicode/reports/techreports.html will come up for
  5569. discussion or approval. These papers can have significant impact on the
  5570. recommendations for implementations and on Unicode conformance. Topics include
  5571. how Unicode text is normalized for program identifiers and on the web, how
  5572. Unicode text should line-break, how to deal with characters that can either
  5573. have full-width or half-width in East Asian contexts, and how to sort Unicode
  5574. characters.
  5575.  
  5576. If you have any feedback on these topics, be sure to review the documents, and
  5577. send your feedback to contact point listed in each paper. For consideration at
  5578. any UTC meeting, you should make sure that your comments are sent well before
  5579. the meeting dates.
  5580.  
  5581. The draft technical reports include:
  5582.  
  5583. UTR #15: Unicode Normalization Forms
  5584. UTR #14: Line Breaking Properties
  5585. UTR #13: Unicode Newline Guidelines
  5586. UTR #11: East Asian Character Width
  5587. UTR #10: Unicode Collation Algorithm
  5588.  
  5589. In addition. we will be now be posting proposed draft technical reports as they
  5590. become available. These are in an earlier stage of development, and have not
  5591. yet been considered by the UTC, so feedback is especially valuable. Topics
  5592. include how to handle Unicode characters in regular expressions, the structure
  5593. and terminology for character encodings, handling Unicode on EBCDIC systems,
  5594. coding annotations (Ruby), and the Unicode BIDI algorithm.
  5595.  
  5596. UTR #18: Unicode Regular Expression Guidelines
  5597. UTR #17: Character Encoding Model
  5598. UTR #16: EBCDIC-Friendly UCS Transformation Format
  5599. UTR #12: Support for Interlinear Annotations
  5600. UTR #9: The Bidirectional Algorithm Reference Implementation
  5601.  
  5602.  
  5603. (UTR #6: Standard Compression Scheme for Unicode (SCSU) has also been
  5604. updated--editorial fixes only.)
  5605.  
  5606.  4-Nov-98  4:19:06-GMT,3638;000000000001
  5607. Return-Path: <unicode@unicode.org>
  5608. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5609.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id XAA22069
  5610.     for <fdc@watsun.cc.columbia.edu>; Tue, 3 Nov 1998 23:19:05 -0500 (EST)
  5611. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5612.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id UAA71048
  5613.     ; Tue, 3 Nov 1998 20:18:22 -0800
  5614. Received: by unicode.org (NX5.67g/NX3.0S)
  5615.     id AA25646; Tue, 3 Nov 98 20:06:44 -0800
  5616. Message-Id: <9811040406.AA25646@unicode.org>
  5617. Errors-To: uni-bounce@unicode.org
  5618. X-Uml-Sequence: 6418 (1998-11-04 04:06:32 GMT)
  5619. From: "Julia Oesterle (Unicode)" <v-juliao@microsoft.com>
  5620. Reply-To: unicode@unicode.org
  5621. To: Unicode List <unicode@unicode.org>
  5622. Date: Tue, 3 Nov 1998 20:06:31 -0800 (PST)
  5623. Subject: Re: Terminal Emulation from Frank da Cruz
  5624.  
  5625. this one went astray...resend.
  5626.  
  5627. Date: Tue, 3 Nov 98 19:25:39 EST
  5628. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  5629. Subject: Re: Terminal Emulation
  5630. >  
  5631. > Rich McGowan wrote:
  5632. >  
  5633. > > I'd suggest the best course of action for now would be to bring the
  5634. > > proposal to the attention of UTC members.  (Some of them are on the
  5635. > > Unicode list, others aren't.)  Ken and I can do this part, which merely
  5636. > > involves sending UTC some pointers and a blurb about the proposal, to
  5637. > > solicit their consideration and feedback.
  5638. > > 
  5639. > Thanks.  I think it's ready for this.  The proposal has been split into
  5640. > three (as noted previously), and updated again today for polish and
  5641. > constistency (from the rushed hatchet job of last Friday):
  5642. >  
  5643. >   HEX BYTE PICTURES FOR UNICODE (plain text)
  5644. >     ftp://kermit.columbia.edu/kermit/ucsterminal/hex.txt
  5645. >  
  5646. >   ADDITIONAL CONTROL PICTURES FOR UNICODE (plain text)
  5647. >     ftp://kermit.columbia.edu/kermit/ucsterminal/control.txt
  5648. >  
  5649. >   TERMINAL GRAPHICS FOR UNICODE (plain text)
  5650. >     ftp://kermit.columbia.edu/kermit/ucsterminal/ucsterminal.txt
  5651. >  
  5652. >   Glyph Map (PDF, contributed by Michael Everson) (*)
  5653. >     ftp://kermit.columbia.edu/kermit/ucsterminal/terminal-emulation.pdf
  5654. >  
  5655. >   Clarification of SNI Glyphs (Microsoft Word 7.0, from SNI)
  5656. >     ftp://kermit.columbia.edu/kermit/ucsterminal/sni-charsets.doc
  5657. >  
  5658. >   Discussion (plain text -- from Unicode mailing list)
  5659. >     ftp://kermit.columbia.edu/kermit/ucsterminal/mail.txt
  5660. >  
  5661. > I think the hex bytes proposal is worth another look by those on both
  5662. > sides 
  5663. > of the fence.  It has been beefed up considerably in the motivation /
  5664. > justification department.
  5665. >  
  5666. > After several more days of comment, I'll send them in on paper.
  5667. >  
  5668. > Thanks again to everybody for all the help (and patience).
  5669. >  
  5670. > - Frank
  5671. >  
  5672. > (*) Michael's glyph map is based on previous drafts; some of the
  5673. > characters
  5674. >     shown in it have since been eliminated from the proposal.
  5675. > ------------------------------Header--------------------------------------
  5676. > ---
  5677. > From watsun.cc.columbia.edu!fdc Tue Nov  3 17:09:57 1998
  5678. > Received: from watsun.cc.columbia.edu by unicode.com id aa28351;
  5679. >           3 Nov 98 17:09 PST
  5680. > Received: from watsun.cc.columbia.edu (watsun.cc.columbia.edu
  5681. > [128.59.39.2])
  5682. >     by mail1.dynamic.com (8.8.5/8.8.5) with ESMTP id QAA15248
  5683. >     for <unicode@unicode.com>; Tue, 3 Nov 1998 16:25:31 -0800
  5684. > Received: (from fdc@localhost)
  5685. >     by watsun.cc.columbia.edu (8.8.5/8.8.5) id TAA24416;
  5686. >     Tue, 3 Nov 1998 19:25:40 -0500 (EST)
  5687. > Date: Tue, 3 Nov 98 19:25:39 EST
  5688. > From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  5689. > Subject: Re: Terminal Emulation
  5690. > In-Reply-To: Your message of Thu, 29 Oct 1998 14:18:14 -0800
  5691. > To: unicode@unicode.com
  5692. > Message-ID: <CMM.0.90.4.910139139.fdc@watsun.cc.columbia.edu>
  5693.  
  5694.  9-Nov-98 21:09:50-GMT,2560;000000000001
  5695. Return-Path: <unicode@unicode.org>
  5696. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5697.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id QAA13219
  5698.     for <fdc@watsun.cc.columbia.edu>; Mon, 9 Nov 1998 16:09:49 -0500 (EST)
  5699. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5700.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id NAA26578
  5701.     ; Mon, 9 Nov 1998 13:09:21 -0800
  5702. Received: by unicode.org (NX5.67g/NX3.0S)
  5703.     id AA18733; Mon, 9 Nov 98 13:00:04 -0800
  5704. Message-Id: <9811092100.AA18733@unicode.org>
  5705. Errors-To: uni-bounce@unicode.org
  5706. X-Uml-Sequence: 6450 (1998-11-09 20:59:44 GMT)
  5707. From: kenw@sybase.com (Kenneth Whistler)
  5708. Reply-To: unicode@unicode.org
  5709. To: Unicode List <unicode@unicode.org>
  5710. Cc: kenw@sybase.com
  5711. Date: Mon, 9 Nov 1998 12:59:43 -0800 (PST)
  5712. Subject: Re: Displaying Plane 1 characters (annotating the code table
  5713.  
  5714. Markus Scherer noted:
  5715.  
  5716. > However, it probably makes sense for files as an easy and somewhat compact
  5717. > format, and it makes sense for the number of possible characters: 1M + 64k,
  5718. > including 128k+6400 private use character code points. There are about 38000
  5719. > characters assigned so far, with about 20000-30000 more in the pipeline.
  5720.  
  5721. Here are the exact values of what currently is encoded and what Unicode 3.0
  5722. will contain (synched with the prospective content of the republication
  5723. of ISO/IEC 10646-1):
  5724.  
  5725. Unicode 2.1:
  5726.  
  5727.  6813 Misc. characters
  5728. 20902 Unihan
  5729. 11172 Johab Hangul
  5730.  6400 Private use
  5731.  2048 Surrogates
  5732.    65 Controls
  5733.     2 Not characters
  5734. 18134 Unassigned assignable
  5735.  
  5736. 38887 Assigned graphic characters
  5737.  
  5738. Unicode 3.0 (prospective, as of November 3, 1998):
  5739.  
  5740. 10554 Misc. characters
  5741. 20902 Unihan
  5742.  6582 Unihan Extension A
  5743. 11172 Johab Hangul
  5744.  6400 Private use
  5745.  2048 Surrogates
  5746.    65 Controls
  5747.     2 Not characters
  5748.  7811 Unassigned assignable
  5749.  
  5750. 49210 Assigned graphic characters
  5751.  
  5752. For a net gain of 10323 new characters.
  5753.  
  5754. Others have noted the following, but I would like to reiterate, so that
  5755. *correct* rumors can circulate, instead of incorrect ones:
  5756.  
  5757. Unicode 3.0 will *not* contain any encoded characters requiring surrogates.
  5758. The republication of ISO/IEC 10646-1 will *not* contain any encoded
  5759.    characters outside of the Basic Multilingual Plane.
  5760.  
  5761. Plane 1 (and 2 and 14) are for ISO/IEC 10646-2, which is still in
  5762. working draft and which has not yet even started a CD ballot. When 10646
  5763. Part 2 progresses far enough, we anticipate publishing a Version 4.0 of
  5764. the Unicode Standard -- and *that* will make use of surrogate codes
  5765. to access encoded characters on Planes 1 and beyond.
  5766.  
  5767. --Ken Whistler
  5768.  
  5769.  9-Nov-98 21:53:20-GMT,3634;000000000001
  5770. Return-Path: <fdc>
  5771. Received: (from fdc@localhost)
  5772.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id QAA28069;
  5773.     Mon, 9 Nov 1998 16:52:57 -0500 (EST)
  5774. Date: Mon, 9 Nov 98 16:52:57 EST
  5775. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  5776. To: Joan Aliprand <BR.JMA@rlg.org>
  5777. cc: Ken Whistler <kenw@sybase.com>, Rick McGowan <rmcgowan@apple.com>,
  5778.         "Hart, Edwin F." <Edwin.Hart@jhuapl.edu>
  5779. Subject: Re: Terminal Charsets Proposal - alternative deadlines
  5780. In-Reply-To: Your message of Fri, 30 Oct 1998 16:45:40 -0800 (PST)
  5781. Message-ID: <CMM.0.90.4.910648377.fdc@watsun.cc.columbia.edu>
  5782.  
  5783. > > Well, I ran out of time -- gotta go now, probably won't be back till
  5784. > > Monday, so there's no way to get these to the appropriate parties on
  5785. > > paper by Fedex on November 2nd.  Maybe November 3rd?...
  5786. > You have two chances:
  5787. > ...
  5788. > (b) But if you get your proposal to the Unicode Office by Monday, November
  5789. >     16, there is enough time to make copies for distribution at the UTC/L2
  5790. >     meeting (even with the Thanksgiving holiday intervening).
  5791. Well, I posted an announcement of the latest drafts about a week ago (to the
  5792. wrong address, but you reposted them, thanks!) and have not heard a peep, so
  5793. I suppose they must be ready to go.
  5794.  
  5795. > And it is possible for us to pull a copy from a site.  (However, then you
  5796. > are trusting that software and connections work correctly.)
  5797. The relevant files are all available via anonymous ftp to
  5798. kermit.columbia.edu [128.59.39.2], directory kermit/ucsterminal.  Transfer
  5799. all files in text mode except the ones marked (*):
  5800.  
  5801.   -rw-rw-r--  1 fdc          1067 Nov  4 11:14 README.TXT
  5802.   -rw-rw-r--  1 fdc         41001 Nov  3 19:12 control.txt
  5803.   -rw-rw-r--  1 fdc         14665 Nov  3 19:12 hex.txt
  5804.   -rw-rw-r--  1 fdc        257434 Nov  9 16:14 mail.txt
  5805.   -rw-rw-r--  1 fdc         42496 Oct 30 12:46 sni-charsets.doc         (*)
  5806.   -rw-rw-r--  1 fdc         88216 Oct 30 12:45 terminal-emulation.pdf   (*)
  5807.   -rw-rw-r--  1 fdc         38763 Nov  3 19:12 ucsterminal.txt
  5808.   -rw-rw-r--  1 fdc         44534 Sep 30 21:27 ucsterminal_01.txt
  5809.   -rw-rw-r--  1 fdc         59180 Oct  7 20:03 ucsterminal_02.txt
  5810.   -rw-rw-r--  1 fdc         37651 Oct 30 15:52 ucsterminal_03.txt
  5811.  
  5812. (*) Transfer these in binary mode.
  5813.  
  5814. The three proposals are:
  5815.  
  5816.   -rw-rw-r--  1 fdc         41001 Nov  3 19:12 control.txt
  5817.   -rw-rw-r--  1 fdc         14665 Nov  3 19:12 hex.txt
  5818.   -rw-rw-r--  1 fdc         38763 Nov  3 19:12 ucsterminal.txt
  5819.  
  5820. The Unicode mail list discussion is:
  5821.  
  5822.   -rw-rw-r--  1 fdc        257434 Nov  9 16:14 mail.txt
  5823.  
  5824. The glyph maps are in a PDF file from Michael Everson:
  5825.  
  5826.   -rw-rw-r--  1 fdc         88216 Oct 30 12:45 terminal-emulation.pdf
  5827.  
  5828. Clarification on the mysterious Siemens Nixdorf glyphs is in the
  5829. following Microsoft Word file:
  5830.  
  5831.   -rw-rw-r--  1 fdc         42496 Oct 30 12:46 sni-charsets.doc
  5832.  
  5833. And the following are earlier drafts of the original monolithic proposal:
  5834.  
  5835.   -rw-rw-r--  1 fdc         44534 Sep 30 21:27 ucsterminal_01.txt
  5836.   -rw-rw-r--  1 fdc         59180 Oct  7 20:03 ucsterminal_02.txt
  5837.   -rw-rw-r--  1 fdc         37651 Oct 30 15:52 ucsterminal_03.txt
  5838.  
  5839. I also have a set of "exhibits" on paper, which are photocopies of
  5840. character-set tables from a selection of terminal manuals.  These are
  5841. listed at the end of ucsterminal.txt.  I don't have any way to put them
  5842. online, so I'll be glad to send them by fedex to any address you designate.
  5843. However, I don't think they could arrive at a Post Office box in time for
  5844. the deadline.
  5845.  
  5846. Can I consider the proposals submitted?  (Your web page says to send paper
  5847. "unless prior arrangements have been made for receipt of electronic copy").
  5848.  
  5849. Thanks!
  5850.  
  5851. - Frank
  5852.  
  5853.  9-Nov-98 22:49:26-GMT,1317;000000000011
  5854. Return-Path: <BR.JMA@RLG.ORG>
  5855. Received: from RLG.ORG (rlg.org [204.161.104.131])
  5856.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with SMTP id RAA15456
  5857.     for <fdc@watsun.cc.columbia.edu>; Mon, 9 Nov 1998 17:49:24 -0500 (EST)
  5858. Message-Id: <199811092249.RAA15456@watsun.cc.columbia.edu>
  5859. Date:     Mon,  9 Nov 98 14:48:50 PST
  5860. From: "Joan Aliprand"   <BR.JMA@RLG.ORG>
  5861. To: fdc@watsun.cc.columbia.edu
  5862. Subject:  Re: Terminal Charsets Proposal - alternative deadlines
  5863.  
  5864. REPLY TO 11/09/98 13:52 FROM FDC@WATSUN.CC.COLUMBIA.EDU "Frank da Cruz": Re:
  5865. Terminal Charsets Proposal - alternative deadlines
  5866.  
  5867. Dear Frank,
  5868.  
  5869. I have put your Terminal Charsets Proposal on the agenda for the UTC/L2
  5870. joint meeting in December.  However, the agenda has many items that are
  5871. time-critical for Version 3.0, so I cannot guarantee whether this proposal
  5872. will be discussed at this meeting.
  5873.  
  5874. I have been unable to connect to the Kermit FTP server this afternoon.  (I
  5875. tried from the Kermit Web site, as well as the direct IP address you gave.)
  5876.  
  5877. If problems persist, I may have to ask you to send the main documents
  5878. (i.e., the three proposals) by express mail or fax to the Unicode Office.
  5879.  
  5880. Yours sincerely,
  5881.  
  5882. -- Joan Aliprand
  5883.    Chair, UTC
  5884.  
  5885.  
  5886.  
  5887.  
  5888. To:  FDC@WATSUN.CC.COLUMBIA.EDU
  5889. cc:  KEN(KENW@SYBASE.COM), RICK(RMCGOWAN@APPLE.COM),
  5890.      HART(EDWIN.HART@JHUAPL.EDU)
  5891.  
  5892. 21-Nov-98 12:43:55-GMT,3190;000000000005
  5893. Return-Path: <markus.kuhn@cl.cam.ac.uk>
  5894. Received: from mailrelay1.cc.columbia.edu (mailrelay1.cc.columbia.edu [128.59.35.143])
  5895.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id HAA01746
  5896.     for <fdc@watsun.cc.columbia.edu>; Sat, 21 Nov 1998 07:43:48 -0500 (EST)
  5897. Received: from heaton.cl.cam.ac.uk (heaton.cl.cam.ac.uk [128.232.32.11])
  5898.     by mailrelay1.cc.columbia.edu (8.8.5/8.8.5) with SMTP id HAA17231
  5899.     for <fdc@columbia.edu>; Sat, 21 Nov 1998 07:43:35 -0500 (EST)
  5900. Received: from trillium.cl.cam.ac.uk (cl.cam.ac.uk) [128.232.8.5] (mgk25)
  5901.     by heaton.cl.cam.ac.uk with esmtp (Exim 1.82 #1)
  5902.     id 0zhCNx-0001jE-00; Sat, 21 Nov 1998 12:43:33 +0000
  5903. X-Mailer: exmh version 2.0.2+CL 2/24/98
  5904. To: fdc@columbia.edu
  5905. cc: unicode@unicode.org
  5906. Subject: UCS Terminal Emulation Draft
  5907. X-URL: http://www.cl.cam.ac.uk/~mgk25/
  5908. Mime-Version: 1.0
  5909. Content-Type: text/plain; charset=us-ascii
  5910. Date: Sat, 21 Nov 1998 12:43:31 +0000
  5911. From: Markus Kuhn <Markus.Kuhn@cl.cam.ac.uk>
  5912. Message-Id: <E0zhCNx-0001jE-00@heaton.cl.cam.ac.uk>
  5913.  
  5914. A few questions/suggestions on
  5915.  
  5916.   ftp://kermit.columbia.edu/kermit/ucsterminal/ucsterminal.txt
  5917.  
  5918. which I am implementing at the moment.
  5919.  
  5920. > * E0A6  Extensible UR or LL brace section      IBM SS240000
  5921. > * E0A7  Extensible LR or UL brace section      IBM SS250000
  5922.  
  5923. I don't understand why there are not four of these. How can UR and LL be
  5924. unified?
  5925.  
  5926. > * E0AE  Right ceiling corner                   DEC Tech 03/05
  5927. > * E0AF  Right floor corner                     DEC Tech 03/06
  5928.  
  5929. What are these good for? Big floor-ceiling operators can already be
  5930. constructed using the bracket segments. And why are there only right
  5931. versions of these?
  5932.  
  5933. >   E0EF  Box drawing double dash H   DGL 03/12 (5)
  5934. > (5) Similar to U+2504 but double rather than triple.
  5935.  
  5936. What is the difference to U+254c (BOX DRAWINGS LIGHT DOUBLE DASH
  5937. HORIZONTAL)? Michael's glyph in
  5938.  
  5939.   ftp://kermit.columbia.edu/kermit/ucsterminal/terminal-emulation.pdf
  5940.  
  5941. doesn't seem to fit the description here. This character is still a bit
  5942. confusing.
  5943.  
  5944. >  E0D8  H line - Scan 5             DSG 07/01, Wyse ANSI 02/02 (2)
  5945.  
  5946. I think, this one should be unified with U+2500. The E0D6-E0DA
  5947. characters should also be renamed, as a scan line count is ambiguous and
  5948. resolution dependent. Something like
  5949.  
  5950. E0D6  BOX DRAWINGS LIGHT HORIZONTAL UPPER ONE SIXTH
  5951. E0D7  BOX DRAWINGS LIGHT HORIZONTAL UPPER TWO SIXTH
  5952. E0D9  BOX DRAWINGS LIGHT HORIZONTAL LOWER TWO SIXTH
  5953. E0DA  BOX DRAWINGS LIGHT HORIZONTAL UPPER ONE SIXTH
  5954.  
  5955. and together with 2500 we would then have all the required lines.
  5956.  
  5957. An implementation of these characters is now available in
  5958.  
  5959.   http://www.cl.cam.ac.uk/~mgk25/download/ucs-fonts.tar.gz
  5960.  
  5961. in the file 6x13-future.bdf, in which I collect proposed implementations
  5962. of post-Unicode 2.1 characters for my 6x13 font. It would be nice if you
  5963. could have a look at these characters. [BTW: The 6x13.bdf file is now
  5964. complete and will be added to various Linux distributions in a few days.
  5965. This is your last chance to send me bug reports and suggestions for this
  5966. free Unicode xterm font before wide distribution.]
  5967.  
  5968. Markus
  5969.  
  5970. -- 
  5971. Markus G. Kuhn, Computer Laboratory, University of Cambridge, UK
  5972. Email: mkuhn at acm.org,  WWW: <http://www.cl.cam.ac.uk/~mgk25/>
  5973.  
  5974. 23-Nov-98 18:59:08-GMT,4546;000000000001
  5975. Return-Path: <unicode@unicode.org>
  5976. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  5977.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id NAA05690
  5978.     for <fdc@watsun.cc.columbia.edu>; Mon, 23 Nov 1998 13:59:05 -0500 (EST)
  5979. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  5980.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id KAA68464
  5981.     ; Mon, 23 Nov 1998 10:56:50 -0800
  5982. Received: by unicode.org (NX5.67g/NX3.0S)
  5983.     id AA19230; Mon, 23 Nov 98 10:49:18 -0800
  5984. Message-Id: <9811231849.AA19230@unicode.org>
  5985. Errors-To: uni-bounce@unicode.org
  5986. X-Uml-Sequence: 6651 (1998-11-23 18:49:05 GMT)
  5987. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  5988. Reply-To: unicode@unicode.org
  5989. To: Unicode List <unicode@unicode.org>
  5990. Cc: unicode@unicode.org
  5991. Date: Mon, 23 Nov 1998 10:49:02 -0800 (PST)
  5992. Subject: Re: UCS Terminal Emulation Draft
  5993.  
  5994. Hi Markus.
  5995.  
  5996. > A few questions/suggestions on
  5997. >   ftp://kermit.columbia.edu/kermit/ucsterminal/ucsterminal.txt
  5998. > which I am implementing at the moment.
  5999. > > * E0A6  Extensible UR or LL brace section      IBM SS240000
  6000. > > * E0A7  Extensible LR or UL brace section      IBM SS250000
  6001. > I don't understand why there are not four of these. How can UR and LL be
  6002. > unified?
  6003. Because they look exactly the same :-)  (IBM being clever...)
  6004.  
  6005. > > * E0AE  Right ceiling corner                   DEC Tech 03/05
  6006. > > * E0AF  Right floor corner                     DEC Tech 03/06
  6007. > What are these good for? Big floor-ceiling operators can already be
  6008. > constructed using the bracket segments. And why are there only right
  6009. > versions of these?
  6010. They're not centered vertically or horizontally.  Do you have a DEC terminal
  6011. manual?  They look about like this:
  6012.  
  6013. +------------------+    +------------------+
  6014. |                  |    |                  |
  6015. |  -------------+  |    |                  |
  6016. |               |  |    |               |  |
  6017. |               |  |    |               |  |
  6018. |                  |    |  -------------+  |
  6019. |                  |    |                  |
  6020. +------------------+    +------------------+
  6021.        03/05                    03/06
  6022.  
  6023. > > E0EF  Box drawing double dash H   DGL 03/12 (5)
  6024. > > (5) Similar to U+2504 but double rather than triple.
  6025. > What is the difference to U+254c (BOX DRAWINGS LIGHT DOUBLE DASH
  6026. > HORIZONTAL)? Michael's glyph in
  6027. >   ftp://kermit.columbia.edu/kermit/ucsterminal/terminal-emulation.pdf
  6028. > doesn't seem to fit the description here. This character is still a bit
  6029. > confusing.
  6030. I might have missed the glyph at U+254C -- I think this one might be a
  6031. candidate for unification.  The DG character, however, has wider spacing
  6032. between the dashes (for what it's worth).
  6033.  
  6034. > >  E0D8  H line - Scan 5             DSG 07/01, Wyse ANSI 02/02 (2)
  6035. > I think, this one should be unified with U+2500.
  6036. >
  6037. I think I commented on this in the proposal.  Yes, they should be unified,
  6038. but only if it can be guaranteed that the unified character works in both
  6039. contexts (PC-style box drawing and VT-style box drawing).  I don't see any
  6040. reason why it shouldn't, but I'm not a font designer.
  6041.  
  6042. > The E0D6-E0DA
  6043. > characters should also be renamed, as a scan line count is ambiguous and
  6044. > resolution dependent. Something like
  6045. > E0D6  BOX DRAWINGS LIGHT HORIZONTAL UPPER ONE SIXTH
  6046. > E0D7  BOX DRAWINGS LIGHT HORIZONTAL UPPER TWO SIXTH
  6047. > E0D9  BOX DRAWINGS LIGHT HORIZONTAL LOWER TWO SIXTH
  6048. > E0DA  BOX DRAWINGS LIGHT HORIZONTAL UPPER ONE SIXTH
  6049. > and together with 2500 we would then have all the required lines.
  6050. I'm certainly not averse to this.
  6051.  
  6052. > An implementation of these characters is now available in
  6053. >   http://www.cl.cam.ac.uk/~mgk25/download/ucs-fonts.tar.gz
  6054. > in the file 6x13-future.bdf, in which I collect proposed implementations
  6055. > of post-Unicode 2.1 characters for my 6x13 font.
  6056. >
  6057. You've encoded them in the private-use area, right?  Hopefully final resting
  6058. places will be designated for them in the U+2xxx region, and the repertoire
  6059. and/or sequencing might be altered.  For that matter the entire proposal might
  6060. be rejected.  In the latter case, of course, we can just keep these characters
  6061. where they are.
  6062.  
  6063. > It would be nice if you
  6064. > could have a look at these characters. [BTW: The 6x13.bdf file is now
  6065. > complete and will be added to various Linux distributions in a few days.
  6066. > This is your last chance to send me bug reports and suggestions for this
  6067. > free Unicode xterm font before wide distribution.]
  6068. I don't have a way to look at BDF files at the moment so can't comment --
  6069. let's take this offline...
  6070.  
  6071. Thanks!
  6072.  
  6073. - Frank
  6074.  
  6075. 23-Nov-98 22:37:12-GMT,1527;000000000001
  6076. Return-Path: <unicode@unicode.org>
  6077. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  6078.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id RAA12301
  6079.     for <fdc@watsun.cc.columbia.edu>; Mon, 23 Nov 1998 17:37:11 -0500 (EST)
  6080. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  6081.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id OAA49562
  6082.     ; Mon, 23 Nov 1998 14:33:24 -0800
  6083. Received: by unicode.org (NX5.67g/NX3.0S)
  6084.     id AA21773; Mon, 23 Nov 98 14:15:36 -0800
  6085. Message-Id: <9811232215.AA21773@unicode.org>
  6086. Errors-To: uni-bounce@unicode.org
  6087. X-Uml-Sequence: 6657 (1998-11-23 22:15:25 GMT)
  6088. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  6089. Reply-To: unicode@unicode.org
  6090. To: Unicode List <unicode@unicode.org>
  6091. Date: Mon, 23 Nov 1998 14:15:24 -0800 (PST)
  6092. Subject: Re: Glyphs of new Unicode 3.0 symbols
  6093.  
  6094. Roman Czyborra <czyborra@cs.tu-berlin.de> wrote:
  6095. > These exist in http://czyborra.com/unifont/.
  6096. > > 237E BELL SYMBOL
  6097. If this is an approved addition, and it is indeed a picture of a
  6098. bell, it can be unified with the "Picture of Bell" character in the
  6099. "Additional Control Pictures for Unicode" proposal.
  6100.  
  6101. > I also would like to see a standardized APPLE.
  6102. I thought corporate logos were off limits.  Note that Data General
  6103. terminals also include a DG-logo glyph.  There are no doubt several
  6104. others.  Well, come to think of it, the number of such logos would
  6105. be bounded by the number of corporations (and other organizations).
  6106. Looks, sounds, and smells like a can of worms to me!
  6107.  
  6108. - Frank
  6109.  
  6110. 30-Nov-98 20:43:16-GMT,6376;000000000001
  6111. Return-Path: <unicode@unicode.org>
  6112. Received: from public.lists.apple.com (public.lists.apple.com [17.254.0.151])
  6113.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id PAA22648
  6114.     for <fdc@watsun.cc.columbia.edu>; Mon, 30 Nov 1998 15:43:09 -0500 (EST)
  6115. Received: from unicode.org (unicode2.apple.com [17.254.3.212])
  6116.     by public.lists.apple.com (8.9.1a/8.9.1) with SMTP id MAA37976
  6117.     ; Mon, 30 Nov 1998 12:42:00 -0800
  6118. Received: by unicode.org (NX5.67g/NX3.0S)
  6119.     id AA00477; Mon, 30 Nov 98 12:13:45 -0800
  6120. Message-Id: <9811302013.AA00477@unicode.org>
  6121. Errors-To: uni-bounce@unicode.org
  6122. X-Uml-Sequence: 6845 (1998-11-30 20:12:10 GMT)
  6123. From: kenw@sybase.com (Kenneth Whistler)
  6124. Reply-To: considered_harmful@unicode.org
  6125. To: Unicode List <unicode@unicode.org>
  6126. Cc: kenw@sybase.com
  6127. Date: Mon, 30 Nov 1998 12:12:09 -0800 (PST)
  6128. Subject: Re: Glyphs of new Unicode 3.0 symbols
  6129. MIME-Version: 1.0
  6130. Content-Type: text/plain; charset=unknown-8bit
  6131. Content-Transfer-Encoding: 8bit
  6132.  
  6133. Roman suggested:
  6134.  
  6135. > Speaking of Unicode 3.0 (thank you all for the many enlightening
  6136. > details!) I would like to express my wish for the following additions
  6137. > to the Unicode 3.0 CD-ROM for implementor's convenience:
  6138.  
  6139. > 2. Add an "age" field to the unidata.txt to specify since which
  6140. >    Unicode version each character has been defined: 
  6141. >    "1.0", "1.1", "2.0", "2.1", or "3.0"
  6142.  
  6143. This is under active consideration for a much revised and extended
  6144. form of the Unicode Character Database data to accompany the release
  6145. of the Unicode Standard, Version 3.0. However, do not expect it to
  6146. simply be an additional field for the UnicodeData-X.Y.Z.txt file. The
  6147. format and field content of that file have been fixed for long enough that
  6148. there are multiple implementations out there that parse it with
  6149. particular assumptions about its format. There is an ongoing discussion,
  6150. but chances are that new data files will be introduced, with similar,
  6151. but new formats, for additional information provided about characters
  6152. in the future.
  6153.  
  6154. > 3. Add an "ASCII transliteration" mapping to each Unicode character
  6155. >    so that it can be rendered readable in ASCII contexts
  6156.  
  6157. This suggestion got thoroughly chewed over last week. Suffice it to
  6158. say that this is *way* down the priority list for those of us working
  6159. on the properties, attributes, and sundry characteristics of characters.
  6160. I consider this to be A) a black hole, and B) a great opportunity for
  6161. the vendors and industrious entrepeneurs to come up with appropriate
  6162. solutions for different classes of applications and groups of customers.
  6163. It is certainly not ripe for an ad hoc standardization by the
  6164. Unicode Consortium.
  6165.  
  6166. > 4. Make the names.txt equivalent to the book's charts by illustrating
  6167. >    it with UTF-8 characters, for example
  6168. > 0025 %  PERCENT SIGN
  6169. >         x (arabic percent sign - 066A ┘¬)
  6170. >         x (per mille sign - 2030 ΓÇ░)
  6171. >         x (per ten thousand sign - 2031 ΓÇ▒)
  6172.  
  6173. This is, of course, a fairly simple thing to do, but it has annoying
  6174. edge cases, since there are four digit years and four digit standards
  6175. citations in the file that have to be filtered so they don't produce
  6176. erroneous conversions. (For an example of the problem, see the note under
  6177. U+0197 in the Unicode Standard, Version 2.0.)
  6178.  
  6179. The transformation from the format of the text-only version of the
  6180. names list to the formatted, final version of the names list is fairly
  6181. complex and subtle. We will certainly again be placing the text-only
  6182. version of the names list on the CD-ROM, but the amount of special-purpose
  6183. massaging we do to it is a matter of resource contention with other
  6184. tasks for publication.
  6185.  
  6186. > 6. Add mapping tables for the other ISO standards listed as source
  6187. >    standards in chapter R.1 but not in mappings/iso*/
  6188.  
  6189. As someone else speculated, much of this information is not just
  6190. "available" and being held back -- it is implicit in mountains of
  6191. standards documents, explicit but scattered in various vendors'
  6192. implementations of mappings, but not sitting ready somewhere to just
  6193. stick on the CD-ROM.
  6194.  
  6195. We'll put what we have available, but even reviewing and updating the
  6196. sometimes outdated information in the tables we *do* have is going
  6197. to be a major task.
  6198.  
  6199. Frank asked:
  6200.  
  6201. > > > 237E BELL SYMBOL
  6202. > > 
  6203. > If this is an approved addition, and it is indeed a picture of a
  6204. > bell, it can be unified with the "Picture of Bell" character in the
  6205. > "Additional Control Pictures for Unicode" proposal.
  6206.  
  6207. This one is from ISO 2047 (see also DIN 66 213). Yes, it could (and should) 
  6208. have been unified with U+2407 SYMBOL FOR BELL, but that is not what the
  6209. ISO committee decided. But this is not the only instance in which a graphic
  6210. representation of a control code has taken on a life of its own as a
  6211. separate graphic character. Think of U+237E BELL SYMBOL now as a cute
  6212. little mushroom with legs in the technical symbols area. A propos for
  6213. representation of a door buzzer, or whatever... But if the terminal
  6214. graphics proposal needs both a "BEL" and a character for a picture of
  6215. a bell, this is it.
  6216.  
  6217. Roman asked:
  6218.  
  6219. > And is U+3004 JAPANESE INDUSTRIAL STANDARD SYMBOL no corporate symbol?
  6220.  
  6221. Yep, but there are always exceptions. This one is in Unicode because,
  6222. although this symbol is not in JIS standards (X 0208, for example), it
  6223. is universally used in Japanese JIS dictionaries as a little symbol to
  6224. indicate the JIS value of a character. So even if someone could point to
  6225. a claim that this is a trademarked logo, it has been genericized by
  6226. usage.
  6227.  
  6228. Tim Partridge asked:
  6229.  
  6230. > Back to the subject of what would be useful on the Unicode 3.0 CD, how about
  6231. > a list of the characters used by various languages? (Perhaps with
  6232. > classifications like "essential" and "only in foreign words".) Could the
  6233. > European subsetters be persuaded to contribute their data? The Cyrillic and
  6234. > Arabic blocks also merit attention.
  6235.  
  6236. This would be a nice thing to have, but is also a tremendous amount of
  6237. work and an open-ended project, since there are disagreements about the
  6238. status of various letters even within well-known languages, and there
  6239. are potentially 1000's of languages to deal with.
  6240.  
  6241. As for whether the European subsetters could be persuaded to contribute
  6242. their data, it might be more efficient for us to simply point at their
  6243. results for European languages when they stabilize and are available
  6244. in a public place. [CEN Workshop Agreement (CWA) on Alphabets of Europe]
  6245.  
  6246. --Ken Whistler
  6247.  
  6248.  
  6249.  7-Dec-98 15:57:11-GMT,7925;000000000005
  6250. Return-Path: <Edwin.Hart@jhuapl.edu>
  6251. Received: from aples2.jhuapl.edu (aples2.jhuapl.edu [128.244.26.86])
  6252.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id KAA21896
  6253.     for <fdc@watsun.cc.columbia.edu>; Mon, 7 Dec 1998 10:57:07 -0500 (EST)
  6254. Received: by aples2.jhuapl.edu with Internet Mail Service (5.5.2232.9)
  6255.     id <XX0C3C3R>; Mon, 7 Dec 1998 10:56:32 -0500
  6256. Message-ID: <91D1D51C2955D111B82B00805F19989501CD7290@aples2.jhuapl.edu>
  6257. From: "Hart, Edwin F." <Edwin.Hart@jhuapl.edu>
  6258. To: "'da Cruz, Frank'" <fdc@watsun.cc.columbia.edu>
  6259. Cc: "'Aliprand, Joan'" <br.jma@rlg.org>, "'Whistler, Ken'"
  6260.      <kenw@sybase.com>,
  6261.         "'McGowan, Rick'" <rmcgowan@apple.com>,
  6262.         "'Thewlis, Dave'" <dthewlis@dcta.com>
  6263. Subject: UTC response to your request to encode characters for terminal em
  6264.     ulation
  6265. Date: Mon, 7 Dec 1998 10:56:31 -0500 
  6266. MIME-Version: 1.0
  6267. X-Mailer: Internet Mail Service (5.5.2232.9)
  6268. Content-Type: text/plain;
  6269.     charset="iso-8859-1"
  6270. Content-Transfer-Encoding: 8bit
  6271. X-MIME-Autoconverted: from quoted-printable to 8bit by watsun.cc.columbia.edu id KAA21896
  6272.  
  6273. Frank,
  6274.  
  6275. What follows is the text of the response of the UTC to your proposals.  (If
  6276. you would prefer, I also have a Word97 version.)  The UTC needs some
  6277. additional information from you (and IBM and SHARE) before it decides about
  6278. the "Terminal Graphics for Unicode" proposal.  The next UTC meeting is in
  6279. February in Palo Alto and we would appreciate your response by then.
  6280.  
  6281. If you want, we can talk about this.
  6282.  
  6283. Best regards,
  6284. Ed
  6285.  
  6286. Edwin F. Hart
  6287. Applied Physics Laboratory
  6288. 11100 Johns Hopkins Road
  6289. Laurel, MD  20723-6099
  6290. +1-240-228-6926 (from Washington, DC area)
  6291. +1-443-778-6926 (from Baltimore area)
  6292. +1-240-228-1093 (fax)
  6293. edwin.hart@jhuapl.edu <mailto:edwin.hart@jhuapl.edu> 
  6294.  
  6295.  
  6296. 1998-December-07
  6297. To:    Frank da Cruz
  6298. From:    Unicode Technical Committee
  6299. Subject:    Response to your three proposals to encode characters for
  6300. terminal emulation.
  6301.  
  6302. Thank you for your three proposals for encoding terminal-emulation
  6303. characters in Unicode.  The proposals were well organized, thorough, and
  6304. well researched.
  6305. Results
  6306. The UTC acknowledges the concerns raised in your three documents.  The UTC
  6307. had extended discussions on these documents at its December, 1998 meeting in
  6308. San JosΘ.  Here is the result of these discussions for each paper.
  6309. 1.    Document L2/98-353, "Additional Control Pictures for Unicode"
  6310.     Status:  rejected
  6311.     The UTC believes that the proposed glyphs would be used as an
  6312. alternate way to display control characters rather than to interchange
  6313. information; e.g., to document control sequences.  The UTC decided not to
  6314. encode these glyphs in Unicode.
  6315.     However, the UTC noted that a bell glyph may have value in other
  6316. contexts and so could be encoded for another purpose in the future.  In
  6317. addition, the UTC noted that Unicode 3.0 aligns the abbreviations for
  6318. control characters along a diagonal as you had requested.
  6319.     As a secondary concern, encoding glyphs for control characters is an
  6320. open-ended proposition.  The UTC knows that multiple sets of control
  6321. characters are defined for the C1 control area.  For example, ISO had two
  6322. standards defining control characters, ISO/IEC 6429 and ISO 6630.  When
  6323. someone proposes a new set of C1 control characters, should they also be
  6324. considered for encoding?  What should be encoded?  Should exactly one glyph
  6325. be encoded per control-character code position or should multiple glyphs be
  6326. encoded for the same control-character code position?  These are examples of
  6327. concerns underlying the UTC decision rather than a request for you to answer
  6328. the questions.
  6329. 2.    Document L2/98-354, "Terminal Graphics for Unicode"
  6330.     Status: deferred for additional information
  6331.     The UTC has requested more information before it makes a decision.
  6332.     Table 5.1, range of E080 to E087.  The UTC has requested an official
  6333. position from IBM and feedback from SHARE on the glyphs used in the status
  6334. area of a 3270 display.
  6335.     Table 5.2, range of E0A0 to E0AD.  The UTC has requested that
  6336. Microsoft provide a list of the full set of glyphs used to construct
  6337. mathematical entities (brackets, braces, sigma, etc.).  Previously, the UTC
  6338. had decided not to encode these as characters.  However, once this
  6339. information is available, the UTC will revisit the issue.
  6340.     In addition, the UTC would appreciate your response to the
  6341. following:
  6342. a.    What is the full set of terminal-emulation glyphs that you
  6343. considered and how did you map those not in your proposal into Unicode?  The
  6344. UTC's concern is for round-trip integrity and distinguishing different
  6345. characters so that the UTC avoids mapping the characters in you proposal to
  6346. the same Unicode characters you used already for other glyphs in your full
  6347. set.  (The concern is not the characters from standard coded character sets
  6348. like 7-bit ASCII and the ISO/IEC 8859 series, but rather the set of symbols
  6349. outside of these sets.)
  6350. b.    Which of the following proposed characters could be unified with
  6351. (mapped into) Unicode characters?
  6352. 1)    Can you provide (a) the source glyphs for the proposed E0AC and E0AD
  6353. sigma/summation parts, and also (b) better glyphs for them.
  6354. 2)    What is the purpose of the proposed E0AE and E0AF characters?  Are
  6355. they supposed to be full corners for a box, or partial corners, or to
  6356. provide the top and bottom corners of right brackets, or to provide serifs
  6357. for the sigma (E0AC and E0AD)?  Could the proposed E0AE and E0AF characters
  6358. be unified with 231D top right corner and 231F bottom right corner?
  6359. 3)    For the proposed E0B0, could it be unified with either 2713 check
  6360. mark or 221A radical?  Is "small" the distinguishing characteristic for not
  6361. unifying it with 2713 or 221A?
  6362. 4)    For the proposed E0B1, should it be unified with either 237B not
  6363. check mark or 2415 symbol for negative acknowledge?
  6364. 5)    What is the purpose of the proposed E0D0 and E0D1 characters?  Are
  6365. they to be used to construct extended brackets and braces with the E0A0 to
  6366. E0AB "extensible" characters?  If so, then they should be moved to the
  6367. mathematical symbol area of your proposal.  If not, please explain how they
  6368. might be used.
  6369. 6)    Could the proposed E0D2 to E0D5 triangle characters be unified with
  6370. the 25E2 to 25E5 black triangle characters?
  6371. 7)    Could the proposed E0E5 diamond be unified with 25C6 black diamond?
  6372. 8)    Could the proposed E0EC be unified with 21E5 rightward arrow to bar?
  6373. 9)    Could the proposed E0ED be unified with 21E4 leftward arrow to bar?
  6374. 3.    Document L2/98-355, "Hex Byte Pictures for Unicode"
  6375.     Status:  rejected
  6376.     The UTC considers that these are glyphs and, as such, they are out
  6377. of the scope of the Unicode standard.  Representing hex bytes visibly is a
  6378. font-rendering issue rather than an information interchange issue.
  6379. Suggestions
  6380. Here are some suggestions for you to consider to help you meet your
  6381. requirements.
  6382. 1.    Code the glyphs in the Private Use Area.  If at some time in the
  6383. future, the terminal emulation vendors are using the assignments, then you
  6384. may resubmit your proposal (except for the pictures for hex bytes) to
  6385. Unicode with this additional justification.  It is beyond the scope of the
  6386. UTC to encode characters in the Private Use Area or to endorse any
  6387. particular use of characters in the Private Use Area.  If the terminal
  6388. emulation community believes that consistent use of private-use code
  6389. positions is desirable, you might consider registering your code assignments
  6390. in a registry for the Private Use Area such as the Conscript Registry.  Note
  6391. that Unicode does not endorse any registry for the Private Use Area.  Both
  6392. Adobe and Apple have described how each uses the Private Use Area.  You may
  6393. want to contact these organizations for additional information.
  6394. 2.    Register the glyphs with AFII (Association for Font Information
  6395. Interchange).  AFII is the registration authority for the ISO/IEC 10036
  6396. glyph registry.  AFII charges a nominal fee for registering glyphs.  If you
  6397. are interested in pursuing this, contact AFII ( <mailto:asmus@unicode.org>
  6398. afii@unicode.org) for more information.
  6399.  
  6400.  7-Dec-98 15:57:11-GMT,7925;000000000015
  6401. Return-Path: <Edwin.Hart@jhuapl.edu>
  6402. Received: from aples2.jhuapl.edu (aples2.jhuapl.edu [128.244.26.86])
  6403.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id KAA21896
  6404.     for <fdc@watsun.cc.columbia.edu>; Mon, 7 Dec 1998 10:57:07 -0500 (EST)
  6405. Received: by aples2.jhuapl.edu with Internet Mail Service (5.5.2232.9)
  6406.     id <XX0C3C3R>; Mon, 7 Dec 1998 10:56:32 -0500
  6407. Message-ID: <91D1D51C2955D111B82B00805F19989501CD7290@aples2.jhuapl.edu>
  6408. From: "Hart, Edwin F." <Edwin.Hart@jhuapl.edu>
  6409. To: "'da Cruz, Frank'" <fdc@watsun.cc.columbia.edu>
  6410. Cc: "'Aliprand, Joan'" <br.jma@rlg.org>, "'Whistler, Ken'"
  6411.      <kenw@sybase.com>,
  6412.         "'McGowan, Rick'" <rmcgowan@apple.com>,
  6413.         "'Thewlis, Dave'" <dthewlis@dcta.com>
  6414. Subject: UTC response to your request to encode characters for terminal em
  6415.     ulation
  6416. Date: Mon, 7 Dec 1998 10:56:31 -0500 
  6417. MIME-Version: 1.0
  6418. X-Mailer: Internet Mail Service (5.5.2232.9)
  6419. Content-Type: text/plain;
  6420.     charset="iso-8859-1"
  6421. Content-Transfer-Encoding: 8bit
  6422. X-MIME-Autoconverted: from quoted-printable to 8bit by watsun.cc.columbia.edu id KAA21896
  6423.  
  6424. Frank,
  6425.  
  6426. What follows is the text of the response of the UTC to your proposals.  (If
  6427. you would prefer, I also have a Word97 version.)  The UTC needs some
  6428. additional information from you (and IBM and SHARE) before it decides about
  6429. the "Terminal Graphics for Unicode" proposal.  The next UTC meeting is in
  6430. February in Palo Alto and we would appreciate your response by then.
  6431.  
  6432. If you want, we can talk about this.
  6433.  
  6434. Best regards,
  6435. Ed
  6436.  
  6437. Edwin F. Hart
  6438. Applied Physics Laboratory
  6439. 11100 Johns Hopkins Road
  6440. Laurel, MD  20723-6099
  6441. +1-240-228-6926 (from Washington, DC area)
  6442. +1-443-778-6926 (from Baltimore area)
  6443. +1-240-228-1093 (fax)
  6444. edwin.hart@jhuapl.edu <mailto:edwin.hart@jhuapl.edu> 
  6445.  
  6446.  
  6447. 1998-December-07
  6448. To:    Frank da Cruz
  6449. From:    Unicode Technical Committee
  6450. Subject:    Response to your three proposals to encode characters for
  6451. terminal emulation.
  6452.  
  6453. Thank you for your three proposals for encoding terminal-emulation
  6454. characters in Unicode.  The proposals were well organized, thorough, and
  6455. well researched.
  6456. Results
  6457. The UTC acknowledges the concerns raised in your three documents.  The UTC
  6458. had extended discussions on these documents at its December, 1998 meeting in
  6459. San JosΘ.  Here is the result of these discussions for each paper.
  6460. 1.    Document L2/98-353, "Additional Control Pictures for Unicode"
  6461.     Status:  rejected
  6462.     The UTC believes that the proposed glyphs would be used as an
  6463. alternate way to display control characters rather than to interchange
  6464. information; e.g., to document control sequences.  The UTC decided not to
  6465. encode these glyphs in Unicode.
  6466.     However, the UTC noted that a bell glyph may have value in other
  6467. contexts and so could be encoded for another purpose in the future.  In
  6468. addition, the UTC noted that Unicode 3.0 aligns the abbreviations for
  6469. control characters along a diagonal as you had requested.
  6470.     As a secondary concern, encoding glyphs for control characters is an
  6471. open-ended proposition.  The UTC knows that multiple sets of control
  6472. characters are defined for the C1 control area.  For example, ISO had two
  6473. standards defining control characters, ISO/IEC 6429 and ISO 6630.  When
  6474. someone proposes a new set of C1 control characters, should they also be
  6475. considered for encoding?  What should be encoded?  Should exactly one glyph
  6476. be encoded per control-character code position or should multiple glyphs be
  6477. encoded for the same control-character code position?  These are examples of
  6478. concerns underlying the UTC decision rather than a request for you to answer
  6479. the questions.
  6480. 2.    Document L2/98-354, "Terminal Graphics for Unicode"
  6481.     Status: deferred for additional information
  6482.     The UTC has requested more information before it makes a decision.
  6483.     Table 5.1, range of E080 to E087.  The UTC has requested an official
  6484. position from IBM and feedback from SHARE on the glyphs used in the status
  6485. area of a 3270 display.
  6486.     Table 5.2, range of E0A0 to E0AD.  The UTC has requested that
  6487. Microsoft provide a list of the full set of glyphs used to construct
  6488. mathematical entities (brackets, braces, sigma, etc.).  Previously, the UTC
  6489. had decided not to encode these as characters.  However, once this
  6490. information is available, the UTC will revisit the issue.
  6491.     In addition, the UTC would appreciate your response to the
  6492. following:
  6493. a.    What is the full set of terminal-emulation glyphs that you
  6494. considered and how did you map those not in your proposal into Unicode?  The
  6495. UTC's concern is for round-trip integrity and distinguishing different
  6496. characters so that the UTC avoids mapping the characters in you proposal to
  6497. the same Unicode characters you used already for other glyphs in your full
  6498. set.  (The concern is not the characters from standard coded character sets
  6499. like 7-bit ASCII and the ISO/IEC 8859 series, but rather the set of symbols
  6500. outside of these sets.)
  6501. b.    Which of the following proposed characters could be unified with
  6502. (mapped into) Unicode characters?
  6503. 1)    Can you provide (a) the source glyphs for the proposed E0AC and E0AD
  6504. sigma/summation parts, and also (b) better glyphs for them.
  6505. 2)    What is the purpose of the proposed E0AE and E0AF characters?  Are
  6506. they supposed to be full corners for a box, or partial corners, or to
  6507. provide the top and bottom corners of right brackets, or to provide serifs
  6508. for the sigma (E0AC and E0AD)?  Could the proposed E0AE and E0AF characters
  6509. be unified with 231D top right corner and 231F bottom right corner?
  6510. 3)    For the proposed E0B0, could it be unified with either 2713 check
  6511. mark or 221A radical?  Is "small" the distinguishing characteristic for not
  6512. unifying it with 2713 or 221A?
  6513. 4)    For the proposed E0B1, should it be unified with either 237B not
  6514. check mark or 2415 symbol for negative acknowledge?
  6515. 5)    What is the purpose of the proposed E0D0 and E0D1 characters?  Are
  6516. they to be used to construct extended brackets and braces with the E0A0 to
  6517. E0AB "extensible" characters?  If so, then they should be moved to the
  6518. mathematical symbol area of your proposal.  If not, please explain how they
  6519. might be used.
  6520. 6)    Could the proposed E0D2 to E0D5 triangle characters be unified with
  6521. the 25E2 to 25E5 black triangle characters?
  6522. 7)    Could the proposed E0E5 diamond be unified with 25C6 black diamond?
  6523. 8)    Could the proposed E0EC be unified with 21E5 rightward arrow to bar?
  6524. 9)    Could the proposed E0ED be unified with 21E4 leftward arrow to bar?
  6525. 3.    Document L2/98-355, "Hex Byte Pictures for Unicode"
  6526.     Status:  rejected
  6527.     The UTC considers that these are glyphs and, as such, they are out
  6528. of the scope of the Unicode standard.  Representing hex bytes visibly is a
  6529. font-rendering issue rather than an information interchange issue.
  6530. Suggestions
  6531. Here are some suggestions for you to consider to help you meet your
  6532. requirements.
  6533. 1.    Code the glyphs in the Private Use Area.  If at some time in the
  6534. future, the terminal emulation vendors are using the assignments, then you
  6535. may resubmit your proposal (except for the pictures for hex bytes) to
  6536. Unicode with this additional justification.  It is beyond the scope of the
  6537. UTC to encode characters in the Private Use Area or to endorse any
  6538. particular use of characters in the Private Use Area.  If the terminal
  6539. emulation community believes that consistent use of private-use code
  6540. positions is desirable, you might consider registering your code assignments
  6541. in a registry for the Private Use Area such as the Conscript Registry.  Note
  6542. that Unicode does not endorse any registry for the Private Use Area.  Both
  6543. Adobe and Apple have described how each uses the Private Use Area.  You may
  6544. want to contact these organizations for additional information.
  6545. 2.    Register the glyphs with AFII (Association for Font Information
  6546. Interchange).  AFII is the registration authority for the ISO/IEC 10036
  6547. glyph registry.  AFII charges a nominal fee for registering glyphs.  If you
  6548. are interested in pursuing this, contact AFII ( <mailto:asmus@unicode.org>
  6549. afii@unicode.org) for more information.
  6550.  
  6551.  8-Dec-98  1:00:34-GMT,1315;000000000001
  6552. Return-Path: <fdc>
  6553. Received: (from fdc@localhost)
  6554.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id UAA21174;
  6555.     Mon, 7 Dec 1998 20:00:17 -0500 (EST)
  6556. Date: Mon, 7 Dec 98 20:00:17 EST
  6557. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  6558. To: "Hart, Edwin F." <Edwin.Hart@jhuapl.edu>
  6559. Cc: "'Aliprand, Joan'" <br.jma@rlg.org>, "'Whistler, Ken'" <kenw@sybase.com>,
  6560.         "'McGowan, Rick'" <rmcgowan@apple.com>,
  6561.         "'Thewlis, Dave'" <dthewlis@dcta.com>
  6562. Subject: Re: UTC response to your request to encode characters for terminal
  6563.         em ulation
  6564. In-Reply-To: Your message of Mon, 7 Dec 1998 10:56:31 -0500
  6565. Message-ID: <CMM.0.90.4.913078817.fdc@watsun.cc.columbia.edu>
  6566.  
  6567. > What follows is the text of the response of the UTC to your proposals.  (If
  6568. > you would prefer, I also have a Word97 version.)
  6569. >
  6570. No thanks, I *like* plain text :-)
  6571.  
  6572. > The UTC needs some
  6573. > additional information from you (and IBM and SHARE) before it decides about
  6574. > the "Terminal Graphics for Unicode" proposal.  The next UTC meeting is in
  6575. > February in Palo Alto and we would appreciate your response by then.
  6576. OK, I'm happy to keep following up.  I'll try to have a detailed response
  6577. for you by end of January.  In the meantime, please let me know what comes in
  6578. from IBM and SHARE.
  6579.  
  6580. Thanks for your consideration and the detailed response.
  6581.  
  6582. - Frank
  6583.  
  6584.  8-Dec-98 14:52:44-GMT,2723;000000000015
  6585. Return-Path: <Edwin.Hart@jhuapl.edu>
  6586. Received: from aples2.jhuapl.edu (aples2.jhuapl.edu [128.244.26.86])
  6587.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id JAA13274
  6588.     for <fdc@watsun.cc.columbia.edu>; Tue, 8 Dec 1998 09:52:37 -0500 (EST)
  6589. Received: by aples2.jhuapl.edu with Internet Mail Service (5.5.2232.9)
  6590.     id <XX0C3F08>; Tue, 8 Dec 1998 09:52:27 -0500
  6591. Message-ID: <91D1D51C2955D111B82B00805F19989501CD72A0@aples2.jhuapl.edu>
  6592. From: "Hart, Edwin F." <Edwin.Hart@jhuapl.edu>
  6593. To: "'Frank da Cruz'" <fdc@watsun.cc.columbia.edu>
  6594. Subject: RE: UTC response to your request to encode characters for termina
  6595.     l em ulation
  6596. Date: Tue, 8 Dec 1998 09:52:20 -0500 
  6597. MIME-Version: 1.0
  6598. X-Mailer: Internet Mail Service (5.5.2232.9)
  6599. Content-Type: text/plain;
  6600.     charset="iso-8859-1"
  6601.  
  6602. Frank,
  6603.  
  6604. Since you sent your reports in plain ASCII text, I had thought that this was
  6605. your preferred medium.
  6606.  
  6607. I'm sorry that the response was not positive. The UTC recognized your
  6608. concerns but felt that the resolution was more appropriate in the
  6609. font/rendering arena rather than coding in Unicode.  If you can get written
  6610. support from terminal emulation vendors, it would strengthen your case.
  6611.  
  6612. Some of the UTC players were rather vehement about not coding the hex digits
  6613. so this part is really dead.  
  6614.  
  6615. Regarding the glyphs used in the 3270 status area, my feeling is that unless
  6616. these are communicated from the controller to the 3270 terminal, the UTC
  6617. will reject these.
  6618.  
  6619. Email me with your phone number if you want to talk about any of this.
  6620.  
  6621. Ed
  6622.  
  6623. Edwin F. Hart
  6624. Applied Physics Laboratory
  6625. 11100 Johns Hopkins Road
  6626. Laurel, MD  20723-6099
  6627. +1-240-228-6926 (from Washington, DC area)
  6628. +1-443-778-6926 (from Baltimore area)
  6629. +1-240-228-1093 (fax)
  6630. edwin.hart@jhuapl.edu <mailto:edwin.hart@jhuapl.edu> 
  6631.  
  6632.  
  6633.  
  6634.     ----------
  6635.     From:  Frank da Cruz [SMTP:fdc@watsun.cc.columbia.edu]
  6636.     Sent:  07 December, 1998 20:00
  6637.     To:  Hart, Edwin F.
  6638.     Cc:  'Aliprand, Joan'; 'Whistler, Ken'; 'McGowan, Rick'; 'Thewlis,
  6639. Dave'
  6640.     Subject:  Re: UTC response to your request to encode characters for
  6641. terminal em ulation
  6642.  
  6643.     > What follows is the text of the response of the UTC to your
  6644. proposals.  (If
  6645.     > you would prefer, I also have a Word97 version.)
  6646.     >
  6647.     No thanks, I *like* plain text :-)
  6648.  
  6649.     > The UTC needs some
  6650.     > additional information from you (and IBM and SHARE) before it
  6651. decides about
  6652.     > the "Terminal Graphics for Unicode" proposal.  The next UTC
  6653. meeting is in
  6654.     > February in Palo Alto and we would appreciate your response by
  6655. then.
  6656.     > 
  6657.     OK, I'm happy to keep following up.  I'll try to have a detailed
  6658. response
  6659.     for you by end of January.  In the meantime, please let me know what
  6660. comes in
  6661.     from IBM and SHARE.
  6662.  
  6663.     Thanks for your consideration and the detailed response.
  6664.  
  6665.     - Frank
  6666.  
  6667.  8-Dec-98 15:57:40-GMT,2245;000000000001
  6668. Return-Path: <fdc>
  6669. Received: (from fdc@localhost)
  6670.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id KAA02356;
  6671.     Tue, 8 Dec 1998 10:57:22 -0500 (EST)
  6672. Date: Tue, 8 Dec 98 10:57:22 EST
  6673. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  6674. To: "Hart, Edwin F." <Edwin.Hart@jhuapl.edu>
  6675. Subject: RE: UTC response to your request to encode characters for termina l
  6676.         em ulation
  6677. In-Reply-To: Your message of Tue, 8 Dec 1998 09:52:20 -0500
  6678. Message-ID: <CMM.0.90.4.913132642.fdc@watsun.cc.columbia.edu>
  6679.  
  6680. > Since you sent your reports in plain ASCII text, I had thought that this was
  6681. > your preferred medium.
  6682. You were right.
  6683.  
  6684. > I'm sorry that the response was not positive. The UTC recognized your
  6685. > concerns but felt that the resolution was more appropriate in the
  6686. > font/rendering arena rather than coding in Unicode.  If you can get written
  6687. > support from terminal emulation vendors, it would strengthen your case.
  6688. But this is a competitive market.  The other terminal emulation makers 
  6689. compete with us, so that will be tough, or at least awkward.  And quite
  6690. honestly, in a way this whole proposal was partly against my better judgement,
  6691. since the other emulation companies have been profiting from our work for
  6692. years, and had this proposal been approved, it would have solved a big problem
  6693. for them.
  6694.  
  6695. > Some of the UTC players were rather vehement about not coding the hex digits
  6696. > so this part is really dead.  
  6697. I expected that, but thought it should be entered into the record anyway,
  6698. because I think it addesses issues that will come up again and again.
  6699.  
  6700. > Regarding the glyphs used in the 3270 status area, my feeling is that unless
  6701. > these are communicated from the controller to the 3270 terminal, the UTC
  6702. > will reject these.
  6703. It's not a big deal.  It would have been nice to have standardized glyphs,
  6704. and I feel I did my duty by proposing them.  So now we'll go ahead and
  6705. put everything in the private use area and distribute custom fonts just like
  6706. everybody else, and live with the fallout.
  6707.  
  6708. Although I do plan to provide the requested responses, I don't feel there
  6709. is much point, since there is no chance that any of this will get into 
  6710. Unicode 3.0 anyway, and I can't afford to drag this out forever -- we have
  6711. deadlines too.
  6712.  
  6713. - Frank
  6714.  
  6715.  8-Dec-98 19:26:20-GMT,1202;000000000011
  6716. Return-Path: <Edwin.Hart@jhuapl.edu>
  6717. Received: from aples2.jhuapl.edu (aples2.jhuapl.edu [128.244.26.86])
  6718.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id OAA01837
  6719.     for <fdc@watsun.cc.columbia.edu>; Tue, 8 Dec 1998 14:26:19 -0500 (EST)
  6720. Received: by aples2.jhuapl.edu with Internet Mail Service (5.5.2232.9)
  6721.     id <XX0C3H3G>; Tue, 8 Dec 1998 14:26:15 -0500
  6722. Message-ID: <91D1D51C2955D111B82B00805F19989501CD72A8@aples2.jhuapl.edu>
  6723. From: "Hart, Edwin F." <Edwin.Hart@jhuapl.edu>
  6724. To: "'da Cruz, Frank'" <fdc@watsun.cc.columbia.edu>
  6725. Subject: feedback from IBM on 3270 status symbols
  6726. Date: Tue, 8 Dec 1998 14:26:12 -0500 
  6727. MIME-Version: 1.0
  6728. X-Mailer: Internet Mail Service (5.5.2232.9)
  6729. Content-Type: text/plain
  6730.  
  6731. Dave,
  6732.  
  6733. IBM has raised the possibility of using of the symbols for documentation and
  6734. this is certainly a valid use.
  6735.  
  6736. The symbols are internal to the 3270 display terminal rather than
  6737. communicated between it and the controller.
  6738.  
  6739. Best regards,
  6740. Ed
  6741.  
  6742. Edwin F. Hart
  6743. Applied Physics Laboratory
  6744. 11100 Johns Hopkins Road
  6745. Laurel, MD  20723-6099
  6746. +1-240-228-6926 (from Washington, DC area)
  6747. +1-443-778-6926 (from Baltimore area)
  6748. +1-240-228-1093 (fax)
  6749. edwin.hart@jhuapl.edu <mailto:edwin.hart@jhuapl.edu> 
  6750.  
  6751.  
  6752.  8-Dec-98 19:37:08-GMT,2025;000000000001
  6753. Return-Path: <fdc>
  6754. Received: (from fdc@localhost)
  6755.     by watsun.cc.columbia.edu (8.8.5/8.8.5) id OAA04895;
  6756.     Tue, 8 Dec 1998 14:36:17 -0500 (EST)
  6757. Date: Tue, 8 Dec 98 14:36:17 EST
  6758. From: Frank da Cruz <fdc@watsun.cc.columbia.edu>
  6759. To: "Hart, Edwin F." <Edwin.Hart@jhuapl.edu>
  6760. Subject: Re: feedback from IBM on 3270 status symbols
  6761. In-Reply-To: Your message of Tue, 8 Dec 1998 14:26:12 -0500
  6762. Message-ID: <CMM.0.90.4.913145777.fdc@watsun.cc.columbia.edu>
  6763.  
  6764. > Dave,
  6765. Who's Dave?
  6766.  
  6767. > IBM has raised the possibility of using of the symbols for documentation 
  6768. > and this is certainly a valid use.
  6769. The UTC probably won't see it that way, since I made that argument for many
  6770. of the other characters that they rejected.
  6771.  
  6772. > The symbols are internal to the 3270 display terminal rather than
  6773. > communicated between it and the controller.
  6774. All symbols are internal to terminals.  The same can be said for (e.g.)
  6775. the backwards question mark, which is not sent by the host, but is displayed
  6776. on screen to indicate some kind of error, and which was accepted by the UTC
  6777. (although perhaps in some other context), or many other symbols that are
  6778. displayed in response to communications from the host, but not necessarily
  6779. mapped to a particular character.
  6780.  
  6781. No big deal -- I think I made all the relevant arguments already.  Even if
  6782. these symbols are not sent by the host or the controller, they still are
  6783. shown on the screen, and therefore PC based emulators will also need to show
  6784. them on the screen.  If these emulators are based on Unicode, but Unicode
  6785. does not include these characters, then all such emulators will have to bundle
  6786. custom fonts, each one probably incompatible with the other.
  6787.  
  6788. On the other hand, if some company like Monotype makes a Unicode "terminal
  6789. emulation font" with all these characters at well-defined positions (and in
  6790. fact, this is exactly what will happen), then this will become a de facto
  6791. standard anyway, which is as good as a real standard except it will conflict
  6792. with other uses of the Private Use area.
  6793.  
  6794. - Frank
  6795.  
  6796.  8-Dec-98 20:33:52-GMT,3517;000000000001
  6797. Return-Path: <Edwin.Hart@jhuapl.edu>
  6798. Received: from aples2.jhuapl.edu (aples2.jhuapl.edu [128.244.26.86])
  6799.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id PAA20309
  6800.     for <fdc@watsun.cc.columbia.edu>; Tue, 8 Dec 1998 15:33:48 -0500 (EST)
  6801. Received: by aples2.jhuapl.edu with Internet Mail Service (5.5.2232.9)
  6802.     id <XX0C3HYW>; Tue, 8 Dec 1998 15:33:48 -0500
  6803. Message-ID: <91D1D51C2955D111B82B00805F19989501CD72A9@aples2.jhuapl.edu>
  6804. From: "Hart, Edwin F." <Edwin.Hart@jhuapl.edu>
  6805. To: "'Frank da Cruz'" <fdc@watsun.cc.columbia.edu>
  6806. Subject: RE: feedback from IBM on 3270 status symbols
  6807. Date: Tue, 8 Dec 1998 15:33:47 -0500 
  6808. MIME-Version: 1.0
  6809. X-Mailer: Internet Mail Service (5.5.2232.9)
  6810. Content-Type: text/plain
  6811.  
  6812. Comments are embedded in your message.
  6813.  
  6814. Edwin F. Hart
  6815. Applied Physics Laboratory
  6816. 11100 Johns Hopkins Road
  6817. Laurel, MD  20723-6099
  6818. +1-240-228-6926 (from Washington, DC area)
  6819. +1-443-778-6926 (from Baltimore area)
  6820. +1-240-228-1093 (fax)
  6821. edwin.hart@jhuapl.edu <mailto:edwin.hart@jhuapl.edu> 
  6822.  
  6823.  
  6824.  
  6825.     ----------
  6826.     From:  Frank da Cruz [SMTP:fdc@watsun.cc.columbia.edu]
  6827.     Sent:  08 December, 1998 14:36
  6828.     To:  Hart, Edwin F.
  6829.     Subject:  Re: feedback from IBM on 3270 status symbols
  6830.  
  6831.     > Dave,
  6832.     > 
  6833.     Who's Dave?
  6834.  
  6835.     Dave is my SHARE manager.  I decided originally to write to him and
  6836. then changed my mind and decided to write directly to you.
  6837.  
  6838.     > IBM has raised the possibility of using of the symbols for
  6839. documentation 
  6840.     > and this is certainly a valid use.
  6841.     > 
  6842.     The UTC probably won't see it that way, since I made that argument
  6843. for many
  6844.     of the other characters that they rejected.
  6845.  
  6846.     Well, I was not smart enough to repeat this argument at the meeting.
  6847. You needed a better mouthpiece.  : )
  6848.  
  6849.     > The symbols are internal to the 3270 display terminal rather than
  6850.     > communicated between it and the controller.
  6851.     > 
  6852.     All symbols are internal to terminals.  The same can be said for
  6853. (e.g.)
  6854.     the backwards question mark, which is not sent by the host, but is
  6855. displayed
  6856.     on screen to indicate some kind of error, and which was accepted by
  6857. the UTC
  6858.     (although perhaps in some other context), or many other symbols that
  6859. are
  6860.     displayed in response to communications from the host, but not
  6861. necessarily
  6862.     mapped to a particular character.
  6863.  
  6864.     All symbols are internal to terminals.  Yes, but the third set
  6865. represents graphic characters from a code table presumably invoked by a
  6866. ISO/IEC 2022 control sequence and then by the 7-bit/8-bit code positions on
  6867. the wire.  Since the characters are communicated on the wire (and hence have
  6868. inherent information content), the UTC is willing to consider encoding them.
  6869. The alternate control characters and hex digits could be displayed using an
  6870. alternate font and appropriate rendering software.
  6871.  
  6872.     No big deal -- I think I made all the relevant arguments already.
  6873. Even if
  6874.     these symbols are not sent by the host or the controller, they still
  6875. are
  6876.     shown on the screen, and therefore PC based emulators will also need
  6877. to show
  6878.     them on the screen.  If these emulators are based on Unicode, but
  6879. Unicode
  6880.     does not include these characters, then all such emulators will have
  6881. to bundle
  6882.     custom fonts, each one probably incompatible with the other.
  6883.  
  6884.     On the other hand, if some company like Monotype makes a Unicode
  6885. "terminal
  6886.     emulation font" with all these characters at well-defined positions
  6887. (and in
  6888.     fact, this is exactly what will happen), then this will become a de
  6889. facto
  6890.     standard anyway, which is as good as a real standard except it will
  6891. conflict
  6892.     with other uses of the Private Use area.
  6893.  
  6894.     - Frank
  6895.  
  6896.