home *** CD-ROM | disk | FTP | other *** search
/ Usenet 1994 October / usenetsourcesnewsgroupsinfomagicoctober1994disk2.iso / std_unix / v13 / 8-bit next >
Internet Message Format  |  1989-01-07  |  46KB

  1. From jsq  Fri Apr  1 14:34:57 1988
  2. Received: by uunet.UU.NET (5.54/1.14) 
  3.     id AA09140; Fri, 1 Apr 88 14:34:57 EST
  4. From: Ghie-Hugh Song  <gs732%uxe.cso.uiuc.edu@uxc.cso.uiuc.edu>
  5. Newsgroups: comp.std.unix
  6. Subject: 8-Bit ASCII Standard on UNIX-POSIX
  7. Message-Id: <10317@uunet.UU.NET>
  8. Sender: std-unix@uunet.UU.NET
  9. Reply-To: gs732%uxe.cso.uiuc.edu@uxc.cso.uiuc.edu (Ghie-Hugh Song )
  10. Date: 29 Mar 88 03:06:55 GMT
  11. Apparently-To: std-unix-archive
  12. Status: O
  13.  
  14. From: gs732%uxe.cso.uiuc.edu@uxc.cso.uiuc.edu (Ghie-Hugh Song )
  15.  
  16. Hello, everyone,  
  17.  
  18. Have you ever dreamed that TeX were more WYSWYG or that you could type
  19. Greek characters in the text mode directly?  If we had an extended
  20. 256 8-bit ASCII character set such as IBM PC's. (See Appendix of 
  21. PC DOS Manual), things would be much easier.
  22.  
  23.   Then why not use WordPerfect or MS Word?  First, all the Greek 
  24. characters and the math symbols are not supported by them, unless we 
  25. buy extra software and hardware.  In IBM's extended ASCII, there is 
  26. no 'Greek tau', 'Greek nu', or inverted Greek capital delta symbol 
  27. for partial differential equations. Even the registered trade mark 
  28. sign 'R in a circle' does not exist.  Then you might ask why not ChiWriter 
  29. or T-cube?  Simply they are not portable!  They are graphics programs.  
  30. They are not public-domain.  One of them is really expensive.
  31. So TeX has been thought to be a better choice for technical writers.  But 
  32. it's not because it is easy to use but because the text is portable
  33. and sometimes it is more versatile than other PC word processors.   In fact,
  34. without a laser printer or VorTeX and a graphics workstation, TeX is 
  35. not so useful as PC word processors.  So something should be 1) ASCII 
  36. text files for portability and 2) easy to use.  Then how about having 
  37. Greek characters and math symbols in the ASCII character set itself?
  38.  
  39.    I've got an idea for all of us.  And I wish to write a letter to
  40. the ANSI people about a new 256 8-bit extended ASCII character standard.  
  41. But I don't know the ANSI's address.  So if you agree with my idea, 
  42. please forward this message to ANSI with your opinion.  
  43.  
  44.    Let's have the Ext-key in our keyboard at the same location as the 
  45. 'Alt' key in IBM's Enhanced keyboard. (I am using the term 'Ext' to 
  46. distinguish it from GNU-Emacs' meta-editing keys.  However, the real name
  47. of the latter half of this extended ASCII set should be
  48. 'meta', since they call it in that way in the termcap files.)
  49. Ext-p (F0-hexdec) will give us a printable character Greek-pi, 
  50. and Ext-shift-p (D0-hexdec) will give us a printable character 
  51. Greek-Pi (captial-pi) directly. IBM's Greek-pi is in E3 in 
  52. hexadecimal which matches 'c' (63-Hexdec) among 
  53. 128 7-bit ASCII codes. So every word processor is different in its way of 
  54. producing pi.  It lowers the portability of word-processed texts.
  55.  
  56.    At the end of this posting, I propose my draft. Please see and
  57. examine it.
  58.  
  59.    One may oppose this draft because the existing printers might not be used.
  60. We can use those with a mere printer driver software with a translater
  61. software as long as we do not type in the original text any one of the fonts 
  62. not supported by the printer.
  63.  
  64.    I understand that the standardization of 8-bit extended ASCII
  65. is too late.  However I know that once this is implemented on 
  66. the new version of UNIX or POSIX, everyone will follow
  67. this slowly.  Now people are gathering to standardize UNIX, POSIX, SVID,
  68. or whatever.  Now is the time to express our opinion to ANSI people.  
  69. If we lose this chance we will never have a standard 8-bit ASCII.
  70. If you agree with my idea, write a letter to ANSI, POSIX committee
  71. (IEEE CS/P1003), and the acting System V.4 committee members of
  72. AT&T-Sun-Unisys(?) immediately for their 
  73. prompt action.  Unfortunately, I do not know any of those addresses. 
  74.  
  75.   I really do not know whether this effort is made first by me.  
  76. Nor do I know whether there exists such extended ASCII made by ANSI.
  77. Since no text-mode terminal has inherent math fonts, I think there is no
  78. such standard so far.
  79.  
  80.   More than one half of college graduates in the world are either
  81. engineers, scientist, or medical doctors.  They need English with Greek 
  82. characters and math fonts to write reports, homeworks, papers. The need
  83. sometimes exceeds that of their own language support.  They need 
  84. a knowledge bank that can save some great idea like 
  85.  
  86.           E = h-bar.omega  : Einstein's photoelectric effect,
  87.           E = mc^2         : Einstein's relativistic energy
  88.  
  89. without backslashes or $'s, and yet portable. 
  90.  
  91.    Thank you for your attention.
  92.  
  93.                                G. Hugh Song
  94.  
  95.                                Coordinated Science Lab.
  96.                                Univ. of Illinois at Urbana-Champaign
  97.                                1101 W. Springfield Av.
  98.                                Urbana, IL 61801
  99.                                song@uispg.csl.uiuc.edu
  100.  
  101. ============================================================
  102.  
  103.    Here is my draft of 256 new 8-bit ASCII character set.  I place the 
  104. second half of 8-bit characters (128-255) next to the first half of them.
  105.  
  106.    I am not decisive on what to assign to the following Ext-control keys (80-
  107. hexdec to 9f-hexdec).  There are two options:
  108.  
  109. 1) We can assign new control keys which have become neccessary
  110.    as the computer science evolves.  Some examples are shown below.
  111.    I wish that someone in the field rearrage the assignment and 
  112.    complete this, since I do not have enough knowledge and current
  113.    implementation status of i/o utilization.
  114. 2) Or we may give some freedom to the manufacturers of keyboard
  115.    and terminals.
  116.  
  117. Even though these (00-hexdec to 1f-hexdec and 80-hexdec to 9f-hexdec) 
  118. are not legitimately printable while editing a text file, I wish there are 
  119. corresponding printable characters such as graphical framing characters
  120. as in IBM PC or a triangle directing left for ^H, not just as the current 
  121. '^' which does not distinguish itself from 5e-hexdec.  It will ease 
  122. debugging communication problems.
  123.  
  124. | 00 ^@ nul   80 sml  decreases character size and increases back
  125.   01 ^a soh   81
  126.   02 ^b stx   82 bld  boldifies and unboldifies (toggle)
  127.   03 ^c etx   83
  128.   04 ^d eot   84 dwn  steps down one half line spacing 
  129.   05 ^e enq   85     
  130.   06 ^f ack   86 
  131.   07 ^g bel   87 grp  enters and exits graphics mode
  132. | 08 ^h bs    88 hlp  invokes help universally. 
  133.   09 ^i ht    89 itl  italicize and deitalicize from now 
  134.   0a ^j nl    8a 
  135.   0b ^k vt    8b mlm  mouse left movement    \
  136.   0c ^l np    8c mlb  mouse left button       |
  137.   0d ^m cr    8d mmb  mouse middle button     |  
  138.   0e ^n so    8e mdm  mouse downward movement |  Important!
  139.   0f ^o si    8f                              |  no matter what these are
  140. | 10 ^p dle   90 mum  mouse upward movement   |  meta-control keys or
  141.   11 ^q dc1   91 mrm  mouse right movement    |  escape sequences.
  142.   12 ^r dc2   92 mrb  mouse right button     /
  143.   13 ^s dc3   93 scr  sripticizes or unscripticizes (toggle)
  144.   14 ^t dc4   94 
  145.   15 ^u nak   95 up   steps up one half line spacing 
  146.   16 ^v syn   96 rev  reverses or reverses back characters's black and white  
  147.   17 ^w etb   97 
  148. | 18 ^x can   98    
  149.   19 ^y em    99    
  150.   1a ^z sub   9a   
  151.   1b ^[ esc   9b atn  escapes during communication calling attention of
  152.                       the local control
  153.   1c ^\ fs    9c  
  154.   1d ^] gs    9d    
  155.   1e ^^ rs    9e   
  156.   1f ^_ us    9f
  157.  
  158.    Now in the following we have printable  characters except the 'DEL' 
  159. key at the end of the lower 7-bit codes.  The alt key may be used to send
  160. the 8-bit code to the host computer
  161. by simulating this key with kermit's 'set key' program such as in 
  162. MSFERMIT version 2.30.  
  163.  
  164.    For the 7-bit terminal environment, in which 8-bit signals are not 
  165. generated or received by the terminal,
  166. such as VT100, it is desirable for the C-shell or the editor to have a key 
  167. which tells the host computer that the next key is one of the upper 
  168. 8-bit codes (128-255).  This key should not contradict with a control key
  169. of the existing editor programs.   The 'esc' key might be thought the best 
  170. choice.  However, most editor programs use this key heavily for some other 
  171. purposes.  To avoid conflict, the 'cr (Cntrl-m)' key, which is redundant 
  172. both in vi and in gnuemacs (You might have noticed notice that 'C-m' is 
  173. changed to 'nl (C-j)' automatically by both editors), may be used.
  174.  
  175.    This will limit the use of the Meta key in our (or Stallman's) GNU-Emacs.   
  176. This actually means no revision in GNU-Emacs.  We just use the ESC key 
  177. to invoke the Meta editing keys, although the keyboard has the Meta key. 
  178. This is the price we pay 
  179. for those Greek characters and the math symbols.  If we use the 'Cntrl-h' for 
  180. the real backspace, we have to choose another key for 
  181. invoking 'help' in GNU-Emacs.  How about the 'Ext-Cntrl-h' ('88-hexdec')
  182. (or 'C-m C-h' on the 7-bit terminal) as a key for invoking help 
  183. in the future version (Ver. 19) of GNU-Emacs.  This is the only change
  184. which is not compatible to the present version (Ver.18).
  185.  
  186.    I'd like to suggest that the 'Ext-Cntrl-h (88-hexdec)' or 'Cntrl-m Cntrl-
  187. h' on the 7-bit terminal be a new standard key invoking help in e
  188. very software package in the future.  Isn't it a good idea?
  189.  
  190. | 20 sp    a0 a horizontal bar longer than just '-'.
  191.   21 !     a1 a black square
  192.   22 "     a2 the starting double quotation mark
  193.   23 #     a3 \neq : not-equal sign '/=' in one character site
  194.   24 $     a4 the Pound symbol (U.K. money unit)
  195.   25 %     a5 \div : the division symbol, ':-' in one character site
  196.   26 &     a6 \cap : the common set in set theory, The inverted 'U'.
  197.   27 '     a7 the starting single quatation mark
  198. | 28 (     a8 the top portion of the left parenthesis
  199.   29 )     a9 the top portion of the left parenthesis
  200.   2a *     aa a small circle at the ' level that usually represents degree
  201.   2b +     ab \pm   : '+-' in one character site with + up and - down.
  202.   2c ,     ac the cedilla symbol without c, s, or C.
  203.   2d -     ad \mp   : '-+' in one character site with - up and + down.
  204.   2e .     ae \cdot : a dot at the center
  205.   2f /     af $\dot $ : a dot at the top
  206. | 30 0     b0 the bottom portion of the right parenthesis
  207.   31 1     b1 \propto : the proportionality symbol, 'oc' in one character site
  208.   32 2     b2 \bigcirc : a big circle.
  209.   33 3     b3 \prime \prime \prime : tripple-prime
  210.   34 4     b4 a vertical line with a wart in the middle as in '{'
  211.   35 5     b5 a vertical line with a wart in the middle as in '}'
  212.   36 6     b6 \partial : the mirror image of '6'
  213.   37 7     b7 \cup : the symbol in the set theory, that looks like 'U'
  214. | 38 8     b8 \infty : the infinity symbol, 'oo' in one character site
  215.   39 9     b9 the bottom portion of the left parenthesis
  216.   3a :     ba $\ddot $ : the umlaut, two dots overhead.
  217.   3b ;     bb \prime \prime : the double-prime
  218.   3c <     bc \le    : '_<' in one character site
  219.   3d =     bd \equiv : '=_' in one character site for the defining equality
  220.   3e >     be \ge    : '_>' in one character site
  221.   3f ?     bf \supset : superset symbol
  222. | 40 @     c0 the registered trademark sign, a small capital R in a circle
  223.   41 A     c1 angstrom, a small circle on top of 'A'
  224.   42 B     c2 \rightarrow : an arrow heading east
  225.   43 C     c3 \copyright  : a small capital 'C' in a circle
  226.   44 D     c4 \Delta
  227.   45 E     c5 \in : 'an element of' symbol in set theory
  228.   46 F     c6 \Phi
  229.   47 G     c7 \Gamma
  230. | 48 H     c8 \hbar  : accented italic h for the Planck constant
  231.   49 I     c9 the top portion of the integral symbol
  232.   4a J     ca the bottom portion of the integral symbol
  233.   4b K     cb \simeq :a set symbol (obtained from U by rotating it 90 deg CW)
  234.   4c L     cc \Lambda
  235.   4d M     cd \subset: symbol in the set theory
  236.   4e N     ce \nabla : inverted Greek-capital-Delta
  237.   4f O     cf \Omega
  238. | 50 P     d0 \Pi
  239.   51 Q     d1 \Theta
  240.   52 R     d2 \surd : also makes a \sqrt if combined with underlines (__)
  241.   53 S     d3 \Sigma
  242.   54 T     d4 the trade mark sign, the superscripted 'TM'
  243.   55 U     d5 \Upsilon
  244.   56 V     d6 \leftarrow : an arrow heading west
  245.   57 W     d7 \ddag : the double dagger symbol used for a footnote.
  246. | 58 X     d8 \Xi
  247.   59 Y     d9 \Psi
  248.   5a Z     da \downarrow : an arrow heading south.
  249.   5b [     db \lceil : a vertical line whose top is clamped to the right
  250.   5c \     dc \times : 'x' without serif, math symbol for a multiplication
  251.   5d ]     dd \rceil : a vertical line whose top is clamped to the left
  252.   5e ^     de $\check $ : an accent symbol inverted from '^'
  253.   5f _     df $\overline $ : a long bar on top.
  254. | 60 `     e0 \prime (60-hexdec is a back-prime)
  255.   61 a     e1 \alpha
  256.   62 b     e2 \beta
  257.   63 c     e3 \chi
  258.   64 d     e4 \delta
  259.   65 e     e5 \epsilon
  260.   66 f     e6 \phi
  261.   67 g     e7 \gamma
  262. | 68 h     e8 \eta
  263.   69 i     e9 \iota
  264.   6a j     ea \smallint : the integral symbol, enlongated s
  265.   6b k     eb \kappa
  266.   6c l     ec \lambda
  267.   6d m     ed \mu
  268.   6e n     ee \nu
  269.   6f o     ef \omega
  270. | 70 p     f0 \pi
  271.   71 q     f1 \theta
  272.   72 r     f2 \rho
  273.   73 s     f3 \sigma
  274.   74 t     f4 \tau
  275.   75 u     f5 a wiggle positioned at the underline(_) level.
  276.   76 v     f6 \vec the short arrow symbol that represents a vector
  277.   77 w     f7 $\dagger $ : the dagger symbol used for a Hermitian conjugate
  278. | 78 x     f8 \xi
  279.   79 y     f9 \psi
  280.   7a z     fa \zeta
  281.   7b {     fb \lfloor : a vertical line whose bottom is clamped to the right  
  282.   7c |     fc \|      : two vertical lines in one character site
  283.   7d }     fd \rfloor : a vertical line whose bottom is clamped to the left  
  284.   7e ~     fe \sim    : a wiggle positioned at the center level
  285. - - - - - - - - - - - - - - - - - - -
  286.   7f del   ff erh  erase the character at the current cursor position 
  287. -------------------------------------------------------------
  288.  
  289.     These all can be reside in the text mode in 8-bit mode so that any text 
  290. mode terminal can display them directly on the text mode screen.
  291. The possible benefit of this extension is:
  292.  
  293. 1. If every typesetting program is revised according to the new standard,
  294.    they will become more WYSWYG. It means we do not need to type the '\alpha' 
  295.    while typing a TeX file.
  296. 2. The wordprocessor and the typesetting programs will be cheaper since they
  297.    do not need to include soft-font files or the hard font ROM.
  298. 3. The word processor files can easily be exported and imported from one
  299.    word processor file to another without losing special characters as 
  300.    long as they reside in 256 character set.
  301.  
  302.    In addition to this new extended ASCII, I think that some of the
  303. present ASCII characters should be redesigned from the present 
  304. ones as follows:
  305.  
  306.   " 22    should be designed to look more like the closing double
  307.           quotation mark as in typeset books.
  308.   ' 27    the closing single quotation mark or apostrophe
  309.           same comment as above (" 22-hexdec)
  310.   * 2a    position this a little higher than the present height
  311.           so that it looks like a footnoting symbol, not like a multiplication
  312.           symbol.
  313.   / 2f    stretch this so that two of these can be connected without breaking
  314.           to make a long slanted line.
  315.   \ 5c    the same comment as above
  316.   _ 5f    the same comment as above so that it should be \underbar{ }
  317.   | 7c    make this a single long vertical line rather than the present
  318.           one broken at the middle.
  319.  
  320.    The current ANSI standard for erasing the previous character is DEL,
  321. not backspace!  Let us encourage everyone to observe this standard.  
  322. I know that the troublemaker IBM does not follow this standard.  
  323. Let them go their way.  We do not care for IBM.  We are talking about UNIX 
  324. and GNU-Emacs and TeX.  Then backspace will do the following job in
  325. GNU-Emacs and vi.
  326.  
  327.  ^h 08  bs    a backspace key without erasing the previously typed 
  328.               character, making an overprinted image when printed. I think this
  329.               special function of this key is actually in the present
  330.               ANSI standard.  You might have noticed that the UNIX 'man'ual
  331.               pages contain '^H' in their text files for underlining.
  332.               It seems now fully supported by most ANSI terminals. (But not on
  333.               IBM's)  Nevertheless, it is not supported by vi or GNU-Emacs. 
  334.               Let's encourage Mr.Stallman to support this in his new
  335.               version of GNU-Emacs. It will display every accented
  336.               vowel for foreign alphabets, the 
  337.               cent (money unit), some foreign money units, the C-cedilla 
  338.               ('Ext-,-backspace-c'), and the null set symbol ('0/' in one 
  339.               character site.
  340.               To edit this backspace we need a special character for 
  341.               this.  A hollow triangle dirrected to the left is good 
  342.               enough.  Also (Emacs maybe not on vi) will have  mode to view
  343.               this while editing.
  344.  ^m 0d  met   In due consideration, the mnemonic should be changed from
  345.               'cr' to 'met'a. 
  346.  
  347.  
  348. ==========================================
  349.     KEYBORAD
  350. -----------------
  351.    This part is not part of my proposal.  I just wish that the new ANSI 
  352. ASCII keyboard has the following keys.  One may assign some 
  353. function keys for the following purposes.  But it goes
  354. without saying that separate keys at the space bar level are more desirable.
  355.  
  356. For text/graphics terminals
  357.  
  358. Italic key : italicizes the normal character. this key should be active
  359.              only on the alpabetic characters, Greek capital characters,
  360.              but not on numeric characters, symbols like '%', '+', '"',etc.
  361.              On a black-and-white text-mode-only terminal which does not have
  362.              ROM to support various fonts (such as VT100), 
  363.              it would be desirable if this key reverses white and black
  364.              of those characters between the two italic keys.
  365.              Black becomes white, white becomes black. (Toggle)
  366. Bold key :   boldens or highlights a character. (Toggle)
  367.  
  368. For graphics terminals
  369.  
  370. Step-up key : moves the position 1/2-line higher.  and then step down key
  371.              to go back to the original line height.
  372. Step-down key : moves the position 1/2-line lower. and then step-up key
  373.              to go back.
  374. Script key : displays the scripted characters. (Toggle)
  375. Small character key : displays small characters from now and restores the 
  376.              size back. (Toggle)
  377.  
  378.    As to the Keyboard Layout,
  379. We do not need to have the editing keypad on the right.
  380. Why don't we move it to the left leaving more space for the mouse?
  381.  
  382. =====================================End of draft=======
  383.  
  384. P.S. At first, I did not intend to do this as a project.  However
  385. it turned out to be a big project.  Now I want to drop
  386. this project and let this free to the public by posting at 
  387. the news system here.  I hope everybody to express their 
  388. opinion and fruitful discussion here.   And fianlly I hope to see ANSI
  389. or POSIX committee act.
  390.  
  391. Please start this project and act, ANSI.
  392.  
  393. Volume-Number: Volume 13, Number 39
  394.  
  395. From uucp  Tue Apr  5 03:28:35 1988
  396. Received: by uunet.UU.NET (5.54/1.14) 
  397.     id AA05757; Tue, 5 Apr 88 03:28:35 EDT
  398. From: Dave Sill <dsill@NSWC-OAS.ARPA>
  399. Newsgroups: comp.std.unix
  400. Subject: Re: 8-Bit ASCII Standard on UNIX-POSIX
  401. Message-Id: <155@longway.TIC.COM>
  402. Sender: std-unix@longway.TIC.COM
  403. Reply-To: Dave Sill <dsill@NSWC-OAS.ARPA>
  404. Date: 4 Apr 88 20:21:29 GMT
  405. Apparently-To: std-unix-archive
  406. Status: O
  407.  
  408. From: Dave Sill <dsill@NSWC-OAS.ARPA>
  409.  
  410. In article <10317@uunet.UU.NET> Ghie-Hugh Song <gs732%uxe.cso.uiuc.edu@uxc.cso.uiuc.edu> writes:
  411. >Have you ever dreamed that TeX were more WYSWYG or that you could type
  412. >Greek characters in the text mode directly?  If we had an extended
  413. >256 8-bit ASCII character set such as IBM PC's. (See Appendix of 
  414. >PC DOS Manual), things would be much easier.
  415. >
  416. > [Proposed 8-bit ASCII deleted.]
  417.  
  418. There was a time when I would have supported such a proposal.  I'd
  419. particularly like to have such extended characters for use in
  420. programming languages (a left-arrow character for assignment, for
  421. example) and in shells (to take the place of metacharacters such as:
  422. <>*&| et cetera that also have normal meanings as punctuation.)
  423.  
  424. However, I can't see that any fixed 8-bit or 9-bit or even 16-bit code
  425. will be able to meet future requirements.  It would only be a matter
  426. of time before people started to complain about characters not in the
  427. standard set.
  428.  
  429. I think a more powerful and flexible system based on the current 7-bit
  430. ASCII would be better.  Bill Joy, in the April issue of Unix Review,
  431. says PostScript is the new ASCII.  I'm inclined to agree that
  432. a PostScript like language would fill the bill better over the long
  433. run (next 10-20 years) than a fixed code.  This would also allow the
  434. internationalization effort to be integrated nicely.  Do any
  435. PostScript/TeX/Metafont weenies care to argue the merits of their
  436. favorite system? 
  437.  
  438. Input and output devices capable of handling such extended character
  439. sets are another problem.  I don't think ctrl/meta/alt/cokebottle keys
  440. on qwerty keyboards are the best way to go, but neither are keyboards
  441. with hundreds of keys.  It would probably be better to have smart
  442. keyboards and drivers that would recognize escape sequences and
  443. replace them with associated extended characters.
  444.  
  445. Output devices, in general, are more capable.  Except for daisy-wheel
  446. printers and dumb terminals, most have graphics capabilities that
  447. could be put to use.  For the ever-important backward compatibility,
  448. though, some scheme would have to be devised.  Perhaps a pseudo-
  449. PostScript for ASCII-only devices could be devised that would display
  450. everything in one font and get the spacing as close as possible to
  451. what was intended.
  452.  
  453. Oh well, I'm rambling...
  454.  
  455. =========
  456. The opinions expressed above are mine.
  457.  
  458. "I no longer think of something as a computer unless
  459.  it's connected to a network."
  460.                     -- Peter Weinberger
  461.  
  462.  
  463. Volume-Number: Volume 13, Number 41
  464.  
  465. From uucp  Tue Apr  5 03:29:49 1988
  466. Received: by uunet.UU.NET (5.54/1.14) 
  467.     id AA05837; Tue, 5 Apr 88 03:29:49 EDT
  468. From: Guy Harris <guy@Sun.COM>
  469. Newsgroups: comp.std.unix
  470. Subject: 8-Bit ASCII Standard on UNIX-POSIX
  471. Message-Id: <156@longway.TIC.COM>
  472. Sender: std-unix@longway.TIC.COM
  473. Reply-To: guy@Sun.COM (Guy Harris)
  474. Date: 4 Apr 88 21:11:13 GMT
  475. Apparently-To: std-unix-archive
  476. Status: O
  477.  
  478. From: guy@Sun.COM (Guy Harris)
  479.  
  480. >    I understand that the standardization of 8-bit extended ASCII
  481. > is too late.
  482.  
  483. You're probably right.  There is already a family of ISO extended character
  484. sets, the ISO 8859 family, that are extensions of ASCII and are being adopted
  485. by many UNIX systems.  The ISO 8859/1 character set, also known as "ISO Latin
  486. Alphabet #1", has been adopted or will be adopted by a number of vendors for
  487. Western European use; AT&T has adopted t, Sun plans to do so, I believe Apollo
  488. has done so, DEC's international character set is similar to it and they may
  489. have adopted it, and I think X/Open has already specified it.
  490.  
  491. Volume-Number: Volume 13, Number 42
  492.  
  493. From uucp  Wed Apr  6 13:36:00 1988
  494. Received: by uunet.UU.NET (5.54/1.14) 
  495.     id AA08155; Wed, 6 Apr 88 13:36:00 EDT
  496. From: std-unix@longway.TIC.COM (Moderator, John S. Quarterman)
  497. Newsgroups: comp.std.unix
  498. Subject: Re: 8-Bit ASCII Standard on UNIX-POSIX
  499. Message-Id: <158@longway.TIC.COM>
  500. References: <10317@uunet.UU.NET>
  501. Reply-To: uunet!harvard.harvard.edu!haddock!karl (Karl Heuer)
  502. Organization: Interactive Systems, Boston
  503. Date: 5 Apr 88 15:47:27 GMT
  504. Apparently-To: std-unix-archive
  505. Status: O
  506.  
  507. From: uunet!harvard.harvard.edu!haddock!karl (Karl Heuer)
  508.  
  509. In article <10317@uunet.UU.NET> gs732%uxe.cso.uiuc.edu@uxc.cso.uiuc.edu (Ghie-Hugh Song ) writes:
  510. >Have you ever dreamed that TeX were more WYSWYG or that you could type
  511. >Greek characters in the text mode directly?  If we had an extended
  512. >256 8-bit ASCII character set such as IBM PC's. (See Appendix of
  513. >PC DOS Manual), things would be much easier.
  514.  
  515. Well, actually I've wished for a *lot* of non-ASCII characters at various
  516. times.  More than you can fit in the 128 available slots.  But most of them
  517. are so seldom used that I don't mind that they don't have reserved 8-bit
  518. values.
  519.  
  520. >For the 7-bit terminal environment, in which 8-bit signals are not generated
  521. >or received by the terminal, such as VT100, it is desirable for the C-shell
  522. >or the editor to have a key which tells the host computer that the next key
  523. >is one of the upper 8-bit codes (128-255).  This key should not contradict
  524. >with a control key of the existing editor programs.
  525.  
  526. There is no such key.  (Yes, Emacs *does* distinguish between C-m and C-j.
  527. Besides, on most keyboards the big key labeled RETURN or ENTER generates C-m,
  528. so if you preempt that for a pseudo-meta, you'd have to use an explicit C-j
  529. (awkward to type) to get a newline.)  Not that it matters -- such editors
  530. normally run in raw mode anyway, so they'd be bypassing the new feature.
  531.  
  532. >In addition to this new extended ASCII, I think that some of the present
  533. >ASCII characters should be redesigned from the present ones as follows:
  534. >[suggests, among other changes, that /\_| should be stretched to fit the
  535. >character cell]
  536.  
  537. If you want line-drawing characters, add a line-drawing font.  Don't try to
  538. make the ASCII set do double duty.
  539.  
  540. >... You might have noticed that the UNIX 'man'ual pages contain '^H' in their
  541. >text files for underlining.  It seems now fully supported by most ANSI
  542. >terminals.
  543.  
  544. Oh?  Underlining with backspace is not unheard of, but I think the escape
  545. sequence \e[4m is more common, especially among "ANSI terminals".  Perhaps
  546. you're confused by software that does this conversion for you (e.g. "more")?
  547. And certainly very few terminals (hardcopy excepted) will display general
  548. overstrikes like a cent sign.
  549.  
  550. Volume-Number: Volume 13, Number 41
  551.  
  552. From uucp  Thu Apr  7 21:29:39 1988
  553. Received: by uunet.UU.NET (5.54/1.14) 
  554.     id AA10260; Thu, 7 Apr 88 21:29:39 EDT
  555. From: (rja <rja@edison.GE.COM>
  556. Newsgroups: comp.std.unix
  557. Subject: Re: 8-Bit ASCII Standard on UNIX-POSIX
  558. Message-Id: <159@longway.TIC.COM>
  559. References: <10317@uunet.UU.NET> <158@longway.TIC.COM>
  560. Sender: std-unix@longway.TIC.COM
  561. Reply-To: rja@edison.GE.COM (rja)
  562. Organization: GE-Fanuc North America
  563. Date: 7 Apr 88 13:01:40 GMT
  564. Apparently-To: std-unix-archive
  565. Status: O
  566.  
  567. From: rja@edison.GE.COM (rja)
  568.  
  569.   I'd thought someone else would have pointed this out, but nothing has
  570. shown up at edison to correct the misconception.  THERE IS AN 8-bit
  571. STANDARD, ISO 8859/1.  It also has other variants (8859/2, etc.) which
  572. support other languages.  The 8859/1 version supports nearly ALL languages
  573. in use in Western Europe.  It is a proper superset of ASCII.
  574.  
  575. [ Actually, Guy Harris already pointed this out.  But your following
  576. observation is quite useful.  -mod ]
  577.  
  578. For more details, please tune into the ongoing discussions in
  579. comp.std.internat, where several people have voiced concerns over
  580. languages NOT supported.  Nevertheless, since it is being adopted as an
  581. X/OPEN standard and big companies like AT&T are adopting it, expect it
  582. to take hold.
  583.  
  584. Volume-Number: Volume 13, Number 47
  585.  
  586. From uucp  Thu Apr  7 22:31:59 1988
  587. Received: by uunet.UU.NET (5.54/1.14) 
  588.     id AA15921; Thu, 7 Apr 88 22:31:59 EDT
  589. From: Mike Threepoint <linhart@topaz.rutgers.edu>
  590. Newsgroups: comp.std.unix
  591. Subject: Re: 8-Bit ASCII Standard on UNIX-POSIX
  592. Message-Id: <160@longway.TIC.COM>
  593. References: <156@longway.TIC.COM>
  594. Sender: std-unix@longway.TIC.COM
  595. Reply-To: linhart@topaz.rutgers.edu (Mike Threepoint)
  596. Organization: The Society for Creative Euthanasia
  597. Date: 7 Apr 88 11:12:59 GMT
  598. Apparently-To: std-unix-archive
  599. Status: O
  600.  
  601. From: linhart@topaz.rutgers.edu (Mike Threepoint)
  602.  
  603. Bo Thide (irf@kuling) recently described it [ISO 8859/1 -mod] as 191
  604. characters cleverly designed with capitals coded as shifted miniscules,
  605. including eth (which I'm not sure what it is), thorn, and sharp S.
  606.  
  607. To possibly add to the list, this sounds like the character set
  608. Microsoft Windows uses and terms (by no standard I know of) "ANSI".
  609. It has the vowels in acute, grave, circumflex, tilde, and umlaut.
  610. The high bit characters also include cent, pound, yen, and universal
  611. currency symbols, circle-R trademark and circle-C copyright symbols,
  612. inverted ? and !, section and paragraph symbols, << guillemets >>,
  613. several accents, 1/4, 1/2, and 3/4 characters, and superscripted 1, 2,
  614. and 3.  The last sound like a bad idea to me, so I actually hope this
  615. is something they threw together themselves.
  616.  
  617. Sound like ISO 8859?  If not, I would be quite interested to know just
  618. what it is.  How much do I send to where (if you can't just mail me a
  619. copy)?
  620.  
  621. What I would also like to see is the ASCII 0..1F (31 dec.) graphic
  622. representations on new machines conform to the ANSI standard.  They
  623. might look impractical, but after setting up a font using them on my
  624. micro, it's amazing how much sense they make to me.
  625.  
  626. -- 
  627. "Science does not remove the terror of the gods."  | Mike Threepoint
  628.             -- J.R. "Bob" Dobbs       | linhart@topaz.rutgers.edu
  629. "One man's theology is another man's belly laugh." | FidoNet 1:107/513
  630.             -- Lazarus Long           | AT&T (201)878-0937
  631.  
  632. Volume-Number: Volume 13, Number 48
  633.  
  634. From uucp  Fri Apr  8 13:29:00 1988
  635. Received: by uunet.UU.NET (5.54/1.14) 
  636.     id AA09236; Fri, 8 Apr 88 13:29:00 EDT
  637. From: Guy Harris <guy@Sun.COM>
  638. Newsgroups: comp.std.unix
  639. Subject: Re: 8-Bit ASCII Standard on UNIX-POSIX
  640. Message-Id: <161@longway.TIC.COM>
  641. Sender: std-unix@longway.TIC.COM
  642. Reply-To: guy@Sun.COM (Guy Harris)
  643. Date: 8 Apr 88 05:38:39 GMT
  644. Apparently-To: std-unix-archive
  645. Status: O
  646.  
  647. From: guy@Sun.COM (Guy Harris)
  648.  
  649. > To possibly add to the list, this sounds like the character set
  650. > Microsoft Windows uses and terms (by no standard I know of) "ANSI".
  651. > It has the vowels in acute, grave, circumflex, tilde, and umlaut.
  652. > The high bit characters also include cent, pound, yen, and universal
  653. > currency symbols, circle-R trademark and circle-C copyright symbols,
  654. > inverted ? and !, section and paragraph symbols, << guillemets >>,
  655. > several accents, 1/4, 1/2, and 3/4 characters, and superscripted 1, 2,
  656. > and 3.  The last sound like a bad idea to me, so I actually hope this
  657. > is something they threw together themselves.
  658.  
  659. > Sound like ISO 8859?
  660.  
  661. Yes.  The superscripted letters *do* come from ISO 8859 (see below).
  662.  
  663. > What I would also like to see is the ASCII 0..1F (31 dec.) graphic
  664. > representations on new machines conform to the ANSI standard.  They
  665. > might look impractical, but after setting up a font using them on my
  666. > micro, it's amazing how much sense they make to me.
  667.  
  668. What "graphic representations" are you referring to?  The only ANSI standard I
  669. know of for characters in the range 0x00 to 0x1f is ASCII, which says they're
  670. *control* characters, not *printable* characters.
  671.  
  672. For your collective amusement, here is a chart of ISO 8859/1 or "ISO Latin
  673. Alphabet #1".  This was derived by some quick hacking on the X11 include file
  674. "keysymdef.h" - yes, X11 uses the ISO character sets as well.
  675.  
  676. non-breaking space        0xa0
  677. inverted exclamation point    0xa1
  678. cent sign            0xa2
  679. pounds sterling            0xa3
  680. "currency symbol"        0xa4
  681. yen                0xa5
  682. broken bar            0xa6
  683. section mark            0xa7
  684. diaeresis            0xa8
  685. copyright            0xa9
  686. feminine ordinal        0xaa
  687.         (this is a subscripted lower-case "a", underlined)
  688. left guillemot            0xab
  689.         (French left quote, looks like small "<<")
  690. not sign            0xac
  691. hyphen                0xad
  692. registered trademark        0xae
  693. macron                0xaf
  694.         (an elevated small horizontal bar)
  695. degree symbol            0xb0
  696. plus/minus            0xb1
  697. superscript 2            0xb2
  698. superscript 3            0xb3
  699. acute accent            0xb4
  700. mu                0xb5
  701. paragraph symbol        0xb6
  702. small centered dot        0xb7
  703. cedilla                0xb8
  704. superscript 1            0xb9
  705. masculine ordinal        0xba
  706.         (this is a subscripted lower-case "o", underlined)
  707. right guillemot            0xbb
  708.         (French right quote, looks like small ">>")
  709. 1/4                0xbc
  710. 1/2                0xbd
  711. 3/4                0xbe
  712. inverted question mark        0xbf
  713. A with grave accent        0xc0
  714. A with acute accent        0xc1
  715. A with circumflex accent    0xc2
  716. A with tilde            0xc3
  717. A with diaeresis        0xc4
  718. A with ring            0xc5
  719.         (as in "Angstrom")
  720. AE dipthong            0xc6
  721. C with cedilla            0xc7
  722. E with grave accent        0xc8
  723. E with acute accent        0xc9
  724. E with circumflex accent    0xca
  725. E with diaeresis        0xcb
  726. I with grave accent        0xcc
  727. I with acute accent        0xcd
  728. I with circumflex accent    0xce
  729. I with diaeresis        0xcf
  730. upper-case eth            0xd0
  731.         (eth is an Icelandic letter)
  732. N with tilde            0xd1
  733. O with grave accent        0xd2
  734. O with acute accent        0xd3
  735. O with circumflex accent    0xd4
  736. O with tilde            0xd5
  737. O with diaeresis        0xd6
  738. multiply sign            0xd7
  739. O with slash            0xd8
  740. U with grave accent        0xd9
  741. U with acute accent        0xda
  742. U with circumflex accent    0xdb
  743. U with diaeresis        0xdc
  744. Y with acute accent        0xdd
  745. upper-case thorn        0xde
  746.         (thorn is an Icelandic letter)
  747. German double-s            0xdf
  748. a with grave accent        0xe0
  749. a with acute accent        0xe1
  750. a with circumflex accent    0xe2
  751. a with tilde            0xe3
  752. a with diaeresis        0xe4
  753. a with ring            0xe5
  754.         (lower-case "A with ring")
  755. ae dipthong            0xe6
  756. c with cedilla            0xe7
  757. e with grave accent        0xe8
  758. e with acute accent        0xe9
  759. e with circumflex accent    0xea
  760. e with diaeresis        0xeb
  761. i with grave accent        0xec
  762. i with acute accent        0xed
  763. i with circumflex accent    0xee
  764. i with diaeresis        0xef
  765. lower-case eth            0xf0
  766. n with tilde            0xf1
  767. o with grave accent        0xf2
  768. o with acute accent        0xf3
  769. o with circumflex accent    0xf4
  770. o with tilde            0xf5
  771. o with diaeresis        0xf6
  772. division sign            0xf7
  773. o with slash            0xf8
  774. u with grave accent        0xf9
  775. u with acute accent        0xfa
  776. u with circumflex accent    0xfb
  777. u with diaeresis        0xfc
  778. y with acute accent        0xfd
  779. lower-case thorn        0xfe
  780. y with diaeresis        0xff
  781.  
  782. Volume-Number: Volume 13, Number 49
  783.  
  784. From uucp  Sat Apr  9 19:58:06 1988
  785. Received: by uunet.UU.NET (5.54/1.14) 
  786.     id AA04772; Sat, 9 Apr 88 19:58:06 EDT
  787. From: std-unix@longway.TIC.COM (Moderator, John S. Quarterman)
  788. Newsgroups: comp.std.unix
  789. Subject: Re: 8-Bit ASCII Standard on UNIX-POSIX
  790. Summary: ISO 6937
  791. Message-Id: <162@longway.TIC.COM>
  792. References: <161@longway.TIC.COM>
  793. Reply-To: uunet!rutgers.edu!mtune!homxb!hrs (H.SILBIGER)
  794. Organization: AT&T Bell Laboratories, Holmdel
  795. Date: 9 Apr 88 13:57:53 GMT
  796. Apparently-To: std-unix-archive
  797. Status: O
  798.  
  799. From: uunet!rutgers.edu!mtune!homxb!hrs (H.SILBIGER)
  800.  
  801. In article <161@longway.TIC.COM>, guy@Sun.COM (Guy Harris) writes:
  802. > From: guy@Sun.COM (Guy Harris)
  803. > > currency symbols, circle-R trademark and circle-C copyright symbols,
  804. > > inverted ? and !, section and paragraph symbols, << guillemets >>,
  805. > > and 3.  The last sound like a bad idea to me, so I actually hope this
  806. > > Sound like ISO 8859?
  807. > Yes.  The superscripted letters *do* come from ISO 8859 (see below).
  808. There is another ISO standard that handles all latin alphabets, known as
  809. ISO6937.  There is a CCITT equivalent.
  810.  
  811. This character set is characteristically used in text communication
  812. applications, such as document architecture, teletex, message handling, etc.
  813.  
  814. ISO 8859 is used mainly in the computer processing environment.
  815.  
  816. [ Because ISO 6937 buys extreme flexibility by composing characters as
  817. two-byte combinations of basic character and accent, while ISO 8859
  818. encodes every character as one byte.  I saw this on comp.std.internat,
  819. which I recommend everybody interested in this discussion should read.  -mod ]
  820.  
  821. Herman Silbiger batavier!hrs@ATT.COM
  822.  
  823. Volume-Number: Volume 13, Number 50
  824.  
  825. From uucp  Thu Apr 14 05:18:56 1988
  826. Received: by uunet.UU.NET (5.54/1.14) 
  827.     id AA24658; Thu, 14 Apr 88 05:18:56 EDT
  828. From: Peter da Silva <peter%sugar.UUCP@uunet.UU.NET>
  829. Newsgroups: comp.std.unix
  830. Subject: Re: 8-Bit ASCII Standard on UNIX-POSIX
  831. Message-Id: <164@longway.TIC.COM>
  832. References: <156@longway.TIC.COM>
  833. Sender: std-unix@longway.TIC.COM
  834. Reply-To: sugar!peter (Peter da Silva)
  835. Organization: Sugar Land UNIX - Houston, TX
  836. Date: 14 Apr 88 00:54:17 GMT
  837. Apparently-To: std-unix-archive
  838. Status: O
  839.  
  840. From: peter@sugar.UUCP (Peter da Silva)
  841.  
  842. >  From: guy@Sun.COM (Guy Harris)
  843. > The ISO 8859/1 character set, also known as "ISO Latin
  844. > Alphabet #1", has been adopted or will be adopted by a number of vendors for
  845. > Western European use; AT&T ... Sun ... Apollo ... DEC ...
  846.  
  847. Add the Commodore Amiga and (I think) the Atari ST to the list...
  848. -- 
  849. -- Peter da Silva      `-_-'      ...!hoptoad!academ!uhnix1!sugar!peter
  850. -- "Have you hugged your U wolf today?" ...!bellcore!tness1!sugar!peter
  851. -- Disclaimer: These aren't mere opinions, these are *values*.
  852.  
  853.  
  854. Volume-Number: Volume 13, Number 51
  855.  
  856. From uucp  Fri Apr 15 13:46:37 1988
  857. Received: by uunet.UU.NET (5.54/1.14) 
  858.     id AA08154; Fri, 15 Apr 88 13:46:37 EDT
  859. From: std-unix@longway.TIC.COM (Moderator, John S. Quarterman)
  860. Newsgroups: comp.std.unix
  861. Subject: Re: 8-Bit ASCII Standard on UNIX-POSIX
  862. Summary: ANSI X3.32 "Graphic Representation of the Control Characters of ASCII"
  863. Keywords: Yale, Master...
  864. Message-Id: <165@longway.TIC.COM>
  865. References: <161@longway.TIC.COM>
  866. Reply-To: uunet!topaz.rutgers.edu!linhart (Mike Threepoint)
  867. Organization: The Society for Creative Euthanasia
  868. Date: 15 Apr 88 01:40:47 GMT
  869. Apparently-To: std-unix-archive
  870. Status: O
  871.  
  872. From: uunet!topaz.rutgers.edu!linhart (Mike Threepoint)
  873.  
  874. u <- guy@Sun.COM (Guy Harris)
  875.  
  876. When we last left our conversation:
  877. [description of MS Windows "ANSI" character set]
  878. me> Sound like ISO 8859?
  879.  
  880. u> Yes.  The superscripted letters *do* come from ISO 8859 (see below).
  881.  
  882. Thanks to your table, I can confirm that they match.  Multiply and
  883. divide symbols are missing, replaced by the ubiquitous empty box, but
  884. now my EGA font is complete (for my IBM compatible, made with CHET, I
  885. could post it to binaries if anyone really wanted it).
  886.  
  887. me> What I would also like to see is the ASCII 0..1F (31 dec.) graphic
  888. me> representations on new machines conform to the ANSI standard.  They
  889. me> might look impractical, but after setting up a font using them on my
  890. me> micro, it's amazing how much sense they make to me.
  891.  
  892. u> What "graphic representations" are you referring to?  The only ANSI standard
  893. u> I know of for characters in the range 0x00 to 0x1f is ASCII, which says
  894. u> they're *control* characters, not *printable* characters.
  895.  
  896. The rather obscure ANSI X3.32-1973 "Graphic Representation of the
  897. Control Characters of ASCII" defines them for use when the
  898. name-in-tiny-letters isn't used.  I found it in Joe Cambell's "C
  899. Programmers Guide to Serial Communications" (Howard W. Sams & Co.)
  900. [wish I had a copy of my own, had to reborrow it to get the ID] which
  901. contains an ASCII chart poster with those symbols on it.
  902.  
  903. It goes something like this:  (they're in that aforementioned font, too)
  904.  
  905. ^@    NUL    a hollow square, like the one used in Mac character sets for
  906.         undefined characters
  907. ^A    SOH    the left column and top row of the cell set, like an
  908.         inverted L
  909. ^B    STX    the bottom row and center column set, like a
  910.         perpendicular symbol
  911. ^C    ETX    the right column and bottom row set, like a reversed L
  912. ^D    EOT    a single zig-zag, like a lightning bolt
  913. ^E    ENQ    a square with an X in it
  914. ^F    ACK    a check mark (tick mark to you Europeans)
  915. ^G    BEL    a hemisphere with two L shaped feet, I want to say
  916.         "doodlebug", but it's probably more like an
  917.         electronic component
  918. ^H    BS    an up arrow bent over leftwards into a U-shaped hook
  919.         at the top
  920. ^I    HT    a right arrow with the barbs extended to the length of
  921.         the shaft, more like a dart
  922. ^J    LF    three parallel horizontal lines
  923. ^K    VT    a downward pointing dart [Campbell says that instead
  924.         of overloading LF with NewLine worsening the present
  925.         incompatibilites, ANSI should have redefined this
  926.         almost totally unused character]
  927. ^L    FF    a down dart with a second arrowhead midway down its
  928.         shaft
  929. ^M    CR    a left dart
  930. ^N    SO    a circle with an X in it
  931. ^O    SI    a circle with a dot in the center
  932. ^P    DLE    a square with a horizontal line through the middle
  933. ^Q    DC1    a circle with the top right quarter sectioned off,
  934.         that is, lines from the center to the top and right
  935. ^R    DC2    same, but lower right quarter
  936. ^S    DC3    same, but lower left quarter
  937. ^T    DC4    same, but top left quarter
  938. ^U    NAK    a check (tick) mark with a horizontal line thru the
  939.         center
  940. ^V    SYN    a rectangle with the bottom cut in half and turned
  941.         outward, like a bottomless rectangle with feet
  942. ^W    ETB    the right column and center row set, a T on its side
  943. ^X    CAN    a down pointing hollow triangle on an up pointing one,
  944.         like an hourglass
  945. ^Y    EM    a vertical line with a fat dot in the middle
  946. ^Z    SUB    a backwards ?
  947. ^[    ESC    a circle with a line through the center
  948. ^\    FS    a square box with the top left quarter sectioned off
  949. ^]    GS    same, but bottom left
  950. ^^    RS    same, but bottom right
  951. ^_    US    same, but top right
  952.  
  953. u> For your collective amusement, here is a chart of ISO 8859/1 or "ISO Latin
  954. u> Alphabet #1".  This was derived by some quick hacking on the X11 include
  955. u> file "keysymdef.h" - yes, X11 uses the ISO character sets as well.
  956. [table deleted]
  957.  
  958. Thanx, I appreciate it.  I'm still interested in 8859-3 (which I read
  959. supports Esperanto), if it's not too much trouble could you tell me
  960. a) what _its_ layout is, or b) how much to send to where?
  961. -- 
  962. "...billions and billions..."            | Mike Threepoint (D-ro 3)
  963.             -- not Carl Sagan    | linhart@topaz.rutgers.edu
  964. "...hundreds if not thousands..."        | FidoNet 1:107/513
  965.             -- Pnews        | AT&T +1 (201)878-0937
  966.  
  967. Volume-Number: Volume 13, Number 52
  968.  
  969. From uucp  Fri Apr 15 14:26:37 1988
  970. Received: by uunet.UU.NET (5.54/1.14) 
  971.     id AA09275; Fri, 15 Apr 88 14:26:37 EDT
  972. From: David Brooks <BROOKS@CSSS-A.PRIME.COM>
  973. Newsgroups: comp.std.unix
  974. Subject: Re: 8-bit discussion in std-unix
  975. Message-Id: <167@longway.TIC.COM>
  976. Sender: std-unix@longway.TIC.COM
  977. Reply-To: BROOKS@CSSS-A.PRIME.COM (David Brooks)
  978. Date: 13 Apr 88 16:22:44 GMT
  979. Apparently-To: std-unix-archive
  980. Status: O
  981.  
  982. From: BROOKS@CSSS-A.PRIME.COM (David Brooks)
  983.  
  984. (this may be a duplicate.  I don't trust our mailers to figure out
  985. longway.UUCP...)
  986.  
  987. [ Judging by the non-standard headers your mailer sent, it's no wonder....
  988. See the next article for std-unix/comp.std.unix posting information.  -mod ]
  989.  
  990. Maybe you can get a comment from the ANSI committee (X3L2).  It labored
  991. for some years to produce the 8-bit set, which was then accepted lock,
  992. stock and barrel by ISO for 8859/1.  ECMA was an intermediary.
  993.  
  994. I was following the ANSI deliberations from a distance; as a result the
  995. Prime PT200 was, I think, the first terminal to implement the set.  The
  996. set is something of a compromise.  The ugly inclusion of multiply and
  997. divide amongst the "o"s is particularly weird; originally these
  998. contained the OE diphthongs in deference to the French.  But, to
  999. everyone's surprise, the French didn't want them!
  1000.  
  1001. Nobody, but nobody, knows how to design eth and thorn.  If any
  1002. Icelanders(?) would post a bitmap AND a PostScript definition of these
  1003. four glyphs, many of us would be grateful.
  1004.  
  1005. And there IS a standard way of invoking 8-bit characters in a 7-bit
  1006. environment: use Shift-out and Shift-in.  These are control-N and
  1007. control-O respectively; they can't be typed directly in EMACS and would
  1008. confuse any software that assumes <one byte> = <one character position>,
  1009. but receiving terminals should do the right thing.
  1010.  
  1011. Assigning graphics to control characters is highly non-standard.
  1012.  
  1013. [ As someone just pointed out, apparently there is an obscure standard. -mod ]
  1014.  
  1015. IBM and Mac assign graphics to the control-1 set (hex 80 to 9F).  Actually
  1016. I wish someone would properly implement the control-1 characters, like
  1017. reverse linefeed, halfline up and down, CSI...
  1018.    __                   __
  1019.   /  )             /   /  )             /
  1020.  /  / __   _ o  __/   /--/ __  ________/_) _
  1021. /__/ (_(_|/ (__(_(   /__/ / (_/_/ /_/ / \_/_)_
  1022.  
  1023. Internet:       BROOKS@CSSS-A.PRIME.COM
  1024. uucp:           {mit-eddie,necntc}!primerd!csss-a.prime.com!brooks
  1025.  
  1026. Standard disclaimer applies as appropriate.
  1027.  
  1028. Volume-Number: Volume 13, Number 54
  1029.  
  1030. From uucp  Sun Apr 17 13:49:25 1988
  1031. Received: by uunet.UU.NET (5.54/1.14) 
  1032.     id AA07114; Sun, 17 Apr 88 13:49:25 EDT
  1033. From: (rja <rja@edison.GE.COM>
  1034. Newsgroups: comp.std.unix
  1035. Subject: Eth and Thorn characters
  1036. Keywords: Icelandic, Vietnamese, ISO8859/1
  1037. Message-Id: <170@longway.TIC.COM>
  1038. Sender: std-unix@longway.TIC.COM
  1039. Reply-To: rja@edison.GE.COM (rja)
  1040. Organization: GE-Fanuc North America
  1041. Date: 16 Apr 88 18:22:53 GMT
  1042. Apparently-To: std-unix-archive
  1043. Status: O
  1044.  
  1045. From: rja@edison.GE.COM (rja)
  1046.  
  1047.   There have been a flurry of postings (primarily in comp.std.unix)
  1048. about ISO 8859/1 (8 bit character set for western European languages).
  1049.  
  1050. A recent posting has inquired about what the Eth and Thorn characters
  1051. look like.
  1052.  
  1053. Eth is similar in appearance to the letter D.  However, eth has an additional
  1054. horizontal line about halfway vertically up on the left-hand vertical stroke.
  1055. This horizontal line extends to the left of where a D would stop and goes
  1056. halfway between the curved and vertical strokes of the D.  The horizontal
  1057. stroke is symmetric with respect to the vertical left-hand line of a D.
  1058.  
  1059. Lowercase eth follows the same pattern with respect to the d, except that
  1060. the horixontal line is about 3/4 up the vertical line of a "d".  The line
  1061. should be halfway between the top of the vertical line and the place where
  1062. the round part of the "d" meets the straight part (upper connection).
  1063.  
  1064. Thorn upper and lower case follows this same pattern except that replace all
  1065. instances of "d" and "D" above with "p" and "P".  The lowercase thorn has
  1066. its horizontal line on the stem as part of the descender and the upper case
  1067. thorn has its horizontal line on the stem rather than between the intersections
  1068. of the straight and vertical lines forming the top of the "P".
  1069.  
  1070. While these characters are originally Icelandic/Norse, the Eth characters are
  1071. also used in Vietnamese (Quoc Ngu).  Vietnamese is normally written using a
  1072. Roman-style script that has an amasing number of diacritical marks, so it isn't
  1073. quite handled by ISO 8859/1.  ISO 8859/1 does come close though....
  1074.  
  1075.   I haven't any reasonable way to generate a bit-map or Postscript image, but
  1076. these descriptions should get the general idea across to the folks at Prime,
  1077. DEC, etc. so they can implement them.
  1078.  
  1079.  I'd be interested in getting mail from anyone who knows if a standard character
  1080. set exists for Vietnamese.
  1081.  
  1082. ______________________________________________________________________________
  1083.          rja@edison.GE.COM      or      ...uunet!virginia!edison!rja  
  1084.              "Noalias must go, this is non-negotiable."  DMR
  1085. ______________________________________________________________________________
  1086.  
  1087. Volume-Number: Volume 13, Number 56
  1088.  
  1089.