home *** CD-ROM | disk | FTP | other *** search
/ Usenet 1994 January / usenetsourcesnewsgroupsinfomagicjanuary1994.iso / sources / std_unix / volume.13 / text0037.txt < prev    next >
Encoding:
Internet Message Format  |  1988-04-18  |  18.1 KB

  1. From: gs732%uxe.cso.uiuc.edu@uxc.cso.uiuc.edu (Ghie-Hugh Song )
  2.  
  3. Hello, everyone,  
  4.  
  5. Have you ever dreamed that TeX were more WYSWYG or that you could type
  6. Greek characters in the text mode directly?  If we had an extended
  7. 256 8-bit ASCII character set such as IBM PC's. (See Appendix of 
  8. PC DOS Manual), things would be much easier.
  9.  
  10.   Then why not use WordPerfect or MS Word?  First, all the Greek 
  11. characters and the math symbols are not supported by them, unless we 
  12. buy extra software and hardware.  In IBM's extended ASCII, there is 
  13. no 'Greek tau', 'Greek nu', or inverted Greek capital delta symbol 
  14. for partial differential equations. Even the registered trade mark 
  15. sign 'R in a circle' does not exist.  Then you might ask why not ChiWriter 
  16. or T-cube?  Simply they are not portable!  They are graphics programs.  
  17. They are not public-domain.  One of them is really expensive.
  18. So TeX has been thought to be a better choice for technical writers.  But 
  19. it's not because it is easy to use but because the text is portable
  20. and sometimes it is more versatile than other PC word processors.   In fact,
  21. without a laser printer or VorTeX and a graphics workstation, TeX is 
  22. not so useful as PC word processors.  So something should be 1) ASCII 
  23. text files for portability and 2) easy to use.  Then how about having 
  24. Greek characters and math symbols in the ASCII character set itself?
  25.  
  26.    I've got an idea for all of us.  And I wish to write a letter to
  27. the ANSI people about a new 256 8-bit extended ASCII character standard.  
  28. But I don't know the ANSI's address.  So if you agree with my idea, 
  29. please forward this message to ANSI with your opinion.  
  30.  
  31.    Let's have the Ext-key in our keyboard at the same location as the 
  32. 'Alt' key in IBM's Enhanced keyboard. (I am using the term 'Ext' to 
  33. distinguish it from GNU-Emacs' meta-editing keys.  However, the real name
  34. of the latter half of this extended ASCII set should be
  35. 'meta', since they call it in that way in the termcap files.)
  36. Ext-p (F0-hexdec) will give us a printable character Greek-pi, 
  37. and Ext-shift-p (D0-hexdec) will give us a printable character 
  38. Greek-Pi (captial-pi) directly. IBM's Greek-pi is in E3 in 
  39. hexadecimal which matches 'c' (63-Hexdec) among 
  40. 128 7-bit ASCII codes. So every word processor is different in its way of 
  41. producing pi.  It lowers the portability of word-processed texts.
  42.  
  43.    At the end of this posting, I propose my draft. Please see and
  44. examine it.
  45.  
  46.    One may oppose this draft because the existing printers might not be used.
  47. We can use those with a mere printer driver software with a translater
  48. software as long as we do not type in the original text any one of the fonts 
  49. not supported by the printer.
  50.  
  51.    I understand that the standardization of 8-bit extended ASCII
  52. is too late.  However I know that once this is implemented on 
  53. the new version of UNIX or POSIX, everyone will follow
  54. this slowly.  Now people are gathering to standardize UNIX, POSIX, SVID,
  55. or whatever.  Now is the time to express our opinion to ANSI people.  
  56. If we lose this chance we will never have a standard 8-bit ASCII.
  57. If you agree with my idea, write a letter to ANSI, POSIX committee
  58. (IEEE CS/P1003), and the acting System V.4 committee members of
  59. AT&T-Sun-Unisys(?) immediately for their 
  60. prompt action.  Unfortunately, I do not know any of those addresses. 
  61.  
  62.   I really do not know whether this effort is made first by me.  
  63. Nor do I know whether there exists such extended ASCII made by ANSI.
  64. Since no text-mode terminal has inherent math fonts, I think there is no
  65. such standard so far.
  66.  
  67.   More than one half of college graduates in the world are either
  68. engineers, scientist, or medical doctors.  They need English with Greek 
  69. characters and math fonts to write reports, homeworks, papers. The need
  70. sometimes exceeds that of their own language support.  They need 
  71. a knowledge bank that can save some great idea like 
  72.  
  73.           E = h-bar.omega  : Einstein's photoelectric effect,
  74.           E = mc^2         : Einstein's relativistic energy
  75.  
  76. without backslashes or $'s, and yet portable. 
  77.  
  78.    Thank you for your attention.
  79.  
  80.                                G. Hugh Song
  81.  
  82.                                Coordinated Science Lab.
  83.                                Univ. of Illinois at Urbana-Champaign
  84.                                1101 W. Springfield Av.
  85.                                Urbana, IL 61801
  86.                                song@uispg.csl.uiuc.edu
  87.  
  88. ============================================================
  89.  
  90.    Here is my draft of 256 new 8-bit ASCII character set.  I place the 
  91. second half of 8-bit characters (128-255) next to the first half of them.
  92.  
  93.    I am not decisive on what to assign to the following Ext-control keys (80-
  94. hexdec to 9f-hexdec).  There are two options:
  95.  
  96. 1) We can assign new control keys which have become neccessary
  97.    as the computer science evolves.  Some examples are shown below.
  98.    I wish that someone in the field rearrage the assignment and 
  99.    complete this, since I do not have enough knowledge and current
  100.    implementation status of i/o utilization.
  101. 2) Or we may give some freedom to the manufacturers of keyboard
  102.    and terminals.
  103.  
  104. Even though these (00-hexdec to 1f-hexdec and 80-hexdec to 9f-hexdec) 
  105. are not legitimately printable while editing a text file, I wish there are 
  106. corresponding printable characters such as graphical framing characters
  107. as in IBM PC or a triangle directing left for ^H, not just as the current 
  108. '^' which does not distinguish itself from 5e-hexdec.  It will ease 
  109. debugging communication problems.
  110.  
  111. | 00 ^@ nul   80 sml  decreases character size and increases back
  112.   01 ^a soh   81
  113.   02 ^b stx   82 bld  boldifies and unboldifies (toggle)
  114.   03 ^c etx   83
  115.   04 ^d eot   84 dwn  steps down one half line spacing 
  116.   05 ^e enq   85     
  117.   06 ^f ack   86 
  118.   07 ^g bel   87 grp  enters and exits graphics mode
  119. | 08 ^h bs    88 hlp  invokes help universally. 
  120.   09 ^i ht    89 itl  italicize and deitalicize from now 
  121.   0a ^j nl    8a 
  122.   0b ^k vt    8b mlm  mouse left movement    \
  123.   0c ^l np    8c mlb  mouse left button       |
  124.   0d ^m cr    8d mmb  mouse middle button     |  
  125.   0e ^n so    8e mdm  mouse downward movement |  Important!
  126.   0f ^o si    8f                              |  no matter what these are
  127. | 10 ^p dle   90 mum  mouse upward movement   |  meta-control keys or
  128.   11 ^q dc1   91 mrm  mouse right movement    |  escape sequences.
  129.   12 ^r dc2   92 mrb  mouse right button     /
  130.   13 ^s dc3   93 scr  sripticizes or unscripticizes (toggle)
  131.   14 ^t dc4   94 
  132.   15 ^u nak   95 up   steps up one half line spacing 
  133.   16 ^v syn   96 rev  reverses or reverses back characters's black and white  
  134.   17 ^w etb   97 
  135. | 18 ^x can   98    
  136.   19 ^y em    99    
  137.   1a ^z sub   9a   
  138.   1b ^[ esc   9b atn  escapes during communication calling attention of
  139.                       the local control
  140.   1c ^\ fs    9c  
  141.   1d ^] gs    9d    
  142.   1e ^^ rs    9e   
  143.   1f ^_ us    9f
  144.  
  145.    Now in the following we have printable  characters except the 'DEL' 
  146. key at the end of the lower 7-bit codes.  The alt key may be used to send
  147. the 8-bit code to the host computer
  148. by simulating this key with kermit's 'set key' program such as in 
  149. MSFERMIT version 2.30.  
  150.  
  151.    For the 7-bit terminal environment, in which 8-bit signals are not 
  152. generated or received by the terminal,
  153. such as VT100, it is desirable for the C-shell or the editor to have a key 
  154. which tells the host computer that the next key is one of the upper 
  155. 8-bit codes (128-255).  This key should not contradict with a control key
  156. of the existing editor programs.   The 'esc' key might be thought the best 
  157. choice.  However, most editor programs use this key heavily for some other 
  158. purposes.  To avoid conflict, the 'cr (Cntrl-m)' key, which is redundant 
  159. both in vi and in gnuemacs (You might have noticed notice that 'C-m' is 
  160. changed to 'nl (C-j)' automatically by both editors), may be used.
  161.  
  162.    This will limit the use of the Meta key in our (or Stallman's) GNU-Emacs.   
  163. This actually means no revision in GNU-Emacs.  We just use the ESC key 
  164. to invoke the Meta editing keys, although the keyboard has the Meta key. 
  165. This is the price we pay 
  166. for those Greek characters and the math symbols.  If we use the 'Cntrl-h' for 
  167. the real backspace, we have to choose another key for 
  168. invoking 'help' in GNU-Emacs.  How about the 'Ext-Cntrl-h' ('88-hexdec')
  169. (or 'C-m C-h' on the 7-bit terminal) as a key for invoking help 
  170. in the future version (Ver. 19) of GNU-Emacs.  This is the only change
  171. which is not compatible to the present version (Ver.18).
  172.  
  173.    I'd like to suggest that the 'Ext-Cntrl-h (88-hexdec)' or 'Cntrl-m Cntrl-
  174. h' on the 7-bit terminal be a new standard key invoking help in e
  175. very software package in the future.  Isn't it a good idea?
  176.  
  177. | 20 sp    a0 a horizontal bar longer than just '-'.
  178.   21 !     a1 a black square
  179.   22 "     a2 the starting double quotation mark
  180.   23 #     a3 \neq : not-equal sign '/=' in one character site
  181.   24 $     a4 the Pound symbol (U.K. money unit)
  182.   25 %     a5 \div : the division symbol, ':-' in one character site
  183.   26 &     a6 \cap : the common set in set theory, The inverted 'U'.
  184.   27 '     a7 the starting single quatation mark
  185. | 28 (     a8 the top portion of the left parenthesis
  186.   29 )     a9 the top portion of the left parenthesis
  187.   2a *     aa a small circle at the ' level that usually represents degree
  188.   2b +     ab \pm   : '+-' in one character site with + up and - down.
  189.   2c ,     ac the cedilla symbol without c, s, or C.
  190.   2d -     ad \mp   : '-+' in one character site with - up and + down.
  191.   2e .     ae \cdot : a dot at the center
  192.   2f /     af $\dot $ : a dot at the top
  193. | 30 0     b0 the bottom portion of the right parenthesis
  194.   31 1     b1 \propto : the proportionality symbol, 'oc' in one character site
  195.   32 2     b2 \bigcirc : a big circle.
  196.   33 3     b3 \prime \prime \prime : tripple-prime
  197.   34 4     b4 a vertical line with a wart in the middle as in '{'
  198.   35 5     b5 a vertical line with a wart in the middle as in '}'
  199.   36 6     b6 \partial : the mirror image of '6'
  200.   37 7     b7 \cup : the symbol in the set theory, that looks like 'U'
  201. | 38 8     b8 \infty : the infinity symbol, 'oo' in one character site
  202.   39 9     b9 the bottom portion of the left parenthesis
  203.   3a :     ba $\ddot $ : the umlaut, two dots overhead.
  204.   3b ;     bb \prime \prime : the double-prime
  205.   3c <     bc \le    : '_<' in one character site
  206.   3d =     bd \equiv : '=_' in one character site for the defining equality
  207.   3e >     be \ge    : '_>' in one character site
  208.   3f ?     bf \supset : superset symbol
  209. | 40 @     c0 the registered trademark sign, a small capital R in a circle
  210.   41 A     c1 angstrom, a small circle on top of 'A'
  211.   42 B     c2 \rightarrow : an arrow heading east
  212.   43 C     c3 \copyright  : a small capital 'C' in a circle
  213.   44 D     c4 \Delta
  214.   45 E     c5 \in : 'an element of' symbol in set theory
  215.   46 F     c6 \Phi
  216.   47 G     c7 \Gamma
  217. | 48 H     c8 \hbar  : accented italic h for the Planck constant
  218.   49 I     c9 the top portion of the integral symbol
  219.   4a J     ca the bottom portion of the integral symbol
  220.   4b K     cb \simeq :a set symbol (obtained from U by rotating it 90 deg CW)
  221.   4c L     cc \Lambda
  222.   4d M     cd \subset: symbol in the set theory
  223.   4e N     ce \nabla : inverted Greek-capital-Delta
  224.   4f O     cf \Omega
  225. | 50 P     d0 \Pi
  226.   51 Q     d1 \Theta
  227.   52 R     d2 \surd : also makes a \sqrt if combined with underlines (__)
  228.   53 S     d3 \Sigma
  229.   54 T     d4 the trade mark sign, the superscripted 'TM'
  230.   55 U     d5 \Upsilon
  231.   56 V     d6 \leftarrow : an arrow heading west
  232.   57 W     d7 \ddag : the double dagger symbol used for a footnote.
  233. | 58 X     d8 \Xi
  234.   59 Y     d9 \Psi
  235.   5a Z     da \downarrow : an arrow heading south.
  236.   5b [     db \lceil : a vertical line whose top is clamped to the right
  237.   5c \     dc \times : 'x' without serif, math symbol for a multiplication
  238.   5d ]     dd \rceil : a vertical line whose top is clamped to the left
  239.   5e ^     de $\check $ : an accent symbol inverted from '^'
  240.   5f _     df $\overline $ : a long bar on top.
  241. | 60 `     e0 \prime (60-hexdec is a back-prime)
  242.   61 a     e1 \alpha
  243.   62 b     e2 \beta
  244.   63 c     e3 \chi
  245.   64 d     e4 \delta
  246.   65 e     e5 \epsilon
  247.   66 f     e6 \phi
  248.   67 g     e7 \gamma
  249. | 68 h     e8 \eta
  250.   69 i     e9 \iota
  251.   6a j     ea \smallint : the integral symbol, enlongated s
  252.   6b k     eb \kappa
  253.   6c l     ec \lambda
  254.   6d m     ed \mu
  255.   6e n     ee \nu
  256.   6f o     ef \omega
  257. | 70 p     f0 \pi
  258.   71 q     f1 \theta
  259.   72 r     f2 \rho
  260.   73 s     f3 \sigma
  261.   74 t     f4 \tau
  262.   75 u     f5 a wiggle positioned at the underline(_) level.
  263.   76 v     f6 \vec the short arrow symbol that represents a vector
  264.   77 w     f7 $\dagger $ : the dagger symbol used for a Hermitian conjugate
  265. | 78 x     f8 \xi
  266.   79 y     f9 \psi
  267.   7a z     fa \zeta
  268.   7b {     fb \lfloor : a vertical line whose bottom is clamped to the right  
  269.   7c |     fc \|      : two vertical lines in one character site
  270.   7d }     fd \rfloor : a vertical line whose bottom is clamped to the left  
  271.   7e ~     fe \sim    : a wiggle positioned at the center level
  272. - - - - - - - - - - - - - - - - - - -
  273.   7f del   ff erh  erase the character at the current cursor position 
  274. -------------------------------------------------------------
  275.  
  276.     These all can be reside in the text mode in 8-bit mode so that any text 
  277. mode terminal can display them directly on the text mode screen.
  278. The possible benefit of this extension is:
  279.  
  280. 1. If every typesetting program is revised according to the new standard,
  281.    they will become more WYSWYG. It means we do not need to type the '\alpha' 
  282.    while typing a TeX file.
  283. 2. The wordprocessor and the typesetting programs will be cheaper since they
  284.    do not need to include soft-font files or the hard font ROM.
  285. 3. The word processor files can easily be exported and imported from one
  286.    word processor file to another without losing special characters as 
  287.    long as they reside in 256 character set.
  288.  
  289.    In addition to this new extended ASCII, I think that some of the
  290. present ASCII characters should be redesigned from the present 
  291. ones as follows:
  292.  
  293.   " 22    should be designed to look more like the closing double
  294.           quotation mark as in typeset books.
  295.   ' 27    the closing single quotation mark or apostrophe
  296.           same comment as above (" 22-hexdec)
  297.   * 2a    position this a little higher than the present height
  298.           so that it looks like a footnoting symbol, not like a multiplication
  299.           symbol.
  300.   / 2f    stretch this so that two of these can be connected without breaking
  301.           to make a long slanted line.
  302.   \ 5c    the same comment as above
  303.   _ 5f    the same comment as above so that it should be \underbar{ }
  304.   | 7c    make this a single long vertical line rather than the present
  305.           one broken at the middle.
  306.  
  307.    The current ANSI standard for erasing the previous character is DEL,
  308. not backspace!  Let us encourage everyone to observe this standard.  
  309. I know that the troublemaker IBM does not follow this standard.  
  310. Let them go their way.  We do not care for IBM.  We are talking about UNIX 
  311. and GNU-Emacs and TeX.  Then backspace will do the following job in
  312. GNU-Emacs and vi.
  313.  
  314.  ^h 08  bs    a backspace key without erasing the previously typed 
  315.               character, making an overprinted image when printed. I think this
  316.               special function of this key is actually in the present
  317.               ANSI standard.  You might have noticed that the UNIX 'man'ual
  318.               pages contain '^H' in their text files for underlining.
  319.               It seems now fully supported by most ANSI terminals. (But not on
  320.               IBM's)  Nevertheless, it is not supported by vi or GNU-Emacs. 
  321.               Let's encourage Mr.Stallman to support this in his new
  322.               version of GNU-Emacs. It will display every accented
  323.               vowel for foreign alphabets, the 
  324.               cent (money unit), some foreign money units, the C-cedilla 
  325.               ('Ext-,-backspace-c'), and the null set symbol ('0/' in one 
  326.               character site.
  327.               To edit this backspace we need a special character for 
  328.               this.  A hollow triangle dirrected to the left is good 
  329.               enough.  Also (Emacs maybe not on vi) will have  mode to view
  330.               this while editing.
  331.  ^m 0d  met   In due consideration, the mnemonic should be changed from
  332.               'cr' to 'met'a. 
  333.  
  334.  
  335. ==========================================
  336.     KEYBORAD
  337. -----------------
  338.    This part is not part of my proposal.  I just wish that the new ANSI 
  339. ASCII keyboard has the following keys.  One may assign some 
  340. function keys for the following purposes.  But it goes
  341. without saying that separate keys at the space bar level are more desirable.
  342.  
  343. For text/graphics terminals
  344.  
  345. Italic key : italicizes the normal character. this key should be active
  346.              only on the alpabetic characters, Greek capital characters,
  347.              but not on numeric characters, symbols like '%', '+', '"',etc.
  348.              On a black-and-white text-mode-only terminal which does not have
  349.              ROM to support various fonts (such as VT100), 
  350.              it would be desirable if this key reverses white and black
  351.              of those characters between the two italic keys.
  352.              Black becomes white, white becomes black. (Toggle)
  353. Bold key :   boldens or highlights a character. (Toggle)
  354.  
  355. For graphics terminals
  356.  
  357. Step-up key : moves the position 1/2-line higher.  and then step down key
  358.              to go back to the original line height.
  359. Step-down key : moves the position 1/2-line lower. and then step-up key
  360.              to go back.
  361. Script key : displays the scripted characters. (Toggle)
  362. Small character key : displays small characters from now and restores the 
  363.              size back. (Toggle)
  364.  
  365.    As to the Keyboard Layout,
  366. We do not need to have the editing keypad on the right.
  367. Why don't we move it to the left leaving more space for the mouse?
  368.  
  369. =====================================End of draft=======
  370.  
  371. P.S. At first, I did not intend to do this as a project.  However
  372. it turned out to be a big project.  Now I want to drop
  373. this project and let this free to the public by posting at 
  374. the news system here.  I hope everybody to express their 
  375. opinion and fruitful discussion here.   And fianlly I hope to see ANSI
  376. or POSIX committee act.
  377.  
  378. Please start this project and act, ANSI.
  379.  
  380. Volume-Number: Volume 13, Number 39
  381.  
  382.