home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1993 #3 / NN_1993_3.iso / spool / comp / text / tex / 15283 < prev    next >
Encoding:
Internet Message Format  |  1993-01-21  |  4.3 KB

  1. Path: sparky!uunet!news.claremont.edu!ucivax!news.service.uci.edu!unogate!mvb.saic.com!info-tex
  2. From: mackay@cs.washington.edu (Pierre MacKay)
  3. Newsgroups: comp.text.tex
  4. Subject: Inputting accented characters (postpositive accents)
  5. Message-ID: <9301211717.AA18234@june.cs.washington.edu>
  6. Date: Thu, 21 Jan 93 09:17:14 -0800
  7. Organization: Info-Tex<==>Comp.Text.Tex Gateway
  8. X-Gateway-Source-Info: Mailing List
  9. Lines: 70
  10.  
  11. In principal, this is an excellent idea, and I have pushed for it since
  12. way back in the late 60s, but it is not without its difficulties.
  13.  
  14. Knuth's accent primitive was never intended for large amounts of
  15. running text, as he makes clear in several places where he
  16. comments on it.  It was to provide the necessary low-level
  17. solution to the immediate problem (fairly acute for a mathematician)
  18. of citations from European literature.  He never contemplated
  19. keyboarding {\it Les Miserables} with the accent primitive.
  20.  
  21. When you propose a postpositive convention, however, you have to make a
  22. distinction between keystrokes and input coding.  The editor you or
  23. your clients use may very well manage the handling of keystrokes in
  24. the way you intend but when you send those keystrokes to a program as
  25. codes, you may get unexpected results.  How do you distinguish
  26. ``Souse'' (in quotes) from ``Souse'', with (sic) "accent grave
  27. over the E" (W. C. Fields, in {\it The Bank Dick}).  The easy answer
  28. (too easy) is to say that the French use << >> and not `` '', but
  29. the French are not the only users of e-acute.  UNICODE has moved in the
  30. direction of postpositive accent conventions, and when all or most of us have
  31. 16-bit character software I think the decision will be seen as very much
  32. the correct one,  but we have to live with 8-bit.
  33.  
  34. About the only way to isolate a sufficient number of accents so they can
  35. be used in a low-level "glass tty" environment as well as on special
  36. and usually proprietary systems, is to provide an intermediate code.
  37. I use the +, because the mathematical symbol, when needed, can and should
  38. always be set in math mode ($+$).  But no one wants to type e+' for every
  39. occurrence of e-acute, nor should they.  The trigraph convention is there
  40. as a backup, in case you have to edit a text from a plain ascii terminal
  41. running nothing but communications software (as I am right now).  The editor
  42. program used by a multilingual author ought to provide a lot of preaccented
  43. glyphs tied to unique eight-bit (ultimately 16-bit) codes, and the translation
  44. to trigraphs ought to be invisible to the user 99 44/100% of the time.
  45. We do that with both Greek and Turkish.  The PC-Write Turkish editor produces
  46. many codes in the 0x80-0xFF range, and those are invisibly translated
  47. by the TeX macro file to digraphs and trigraphs in a post-positive
  48. accent convention.  The digraph convention is there so that files can
  49. be sent through the mail, and so that last minute editing can be done
  50. on displays that know nothing of the PC-Write Turkish convention.
  51.  
  52. Of course, there have to be fonts with ligature tables that interpret
  53. digraphs and trigraphs and produce accented TeX characters.  That assumes
  54. the existence of a font with composite accented characters, such as
  55. the DC (Cork) encoded fonts being developed at the present time.
  56.  
  57. If you have an editor whose display codes exactly match the DC encoding,
  58. and a set of display fonts that will produce the correct glyphs,
  59. there is nothing left to do but make sure that your clients are
  60. comfortable with the keystroke sequence.  Otherwise they can
  61. use some piped interpretation such as
  62.  
  63. MS Word | translator | TeX.
  64.  
  65. The important point is that the choice of keystroke sequence for the
  66. comfort of the author is not really TeX's business.  It is the business
  67. of an editor or a "Word Processor".  Once an unambiguous coding has been
  68. established within the editor, it is relatively easy to interpret that coding
  69. in a way that TeX will handle effectively, but the author usually does
  70. not need to worry about the specifics of the interpretation.
  71.  
  72.  
  73. Email concerned with UnixTeX distribution software should be sent primarily
  74. to:    elisabet@max.u.washington.edu           Elizabeth Tachikawa
  75. otherwise to:  mackay@cs.washington.edu        Pierre A. MacKay
  76. Smail:  Northwest Computing Support Center    Resident Druid for
  77.     Thomson Hall, Mail Stop DR-10        Unix-flavored TeX
  78.     University of Washington
  79.     Seattle, WA 98195
  80.     (206) 543-6259
  81.