home *** CD-ROM | disk | FTP | other *** search
/ NetNews Usenet Archive 1992 #16 / NN_1992_16.iso / spool / de / comp / os / unix / 1297 < prev    next >
Encoding:
Text File  |  1992-07-25  |  18.3 KB  |  450 lines

  1. Newsgroups: de.comp.os.unix
  2. Path: sparky!uunet!zaphod.mps.ohio-state.edu!sol.ctr.columbia.edu!ira.uka.de!math.fu-berlin.de!zrz.tu-berlin.de!supergau
  3. From: supergau@cs.tu-berlin.de (Thipor Kong)
  4. Subject: Re: dt. Umlaute auf SUN SPARC, X11?  (Hilfe!)
  5. Message-ID: <5VF59W@mailgzrz.tu-berlin.de>
  6. Sender: news@mailgzrz.tu-berlin.de (News Manager)
  7. Nntp-Posting-Host: hektor.cs.tu-berlin.de
  8. Organization: Techn. University of Berlin, Germany
  9. References: <1992Jul13.101256.16350@dfv.rwth-aachen.de>
  10. Date: Sat, 25 Jul 1992 18:39:08 GMT
  11. Lines: 437
  12.  
  13.  > Die Geraete haben alle amerikanische Tastaturen und normalerweise ist
  14.  > es unueblich, andere ASCII-Zeichen als 7-bit zu verwenden.
  15.  > 
  16.  > Nun ist mir aber aufgefallen, dass die Geraete problemlos den ISO-8859
  17.  > Zeichensatz beherrschen und dait u.a. auch alle deutschen Umlaute
  18.  > darstellen und verarbeiten koennen.
  19.  
  20. Hier ein Text, der die Umstellung von Software auf iso8859_1 generell be-
  21. handelt.
  22.  
  23. Thipor
  24.  
  25. PS: hat sich schon jemand um iso8859-Umlaute f"ur 386BSD gek"ummert?
  26.  
  27.  
  28. $Header: /home/c/cross/texts/RCS/Umlaute,v 1.5 1992/07/14 12:36:23 cross Exp cross $
  29.  
  30.         ISO 8859-1 Umgebung -- Umlaute
  31.         ------------------------------
  32.  
  33. Dieser Text soll beschreiben, wie man/frau die Arbeitsumgebung 
  34. (insbesondere die Sun- und UNIX-Umgebung) so einstellen kann,
  35. dass die Verwendung von Zeichen, deren 8. Bit gesetzt ist 
  36. (im folgenden 8-bit-Zeichen genannt), moeglich wird. Dabei wird
  37. von einem Zeichensatz ausgegangen, der die normalen ASCII-Zeichen
  38. um in Westeuropa gebraeuchliche Sonderzeichen erweitert: ISO 8859-1.
  39. Seine Geschwister werden weiter unten dargestellt.
  40.  
  41. Es gibt sowohl im Fachbereichsnetz als auch in den deutschen News
  42. seit langem zwei Lager: die einen sagen, UNIX sei ASCII-basiert, 
  43. und man solle mit der Umstellung auf internationale Zeichensaetze 
  44. solange warten, bis es (a) eine Norm gebe, die wirklich alle denkbaren 
  45. Zeichen beruecksichtigt, und (b) alle Tools und Protokolle darauf 
  46. eingestellt seien.  Ihre Gegner wollen darauf nicht warten, sondern 
  47. meinen, Umlaute gehoerten zur deutschen Schriftsprache, auf deren
  48. vollstaendigen Gebrauch sie auch auf dem Rechner nicht verzichten
  49. wollten.
  50.  
  51. Dieses Dokument will nicht zu der Diskussion beitragen; es schildert
  52. lediglich die Massnahmen, die bei einer Umstellung notwendig sind.
  53.  
  54.  
  55. Grundsaetzlich gilt leider die Regel: Jedes noch so kleine Programm
  56. muss einzeln dazu ueberredet werden, 8 Bit zu verstehen.
  57. Ein grosses Uebel ist die fehlerhafte Benutzung der libc: Viele
  58. Programme (z.B.) rufen isprint() auf, ohne sich vorher mit isascii()
  59. vergewissert zu haben, dass das Argument ein 7-bit-Zeichen ist --
  60. isprint() liefert bei 8-bit-Zeichen beliebigen Muell... (Die Manual-
  61. page ctype(3V) ist irrefuehrend.)
  62.  
  63. Bevor die Tuecken der einzelnen Programme geschildert werden,
  64. eine Kurzzusammenfassung der Situation und notwendigen Schritte
  65. im Fachbereichsnetz.
  66.  
  67.  
  68. Kurzzusammenfassung fuer X-Umgebungen in cs.tu-berlin.de
  69. ========================================================
  70.  
  71. Folgende Aenderungen sind fuer die Standardsituation im 
  72. Fachbereichsnetz, SunOS4.1 unter X, notwendig (natuerlich nur,
  73. soweit die entsprechenden Programme benutzt werden ;-)):
  74.  
  75.     ~/.cshrc:     setenv LC_CTYPE iso_8859_1
  76.           setenv LESSCHARSET latin1
  77.  
  78.     ~/.emacs:     (set-default 'ctl-arrow 1)
  79.                   (autoload 'accent-mode "accent-mode" "Mode for iso chars" t)
  80.  
  81.     ~/.nn/init:   set data-bits 8
  82.  
  83.     ~/.elm/elmrc: [pager = builtin ersetzen durch] pager = less
  84.  
  85. Falls der emacs-mode aktiviert werden soll, der als "a, "u, etc.
  86. eingegebene Umlaute automatisch in ISO-Zeichen umsetzt, im emacs eingeben:
  87.  
  88.     M-x accent-mode
  89.  
  90.  
  91.     
  92. Einzelne Programme (auch ausserhalb des Fachbereichsnetzes gueltig)
  93. ===================================================================
  94.  
  95. terminal
  96. -------- [dieser Absatz gilt nur fuer ASCII Terminals]
  97.     Bevor irgendwas an der Software gedreht wird, muss natuerlich
  98.     das Terminal 8-bit-Zeichen uebertragen und anzeigen koennen.
  99.     Es sollte also auf 8 bit, no parity eingestellt werden;
  100.     der Zeichensatz sollte auf ISO8859 stehen (nicht international
  101.     ASCII, dabei werden nur einige 7-bit-Zeichen ueberladen).
  102.     VT-Terminals haben eine verlockende Option "8-bit-controls",
  103.     die stiftet aber nur Verwirrung, solange termcap und terminfo
  104.     nicht auch geaendert werden, und sollte deshalb auf 
  105.     "7-bit-controls" stehenbleiben.  :-)
  106.  
  107.     Die Eingabe von Umlauten geschieht meist ueber die 
  108.     Compose-Taste: z.B. Compose-"-a (nacheinander) ergibt umlaut-a.
  109.     Nicht zu verwechseln mit Compose-a-e (daenische ae-Ligatur).
  110.     Alle Compose-Argumente sind mit zwei, solche mit Shift mit drei
  111.     Tastendruecken zu erreichen.
  112.     Die Bedeutung einiger Compose-Argumente ist davon abhaengig,
  113.     welche Tastatur eingestellt ist.
  114.     Eine vollstaendige Liste befindet sich in jedem DEC Terminal-
  115.     Handbuch seit VT220.
  116.  
  117.  
  118. terminalserver, telnet-Protokoll
  119. --------------------------------
  120.     Das Telnet-Protokoll (RFC 854) benutzt einen 8-bit-breiten
  121.     Datenstrom, um ASCII-Daten zu uebertragen. Es ist spezifi-
  122.     ziert, dass andere als ASCII-Zeichen "zu keiner Aktion"
  123.     fuehren. Die meisten Terminalserver, -multiplexer und 
  124.     Telnetprogramme (genaugenommen alle, die ich kenne) geben
  125.     8-bit-Zeichen trotzdem an den Benutzer weiter, so dass
  126.     ISO-Zeichen angezeigt werden koennen.
  127.  
  128. terminalserver, rlogin-Protokoll
  129. --------------------------------
  130.     Manche Terminalserver beherrschen auch das rlogin-Protokoll;
  131.     bei den mir bekannten ist der Datenstrom 8 bit breit, wenn
  132.     er nicht umgestellt wird.
  133.  
  134. Modems
  135. ------  siehe Stichwort "TTY"; alle Modems am Fachbereichsnetz
  136.     und die des ZRZ sind auf 8-bit-Uebertragung geschaltet.
  137.  
  138. PC/Atari/Amiga-Terminalprogramme
  139. --------------------------------
  140.     IBM verwendet einen internationalen Zeichensatz, der nicht
  141.     ISO 8859 entspricht. Atari hat sich IBM angeschlossen.
  142.     Die meisten Terminalprogramme sind aber auf ISO 8859
  143.     umschaltbar. Diese Einstellungsmoeglichkeit darf nicht
  144.     mit "8-bit-controls" (siehe Stichwort "Terminal") oder
  145.     mit "international ASCII character set" (einige 7-bit-
  146.     Zeichen mit nationalen Sonderzeichen ueberladen) 
  147.     verwechselt werden.
  148.  
  149. getty
  150. -----   Sun's default-Eintrag in /etc/gettytab definiert "ap":
  151.     7 bit, any parity. Er muss auf "p8" geaendert werden.
  152.  
  153. TTY
  154. ---    Obwohl 8-bit-Frames uebertragen werden, entfernen die
  155.     TTY Treiber der meisten Betriebssysteme das 8. Bit, wenn
  156.     sie nicht besonders daran gehindert werden.
  157.     In BSD: "stty pass8"; in System V: "stty -istrip -ostrip cs8".
  158.     In SunOS: eine der beiden Formen.
  159.  
  160.     Manche wirklich alten BSD4.2/4.3-Versionen benoetigen 
  161.     zusaetzlich (sogar auf pseudo ttys!!) "-even -odd";
  162.     standardmaessig sind sie auf 'Mark Parity' eingestellt
  163.     (codiert als even und odd parity gleichzeitig).
  164.  
  165. Shells
  166. ------  In POSIX wurde ein System zur Unterstuetzung nationaler
  167.     "Besonderheiten" eingefuehrt (nicht nur Zeichensaetze, sondern
  168.     auch Dezimalpunkte, Waehrungen, Datumformat, und schlimmsten-
  169.     falls die Sprache der Programm- und Systemmeldungen).
  170.     Es laesst sich durch Setzen von Environmentvariablen beein-
  171.     flussen. Der Zeichensatz wird durch LC_CTYPE umgesetzt.
  172.     Sun unterstuetzt zur Zeit nur "default" und "iso_8859_1".
  173.     Also: "setenv LC_CTYPE iso_8859_1".
  174.  
  175.     Andere Betriebssysteme, die National Language Support (NLS)
  176.     schon vor POSIX hatten, benutzen meist andere Variablen, z.B.
  177.     "LANG". Einzelheiten sind mir nicht bekannt.
  178.  
  179.     Die mitgelieferten Shells aelterer Betriebssysteme unterstuetzen
  180.     oft gar keine 8-bit-Zeichen -- viele Programme in der alten
  181.     4.3BSD-Release benutzen das 8. Bit als Statusbit (meist als
  182.     Kennzeichnung, ob das entsprechende Eingabezeichen in Quotes 
  183.     eingeschlossen war).
  184.  
  185.     Versionen der tcsh seit etwa 1988 benutzen fuer diese Zwecke
  186.     das 16. Bit statt des 8.
  187.  
  188. rlogin
  189. ------    sollte per Alias "rlogin -L" oder "rlogin -8" aufgerufen werden. 
  190.     Die System V-Syntax (auch DEC) erlaubt -L/-8 nur nach der Option
  191.     "-l <user>" (falls -l angegeben wird). 
  192.     Beim SunOS4.1 ist anscheinend -8 per default eingestellt, auch
  193.     wenn die ManualPage das nicht suggestiert.
  194.  
  195. xterm
  196. -----    xterm selbst ist immer 8 bit clean. Sofern der verwendete Font
  197.     Umlaute enthaelt (Test mit xfd -fn <font>), werden sie auch
  198.     dargestellt (*). Die Eingabe ist etwas gewoehnungsbeduerftig:
  199.     Die Meta-Taste setzt das 8. Bit, also:
  200.         ae = M-d         Ae = M-D
  201.         oe = M-v         Oe = M-V
  202.         ue = M-|         Ue = M-\
  203.         ss = M-_
  204.     (unter Umstaenden sind die Zeichen nur mit Shift erreichbar)
  205.     Die Umlaute koennen natuerlich mit xmodmap auf 'sinnvollere'
  206.     Tasten umgelegt werden.
  207.  
  208.     (*) XTerm benutzt pseudo ttys und Shells. Wenn eines von
  209.     beiden nur 7 Bit darstellt, kann xterm natuerlich keine
  210.     Wunder vollbringen. Was pseudo ttys angeht, stellt XTerm
  211.     sie zwar auf "pass8" um, aber siehe Punkt "ttys".
  212.  
  213.  
  214. emacs
  215. -----    Alle Angaben beziehen sich auf Version 18.58; aeltere Versionen
  216.     koennen zwar auch gepatched werden (s.u.), aber das funktioniert
  217.     angeblich nicht korrekt; neuere Versionen (emacs 19) werden
  218.     per default 8-bit-Zeichen anzeigen koennen.
  219.  
  220.     Grundsaetzlich ist der emacs zwar 8-bit-"clean", d.h. er
  221.     entfernt an keiner Stelle das 8. Bit, er haelt diese Zeichen
  222.     aber fuer nicht lesbar und zeigt sie deshalb oktal an.
  223.  
  224.     Das kann durch den ctl-arrow-patch geaendert werden, der z.B.
  225.     von ftp.cs.tu-berlin.de:/pub/gnu/emacs/contrib verfuegbar ist.
  226.     (im Fachbereichsnetz installiert)
  227.     Der Patch wird aktiviert durch eine Zeile in ~/.emacs:
  228.         (set-default 'ctl-arrow 1)
  229.  
  230.     8-bit-Zeichen koennen unter X mit der Compose-Taste wie auf
  231.     VT-Terminals eingegeben werden (s.o.).  Damit die Zeichen nicht
  232.     als Kommandos interpretiert werden, muss vorher quoted-insert
  233.     (C-q) eingegeben werden. Das ist umstaendlich und kann wie beim
  234.     xterm durch Aenderung der key bindings verbessert werden.
  235.  
  236.     Die Eingabe mittels der Compose-Taste ist aus unbekannten 
  237.     Gruenden auf richtigen VT's leider nicht moeglich (mit der im 
  238.     Fachbereichsnetz installierten Version).
  239.  
  240.     Alternativ koennen Umlaute als Folge von 7-bit-Zeichen mithilfe
  241.     des accent-mode eingegeben werden: er wandelt 7-bit-Sequenzen
  242.     ("a, "s etc. wie in TeX) in die korrespondierenden Umlaute um.
  243.     In ~/.emacs sollte die Zeile stehen:
  244.         (autoload 'accent-mode "accent-mode" "Mode for iso chars" t)
  245.     Im emacs aktivieren mit:
  246.         M-x accent-mode
  247.  
  248. vi
  249. --    wird -- zumindest bei Sun -- durch die Variable LC_CTYPE
  250.     (siehe Stichwort "Shells") auf 8 bit eingestellt.
  251.  
  252. Utilities
  253. ---------
  254.     less: abhaengig von LESSCHARSET, leider nicht von LC_CTYPE.
  255.       LESSCHARSET muss auf "latin1" gesetzt sein.
  256.     awk, sed, andere klassische UNIX Tools: sind sehr haeufig
  257.       (auch unter SunOS) nicht 8-bit-clean und auch nicht dazu
  258.       zu ueberreden.
  259.  
  260. Drucken
  261. -------    Drucker sind meist ueber serielle Leitungen angeschlossen,
  262.     die auf 8 bit eingestellt sein muessen (siehe ttys).
  263.  
  264.     Einstellungen fuer ASCII-Drucker: unbekannt
  265.  
  266.     PostScript-Drucker: Haben Fonts mit Umlauten, die entweder
  267.         im Klartext uebermittelt werden koennen (nachdem der
  268.         Drucker mit einem entsprechenden Header darauf vorbereitet
  269.         wurde), oder verschluesselt als 7-bit-Zeichen (so geben
  270.         dvips und troff Umlaute aus).
  271.  
  272.     a2ps kann nur 7-bit-Zeichen ausgeben.
  273.         Dafuer gibt es im Fachbereichsnetz /home/pub/bin/iso2ps.
  274.  
  275.  
  276. Compiler
  277. --------
  278.     C-Compiler moegen keine Umlaute in Bezeichnern, weil das
  279.     dem ANSI C Standard widerspricht. Umlaute in Kommentaren
  280.     sind meist ungiftig. Umlaute in Strings ebenfalls; die
  281.     meisten C Libraries (printf..) sind auch nicht allergisch
  282.     dagegen.
  283.  
  284.  
  285. Mail
  286. ----    Hier muss mensch unterscheiden zwischen MTA (Message Transfer 
  287.         Agent, sendmail, smail) und UA (User Agent, elm, emacs/Rmail).
  288.  
  289.     sendmail: ist normalerweise nicht 8-bit-clean, sondern entfernt
  290.     das 8. Bit aus allen vom Benutzer angenommenen Mails. Die
  291.     Implementierung im Fachbereichsnetz unterlaesst dies, allerdings
  292.     auf eine noch nicht sehr intuitive Weise.
  293.     smail: keine Ahnung.
  294.  
  295.     Es gilt, dass fuer den Empfaenger Sonderzeichen nur 'sinnvoll'
  296.     sind, wenn der Sender spezifiziert hat, welcher Zeichensatz
  297.     benutzt wurde. Die Syntax der entsprechenden Header-Felder
  298.     ist zwar seit Juni 1992 standardisiert, aber noch nicht weit
  299.     verbreitet. Ein korrekter Header sieht nach RFC 1341 so aus:
  300.  
  301.         MIME-Version: 1.0
  302.         Content-Type: text/plain; charset=ISO-8859-1
  303.         Content-Transfer-Encoding: 8bit
  304.  
  305.     Neuere IDA-Sendmailversionen akzeptieren auch:
  306.     "X-Charset: ISO-8859-1" oder "X-Charset: LATIN1"
  307.  
  308.     WICHTIG: Dummerweise spezifiziert RFC822, dass Internet
  309.     Text Messages (Mails, News-Artikel) nur 7-bit-Zeichen 
  310.     enthalten duerfen.  Das heisst, alle oben genannten Massnahmen
  311.     sind nur normkonform, wenn "irgendwer" eine Konvertierung in
  312.     7-bit-Zeichen bzw. daraus zurueck vornimmt. (sendmail kann das,
  313.     es ist aber im Fachbereichsnetz nicht eingeschaltet.)
  314.  
  315.     Insbesondere ist der Header "Content-Transfer-Encoding: 8bit"
  316.     _nicht_ RFC822-konform, weil er spezifiziert, dass 8-bit-
  317.     Zeichen uebertragen werden; ich habe ihn zitiert, weil er
  318.     die Situation widerspiegelt, wie 8-bit-Zeichen in Mails und
  319.     Newsartikeln uebertragen werden, die vom Fachbereichsnetz
  320.     ausgehen.
  321.  
  322.  
  323.     elm2.3: Benutzt zur Eingabe einen Editor, siehe dort.
  324.     Ausgabe: Der elm "builtin" pager ist NICHT 8-bit-clean, weil
  325.     er faelschlicherweise isprint() benutzt (s.o.).
  326.     Bis es eine korrigierte Version gibt, kann der Pager in 
  327.     ~/.elm/elmrc mit "pager = less" umgesetzt werden.
  328.  
  329.     emacs/Rmail: siehe emacs.
  330.  
  331. News
  332. ----    Das Newssystem selbst ist durchgaengig de facto 8-bit-clean.
  333.     (Zur Zulaessigkeit der Verwendung von 8-bit-Zeichen siehe
  334.     aber Stichwort "Mail").
  335.     Es gibt noch einige Sites, die das weithin verdammte alte
  336.     "B-News" benutzen (z.B. unido). Soweit mir bekannt, entfernt
  337.     es das 8. Bit aus allen Artikeln, die es transferiert.
  338.  
  339.     Newsreader: rn, trn: sind ohne weitere Einstellungen 8-bit-clean.
  340.     nn: in ~/.nn/init: "local data-bits 8"
  341.     gnus: siehe emacs.
  342.  
  343. Netiquette -- WARNUNG
  344. ---------------------
  345.     Es wird davon abgeraten, in englischsprachigen Newsgroups/Mails
  346.     Umlaute zu benutzen (Achtung: ~/.signature). 
  347.     Die meisten Amis haben noch nie was von ISO 8859 gehoert.
  348.  
  349.     In Europa wird sich ISO 8859 vermutlich in ca. zwei Jahren
  350.     durchgesetzt haben (subjektive Prognose); im Moment sind aber 
  351.     leider die meisten Mail-/Newsleser noch nicht darauf eingestellt --
  352.     die meisten Betriebssysteme sind inzwischen in der Lage, 
  353.     8-bit-Zeichen anzuzeigen (siehe oben), aber solange jeder
  354.     Benutzer dazu seine Umgebung noch umkonfigurieren muss, wird
  355.     es Leute geben, die 8-bit-Zeichen nicht angezeigt bekommen
  356.     und deshalb den Erzeuger dieser Zeichen anmeckern ("flamen").
  357.     
  358.     Ich persoenlich sage dann immer, "SunOS? HP? Xterm?
  359.     Selber schuld, bringt Eure Umgebung in Ordnung, hier ist
  360.     unser /usr/INFO/Umlaute, damit kriegt Ihr das schon hin"... :-)
  361.  
  362.     Aber wer garantiert keinen Aerger haben will, muss leider
  363.     noch auf Umlaute in Mails / News verzichten, wenn er sich
  364.     nicht mit den Emfaengern abgesprochen hat.
  365.  
  366.  
  367.  
  368. Zum Schluss die fundamentale Frage: Was ist eigentlich ISO-8859?
  369.  
  370. | Newsgroups: fb20.sun
  371. | From: cabo@cs.tu-berlin.de (Carsten Bormann)
  372. | Date: Fri, 22 May 1992 18:07:39 GMT
  373. | In der UNIX-Welt West-Europas hat sich ISO 8859-1 (oder der aeltere,
  374. | aber aehnliche DEC-Hausstandard) durchgesetzt.  Ein a-Umlaut ist hier
  375. | z.B. \344.  In der IBM-PC-Welt ist ein a-Umlaut aber ein \204 (man
  376. | korrigiere mich; ich habe gerade keine Code Page 437 zur Hand).
  377. | Da man in 190 Positionen [die restlichen sind mit Sonderzeichen wie
  378. | ESC belegt] nicht alle lateinischen alphabetischen Zeichen (und schon 
  379. | gar nicht Kyrillisch, Hebraeisch, Arabisch, Griechisch) unterbringen 
  380. | kann, gibt es aber auch noch ISO 8895-2 (Ost-Europa), [sorry, den Rest 
  381. | schreibe ich auf Englisch, weil ich ihn gerade greifbar habe] and two 
  382. | other character sets the target regions of which were not identified in 
  383. | the standard (ISO 8859-3, ISO 8859-4).  In addition, Latin/Cyrillic (ISO
  384. | 8859-5), Latin/Arabic (ISO 8859-6), Latin/Greek (ISO 8859-7), and
  385. | Latin/Hebrew (ISO 8859-8) character sets have been standardized under
  386. | the same design rules.  Finally, a fifth Latin alphabet was created to
  387. | satisfy the needs of a European economic region that needed Turkish
  388. | national characters but could live without the Icelandic/Faroese
  389. | national characters present in ISO 8859-1 (ISO 8859-9).  ISO 8859-1 to
  390. | ISO 8859-4 and ISO 8859-9 are known informally as Latin-1 to Latin-5;
  391. | all of these character sets are a subset of the revised version of ISO
  392. | 6937-2 (which was amended in 1989 to include a non-breakable space, a
  393. | soft hyphen, a not sign, and a broken vertical bar).  The right code
  394. | pages of ISO 8859-5 to ISO 8859-8 are currently the accepted way to
  395. | encode the major non-Latin alphabetic character sets.
  396. | requirements for syllabic or ideographic character sets have up to now
  397. | been satisfied by national standards such as the Japanese (JIS) or
  398. | Chinese national character sets, some of which are registered under
  399. | ISO 2375 and thus are part of ECMA-48.  A new work item is under way
  400. | to define a unified coded character set for alphabetic, syllabic, and
  401. | ideographic writing systems, based on a multi-byte encoding (ISO/IEC
  402. | 10646, currently at the stage of a Draft International Standard).
  403. | Unfortunately, as the harmonization of the various far-east
  404. | ideographic repertoires is a time-consuming process, agreement of this
  405. | new standard still seems to be years away.
  406.  
  407.  
  408. Literatur
  409. ---------
  410.  
  411.     Coded Character Set -- 7-Bit American Standard Code for Information
  412.     Interchange, ANSI X3.4-1986.
  413.  
  414.     Information Processing -- 8-bit Single-Byte Coded Graphic Character
  415.     Sets -- Part 1: Latin Alphabet No. 1, ISO 8859-1:1987.
  416.  
  417.     Crocker, D.: RFC 822 -- Standard for the format of ARPA Internet
  418.     text messages.  August 1982.
  419.  
  420.     Borenstein, N.; Freed, N.: RFC 1341 -- MIME (Multipurpose Internet 
  421.     Mail Extensions): Mechanisms for specifying and describing the 
  422.     format of Internet message bodies.  Juni 1992.
  423.  
  424.     IEEE Standard 1003.1 (POSIX.1)
  425.  
  426.     ISO/IEC 9945-2.2 Committee Draft POSIX Shell and Utilities (POSIX.2),
  427.     informative annex F, ISO/IEC JTC1/SC22 N1063.  Oktober 1991.
  428.  
  429.     ANSI X3.159-1989 C language standard. 1989.
  430.  
  431.     X/OPEN Portability Guide Volume 3 (XVS Supplementary Definitions),
  432.     Chapter 3 (Native Language Support). 1987.
  433.  
  434.     Solaris 1.0.1 Developer's Set, System Services Overview, pp. 115--158,
  435.     Native Language Application Support. Sun Microsystems 1992.
  436.  
  437.     SunOS4.1 Reference Manual (printed Version): ascii(7), iso_8859_1(7),
  438.     locale(5), ctype(3V), gettytab(5).  Februar 1990.
  439.  
  440.     Richard M. Stallman: GNU Emacs Reference Manual. 1988--.
  441.  
  442. --end-of-file--
  443. -- 
  444. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
  445.  Σ÷ⁿ▀─╓▄!!!                                            supergau@cs.tu-berlin.de
  446.  
  447.