home *** CD-ROM | disk | FTP | other *** search
/ ftp.pasteur.org/FAQ/ / ftp-pasteur-org-FAQ.zip / FAQ / de-usenet-umlaute < prev    next >
Text File  |  1998-04-01  |  38KB  |  886 lines

  1. Path: senator-bedfellow.mit.edu!bloom-beacon.mit.edu!news.kodak.com!news-pen-14.sprintlink.net!206.229.87.26!news-east.sprintlink.net!news-peer.sprintlink.net!news.sprintlink.net!Sprint!cpk-news-hub1.bbnplanet.com!news.bbnplanet.com!fu-berlin.de!news.tu-darmstadt.de!news.RoBIN.de!live.RoBIN.de!live!kosta
  2. From: kosta@live.robin.de (Kosta Kostis)
  3. Newsgroups: de.comp.standards,de.answers,news.answers
  4. Subject: Umlaute im deutschsprachigen Usenet FAQ
  5. Followup-To: de.comp.standards
  6. Date: 1 Apr 1998 02:00:00 +0200
  7. Organization: rent a bassist
  8. Lines: 863
  9. Sender: kosta@live.RoBIN.de
  10. Approved: news-answers-request@MIT.EDU
  11. Expires: Sat, 02 May 98 02:00:00 MEST
  12. Message-ID: <6fs020$hmq@blues.robin.de>
  13. Reply-To: umlaute@live.robin.de
  14. NNTP-Posting-Host: blues.robin.de
  15. Mime-Version: 1.0
  16. Content-Type: text/plain; charset=ISO-8859-1
  17. Content-Transfer-Encoding: 8bit
  18. Summary: This article is written in German and explains how to read/write
  19.     German Umlaut characters using ISO 8859-1 and MIME in the German
  20.     Usenet hirarchy de.*
  21. Xref: senator-bedfellow.mit.edu de.comp.standards:3203 de.answers:1908 news.answers:126729
  22.  
  23. Archive-name: de-usenet-umlaute
  24. Version: 1.16
  25. Last-modified: Thu, 12 Feb 98
  26. Posting-Frequency: monthly
  27.  
  28. {
  29.     This article is written in German and explains how to read/write
  30.     (not only) German Umlaut characters using ISO 8859-1 and MIME in
  31.     the German Usenet hierarchy de.*
  32. }
  33.  
  34. Hallo Leute!
  35.  
  36. Dieser Artikel ist ein Umlaute-FAQ fuer das deutschsprachige Usenet
  37. und wird in "de.comp.standards", "de.answers" und "news.answers"
  38. veroeffentlicht.
  39.  
  40. Bitte schickt saemtliche Anregungen an
  41.  
  42.     umlaute@live.robin.de (Kosta Kostis)
  43.  
  44. damit dieser Text schrittweise verbessert werden kann.
  45.  
  46. Die aktuelle Version des FAQ findet man ab sofort unter
  47.  
  48.     http://www.kostis.net/de/faq/umlaute/
  49.  
  50. Vielen Dank fuer wertvolle Hinweise an:
  51.  
  52.   Joachim Astel, Heiko Bobzin, Carsten Bormann, Lothar Borrmann,
  53.   Karl Brodowsky, Tilman Burmester, Roman Czyborra, AndrΘ Deparade,
  54.   Lutz Donnerhacke, Hans-Ch. Eckert, Hans Fischer, Helmut Fromberger,
  55.   Andreas Heidemann, Ulli Horlacher, Robert Joop, Wolfgang Keller,
  56.   Ulrich Klauer, Klaus Kretschel, Markus Kuhn, Martin v. Loewis,
  57.   Peter Mandrella, Gerold Meerkoetter, Ulrich Mueller, Thilo Pfennig,
  58.   Christian Schaefer, Heiko Schlichting, Martin, Sojka, Michael Staats,
  59.   Wolfgang Strobl, Maximilian Vogt, Christian Weisgerber,
  60.   Lueko Willms, Dr. Klaus Wolferts, Wolfgang Zenker
  61.  
  62. Sollten weitere Leute Mails an mich geschickt haben, so sind diese
  63. leider verloren gegangen bzw. in meinem Mail-Durcheinander "verschuett"
  64. gegangen, sorry. Meldet euch einfach ggf. nochmal. :)
  65.  
  66. Aus gegebenem Anlass bitte ich um Verstaendnis dafuer, dass nicht jeder
  67. Hinweis gleich in den FAQ hereinkommen kann. Ich verdiene mein Geld
  68. nun mal nicht mit dem Erstellen und Warten von FAQs und ich habe noch
  69. andere Hobbies. Also: bitte etwas Geduld oder Freiwillige vor!  :)
  70.  
  71. Weiterhin sind nicht alle Informationen auf meinem Mist gewachsen.
  72. Ich bin bei manchen Details also 100% abhaengig von der Zuverlaessigkeit
  73. der Beitraege. Damit sind alle Angaben ohne Gewaehr. Der Rechtsweg ist
  74. ausgeschlossen.  =;^)
  75.  
  76. ===========================================================================
  77. Umlaute im deutschsprachigen Teil des Usenet
  78. ===========================================================================
  79.  
  80. Inhaltsverzeichnis:
  81.  
  82. Kapitel   Bezeichnung
  83.  
  84.     1.    Intro
  85.     2.    Zeichenkodierungen
  86.     3.    MIME-Header
  87.     4.    Einstellungen fuer ISO 8859-1 und MIME
  88.  
  89. Anhang    Bezeichnung
  90.  
  91.     D.    Definitionen
  92.     F.    ISO 8859 Fonts
  93.     G.    ISO 8859-1 Gueltigkeitsbereiche
  94.     P.    ISO 8859-1 Peripherie etc.
  95.     T.    ISO 8859 Tools zur Konvertierung von Zeichenkodierungen
  96.     V.    Verschiedene Informationsquellen zu Zeichenkodierungen
  97.     Z.    Zeichenkodierungsbeschreibung von ISO 8859-1 (Kodes A0 bis FF)
  98.  
  99. ===========================================================================
  100. 1. Intro
  101. ===========================================================================
  102.  
  103. Dieser Artikel ist fuer diejenigen gedacht, die wissen moechten, wie sie
  104. an die nach ISO 8859-1 kodierten Umlaute (und andere) Zeichen in News
  105. kommen. Er soll beschreiben, was moeglich ist und nicht diskutieren, ob
  106. alle damit "gluecklich" werden, ausser vielleicht:
  107.  
  108. Niemand sollte "angemacht" werden wegen der Verwendung von Umschreibungen
  109. fuer Umlaute wie z. B. "ae". Aehnliches gilt fuer die TeX-Schreibweise.
  110. Genauso sollte aber auch niemand "angemacht" werden wegen der Verwendung
  111. von RFC-2045-2049 konformen Zeichen nach ISO 8859-1 kodiert mit
  112. entsprechenden MIME-Headerzeilen.
  113.  
  114. Der obige Satz ist ein Aufruf zur Toleranz und kein Freibrief. Es
  115. sollte eine einheitliche Verwendung angestrebt werden, die in der
  116. ersten Naeherung ISO 8859-1 als Kodierung und die entsprechenden
  117. MIME-Headerzeilen verwendet.
  118.  
  119. Dieser Artikel kann und will nicht beschreiben, wie jedes Geraet
  120. auf ISO 8859-1 umgestellt wird (z. B. Drucker).
  121.  
  122. Um die Zielgruppe auch erreichen zu koennen, wurde dieser Artikel, bis
  123. auf die Zeichentabelle im Anhang Z, konvertiert (d. h. die Umlaute
  124. wurden "expandiert"). Das verwendete Programm entspricht im
  125. wesentlichen dem Programm "iso2asc", das spaeter noch einmal
  126. angesprochen wird.
  127.  
  128. Nach Moeglichkeit sollte sich jeder Betreiber eines Usenet-Knotens mit
  129. deutschsprachigen Benutzern bemuehen, dass Texte per MIME/ISO 8859-1
  130. korrekt dargestellt werden (zur Not kann auf alten Terminals auch auf
  131. eine Ersatzdarstellung konvertiert werden). Weniger dringend, aber
  132. ebenfalls wuenschenswert, ist die Moeglichkeit zur Eingabe von Zeichen
  133. ausserhalb der US-ASCII-Zeichenkodierung, wie z. B. Umlaute.
  134.  
  135. Der Usenet-Standard zur 8-bit-Kodierung in den deutschsprachigen
  136. Gruppen de.* ist ISO 8859-1 (vgl. dazu RFC-2045-2049).
  137.  
  138. Gateways sollten beim Uebergang in das Usenet entsprechende
  139. Zeichenkodierungskonvertierungen vornehmen und entsprechende Header
  140. verwenden. Das wird bei einigen Gateways bereits getan (z. B.
  141. beim MausNet, einem deutschsprachigem Mailboxnetz).
  142.  
  143. Wer Fragen zu Umlauten im Usenet diskutieren moechte, moege das bitte
  144. in der Gruppe de.comp.standards tun. Diese Gruppe wurde nach einigen
  145. unschoenen Fehden 1992 unter anderem genau dafuer eingerichtet.  ;)
  146.  
  147. In anderen News-Hierarchien werden 8-bit-Zeichenkodierungen bereits seit
  148. langer Zeit erfolgreich eingesetzt, wie z. B. koi8-r in den relcom-Gruppen.
  149. Dort werden allerdings keine MIME-Header verwendet und bisher auch sonst
  150. kein besonderer Wert auf Kompatibilitaet gelegt.
  151.  
  152. ===========================================================================
  153. 2.  Zeichenkodierungen
  154. ===========================================================================
  155.  
  156. ===========================================================================
  157. 2.1  Geschichte der Zeichenkodierungen
  158. ===========================================================================
  159.  
  160. Ich bin mir bewusst, dass diese Auflistung sowohl unvollstaendig als auch
  161. einigermassen willkuerlich ist - man moege mir das nachsehen.
  162.  
  163. Ende April 1965 wurde ECMA-6 verabschiedet. ECMA-6 ist die 7-bit
  164. Zeichenkodierung, die auch als US-ASCII oder auch als ISO 646 bzw.
  165. als DIN 66003 (Juni 1974) bekannt und weit verbreitet ist.
  166. (Eigentlich sollte man denken, dass der US-ASCII auch aus den USA
  167. stammt, jedoch ist mir keine US-amerikanische Quelle bekannt, die
  168. aelter als April 1965 ist - kann das sein?)
  169.  
  170. Mit der Zeit wurde den EDV-Treibenden das Umschreiben von Umlauten
  171. zu laestig  ;)  und sie entwarfen nationale Varianten von ISO 646.
  172. Das fuehrte dazu, dass man sich z. B. in Deutschland zwischen Umlauten
  173. und eckigen sowie geschweiften Klammern entscheiden musste oder mit
  174. Escape-Sequenzen arbeiten.
  175.  
  176. Bekannte Terminals, die ISO 646 als Zeichenkodierung verwendet haben:
  177.  
  178.     DEC VT52, DEC VT100
  179.  
  180. Im Jahre 1981 kam der IBM PC mit einer 8-bit Zeichenkodierung heraus.
  181. Leider schienen die Entwickler bei der Reihenfolge der Zeichen
  182. gewuerfelt zu haben. Das Ergebnis: die IBM Codepage 437.
  183.  
  184. Im Jahre 1982 wurden die ersten DEC VT220 und VT240 auf den
  185. Markt gebracht, die einen Vorlaeufer von ISO 8859-1 im Einsatz
  186. hatten: DEC MCS (DEC Multinational Character Set).
  187.  
  188. Im Jahre 1985 kam der Commodore Amiga auf den Markt, der bereits
  189. damals im wesentlichen ISO 8859-1 verwendet hat. Microsoft Windows
  190. erblickte 1984 das Licht der Welt und war auch mit einer Kodierung
  191. ausgestattet, die im wesentlichen ISO 8859-1 entspricht.
  192.  
  193. Im Maerz 1985 wurde ECMA-94 verabschiedet. Dieser Standard ist
  194. auch als ISO 8859-1 bis ISO 8859-4 bekannt. ISO 8859-1 wurde 1987
  195. verabschiedet. Die Europaeer waren mehr als 2 Jahre voraus.  ;)
  196.  
  197. Im Jahre 1987 kam MS-DOS 3.3 auf den Markt und damit die
  198. IBM Codepage 850. Diese Codepage enthaelt saemtliche Zeichen,
  199. die auch in ISO 8859-1 vorkommen, allerdings in einer anderen
  200. Reihenfolge, so dass eine verlustfreie Konvertierung moeglich wurde.
  201.  
  202. Andere Rechner haben wieder andere Zeichenkodierungen, die sich aber
  203. im Zweifel mit geringen Aufwand von/nach ISO 8859-1 wandeln lassen.
  204.  
  205. ===========================================================================
  206. 2.2  Warum ISO 8859-1?
  207. ===========================================================================
  208.  
  209. Vorteile von ISO 8859-1 gegenueber anderen 8-bit-Zeichenkodierungen:
  210.  
  211.    - ISO 8859-1 ist eine herstellerunabhaengige internationale Norm.
  212.    - Viele Hersteller unterstuetzen mittlerweile ISO 8859-1.
  213.    - Es gibt eine Fuelle von Konvertern von/nach ISO 8859-1.
  214.    - RFC-2045-2049 (MIME) unterstuetzt ISO 8859-1.
  215.    - ISO 8859 ist so konzipiert, dass Zeichen im Bereich 0x80 bis 0x9F
  216.      nicht vorkommen duerfen bzw. sie sind nicht durch druckbare Zeichen
  217.      belegt. Das ist besonders in einem so heterogenen Netz wie dem Usenet
  218.      wichtig, da dieser Bereich bei 8-bit Terminals (z. B. DEC VT3xx) fuer
  219.      Steuerzeichen vorgesehen ist. Wird beim einem ISO 8859 Zeichen das
  220.      hoechstwertige Bit "abgeschnitten", so entsteht ein darstellbares
  221.      US-ASCII Zeichen.
  222.  
  223.      Sobald ISO/IEC 10646-1 und UTF-8 (siehe unten) eingefuehrt werden und
  224.      Verbreitung finden, wird dieses Argument allerdings an Bedeutung
  225.      verlieren. Fuer UTF-8 werden die Kodes zwischen 0x80 und 0x9F
  226.      benoetigt. Es ist daher sinnvoll, News-Software auf Dauer auf diese
  227.      Tatsache einzustellen.
  228.  
  229.    - MS-DOS Codepages, Apple Mac Zeichenkodierungen und auch der NeXTSTEP
  230.      Encoding Vector verwenden leider Kodes im Bereich 0x80 bis 0x9F.
  231.      Das ist, wie gesagt, zum aktuellen Zeitpunkt nicht vorteilhaft.
  232.      
  233. Die Anzahl der zu unterstuetzenden Kodierungen sollte man aus technischen
  234. Gruenden ohnehin moeglichst gering halten, um die Komplexitaet der Programme
  235. nicht auch noch durch aufwendige Konverter zu ueberfrachten. Es ist schon
  236. muehselig genug, von den "Hauszeichenkodierungen" in die von RFC-2045-2049
  237. genannten Zeichenkodierungen konvertieren zu koennen.
  238.  
  239. Allgemeine Einschraenkungen von ISO 8859-1 als 8-bit-Zeichenkodierung:
  240.  
  241. Diese Zeichenkodierung deckt zwar die wichtigsten Zeichen, die auf den
  242. Schreibmaschinen fuer ueber 14 (hauptsaechlich westeuropaeische) Sprachen
  243. zu finden sind, aber als langfristige, weltweit akzeptable Zeichenkodierung
  244. ist ISO 8859-1 ungeeignet, da z. B. nicht mal alle europaeischen Sprachen
  245. abgedeckt werden. Ausserdem fehlen auch fuer deutschsprachige Benutzer viele
  246. Zeichen, wie sie etwa im wissenschaftlichen Bereich sehr wuenschenswert
  247. waeren (z. B. deutsche Anfuehrungszeichen, mathematische Symbole, usw.).
  248.  
  249. In anderen Laendern koennen auch andere Zeichenkodierungen von Interesse
  250. sein, so z. B. ISO 8859-2 fuer Tschechien und Polen etc. oder ISO 8859-7
  251. fuer Griechenland. Die Russen bevorzugen koi8-r und nicht ISO 8859-5. Hier
  252. wurde wohl am "Markt" vorbei genormt. Dies aber nur am Rande zur Info.
  253.  
  254. Es sei vermerkt, dass ISO 8859-2, ISO 8859-3, ISO 8859-4, ISO 8859-9
  255. und ISO 8859-10 die fuer Deutsch notwendigen Umlaute nicht nur
  256. beinhalten, sondern vor allen Dingen mit den gleichen Kodes.
  257. Wer also osteuropaeische Texte genauso lesen koennen moechte wie
  258. deutsche, dem sei ISO 8859-2 empfohlen. ISO 8859-9 fuer Leute, die
  259. tuerkische und deutsche Texte lesen koennen wollen.
  260.  
  261. Auf lange Sicht:
  262.  
  263. Als langfristige Loesung bietet sich ISO/IEC 10646-1/Unicode 2.0 an.
  264. Entwickler von Usenet-Software sollten sich mit dieser Alternative
  265. vertraut machen, insbesondere mit der UTF-8 Kodierung, die fuer das
  266. Usenet besonders geeignet erscheint, da ASCII-Texte ohne Veraenderung
  267. dargestellt werden koennen.
  268.  
  269. Weitere Informationen zum Thema ISO/IEC 10646-1:1993 und UTF-8 finden
  270. Entwickler und andere Interessierte in Anhang V.
  271.  
  272. ===========================================================================
  273. 3.   MIME-Header
  274. ===========================================================================
  275.  
  276. RFC-2045-2049 beschreibt die Multipurpose Internet Mail Extensions,
  277. auch als MIME bekannt. Nach MIME ist ISO 8859-1 eine gueltige
  278. Zeichenkodierung. Dieser muss allerdings den Mail- und News-Readern
  279. angezeigt werden. Zu diesem Zweck gibt es entsprechende MIME
  280. Header-Zeilen:
  281.  
  282.         MIME-Version: 1.0
  283.         Content-Type: text/plain; charset=ISO-8859-1
  284.         Content-Transfer-Encoding: 8bit
  285.  
  286. Diese Header-Zeilen sind fuer MIME-kompatible Software wichtig
  287. und beschreiben die im Message Body verwendete Kodierung.
  288. Wer ISO 8859-1 Zeichen ohne diese Header verschickt, ist durch
  289. RFC-2045-2049 nicht sanktioniert.
  290.  
  291. Wer auf Umlaute etc. auch in den Header-Zeilen nicht verzichten
  292. moechte, der sollte sich RFC-2045-2049 zu diesem Thema anschauen und
  293. sich ueberlegen, ob er/sie das dann immer noch will...  ;)
  294.  
  295. 8-bit-Zeichen in den Header-Zeilen haben in der Vergangenheit immer
  296. wieder zu Problemen gefuehrt. Manche Antik-Software soll sogar ob
  297. dieser Zeichen einfach abstuerzen. Also nie ohne Kodierung verwenden.
  298.  
  299. ===========================================================================
  300. 4.   Einstellungen fuer ISO 8859-1 und MIME
  301. ===========================================================================
  302.  
  303. Folgende Tips entstammen zu einem gewissen Teil dem Umlaute-FAQ
  304. ftp://ftp.cs.tu-berlin.de/projects/umlaute/install. Weitere Tips habe
  305. ich u. a. vielen Postings in diversen Gruppen entnommen. Eine
  306. Nennung der einzelnen Personen ist dabei leider nicht mehr moeglich.
  307. Trotzdem vielen Dank an alle!
  308.  
  309. In diesem Kapitel sind wohl noch die groessten Luecken.
  310. Bitte schickt mir was immer ihr zu diesem Thema beitragen
  311. koennt, damit dieses Teil moeglichst vielen Leuten hilft.
  312.  
  313. Die Reihenfolge der genannten Plattformen ist alphabetisch...
  314.  
  315. ---------------------------------------------------------------------------
  316. 4.1  Acorn RISC OS
  317. ---------------------------------------------------------------------------
  318.  
  319. Einer der Standard-Zeichenkodierungen ist ISO 8859-1.
  320. Eine Zeichenkonvertierung ist daher nicht notwendig.
  321.  
  322. ---------------------------------------------------------------------------
  323. 4.2  Amiga OS
  324. ---------------------------------------------------------------------------
  325.  
  326. Die Standard-Zeichenkodierung ist ISO 8859-1.
  327. Eine Zeichenkonvertierung ist daher nicht notwendig.
  328.  
  329. ---------------------------------------------------------------------------
  330. 4.3  Apple Macintosh (System 7)
  331. ---------------------------------------------------------------------------
  332.  
  333. Die Zeichenkodierunge Apple Roman ist von der Zeichenmenge weitgehend
  334. identisch mit ISO 8859-1, jedoch ist eine andere Kodierung vorhanden.
  335. Konverter lassen sich leicht mit den in Anhang T genannten Tools erzeugen.
  336. Software wie Eudora und Iride unterstuetzen MIME. News-Reader wie Newswatcher
  337. unterstuetzen ISO 8859-1, rnMac und TheNews arbeiten unter Verwendung
  338. von funktionierenden XLATS Resourcen, welche man auf dem FTP-Server
  339. ftp.uni-passau.de im Mac Archiv findet. Weitere Mac-Software, die MIME
  340. unterstuetzt: Claris Emailer, MacSOUP (Newsreader).
  341.  
  342. ---------------------------------------------------------------------------
  343. 4.4  Atari (GEM)
  344. ---------------------------------------------------------------------------
  345.  
  346. Die Zeichenkodierungen des Atari ist weitgehend identisch mit der IBM
  347. Codepage 437. Siehe PC. Konverter lassen sich leicht mit den in Anhang T
  348. genannten Tools erzeugen. Die gaengige Usenet Software fuer den Atari
  349. nimmt diese Konvertierung bereits automatisch vor (z. B. HERMES).
  350.  
  351. ---------------------------------------------------------------------------
  352. 4.5  NeXTSTEP
  353. ---------------------------------------------------------------------------
  354.  
  355. Der NeXTSTEP Encoding Vector ist von der Zeichenmenge her weitgehend
  356. identisch mit ISO 8859-1, jedoch ist eine andere Kodierung vorhanden.
  357. Konverter lassen sich leicht mit den in Anhang T genannten Tools erzeugen.
  358. NeXTSTEP ist in diesem Zusammenhang als U*IX-Derivat zu betrachten.
  359.  
  360. Ansonsten laesst sich die ISO 8859-1 Darstellung wie folgt erreichen:
  361.  
  362.     Einloggen via rlogin -8
  363.     stty pass8
  364.     stty pass8out
  365.  
  366. ---------------------------------------------------------------------------
  367. 4.6  PC
  368. ---------------------------------------------------------------------------
  369.  
  370. PC sind in der Regel mit folgenden Video-Karten bestueckt:
  371.  
  372. MDA, HGC, CGA, EGA und VGA. Die Standard-Zeichenkodierung fuer diese
  373. Videoadapter ist IBM Codepage 437. Diese Zeichenkodierung umfasst
  374. US-ASCII, die fuer einige europaeische Sprachen notwendigen Zeichen,
  375. Rahmenzeichen und einiges mehr.
  376.  
  377. Bei EGA und VGA lassen sich andere Zeichenkodierungen nachladen, was durch
  378. manche Betriebssysteme unterstuetzt wird und durch andere leider nicht.
  379.  
  380. ---------------------------------------------------------------------------
  381. 4.6.1  PC unter Coherent 3.x, 4.x
  382. ---------------------------------------------------------------------------
  383.  
  384. Coherent unterstuetzt 8-bit und die IBM Codepage 437 generell.
  385. Fuer Coherent 4.2 gibt es optional X11.
  386. Coherent ist in diesem Zusammenhang als U*IX-Derivat zu betrachten.
  387.  
  388. ---------------------------------------------------------------------------
  389. 4.6.2  PC unter Linux
  390. ---------------------------------------------------------------------------
  391.  
  392. Linux unterstuetzt im Console-Betrieb ISO 8859-1 in der Form,
  393. dass Linux die in der IBM Codepage 437 vorhandenen Zeichen auf
  394. ISO 8859-1 abbildet und umgekehrt. Es gibt auch die Moeglichkeit
  395. Fonts zu laden (VGA), bitte fragt mich aber nicht wie.  :)
  396. Linux ist in diesem Zusammenhang als U*IX-Derivat zu betrachten.
  397.  
  398. ---------------------------------------------------------------------------
  399. 4.6.3  PC unter Minix
  400. ---------------------------------------------------------------------------
  401.  
  402. Soweit mir bekannt ist, unterstuetzt Minix 8-bit und die IBM Codepage 437.
  403. Es gilt, bis auf den Hinweis zu X11, das gleiche wie beim PC unter
  404. Coherent. Minix ist in diesem Zusammenhang als U*IX-Derivat zu betrachten.
  405.  
  406. ---------------------------------------------------------------------------
  407. 4.6.4  PC unter MS-DOS
  408. ---------------------------------------------------------------------------
  409.  
  410. Die Standard-Zeichenkodierung fuer MS-DOS in Deutschland ist in der Regel
  411. IBM Codepage 437. Seit MS-DOS 5.0 versucht das Installationsprogramm
  412. die IBM Codepage 850 zu installieren. Diese hat gegenueber der Codepage
  413. 437 den Vorteil, dass saemtliche Zeichen aus ISO 8859-1 vorhanden sind,
  414. was aber zu Lasten einiger Rahmenzeichen ging. Weiterhin kosten die
  415. entsprechenden Geraetetreiber ein paar KB. Konverter lassen sich leicht
  416. mit den im Anhang T genannten Tools erzeugen. Es gibt auch Freeware
  417. ISO 8859 Codepages fuer MS-DOS (z. B. Codepage 819) - siehe Anhang F.
  418.  
  419. ---------------------------------------------------------------------------
  420. 4.6.4.1 PC unter MS-DOS und MS-DOS Waffle 1.65
  421. ---------------------------------------------------------------------------
  422.  
  423. Fuer MS-DOS Waffle 1.65 gibt es einen einfachen MIME-Patch. Siehe Anhang T.
  424.  
  425. ---------------------------------------------------------------------------
  426. 4.6.4.2  PC unter MS-DOS mit CrossPoint
  427. ---------------------------------------------------------------------------
  428.  
  429. CrossPoint arbeitet intern ausschliesslich mit Codepage 437, konvertiert
  430. diese beim Verarbeiten oder Erzeugen von RFC-Nachrichten aber
  431. automatisch nach ISO-8859-1. Nicht vorhandene Zeichen werden dabei in
  432. moeglichst aehnlich aussehende Zeichen umgewandelt.
  433.  
  434. In Mails werden generell die entsprechenden MIME-Zeilen erzeugt. Fuer
  435. News muss MIME unter Config/Optionen/Netze/Verschiedenes eingeschaltet
  436. werden.
  437.  
  438. ---------------------------------------------------------------------------
  439. 4.6.4.3 PC unter MS-DOS und Microsoft Windows
  440. ---------------------------------------------------------------------------
  441.  
  442. Microsoft Windows verwendet in der Regel ISO 8859-1. Es gibt aber
  443. mittlerweile auch Versionen fuer andere Sprachraeume (z. B. Russisch
  444. mit kyrillischer Zeichenkodierung).
  445.  
  446. ---------------------------------------------------------------------------
  447. 4.6.5  PC unter OS/2
  448. ---------------------------------------------------------------------------
  449.  
  450. IBM OS/2 verwendet intern leider immer noch IBM Codepage 850 und nicht
  451. ISO 8859-1 aka IBM Codepage 819. Das Windows Sub-System zeigt ISO 8859-1
  452. jedoch korrekt an. Die Konvertierung zwischen IBM Codepage 850 und
  453. ISO 8859-1 ist recht einfach und sogar "verlustfrei".
  454.  
  455. ---------------------------------------------------------------------------
  456. 4.6.6 PC unter Microsoft Windows 95
  457. ---------------------------------------------------------------------------
  458.  
  459. Microsoft Windows 95 verwendet in der Regel ISO 8859-1. Mitgeliefert
  460. werden aber auch osteuropaeische, griechische, kyrillische und tuerkische
  461. Fonts, welche im wesentlichen ISO 8859-2, -7, -5 und -9 entsprechen.
  462.  
  463. ---------------------------------------------------------------------------
  464. 4.6.7  PC unter Windows NT
  465. ---------------------------------------------------------------------------
  466.  
  467. Microsoft Windows NT verwendet intern Unicode. Als Untermenge ist
  468. daher ISO 8859-1 vorhanden. Die Zeichenkodierung macht hier keine
  469. besonderen Probleme. Leider liefert Microsoft auch in der Version 4.x
  470. keine auch nur annaeherungsweise vollstaendigen Unicode Fonts mit.
  471.  
  472. ---------------------------------------------------------------------------
  473. 4.7  U*IX Umgebungen
  474. ---------------------------------------------------------------------------
  475.  
  476. Tip zum Auffinden systemspezifischer Informationen zur
  477. Internationalisierung:
  478.  
  479.    man -k locale
  480.    man -k international
  481.  
  482. ---------------------------------------------------------------------------
  483. (a) 7-bit Terminal (VT52 oder VT100)
  484. ---------------------------------------------------------------------------
  485.  
  486. Da hilft dann nur noch das Programm iso2asc von Markus Kuhn
  487. (siehe Anhang T)
  488.  
  489. ---------------------------------------------------------------------------
  490. (b) falsch eingestelltes 8-bit Terminal (VT2xx oder neuer)
  491. ---------------------------------------------------------------------------
  492.  
  493. Das Terminal muss per Setup eingestellt werden. Bei DEC Terminals
  494. geht das in der Regel durch Druck auf die Taste F3.
  495. Der Rest ist menuegefuehrt - Speichern nicht vergessen!
  496.  
  497. ---------------------------------------------------------------------------
  498. (c) BNews lokal oder im Pfad
  499. ---------------------------------------------------------------------------
  500.  
  501. Ist es lokal im Einsatz, hilft entweder nur patchen (entfernen von
  502. "& 0x7F" aus den Quellen) oder Patches des Binaries oder Installation
  503. von z. B. CNews.
  504.  
  505. Ist BNews auf einem Rechner im Pfad im Einsatz, hilft nur das Aufspueren
  506. des entsprechenden Rechners und der Versuch den dortigen System-Admin
  507. zu bitten entweder zu patchen oder neu zu installieren.
  508. Alternativ kann man auch versuchen, sich andere Feeds fuer News zu
  509. suchen, die keine "Steinzeit-Software" fahren...
  510.  
  511. ---------------------------------------------------------------------------
  512. (d) 7-bit tty
  513. ---------------------------------------------------------------------------
  514.  
  515. Manche ttys sind default-maessig auf 7-bit eingestellt. Da hilft meist
  516.  
  517. BSD     : stty pass8
  518. System V: stty -istrip -8
  519.  
  520. ggf. wird stattdessen benoetigt:
  521.  
  522.           stty -istrip cs8
  523.  
  524. (unter Ultrix 4.2, HP-UX 9.01, SunOS 4.1.1 und 5.3 sowie SysV68)
  525.  
  526. Suns "moegen" in ihrer /etc/gettytab statt "ap" den Eintrag "p8"
  527. Manche ttys sollen auch "-even -odd" benoetigen...
  528.  
  529. ---------------------------------------------------------------------------
  530. (e) auf 7-bit eingestellte Shell
  531. ---------------------------------------------------------------------------
  532.  
  533. Abhilfe durch: setenv LC_CTYPE iso_8859_1
  534. oder           LC_CTYPE=iso_8859_1 ; export LC_CTYPE
  535.  
  536. Manche Systeme benoetigen andere Werte fuer diese Variable, so ist
  537. z.B. unter Ultrix 4.2 LC_CTYPE=GER_DE.8859 angesagt.
  538.  
  539. ---------------------------------------------------------------------------
  540. (f) less
  541. ---------------------------------------------------------------------------
  542.  
  543. Abhilfe durch: setenv LESSCHARSET latin1
  544. oder           LESSCHARSET=latin1 ; export LESSCHARSET
  545.  
  546. ---------------------------------------------------------------------------
  547. (g) nn
  548. ---------------------------------------------------------------------------
  549.  
  550. Man schreibe am besten in die init-Datei der nn-Installation
  551. (je nach Installation z. B. "/usr/local/lib/nn/init")
  552.  
  553.         set data-bits 8
  554.  
  555. Wer dafuer keine Privilegien hat, kann das auch in die Datei
  556. "~/.nn/init" schreiben. Dann gilt es nur fuer diesen Benutzer.
  557.  
  558. Es gibt fuer 7-bit Terminal Benutzer einen Patch fuer nn, der iso2asc
  559. von Markus Kuhn verwendet um z. B. Umlaute zu konvertieren.
  560.  
  561. ---------------------------------------------------------------------------
  562. (h) rlogin mit 7-bit
  563. ---------------------------------------------------------------------------
  564.  
  565. Abhilfe durch: rlogin -L
  566. oder           rlogin -8
  567.  
  568. ---------------------------------------------------------------------------
  569. (i) kermit (C-Kermit 5A)
  570. ---------------------------------------------------------------------------
  571.  
  572. Kermit ist ein Kommunikationsprogramm, mit dem man sich etwa via Modem
  573. auf anderen Rechnern einloggen kann. Um eine 8bit durchlaessige
  574. Terminal-Session zu bekommen, muss man folgende Befehle etwa per Hand
  575. oder in einer Initialisierungsdatei ausfuehren:
  576.  
  577.         set terminal bytesize 8
  578.         set command  bytesize 8
  579.  
  580. ---------------------------------------------------------------------------
  581. (j) emacs (ab Version 19)
  582. ---------------------------------------------------------------------------
  583.  
  584. Man schreibe am besten in die Datei ".../site-lisp/default.el"
  585.  
  586.     (standard-display-european 1)
  587. und
  588.     (require 'iso-syntax)
  589.  
  590. Wenn das nicht geht, sollte das in die Datei ~/.emacs geschrieben werden.
  591.  
  592. Folgende Zeilen sollen die Eingabe (von Umlauten etc.) erleichtern:
  593.  
  594. (set-input-mode
  595.     (car (current-input-mode))
  596.     (nth 1 (current-input-mode))
  597. 0)
  598.  
  599. Ab der Version 19.26 beachtet emacs die Environment-Variable LC_CTYPE.
  600. Die oben angegebenen Zeilen sind dann nicht mehr notwendig.
  601.  
  602. ---------------------------------------------------------------------------
  603. 4.8  VAX/VMS, OpenVMS
  604. ---------------------------------------------------------------------------
  605.  
  606. VAX/VMS ist 8-bit clean. Alle Transportprotokolle sind in der Regel 8-bit
  607. clean. Die Terminals ab VT2xx koennen 8-bit uebertragen. Newsreader und
  608. Editoren sind 8-bit clean. Theoretisch sind auch die Mailer 8-bit clean,
  609. aber so mancher "Hack" macht dieses Feature wieder unbrauchbar.
  610. Die folgende Eingabe stellt ein Terminal auf 8-bit Betrieb:
  611.  
  612.    set terminal /eightbit
  613.  
  614. ---------------------------------------------------------------------------
  615. 4.7.1  AIX (3.1, 3.2)
  616. ---------------------------------------------------------------------------
  617.  
  618. Kodierung wird ueber LANG gesteuert:
  619.  
  620.    1. Buchstabe gross (z.B. En_US) = PC-Kodierung,
  621.    1. Buchstabe klein (z.B. en_US) = ISO Kodierung.
  622.  
  623. Beim Schreiben von Applikationen entsprechenden setlocale Aufruf
  624. nicht vergessen, sonst geht die Umlaut-Eingabe nicht.
  625.  
  626. ===========================================================================
  627. Anhang D: Definitionen
  628. ===========================================================================
  629.  
  630. 7-bit Text:
  631.     ein 7-bit Text besteht nur aus Zeichen im Bereich 32 bis 126
  632.     sowie ausgewaehlter Steuerzeichen aus dem Bereich 0 bis 31.
  633.     (in der Regel HT (9), LF (10) und ggf. auch FF (12))
  634.     Eine implizite Zeichenkodierung ist damit nur im Verbund mit
  635.     MIME gegeben: ISO 646.IRV
  636.     Das ist zwar mit Sicherheit die am meisten verwendete 7-bit
  637.     Kodierung, aber es gibt eben noch andere.
  638.  
  639. 8-bit clean:
  640.     wie 7-bit Text mit der folgenden Erweiterung: Zeichen im
  641.     Bereich 160 bis 255 sind zusaetzlich zulaessig.
  642.     Eine implizite Zeichenkodierung ist damit nur im Verbund mit
  643.     MIME gegeben: ISO 8859-1
  644.     Besser ist es jedoch die verwendete Zeichenkodierung
  645.     explizit anzugeben (z. B. durch MIME charset).
  646.  
  647. ===========================================================================
  648. Anhang F: ISO 8859 Fonts
  649. ===========================================================================
  650.  
  651. ISO 8859 Codepages fuer MS-DOS
  652.  
  653.       ftp://ftp.informatik.uni-erlangen.de/pub/doc/ISO/charsets/isocp*.zip
  654.  
  655. ISO 8859 Fonts fuer EGA/VGA (z. B. fuer U*IX auf PC)
  656.  
  657.       ftp://ftp.informatik.uni-erlangen.de/pub/doc/ISO/charsets/isof*.tar.gz
  658.  
  659. ===========================================================================
  660. Anhang G: ISO 8859-1 Gueltigkeitsbereiche
  661. ===========================================================================
  662.  
  663. Alle ISO 8859 Zeichenkodierungen haben folgende Dinge gemeinsam:
  664.  
  665. Die Kodes 00-1F und 7F-9F sind Steuerkodes bzw. undefiniert.
  666. Die Kodes 20-7F sind identisch mit den Kodes 20-7F in ISO 646 (IRV).
  667. Die Kodes A0 (NO-BREAK SPACE) und AD (SOFT HYPHEN) sind allen gemeinsam.
  668. Diesen Kodes haben eine besondere Bedeutung und sollten in Editoren
  669. Anwendungen finden (koennen).
  670.  
  671. IRV steht fuer "International Reference Version".
  672. ---------------------------------------------------------------------------
  673. ISO 8859-1 aka ECMA-94 aka LATIN ALPHABET No. 1
  674. ---------------------------------------------------------------------------
  675.  
  676. Die folgenden Sprachen werden durch ISO 8859-1 unterstuetzt:
  677.  
  678. Daenisch, Deutsch, Englisch, Faeroeisch, Finnisch, Franzoesisch,
  679. Irisch, Islaendisch, Italienisch, Niederlaendisch, Norwegisch,
  680. Portugiesisch, Spanisch und Schwedisch.
  681.  
  682. Im Franzoesischen werden zwar (theoretisch) auch die oe/OE-Ligaturen
  683. "benoetigt", jedoch waren es gerade die Franzosen, die bei der
  684. Erstellung der Norm der Meinung waren, man koenne auf diese Zeichen
  685. verzichten.
  686.  
  687. ===========================================================================
  688. Anhang P: ISO 8859-1 Peripherie etc.
  689. ===========================================================================
  690.  
  691. Die folgenden drei Listen sind absolut unvollstaendig.
  692. Bitte schickt mir an Informationen, was ihr habt. Danke!
  693.  
  694. ---------------------------------------------------------------------------
  695. Betriebssysteme und Oberflaechen, die ISO 8859-1 direkt unterstuetzen
  696. ---------------------------------------------------------------------------
  697.  
  698. AIX, Acorn RISC-OS, Amiga-OS, DEC ULTRIX, IRIX, Linux,
  699. Microsoft Windows, Microsoft Windows NT, OpenVMS, Sun OS,
  700. VAX/VMS, X11
  701.  
  702. ---------------------------------------------------------------------------
  703. Terminals, die ISO 8859-1 direkt unterstuetzen
  704. ---------------------------------------------------------------------------
  705.  
  706. DEC VT2xx[1], DEC VT3xx, DEC VT4xx und neuer.
  707.  
  708. ---------------------------------------------------------------------------
  709. Drucker, die ISO 8859-1 direkt unterstuetzen
  710. ---------------------------------------------------------------------------
  711.  
  712. DEClaser xxxx, DEC LA xx, DEC LA xxx, DEC LN03[1], HP DeskJet,
  713. HP LaserJet (II und neuer), Kyocera F-xxx, Kyocera F-xxxx u.v.m.
  714.  
  715. [1] unterstuetzt nur DEC MCS (Untermenge von ISO 8859-1, bis auf 2 Zeichen)
  716.  
  717. ===========================================================================
  718. Anhang T: ISO 8859 Tools zur Konvertierung von Zeichenkodierungen
  719. ===========================================================================
  720.  
  721. transtab
  722.     ANSI-C Quellen fuer einen Zeichenkodierungskonvertergenerator
  723.     Enthaelt Klartextbeschreibungen fuer ueber 78 Zeichenkodierungen.
  724.  
  725.       ftp://ftp.informatik.uni-erlangen.de/pub/doc/ISO/charsets/trans120.tar.gz
  726.  
  727. GNU-recode
  728.     GNU Konverter, basiert auf RFC-1345.
  729.  
  730.       ftp://ftp.cs.tu-berlin.de/pub/gnu/recode-3.3.tar.gz
  731.  
  732. tcs
  733.     translate character set - Plan 9 utility
  734.  
  735.       ftp://research.att.com/dist/tcs.shar.Z
  736.  
  737. iso2asc
  738.     Programm zur Wandlung von ISO 8859-1 Zeichen in eine 7bit
  739.     US-ASCII-Ersatzdarstellung (z. B. "ae").
  740.  
  741.       ftp://ftp.informatik.uni-erlangen.de/pub/doc/ISO/charsets/iso2asc.c
  742.       ftp://ftp.informatik.uni-erlangen.de/pub/doc/ISO/charsets/iso2asc.txt
  743.  
  744.  
  745. konvers.el
  746.     Konvertierung zwischen TeX-Schreibweise und ISO 8859-1 fuer EMACS
  747.  
  748.       ftp://ftp.informatik.uni-erlangen.de/pub/doc/ISO/charsets/konvers-*.tar.gz
  749.  
  750. Es gibt auch einen primitiven MIME-Patch fuer MS-DOS Waffle 1.65
  751. auf dem ftp-Server in Erlangen (MIME*.ZIP). Dieser wird aber nicht
  752. mehr gepflegt und ist nur spaerlich dokumentiert.  =;^)
  753.  
  754. Randbemerkung:
  755.     tcs und Recode lassen sich nur mit hohem Aufwand unter MS-DOS
  756.     uebersetzen und benoetigen unangenehm viel Arbeitsspeicher.
  757.  
  758. ===========================================================================
  759. Anhang V: Verschiedene Informationsquellen zu Zeichenkodierungen
  760. ===========================================================================
  761.  
  762.     http://www.unicode.org/
  763.     http://www.vlsivie.tuwien.ac.at/mike/i18n.html
  764.     http://www.iro.umontreal.ca/labs/ltp/accents_toc.html
  765.     http://www.cs.tu-berlin.de/~czyborra/charsets/
  766.     http://www.kostis.net/charsets/
  767.  
  768.     ftp://dkuug.dk/
  769.     ftp://ftp.informatik.uni-erlangen.de/pub/doc/ISO/charsets/
  770.     ftp://research.att.com/
  771.     ftp://ftp.unicode.org/
  772.  
  773. ===========================================================================
  774. Anhang Z: Zeichenkodierungsbeschreibung ISO 8859-1 (Kodes A0 bis FF)
  775. ===========================================================================
  776.  
  777. Die Zeichenkodes 20 bis 7E sind identisch mit ISO 646.IRV (US-ASCII).
  778. Eine Auflistung dieser Zeichen kann ich mir (hoffentlich) sparen... ;)
  779. Die Zeichenkodes 00 bis 1F und 7F bis 9F sind in ISO 8859-1 nicht als
  780. druckbare Zeichen deklariert.
  781. Ich habe diese Zeichen daher nicht in diese Liste aufgenommen.
  782. Die "Syntax" der Liste ist:
  783.  
  784. Hex     8bit    ISO/IEC 10646-1:1993(E)
  785. Code    Zeichen Zeichenname
  786.  
  787. A0      á       NO-BREAK SPACE
  788. A1      í       INVERTED EXCLAMATION MARK
  789. A2      ó       CENT SIGN
  790. A3      ú       POUND SIGN
  791. A4      ñ       CURRENCY SIGN
  792. A5      Ñ       YEN SIGN
  793. A6      ª       BROKEN BAR
  794. A7      º       SECTION SIGN
  795. A8      ¿       DIAERESIS
  796. A9      ⌐       COPYRIGHT SIGN
  797. AA      ¬       FEMININE ORDINAL INDICATOR
  798. AB      ½       LEFT-POINTING DOUBLE ANGLE QUOTATION MARK
  799. AC      ¼       NOT SIGN
  800. AD      ¡       SOFT HYPHEN
  801. AE      «       REGISTERED SIGN
  802. AF      »       MACRON
  803. B0      ░       DEGREE SIGN
  804. B1      ▒       PLUS-MINUS SIGN
  805. B2      ▓       SUPERSCRIPT TWO
  806. B3      │       SUPERSCRIPT THREE
  807. B4      ┤       ACUTE ACCENT
  808. B5      ╡       MICRO SIGN
  809. B6      ╢       PILCROW SIGN
  810. B7      ╖       MIDDLE DOT
  811. B8      ╕       CEDILLA
  812. B9      ╣       SUPERSCRIPT ONE
  813. BA      ║       MASCULINE ORDINAL INDICATOR
  814. BB      ╗       RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK
  815. BC      ╝       VULGAR FRACTION ONE QUARTER
  816. BD      ╜       VULGAR FRACTION ONE HALF
  817. BE      ╛       VULGAR FRACTION THREE QUARTERS
  818. BF      ┐       INVERTED QUESTION MARK
  819. C0      └       LATIN CAPITAL LETTER A WITH GRAVE
  820. C1      ┴       LATIN CAPITAL LETTER A WITH ACUTE
  821. C2      ┬       LATIN CAPITAL LETTER A WITH CIRCUMFLEX
  822. C3      ├       LATIN CAPITAL LETTER A WITH TILDE
  823. C4      ─       LATIN CAPITAL LETTER A WITH DIAERESIS
  824. C5      ┼       LATIN CAPITAL LETTER A WITH RING ABOVE
  825. C6      ╞       LATIN CAPITAL LIGATURE AE
  826. C7      ╟       LATIN CAPITAL LETTER C WITH CEDILLA
  827. C8      ╚       LATIN CAPITAL LETTER E WITH GRAVE
  828. C9      ╔       LATIN CAPITAL LETTER E WITH ACUTE
  829. CA      ╩       LATIN CAPITAL LETTER E WITH CIRCUMFLEX
  830. CB      ╦       LATIN CAPITAL LETTER E WITH DIAERESIS
  831. CC      ╠       LATIN CAPITAL LETTER I WITH GRAVE
  832. CD      ═       LATIN CAPITAL LETTER I WITH ACUTE
  833. CE      ╬       LATIN CAPITAL LETTER I WITH CIRCUMFLEX
  834. CF      ╧       LATIN CAPITAL LETTER I WITH DIAERESIS
  835. D0      ╨       LATIN CAPITAL LETTER ETH
  836. D1      ╤       LATIN CAPITAL LETTER N WITH TILDE
  837. D2      ╥       LATIN CAPITAL LETTER O WITH GRAVE
  838. D3      ╙       LATIN CAPITAL LETTER O WITH ACUTE
  839. D4      ╘       LATIN CAPITAL LETTER O WITH CIRCUMFLEX
  840. D5      ╒       LATIN CAPITAL LETTER O WITH TILDE
  841. D6      ╓       LATIN CAPITAL LETTER O WITH DIAERESIS
  842. D7      ╫       MULTIPLICATION SIGN
  843. D8      ╪       LATIN CAPITAL LETTER O WITH STROKE
  844. D9      ┘       LATIN CAPITAL LETTER U WITH GRAVE
  845. DA      ┌       LATIN CAPITAL LETTER U WITH ACUTE
  846. DB      █       LATIN CAPITAL LETTER U WITH CIRCUMFLEX
  847. DC      ▄       LATIN CAPITAL LETTER U WITH DIAERESIS
  848. DD      ▌       LATIN CAPITAL LETTER Y WITH ACUTE
  849. DE      ▐       LATIN CAPITAL LETTER THORN
  850. DF      ▀       LATIN SMALL LETTER SHARP S
  851. E0      α       LATIN SMALL LETTER A WITH GRAVE
  852. E1      ß       LATIN SMALL LETTER A WITH ACUTE
  853. E2      Γ       LATIN SMALL LETTER A WITH CIRCUMFLEX
  854. E3      π       LATIN SMALL LETTER A WITH TILDE
  855. E4      Σ       LATIN SMALL LETTER A WITH DIAERESIS
  856. E5      σ       LATIN SMALL LETTER A WITH RING ABOVE
  857. E6      µ       LATIN SMALL LIGATURE AE
  858. E7      τ       LATIN SMALL LETTER C WITH CEDILLA
  859. E8      Φ       LATIN SMALL LETTER E WITH GRAVE
  860. E9      Θ       LATIN SMALL LETTER E WITH ACUTE
  861. EA      Ω       LATIN SMALL LETTER E WITH CIRCUMFLEX
  862. EB      δ       LATIN SMALL LETTER E WITH DIAERESIS
  863. EC      ∞       LATIN SMALL LETTER I WITH GRAVE
  864. ED      φ       LATIN SMALL LETTER I WITH ACUTE
  865. EE      ε       LATIN SMALL LETTER I WITH CIRCUMFLEX
  866. EF      ∩       LATIN SMALL LETTER I WITH DIAERESIS
  867. F0      ≡       LATIN SMALL LETTER ETH
  868. F1      ±       LATIN SMALL LETTER N WITH TILDE
  869. F2      ≥       LATIN SMALL LETTER O WITH GRAVE
  870. F3      ≤       LATIN SMALL LETTER O WITH ACUTE
  871. F4      ⌠       LATIN SMALL LETTER O WITH CIRCUMFLEX
  872. F5      ⌡       LATIN SMALL LETTER O WITH TILDE
  873. F6      ÷       LATIN SMALL LETTER O WITH DIAERESIS
  874. F7      ≈       DIVISION SIGN
  875. F8      °       LATIN SMALL LETTER O WITH STROKE
  876. F9      ∙       LATIN SMALL LETTER U WITH GRAVE
  877. FA      ·       LATIN SMALL LETTER U WITH ACUTE
  878. FB      √       LATIN SMALL LETTER U WITH CIRCUMFLEX
  879. FC      ⁿ       LATIN SMALL LETTER U WITH DIAERESIS
  880. FD      ²       LATIN SMALL LETTER Y WITH ACUTE
  881. FE      ■       LATIN SMALL LETTER THORN
  882. FF              LATIN SMALL LETTER Y WITH DIAERESIS
  883. -- 
  884.   Kosta Kostis, Talstr. 25, D-63322 R÷dermark, Germany
  885.   http://www.kostis.net/de/privat/
  886.