SGML ist als ISO-Norm 8779 festgeschrieben und wird immer häufiger von großen Konzernen und Institutionen zum internationalen, standardisierten Dokumentenaustausch benutzt. HTML ist zur Sprache für Dokumente des World Wide Web (WWW) im Internet geworden.
Damit ein HTML-Dokument ansprechend präsentiert wird, stellen die modernen Anzeigeprogramme (WWW-Browser) umfangreiche Konfigurationsmöglichkeiten bereit. Beispielsweise stehen dem Anwender zur Konfiguration alle installierten Schriftarten zur Verfügung.
HTML-Dateien enthalten neben Text sogenannte Tags. Die Tags bestehen aus
spitzen Klammern
Ein HTML-Dokument kann außer Text auch Grafiken sowie multimediale
Elemente (Sound, Video usw.) enthalten. Solche Elemente werden als
Referenz auf eine entsprechende Grafik- oder Multimedia-Datei notiert.
Die Präsentations-Software muß entsprechende Software-Module besitzen
oder aufrufen, mit deren Hilfe solche Dateien dargestellt werden
können.
Der Grund dafür: Internet und HTML kommen aus der Unix-Welt.
Ein echter Unix-Hacker braucht nichts anderes als seinen vi-Editor, der
ist zeilenorientiert, kryptisch und sagenhaft schnell. Damit schreibt der
Unix-Hacker Raumfahrt-Programme ebenso wie belichtungsfähige Druckdokumente
(das ist kein Scherz!).
Doch inzwischen haben die Branchenriesen wie Microsoft und Co. die
märchenhaften Wachstumsraten im WWW wahrgenommen. Jetzt wird investiert und
geklotzt, um Software für das WWW bereitzustellen, die dem Niveau und dem
Anspruch moderner Anwendungen entspricht.
Jedes bessere Textverarbeitungs- und DTP-System wird künftig
das Erstellen von HTML-Dateien unterstützen oder automatisieren.
WordPerfect wird bereits mit HTML-Filter ausgeliefert, FrameMaker folgt auf
den Fuß. In spätestens ein bis zwei Jahren werden Sie dieses Dokument
hier mit Nostalgiegefühlen lesen, denn niemand wird es dann noch
nötig haben, sich mit den Niederungen der HTML-Tags abzugeben
- oder interessiert es Sie etwa, wie RTF-Dateien (ebenfalls reine ASCII-Dateien mit
Steuerzeichen in Klartextform) von innen aussehen?
Bis dahin aber sollte sich jeder, der EDV-mäßig auf der Höhe der
Zeit sein muß oder will, näher mit HTML und seinen Sprachelementen
beschäftigen.
Die Normung der Sprachversion 3.0 von HTML soll Ende 1995
abgeschlossen sein. Dann wird sich zeigen, welchen Einfluß dieser Standard
auf die weitere Sprachentwicklung überhaupt noch hat.
Als Beitrag zum Machtkampf zwischen Netscape und Microsoft wird in diesem Dokument
ein dritter, bislang nur in Fachkreisen bekannter WWW-Browser erwähnt, der
echtes HTML 3 (laut den Vorschlägen des W3-Konsortiums) interpretiert und
isg. mehr HTML versteht als Netscape und Internet Explorer zusammen: der UDI
WWW-Browser von Bernd Richter. Das Programm ist noch in Entwicklung, aber angesichts
der millionenschweren Konkurrenz ein echtes Software-Wunder, das sich
hoffentlich eine Marktposition erkämpfen wird.
Puristen kristisieren daran, daß durch die Gestaltungsfreiheit der
Charakter der Dokumentbeschreibungssprache verloren gehe. Wenn man
z.B. mitten im Text Wörter so formatiert, daß der Anwender sie
nicht von Überschriften unterscheiden kann, werde die ganze Idee
der Strukturierung nach Überschriftenebenen und Textabsatzformaten
hinfällig. Außerdem, so die Puristen, werde mit der
großen Gestaltungsfreiheit die Kommerzialisierung des WWW
vorangetrieben, so daß am Ende statt Information nur noch bunte
Werbeplakate im Web dominieren.
Der geplante Sprachstandard 3.0 sieht aber auch wichtige Neuerungen
für den technisch-wissenschaftlichen Bedarf vor. Tabellen, von
einigen Browsern bereits unterstützt, werden dazugehören,
ebenso wie die Notation technisch/mathematischer Formeln,
Fußnoten oder Aufmerksamkeitssymbole im Text. Dazu kommt die
wichtige Neuerung der Style-Sheets. Ferner sind Erweiterungen für
den Dateikopf einer HTML-Datei in Sicht. Dadurch wird es dann z.B.
möglich sein, sog. "guided tours" anzubieten, d.h.
Dateien, die in Reihe geschaltet sind und sequentiell gelesen werden
können. Das Ganze wird dann ähnlich funktionieren wie bei den
"Browse-Buttons" in der Windows-Hilfe.
Zweifellos ist sie das, und ihre Bedeutung zieht sie heute vor
allem aus dieser Tatsache. Aber HTML-Dateien liegen schon längst
nicht mehr nur auf den WWW-Servern des Internet herum. Jeder, der einen
WWW-Browser hat, legt HTML-Dateien auf dem eigenen Rechner ab. Viele
Anwender, die einen zeitabhängigen Internet-Zugang haben, speichern
interessante HTML-Seiten gleich lokal ab und lesen sie hinterher offline.
Auch in Mailboxen liegen HTML-Dateien zum Download bereit, meistens
Dateien mit Verweisen zu interessanten Stellen im WWW. Auch auf
einschlägigen CD-ROMs werden künftig immer mehr HTML-Dateien
zu finden sein.
In wenigen Jahren wird es wohl kaum einen Personal Computer und keine Workstation
mehr geben, auf der nicht ein WWW-Browser oder ein vergleichbares
HTML-Präsentationswerkzeug installiert sein wird. HTML wird zum
zweitkleinsten gemeinsamen Nenner jenseits des ASCII-Zeichensatzes werden.
Firmenpräsentationen, Handbücher, Fachliteratur, ganze Dokumentarchive
werden online, auf CDs oder anderen Datenträgern in HTML-Form zur Verfügung
stehen. HTML ist in den 90er Jahren das, was die CompactDisc (CD) in
den 80ern war: ein Selbstläufer, der ganz zwanglos zum Maß
aller Dinge wird. HTML wird den Sprung vom bloßen Dateiformat zur
Universalsprache schaffen.
Um diesem Umstand gerecht zu werden, brauchen wir etwas, das die
Querverweise zum Prinzip erhebt. Wir haben es auch schon gefunden und
"Hypertext" genannt.
Hypertext ist Text mit Zeigern auf anderen Text. Viel mehr steckt
zunächst wirklich nicht dahinter. Das ist nichts anderes, als wenn
Sie in einer Bibliothek anfangen, in einem Buch über ein
interessantes Thema zu lesen. Sie erfahren einiges, aber längst
nicht alles, was Sie wissen wollten. Nun enthält das Buch
Angaben zu weiterführender Literatur, und Sie quälen sich damit
ab, diese Literatur aufzutreiben. Sie geben Fernleihen auf und warten
wochenlang auf das begehrte Schriftstück.
Bei Hypertext ist der Verweis auf die weiterführende Literatur mit
der Maus anklickbar, und wenn Sie draufklicken, sind Sie sofort in dem
gewünschten Dokument. Das ist, salopp gesagt, der einzige, allerdings
entscheidende Unterschied zu herkömmlichen Textmedien. Alles ist
verfügbar im Augenblick des spontanen Interesses. Hypertext hat also
etwas mit den gebratenen Tauben zu tun, die einem im Paradies in den
Mund fliegen.
Seit Mitte der 60er Jahre beschäftigt das "Phänomen
Hypertext" die Geister. Das Problem war immer nur, wo man all die
viele Information speichern soll, die in so einem paradiesischen Hypertext
auf Knopfdruck zur Verfügung stehen soll. Die Antwort: auf
irgendeinem x-beliebigen Rechner, wenn er denn in der Lage ist, als
Internet-Server zu fungieren.
Es hat erstaunlich lange gedauert, bis man auf diese Antwort kam. Aber
jetzt ist sie da, in Form des World Wide Web. Und HTML ist sozusagen die
technische Grundlage für das Prinzip der gebratenen Querverweis-Tauben.
In diesem Dokument haben Sie Gelegenheit, sich näher damit zu
beschäftigen.
HTML-Dateien selbst erstellen
HTML - die Sprache des WWW
Wieviel Sie über HTML wissen sollten
Zur Zeit: leider noch sehr viel (deshalb auch dieses Dokument hier).
In Zukunft: mit Sicherheit so gut wie nichts mehr.
HTML-Dateien selbst erstellen
HTML - die Sprache des WWW
Diskussionen um HTML 3.0
Bei HTML treffen mittlerweile drei Welten aufeinander: die geordnete Welt der
internationalen ISO-Normierung, die chaotische Welt der kreativen
Genies im Internet, und die profitorientierte Welt der großen Software-Firmen.
Mosaic oder der Weg von HTML 1.0 zu HTML 2.0
Angefangen hat es mit dem ersten ISO-genormten, sehr einfachen
1.0-Standard des HTML-Formats. Populär wurde das Format jedoch
erst durch den grafischen modernen WWW-Browser Mosaic. Die Programmierer
von Mosaic erfanden auch neue Features, die sie in ihrem WWW-Browser
implementierten, ohne daß diese Features von der ISO-Norm
abgesegnet waren. Da sich Mosaic rasend schnell verbreitete, wuchs auch
die Anzahl von WWW-Seiten mit Mosaic-eigenen Sprachelementen. In der
offiziellen Sprach-Version 2.0 wurden dann einige der Mosaic-Features
aufgenommen, andere nicht. So kam es zu den sog. "obsoleten"
Sprachelementen. Das sind Sprachelemente, die in der Realität
verwendet werden, aber nicht zum Sprachstandard gehörten.
Netscape und Microsoft oder der Weg von HTML 2.0 zu HTML 3.0
Inzwischen hat der WWW-Browser Netscape die Rolle des Avantgardisten
übernommen. Ab der Programmversion 1.1 bietet Netscape etliche
Features an, die nicht zum gegenwärtig gültigen HTML-Standard
2.0 gehören. Doch obwohl Netscape derzeit von ca. 70% aller Internet-Surfer
verwendet wird, hat sich Microsoft zu einem Feldzug gegen diese Vorherrschaft
entschlossen und seinen Internet Explorer hochgerüstet. Beide Flaggschiffe,
Netscape Navigator und MS Internet Explorer, liegen derzeit in der Version 2.0
vor. Und beide tun sich durch HTML-Spachelemente hervor, die in keiner HTML-3-
Spezifikation vorkommen, und die nur der eigene Browser versteht. Dadurch kommt
zwar jede Menge frischer Wind ins Web, doch die Entwicklung ist zugleich auch
sehr bedenklich, da die software-unabhängige Normung der HTML-Sprache in
dem Machtkampf dieser Giganten unterzugehen droht.
Technokraten contra Designer
Netscape und der Internet Explorer kommen vor allem den Wünschen von Werbegrafikern und
Designern kommerzieller WWW-Seiten entgegen. Solche Leute wollen
verständlicherweise die totale Gestaltungsfreiheit bei
Textformatierung und farblicher Gestaltung.
WWW-Software im HTML-3.0-Zeitalter
Zukünftige WWW-Browser werden hohen Anforderungen genügen
müssen, um die neuen Features der HTML-Version 3.0 korrekt
umzusetzen. Parallel dazu werden die jetzt üblichen HTML-Editoren durch
Konverter-Tools abgelöst werden, die zur künftigen
Ausstattung kommerzieller Textverarbeitungsprogramme gehören
werden. Auch kombinierte Editier-Präsentier-Pakete wie
Netscape 2.0 Gold könnten sich durchsetzen.
HTML-Dateien selbst erstellen
HTML - die Sprache des WWW
Vom Dateiformat zur Universalsprache
Dank WWW ist HTML, die kleine, hypertext-orientierte Schwester von SGML,
in aller Munde. In jeder Fachzeitschrift ist zu lesen, daß HTML die Sprache des WWW sei.
HTML-Dateien selbst erstellen
HTML - die Sprache des WWW
HTML und die wichtigste Erkenntnis unserer Zeit
Die wichtigste Erkenntnis unserer Zeit lautet (frei nach Murphy): es gibt
kein endgültiges Wissen, im entscheidenden Moment gibt es immer nur
Querverweise.
HTML-Dateien selbst erstellen
HTML - die Sprache des WWW