HTML-Dateien selbst erstellen


HTML - die Sprache des WWW

HTML als Dokumentbeschreibungssprache
Wieviel Sie über HTML wissen sollten
Diskussionen um HTML 3.0
Vom Dateiformat zur Universalsprache
HTML und die wichtigste Erkenntnis unserer Zeit


HTML als Dokumentbeschreibungssprache

HTML bedeutet HyperText Markup Language. Es handelt sich dabei um einen Ableger von SGML (Structured Generalized Markup Language) mit spezieller Ausrichtung auf Hypertext-Funktionen.

SGML ist als ISO-Norm 8779 festgeschrieben und wird immer häufiger von großen Konzernen und Institutionen zum internationalen, standardisierten Dokumentenaustausch benutzt. HTML ist zur Sprache für Dokumente des World Wide Web (WWW) im Internet geworden.

Aufgabe von Dokumentbeschreibungssprachen

HTML ist eine sogenannte Dokumentbeschreibungssprache. Eine Dokumentbeschreibungssprache hat die Aufgabe, die logischen Strukturen eines Dokuments zu beschreiben. Dazu gehören Kapitel, Unterkapitel, Absätze, Querverweise zu anderen Dokumenten usw. Daneben hält HTML in der künftigen Version 3.0 etliche Sprachelemente zur Formatierung von Text und zum Darstellen von Tabellen u.ä. bereit.

Damit ein HTML-Dokument ansprechend präsentiert wird, stellen die modernen Anzeigeprogramme (WWW-Browser) umfangreiche Konfigurationsmöglichkeiten bereit. Beispielsweise stehen dem Anwender zur Konfiguration alle installierten Schriftarten zur Verfügung.

Hypertext und Hypermedia als ASCII-Text

HTML-Dokumente selbst bestehen aus reinem ASCII-Text und können mit jedem ASCII-Editor gelesen und bearbeitet werden. Dadurch bleiben HTML-Dokumente plattformunabhängig, d.h. dasselbe Dokument kann auf Sun-Workstations, auf Apple Macintoshs, auf Ataris oder IBM-PCs präsentiert werden. PlattformabhΣngig ist nur die Präsentations-Software.

HTML-Dateien enthalten neben Text sogenannte Tags. Die Tags bestehen aus spitzen Klammern . Innerhalb der spitzen Klammern werden HTML-Befehle notiert. WWW-Browser interpretieren die Tags und erzeugen daraus die korrekte Abbildung der Dokumentstruktur.

Ein HTML-Dokument kann außer Text auch Grafiken sowie multimediale Elemente (Sound, Video usw.) enthalten. Solche Elemente werden als Referenz auf eine entsprechende Grafik- oder Multimedia-Datei notiert. Die Präsentations-Software mu▀ entsprechende Software-Module besitzen oder aufrufen, mit deren Hilfe solche Dateien dargestellt werden können.


HTML-Dateien selbst erstellen
HTML - die Sprache des WWW


Wieviel Sie über HTML wissen sollten

Zur Zeit: leider noch sehr viel (deshalb auch dieses Dokument hier). In Zukunft: mit Sicherheit so gut wie nichts mehr.

Der Grund dafür: Internet und HTML kommen aus der Unix-Welt. Ein echter Unix-Hacker braucht nichts anderes als seinen vi-Editor, der ist zeilenorientiert, kryptisch und sagenhaft schnell. Damit schreibt der Unix-Hacker Raumfahrt-Programme ebenso wie belichtungsfähige Druckdokumente (das ist kein Scherz!).

Doch inzwischen haben die Branchenriesen wie Microsoft und Co. die märchenhaften Wachstumsraten im WWW wahrgenommen. Jetzt wird investiert und geklotzt, um Software für das WWW bereitzustellen, die dem Niveau und dem Anspruch moderner Anwendungen entspricht.

Jedes bessere Textverarbeitungs- und DTP-System wird künftig das Erstellen von HTML-Dateien unterstützen oder automatisieren. WordPerfect wird bereits mit HTML-Filter ausgeliefert, FrameMaker folgt auf den Fu▀. In spätestens ein bis zwei Jahren werden Sie dieses Dokument hier mit Nostalgiegefühlen lesen, denn niemand wird es dann noch nötig haben, sich mit den Niederungen der HTML-Tags abzugeben - oder interessiert es Sie etwa, wie RTF-Dateien (ebenfalls reine ASCII-Dateien mit Steuerzeichen in Klartextform) von innen aussehen?

Bis dahin aber sollte sich jeder, der EDV-mΣ▀ig auf der Höhe der Zeit sein mu▀ oder will, näher mit HTML und seinen Sprachelementen beschäftigen.


HTML-Dateien selbst erstellen
HTML - die Sprache des WWW


Diskussionen um HTML 3.0

Bei HTML treffen mittlerweile drei Welten aufeinander: die geordnete Welt der internationalen ISO-Normierung, die chaotische Welt der kreativen Genies im Internet, und die profitorientierte Welt der großen Software-Firmen.

Mosaic oder der Weg von HTML 1.0 zu HTML 2.0

Angefangen hat es mit dem ersten ISO-genormten, sehr einfachen 1.0-Standard des HTML-Formats. Populär wurde das Format jedoch erst durch den grafischen modernen WWW-Browser Mosaic. Die Programmierer von Mosaic erfanden auch neue Features, die sie in ihrem WWW-Browser implementierten, ohne daß diese Features von der ISO-Norm abgesegnet waren. Da sich Mosaic rasend schnell verbreitete, wuchs auch die Anzahl von WWW-Seiten mit Mosaic-eigenen Sprachelementen. In der offiziellen Sprach-Version 2.0 wurden dann einige der Mosaic-Features aufgenommen, andere nicht. So kam es zu den sog. "obsoleten" Sprachelementen. Das sind Sprachelemente, die in der Realität verwendet werden, aber nicht zum Sprachstandard gehörten.

Netscape und Microsoft oder der Weg von HTML 2.0 zu HTML 3.0

Inzwischen hat der WWW-Browser Netscape die Rolle des Avantgardisten übernommen. Ab der Programmversion 1.1 bietet Netscape etliche Features an, die nicht zum gegenwärtig gültigen HTML-Standard 2.0 gehören. Doch obwohl Netscape derzeit von ca. 70% aller Internet-Surfer verwendet wird, hat sich Microsoft zu einem Feldzug gegen diese Vorherrschaft entschlossen und seinen Internet Explorer hochgerüstet. Beide Flaggschiffe, Netscape Navigator und MS Internet Explorer, liegen derzeit in der Version 2.0 vor. Und beide tun sich durch HTML-Spachelemente hervor, die in keiner HTML-3- Spezifikation vorkommen, und die nur der eigene Browser versteht. Dadurch kommt zwar jede Menge frischer Wind ins Web, doch die Entwicklung ist zugleich auch sehr bedenklich, da die software-unabhängige Normung der HTML-Sprache in dem Machtkampf dieser Giganten unterzugehen droht.

Die Normung der Sprachversion 3.0 von HTML soll Ende 1995 abgeschlossen sein. Dann wird sich zeigen, welchen Einfluß dieser Standard auf die weitere Sprachentwicklung überhaupt noch hat.

Als Beitrag zum Machtkampf zwischen Netscape und Microsoft wird in diesem Dokument ein dritter, bislang nur in Fachkreisen bekannter WWW-Browser erwähnt, der echtes HTML 3 (laut den Vorschlägen des W3-Konsortiums) interpretiert und isg. mehr HTML versteht als Netscape und Internet Explorer zusammen: der UDI WWW-Browser von Bernd Richter. Das Programm ist noch in Entwicklung, aber angesichts der millionenschweren Konkurrenz ein echtes Software-Wunder, das sich hoffentlich eine Marktposition erkämpfen wird.

Technokraten contra Designer

Netscape und der Internet Explorer kommen vor allem den Wünschen von Werbegrafikern und Designern kommerzieller WWW-Seiten entgegen. Solche Leute wollen verständlicherweise die totale Gestaltungsfreiheit bei Textformatierung und farblicher Gestaltung.

Puristen kristisieren daran, daß durch die Gestaltungsfreiheit der Charakter der Dokumentbeschreibungssprache verloren gehe. Wenn man z.B. mitten im Text W÷rter so formatiert, daß der Anwender sie nicht von Überschriften unterscheiden kann, werde die ganze Idee der Strukturierung nach Überschriftenebenen und Textabsatzformaten hinfällig. Außerdem, so die Puristen, werde mit der großen Gestaltungsfreiheit die Kommerzialisierung des WWW vorangetrieben, so daß am Ende statt Information nur noch bunte Werbeplakate im Web dominieren.

Der geplante Sprachstandard 3.0 sieht aber auch wichtige Neuerungen für den technisch-wissenschaftlichen Bedarf vor. Tabellen, von einigen Browsern bereits unterstützt, werden dazugehören, ebenso wie die Notation technisch/mathematischer Formeln, Fußnoten oder Aufmerksamkeitssymbole im Text. Dazu kommt die wichtige Neuerung der Style-Sheets. Ferner sind Erweiterungen für den Dateikopf einer HTML-Datei in Sicht. Dadurch wird es dann z.B. möglich sein, sog. "guided tours" anzubieten, d.h. Dateien, die in Reihe geschaltet sind und sequentiell gelesen werden können. Das Ganze wird dann ähnlich funktionieren wie bei den "Browse-Buttons" in der Windows-Hilfe.

WWW-Software im HTML-3.0-Zeitalter

Zukünftige WWW-Browser werden hohen Anforderungen genügen müssen, um die neuen Features der HTML-Version 3.0 korrekt umzusetzen. Parallel dazu werden die jetzt üblichen HTML-Editoren durch Konverter-Tools abgelöst werden, die zur künftigen Ausstattung kommerzieller Textverarbeitungsprogramme gehören werden. Auch kombinierte Editier-Präsentier-Pakete wie Netscape 2.0 Gold könnten sich durchsetzen.


HTML-Dateien selbst erstellen
HTML - die Sprache des WWW


Vom Dateiformat zur Universalsprache

Dank WWW ist HTML, die kleine, hypertext-orientierte Schwester von SGML, in aller Munde. In jeder Fachzeitschrift ist zu lesen, da▀ HTML die Sprache des WWW sei.

Zweifellos ist sie das, und ihre Bedeutung zieht sie heute vor allem aus dieser Tatsache. Aber HTML-Dateien liegen schon längst nicht mehr nur auf den WWW-Servern des Internet herum. Jeder, der einen WWW-Browser hat, legt HTML-Dateien auf dem eigenen Rechner ab. Viele Anwender, die einen zeitabhängigen Internet-Zugang haben, speichern interessante HTML-Seiten gleich lokal ab und lesen sie hinterher offline. Auch in Mailboxen liegen HTML-Dateien zum Download bereit, meistens Dateien mit Verweisen zu interessanten Stellen im WWW. Auch auf einschlägigen CD-ROMs werden künftig immer mehr HTML-Dateien zu finden sein.

In wenigen Jahren wird es wohl kaum einen Personal Computer und keine Workstation mehr geben, auf der nicht ein WWW-Browser oder ein vergleichbares HTML-Präsentationswerkzeug installiert sein wird. HTML wird zum zweitkleinsten gemeinsamen Nenner jenseits des ASCII-Zeichensatzes werden. Firmenpräsentationen, Handbücher, Fachliteratur, ganze Dokumentarchive werden online, auf CDs oder anderen Datenträgern in HTML-Form zur Verfügung stehen. HTML ist in den 90er Jahren das, was die CompactDisc (CD) in den 80ern war: ein Selbstläufer, der ganz zwanglos zum Maß aller Dinge wird. HTML wird den Sprung vom bloßen Dateiformat zur Universalsprache schaffen.


HTML-Dateien selbst erstellen
HTML - die Sprache des WWW


HTML und die wichtigste Erkenntnis unserer Zeit

Die wichtigste Erkenntnis unserer Zeit lautet (frei nach Murphy): es gibt kein endgültiges Wissen, im entscheidenden Moment gibt es immer nur Querverweise.

Um diesem Umstand gerecht zu werden, brauchen wir etwas, das die Querverweise zum Prinzip erhebt. Wir haben es auch schon gefunden und "Hypertext" genannt.

Hypertext ist Text mit Zeigern auf anderen Text. Viel mehr steckt zunächst wirklich nicht dahinter. Das ist nichts anderes, als wenn Sie in einer Bibliothek anfangen, in einem Buch über ein interessantes Thema zu lesen. Sie erfahren einiges, aber längst nicht alles, was Sie wissen wollten. Nun enthält das Buch Angaben zu weiterführender Literatur, und Sie quälen sich damit ab, diese Literatur aufzutreiben. Sie geben Fernleihen auf und warten wochenlang auf das begehrte Schriftstück.

Bei Hypertext ist der Verweis auf die weiterführende Literatur mit der Maus anklickbar, und wenn Sie draufklicken, sind Sie sofort in dem gewünschten Dokument. Das ist, salopp gesagt, der einzige, allerdings entscheidende Unterschied zu herkömmlichen Textmedien. Alles ist verfügbar im Augenblick des spontanen Interesses. Hypertext hat also etwas mit den gebratenen Tauben zu tun, die einem im Paradies in den Mund fliegen.

Seit Mitte der 60er Jahre beschäftigt das "Phänomen Hypertext" die Geister. Das Problem war immer nur, wo man all die viele Information speichern soll, die in so einem paradiesischen Hypertext auf Knopfdruck zur Verfügung stehen soll. Die Antwort: auf irgendeinem x-beliebigen Rechner, wenn er denn in der Lage ist, als Internet-Server zu fungieren.

Es hat erstaunlich lange gedauert, bis man auf diese Antwort kam. Aber jetzt ist sie da, in Form des World Wide Web. Und HTML ist sozusagen die technische Grundlage fⁿr das Prinzip der gebratenen Querverweis-Tauben.

In diesem Dokument haben Sie Gelegenheit, sich näher damit zu beschäftigen.


HTML-Dateien selbst erstellen
HTML - die Sprache des WWW