Allgemeines zu HTML und WWW


HTML als Dokumentbeschreibungssprache

HTML bedeutet HyperText Markup Language. Es handelt sich dabei um einen Ableger von SGML (Structured Generalized Markup Language) mit spezieller Ausrichtung auf Hypertext-Funktionen.

SGML ist als ISO-Norm 8779 festgeschrieben und wird immer häufiger von großen Konzernen und Institutionen zum internationalen, standardisierten Dokumentenaustausch benutzt. HTML ist zur Sprache für Dokumente des World Wide Web (WWW) im Internet geworden.

Aufgabe von Dokumentbeschreibungssprachen

HTML ist eine sogenannte Dokumentbeschreibungssprache. Eine Dokumentbeschreibungssprache hat die Aufgabe, die logischen Strukturen eines Dokuments zu beschreiben. Dazu gehören Kapitel, Unterkapitel, Absätze, Querverweise zu anderen Dokumenten usw. Daneben hält HTML in der neuesten Version 3.0 etliche Sprachelemente zur Formatierung von Text und zum Darstellen von Tabellen u.ä. bereit.

Damit ein HTML-Dokument ansprechend präsentiert wird, stellen die modernen Anzeigeprogramme (WWW-Browser) umfangreiche Konfigurationsmöglichkeiten bereit. Beispielsweise stehen dem Anwender zur Konfiguration alle installierten Schriftarten zur Verfügung.

Hypertext und Hypermedia als ASCII-Text

HTML-Dokumente selbst bestehen aus reinem ASCII-Text und können mit jedem ASCII-Editor gelesen und bearbeitet werden. Dadurch bleiben HTML-Dokumente plattformunabhängig, d.h. dasselbe Dokument kann auf Sun-Workstations, auf Apple Macintoshs oder IBM-PCs präsentiert werden. Plattformabhängig ist nur die Präsentations-Software.

HTML-Dateien enthalten neben Text sogenannte Tags. Die Tags bestehen aus spitzen Klammern < und >. Innerhalb der spitzen Klammern werden HTML-Befehle notiert. WWW-Browser interpretieren die Tags und erzeugen daraus die korrekte Abbildung der Dokumentstruktur.

Ein HTML-Dokument kann außer Text auch Grafiken sowie multimediale Elemente (Sound, Video usw.) enthalten. Solche Elemente werden als Referenz auf eine entsprechende Grafik- oder Multimedia-Datei notiert. Die Präsentations-Software muß entsprechende Software-Module besitzen oder aufrufen, mit deren Hilfe solche Dateien dargestellt werden können.


Zur Neuorientierung: zurück zum Inhaltsverzeichnis oder zur Überschrift Allgemeines

HTML und das WWW

Das WWW (World Wide Web) ist das mittlerweile größte Online-Informationsnetz der Welt. Ins Leben gerufen wurde es 1989 von CERN (Europäisches Labor für Teilchenphysik, Genf) mit dem Zweck, über das Internet ein Fachliteraturnetz zu errichten. Mastermind des Projekts wurde der britische Informatiker Dr. Tim Berners-Lee. Die Idee verbreitete sich alsbald weit über die Fachkreise hinaus. Doch erst die Programmierhelden Marc Andreesen und Eric Bin vom National Center for Supercomputing Applications (USA) begründeten den weltweiten Durchbruch des WWW. Denn sie entwickelten die erste attraktive "Front-End-Software" für das Web, den WWW-Browser Mosaic. Mit diesem Programm, dessen Quellcode in den Anfangszeiten jedermann downloaden konnte, um es für seine Rechnerumgebung zu kompilieren, schufen die beiden eine neue Software-Gattung, die wir wohl in wenigen Jahren auf fast jedem Computer dieser Welt finden werden.

Seit diesem Durchbruch in Sachen Benutzerfreundlichkeit ist die explosionsartige Ausbreitung WWW nicht mehr aufzuhalten. Inzwischen gibt es im WWW wohl kaum ein Thema mehr, über das es nicht irgendwo irgendwelche Dokumente gibt.

WWW-Seiten

Die Dokumente im WWW nennt man "WWW-Seiten" (engl. "WWW pages"). WWW-Seiten sind HTML-Dateien, die auf offiziellen WWW-Server-Rechnern gespeichert sind öffentlich zugänglich sind.

Das Besondere beim WWW gegenüber herkömmlichen Informationssammlungen im Internet ist die Hypertext-Orientierung. Jede WWW-Seite kann Verweise auf beliebige andere WWW-Seiten enthalten. HTML stellt die Sprachsyntax dazu zur Verfügung. Zwischen der Datei, die einen Verweis enthält, und der Datei, auf die verwiesen wird, können viele tausend Datenverbindungskilometer (World Wide) liegen. Durch die Hypertext-Verweisstruktur entsteht der Netzeffekt (Web).

Index-Listen und Suchmaschinenen

Um eine reichhaltige Vernetzung und damit die Attraktivität des WWW zu sichern, gibt es viele fleißige Geister, die Index-Listen mit Verweisen zu bestimmten Themen erstellen und pflegen. Beispiele im WWW für solche Index-Listen sind: Darüber hinaus gibt es "Suchmaschinen". Dabei rufen Sie eine Datenbank auf, in der die Verweisadressen von vielen Tausend WWW-Seiten gespeichert sind. Die Datenbank sorgt dafür, daß beim Aufruf im Fenster Ihres WWW-Browsers ein Formular erscheint, in dem Sie Sucheingaben zu Begriffen, Dateien, Themen usw. machen. Das fertig ausgefüllte Formular senden Sie dann an die Datenbank. Die Datenbank wertet die Suchanfrage aus, und das Ergebnis erscheint im Fenster Ihres WWW-Browser in Form einer mehr oder weniger großen Liste von Verweisen. Solche Suchergebnis-Verweislisten bestehen aus automatisch generiertem HTML-Code. Beispiele für solche Suchmaschinen im WWW sind:
Zur Neuorientierung: zurück zum Inhaltsverzeichnis oder zur Überschrift Allgemeines

HTML-Editoren

Zum Erstellen von HTML-Dateien können Sie jeden Editor verwenden. Spezielle HTML-Editoren vereinfachen jedoch das Erstellen von HTML-Dateien.

Arten von HTML-Editoren

Grundsätzlich kann man bei HTML-Editoren zwischen ASCII-Editoren und WYSIWYG-Editoren (WYSIWYG = What You See Is What You Get) unterscheiden. ASCII-Editoren sind gewöhnliche Texteditoren. Sie verfügen in der Regel über eine Buttonleiste und diverse Menübefehle, um die HTML-Tags in den Text einzufügen. Die Tags erscheinen sichtbar im Text. WYSIWYG-Editoren bieten ebenfalls Buttonleisten und Menübefehle an, um das Setzen der HTML-Tags im Dialog zu unterstützen. Der Unterschied ist jedoch, daß die Tags nicht angezeigt werden (bzw. nur auf Wunsch). Stattdessen wird der Text bereits so am Bildschirm angezeigt wie später bei den WWW-Browsern. Derzeit sind ASCII-Editoren in der Überzahl. WYSIWYG-Editoren wird zwar die Zukunft gehören, aber vermutlich werden es keine Standalone-Programme sein. Vielmehr ist abzusehen, daß zukünftige Versionen kommerzieller Textverarbeitungs- und DTP-Programme das Erstellen von HTML- (und SGML-Dokumenten) von Haus aus unterstützen werden (siehe dazu auch Tips & Tricks zum Konvertieren von Text).

HTML-Editoren (Auswahl)

Unix: PC/Windows: Macintosh:
Zur Neuorientierung: zurück zum Inhaltsverzeichnis oder zur Überschrift Allgemeines

HTML-Code automatisch generieren

Wenn Sie im WWW "surfen", erscheinen im Anzeigefenster Ihres WWW-Browsers oftmals Daten, die erst auf Ihre Aktivität hin erzeugt werden. Als Anwender merken Sie davon nichts. Es handelt sich dabei um HTML-Code, der von einem Programm oder einer Batchdatei (Unix-Shellscript) automatisch generiert wird.

Das automatische Generieren von HTML-Code hat folgende Vorteile:

Ein Freund von mir hat z.B. ein kleines Pascal-Programm geschrieben, das die lokale Festplatte nach Dateien mit der Endung .HTM durchsucht, diese Dateien öffnet, den Titel der Datei ermittelt und alle ermittelten Titel als HTML-Verweis auf die betreffenden Dateien in eine neue HTML-Datei namens LOCAL.HTM schreibt. Auf diese Weise wird automatisch eine HTML-Datei generiert, die alle auf der lokalen Platte enthaltenen HTML-Dateien nach ihren Titeln auflistet. Jeder Titel ist anklickbar, und beim Anklicken wird die betreffende Datei aufgerufen.

Automatische Code-Generierung ist eher etwas für Programmierer. Um näher darauf einzugehen, müßte man Beispiele bringen, die jeden Nichtprogrammierer in die Flucht treiben. Deshalb wird hier nicht näher darauf eingegangen. Die Erwähnung automatischer HTML-Code-Generierung ist jedoch wichtig, da die Anzahl automatisch generierten HTML-Codes in Zukunft sicher noch stark zunehmen wird.


Zur Neuorientierung: zurück zum Inhaltsverzeichnis oder zur Überschrift Allgemeines

WWW-Browser

WWW-Browser sind Präsentations-Programme für HTML-Dokumente, die auf einer vorher zu installierenden Internet-Basis-Software aufsetzen und das Navigieren im World Wide Web (WWW) erlauben.

WWW-Browser unterstützen in der Regel nicht nur das Präsentieren von HTML-Dateien, sondern auch andere Internet-Dienste. So können Sie mit Hilfe von WWW-Browsern z.B. auch Dateien downloaden mit FTP oder Newgroups-Nachrichten lesen.

Darüber hinaus können Sie mit WWW-Browsern auch offline HTML-Dateien auf ihrem eigenen Rechner lesen. Sogar die CERN's Original-Zeilen-Browser (Der erste WWW-Browser überhaupt)

  • Chimera (WWW-Browser für Unix / X-Windows)
  • Download: Chimera
  • Mike Peter Bretz's bearbeiteter Mosaic-2.4.1
  • Python WWW-Browser (von Dan Connolly: erfordert Motif, HTML widget, und SGML.C aus libWWW) PC/Windows: Macintosh:
    Zur Neuorientierung: zurück zum Inhaltsverzeichnis oder zur Überschrift Allgemeines

    Diskussionen um HTML 3.0

    Bei HTML treffen zwei Welten aufeinander: die geordnete Welt der internationalen ISO-Normierung und die chaotische Welt der kreativen Genies im Internet. Und beide Welten haben zu gleichen Teilen zum Erfolg des WWW und des HTML-Formats beigetragen.

    Mosaic oder der Weg von HTML 1.0 zu HTML 2.0

    Angefangen hat es mit dem ersten ISO-genormten, sehr einfachen 1.0-Standard des HTML-Formats. Populär wurde das Format jedoch erst durch den grafischen modernen WWW-Browser Mosaic. Die Programmierer von Mosaic erfanden auch neue Features, die sie in ihrem WWW-Browser implementierten, ohne daß diese Features von der ISO-Norm abgesegnet waren. Da sich Mosaic rasend schnell verbreitete, wuchs auch die Anzahl von WWW-Seiten mit Mosaic-eigenen Sprachelementen. In der offiziellen Sprach-Version 2.0 wurden dann einige der Mosaic-Features aufgenommen, andere nicht. So kam es zu den sog. "obsoleten" Sprachelementen. Das sind Sprachelemente, die in der Realität verwendet werden, aber nicht zum Sprachstandard gehörten. Hier in "HTML-Dateien selbst erstellen" werden die "obsoleten" Sprachelemente der HTML-Version 2.0 bewußt nicht vorgestellt.

    Netscape oder der Weg von HTML 2.0 zu HTML 3.0

    Inzwischen hat der WWW-Browser Netscape die Rolle des Avantgardisten übernommen. In der Programmversion 1.1 bietet Netscape etliche Features an, die nicht zum gegenwärtig gültigen HTML-Standard 2.0 gehören. Die Normung der Sprachversion 3.0 soll Ende 1995 abgeschlossen sein. Dann wird vermutlich das gleiche passieren wie bei der letzten Version. Einige Features von Netscape werden ganz "durchfallen" oder anders normiert, als sie bei Netscape derzeit implementiert sind.

    Technokraten contra Designer

    Netscape V1.1 kommt vor allem den Wünschen von Werbegrafikern und Designern von kommerziellen WWW-Seiten entgegen. Solche Leute wollen verständlicherweise die totale Gestaltungsfreiheit bei Textformatierung und farblicher Gestaltung. Mit der Möglichkeit, Text- und Hintergrundfarben sowie Formeln, Fußnoten oder Aufmerksamkeitssymbole im Text. Ferner sind Neuerungen für den Dateikopf einer HTML-Datei in Sicht. Dadurch wird es dann z.B. möglich sein, sog. "guided tours" anzubieten, d.h. Dateien, die in Reihe geschaltet sind und sequentiell gelesen werden können. Das Ganze wird dann ähnlich funktionieren wie bei den "Browse-Buttons" in der Windows-Hilfe.

    WWW-Software im HTML-3.0-Zeitalter

    Zukünftige WWW-Browser werden hohen Anforderungen genügen müssen, um die neuen Features der HTML-Version 3.0 korrekt umzusetzen. Es ist absehbar, daß die jetzt dominierenden Freeware-Produkte aus der Hacker-Ecke von professionellen Produkten abgelöst werden. Microsoft hat für Windows 95 bereits einen Profi-Browser angekündigt. Andere werden folgen. Parallel dazu werden die jetzt üblichen HTML-Editoren durch Konverter-Tools abgelöst werden, die zur künftigen Ausstattung kommerzieller Textverarbeitungsprogramme gehören werden. Auch kombinierte Editier-Präsentier-Pakete könnten sich durchsetzen.
    Zur Neuorientierung: zurück zum Inhaltsverzeichnis oder zur Überschrift Allgemeines

    Plädoyer: HTML als Universalsprache

    Als ich 1993 in einem Vortrag zum ersten mal etwas von SGML hörte, fiel bei mir sofort der Groschen. Denn ich war auf der Suche nach einer Hypertext-Plattform, die möglichst unabhängig von bestimmten Software-Umgebungen oder Anwendungen sein sollte. SGML, hörte ich, sei eine als ISO-Norm festgeschriebene, unter anderem auch hypertext-fähige Beschreibungssprache für Dokumente aller Art. Sofort wollte ich mehr darüber wissen, aber im Buchhandel konnte man mir nicht weiterhelfen.

    Jetzt ist HTML, die kleine, hypertext-orientierte Schwester von SGML, in aller Munde. In jeder Fachzeitschrift ist auf jeder zweiten Seite zu lesen, daß HTML die Sprache des WWW sei, und alle sprechen es immer wieder nach: HTML ist die Sprache des WWW.

    Nun, zweifellos ist sie das, und ihre Bedeutung zieht sie heute vor allem aus dieser Tatsache. Aber HTML-Dateien liegen schon längst nicht mehr nur auf den WWW-Servern des Internet herum. Jeder, der einen WWW-Browser hat, legt HTML-Dateien auf dem eigenen Rechner ab. Viele Anwender, die einen zeitabhängigen Internet-Zugang haben, speichern interessante HTML-Seiten gleich lokal ab und lesen sie hinterher offline. Auch in Mailboxen liegen HTML-Dateien zum Download bereit, meistens Dateien mit Verweisen zu interessanten Stellen im WWW. Auch auf einschlägigen CD-ROMs werden künftig immer mehr HTML-Dateien zu finden sein.

    Ich selbst habe mir auf meinem Rechner längst ein "Local Web" aus HTML-Dateien errichtet. Und mit Freunden, die ebenfalls WWW-Browser ihr eigen nennen, tausche ich längst keine schnöden Textdateien, sondern HTML-Dateien aus. Das Umsetzen von vorhandenen Daten besorge ich derzeit noch ziemlich schlicht per Copy und Paste. Zum Konvertieren von verbreiteten Dateiformaten in HTML kommen aber immer mehr Tools auf den Markt. So gibt es z.B. Konverter für MS-Excel oder FrameMaker.

    In wenigen Jahren wird es, so meine Behauptung, praktisch keinen Personal Computer und keine Workstation mehr geben, auf der nicht ein WWW-Browser oder ein vergleichbares HTML-Präsentationswerkzeug installiert sein wird. HTML wird zum zweitkleinsten gemeinsamen Nenner jenseits des ASCII-Zeichensatzes werden. Firmenpräsentationen, Handbücher, Fachliteratur, ganze Dokumentarchive werden online, auf CDs oder anderen Datenträgern in HTML-Form zur Verfügung stehen. HTML wird dank ISO-Normierung und Einsatz im explodierenden WWW den Sprung vom bloßen Dateiformat zur Universalsprache schaffen.

    Unsere Editoren werden dann natürlich so ausgereift sein, daß man von HTML selbst nicht mehr viel wissen muß, um HTML-Dateien zu erstellen. Bis dahin aber sollte sich jeder, der EDV-mäßig auf der Höhe der Zeit sein muß oder will, näher mit HTML beschäftigen.

    Denn die wichtigste Erkenntnis unserer Zeit lautet: es gibt kein endgültiges Wissen, es gibt immer nur Querverweise. Folglich brauchen wir Hypertext.


    Zur Neuorientierung: zurück zum Inhaltsverzeichnis oder zur Überschrift Allgemeines