1.12, 19.09.2002: Analyze-Programm zur Session-Auswertung aus
Server-Access-Log 1.12, 25.01.2002: Test auf abweichende Groß/Kleinschreibung in Links 1.11, 19.01.2001: "-" am Keywords-Anfang deaktiviert Keyword-Anker bei langen Files 1.10, 07.11.2000: Angabe lokaler Domain möglich, wird bei Link-Check berücksichtigt 1.09, 24.04.2000: Ankernamen werden auch bei <a xxx name="..."> erkannt 1.08, 26.11.1999: Link-Test funktioniert jetzt auch bei CGI-String hinter "?" im Link 1.07, 25.07.1999: Topsite findet jetzt auch doppelt vergebene Ankernamen in einer Datei 1.06, 12.06.1999: Optionaler Test, ob alle Anker aus derselben Datei referenziert werden 1.05, 29.06.1999: Anker werden auch in <a xxx href=...> erkannt (xxx wird ignoriert) 1.04, 28.06.1999: Link-Testseite (siehe Konfigurations-Optionen) 1.03, 26.06.1999: Außer href auch Erkennung von src=... und background=... 1.02, 20.06.1999: Ausschließen von Dateien und Verzeichnissen mit robots.txt möglich 1.01, 19.06.1999: Falscher Link nahe Dateiende blieb bei 1.00 unentdeckt - korrigiert 1.00, 05.06.1999: Erstversion |
TopSite läuft unter Windows 95, 98, 2000 und NT. Es kontrolliert die Konsistenz einer Website. Dazu überprüft es Dateien mit der Endung .htm oder .html auf falsche Links zu anderen Dateien, auf fehlende Titel- oder Suchwort-Angaben und andere typische Probleme. Sie können TopSite zur Prüfung einer lokalen Kopie Ihrer Internet-Site einsetzen, wahlweise auf einem Netzlaufwerk oder auf der eigenen Festplatte.
Zu TopSite gehört auch eine Javascript-basierende Suchmaschine für Ihre Website, deren Suchwort-Index automatisch aus den Schlüsselworten der HTML-Dateien generiert wird.
Entpacken Sie bitte zuerst die Archivdatei in ein temporäres, leeres Verzeichnis und starten Sie darin dann SETUP. Das Installationsprogramm schlägt Ihnen C:\Programme\TopSite als Installationspfad vor. Sie finden TopSite anschließend im Windows-Startmenü unter "Programme". Nach erfolgreicher Installation können Sie das temporäre Verzeichnis wieder löschen.
Sie können TopSite bei Bedarf wieder deinstallieren, indem Sie im Windows-Startmenü "Einstellungen" wählen, dann "Software" anklicken und in der Liste TopSite markieren. Mit "Hinzufügen/Entfernen" wird TopSite von Ihrem System entfernt.
TopSite findet innerhalb von Sekunden folgende typische Fehler:
Folgendes wird nicht überprüft:
Zunächst kopieren Sie bitte die drei Dateien search.htm, search1.htm und search2.htm aus dem TopSite-Verzeichnis in das Hauptverzeichnis Ihres Web-Projekts. Sie realisieren eine auf Javascript basierende Suchmaschine für Ihre Webseiten. Sie können z.B. auf Ihrer Index-Seite (üblicherweise index.htm oder index.html) einen Link zu search.htm einbauen, damit die Besucher Ihrer Web-Site nach Stichworten suchen können.
Voraussetzung für die Suche ist, daß in allen Ihren HTML-Dateien zwischen <head> und </head> ein Eintrag wie beispielsweise der folgende existiert:
<meta name="keywords" content="Müll-Abfuhr, Abfall, Entsorgung">
Aus diesen Angaben generiert TopSite einen Suchwort-Index und schreibt ihn direkt in die Datei search1.htm, die ihrerseits von search.htm aufgerufen wird. Bei erfolgreicher Suche wird eine Ergebnisliste mit direkten Links zu den jeweiligen Seiten ausgegeben. Der eigentliche Text der Dateien wird absichtlich nicht ausgewertet, da die dann entstehende Suchwort-Anzahl den sinnvollen Umfang eines Javascript-Programms bei weitem sprengen würde. (Die Suchmaschine erfordert einen Browser wie Netscape-Communicator oder Microsoft Internet Explorer ab Version 4.0 mit aktiviertem Javascript.)
Alle Ihre Seiten sollten auch über einen Titel verfügen. Der Titel wird im Abschnitt <head> der HTML-Datei zwischen <title> und </title> angegeben und wird von Suchmaschinen als Ergebnis-Link angezeigt.
Wenn Sie möchten, daß bestimmte Dateien nicht von der TopSite- und anderen Suchmaschinen indiziert werden, tragen Sie im HTML-Header statt der "keywords"-Angaben einfach folgende Zeile ein:
<meta name="robots" content="noindex">
Damit die Suchmaschine in der Lage ist, mit einem Link der Ergebnisliste nicht nur die gewünschte Datei aufzurufen, sondern bei längeren Dateien (voreingestellt sind 20 K, änderbar in search1.htm in der Zeile var kb=20) sogar direkt an den zur passenden Textstelle gehörenden Anker zu springen, wird erwartet, daß zu allen mit keywords=... definierten Stichworten auch ein passender Anker existiert, dessen Schreibweise gegenüber dem Schlüsselwort ggf. wie folgt angepaßt ist:
Im obigen Beispiel sollten also, wenn die Datei länger als 20 K ist, Anker mit den Namen "muellabfuhr", "abfall" und "entsorgung" an den passenden Stellen im Text existieren. Beachten Sie bitte, daß statt "Müll-Abfuhr" als Ankername "muellabfuhr" benutzt wird, da Satzzeichen entfallen und Umlaute konvertiert werden.
Wenn Sie ausnahmsweise möchten, daß bei einer Datei Suchworte nicht als Anker
benutzt werden, obwohl die angegebene Dateilänge eigentlich überschritten wird, schreiben
Sie an den Anfang der Keywords-Liste einfach einen Bindestrich, zum Beispiel:
keywords="-,Äpfel,Birnen"
Es ist dann nicht nötig, für jedes Keyword einen entsprechenden Anker in der Datei
anzulegen.
Sie können die Datei topsite.exe direkt aus Ihrem Web-Verzeichnis als aktuellem Verzeichnis starten, wenn das TopSite-Verzeichnis im Suchpfad ist.
Falls Sie TopSite aus einem anderen als Ihrem Web-Verzeichnis starten, müssen Sie das zu überprüfende Hauptverzeichnis durch einen Doppelklick auf die entsprechende Stelle im TopSite-Verzeichnisfenster angeben. Der Pfad erscheint zur Kontrolle in der Statuszeile darunter. (Außer in diesem Pfad werden von TopSite stets auch HTML-Dateien in allen darunterliegenden Verzeichnissen geprüft.)
Klicken Sie anschließend auf "Start". Im rechten Ergebnis-Fenster sehen Sie dann eventuell festgestellte Probleme. Erfahrungsgemäß meldet TopSite bei der ersten Überprüfung oft eine ganze Menge von Fehlern, die Sie dann nach und nach mit einem HTML-Editor bearbeiten können. Im Konfigurations-Menü läßt sich einstellen, nach wievielen Fehlern der Analysevorgang abgebrochen wird, damit die Liste nicht gar zu lang wird.
Wenn Sie hinterher statt "Gefundene Probleme" in der Auswahlbox rechts oben "Externe Links" auswählen, erhalten Sie eine alphabetisch sortierte Liste externer ftp-, http- und mailto-Adressen, die in Ihren Seiten benutzt werden. Sie können diese Adressen ggf. manuell mit einem Browser überprüfen (TopSite selbst tut das nicht, weil es keine TCP/IP-Verbindung benutzt und auch z.B. die Gültigkeit von Mail-Adressen kaum überprüfen könnte).
Im Menü "Datei" können Sie mit "Ergebnis drucken" eine Liste der gefundenen Probleme und die in Ihren Seiten enthaltenen externen Links auf den Drucker ausgeben. Es wird die interne Schrift des installierten Standard-Druckers benutzt.
Im Konfigurations-Menü von TopSite können Sie mit Eigene Domain Ihre Internet-Domain einstellen, zum Beispiel www.nikocity.de/home/meier oder www.meinname.de. Dadurch werden Links auf andere Seiten derselben Domain als lokale Links erkannt und können dadurch mit überprüft werden.
Unter dem Punkt "Einstellungen" des Konfigurations-Menüs haben Sie folgende Möglichkeiten:
Abbruch bei [...] Meldungen: Sie können die Länge der ausgegebenen Liste begrenzen, um sich bei sehr umfangreichen Ausgaben erst einmal mit dem "ersten Schwung" Fehlermeldungen befassen zu können.
Folgende Probleme finden: Stellen Sie hier ein, welche Prüfungen TopSite in Ihren HTML-Dateien vornehmen soll. Je nach Systemumgebung ist oft nur ein Teil der angebotenen Punkte wirklich sinnvoll. Unabhängig von den hier angeklickten Analysen prüft TopSite immer fehlende Titel- und Suchwort-Angaben im HTML-Header, die irrtümliche Verwendung von "\" statt "/" in Pfaden sowie doppelt vergebene Ankernamen in einer Datei.
Ergebnisdruck: Hier können Sie einstellen, ob beim Ausdruck (Datei-Menü, Ergebnisdruck) nur die gefundenen Probleme, nur die externen Links oder beide Daten ausgegeben werden. Ferner können Sie einen linken Papierrand angeben.
Die in Javascript realisierte Suchmaschine besteht aus den drei Dateien search.htm (Frameset, das ist der eigentliche Such-Link), search1.htm (der Suchwort-Eingabeteil mit Wortliste und Javascript-Programm) und search2.htm (das Ausgabefenster, das zunächst einen Erklärungstext beinhaltet).
Das Setup-Programm von TopSite kopiert diese drei Dateien zunächst ins TopSite-Verzeichnis. Sie müssen sie ggf. noch manuell in das Verzeichnis kopieren, in dem sich Ihre sonstigen Web-Seiten befinden.
Sie können alle drei Dateien mit einem normalen Text- oder HTML-Editor bearbeiten, solange Sie die Javascript-Teile nicht löschen oder unzulässig ändern. TopSite erkennt die Filenamen- und Suchwort-Abschnitte in search1.htm an bestimmten Schlüsselworten und würde deshalb u.U. bei Änderungen darin nicht mehr korrekt funktionieren.
Vom Benutzer eingegebene Worte werden zunächst vom Javascript-Programm so vorbehandelt, wie das auch TopSite mit den Keywords der Dateien machte: Es werden Satzzeichen herausgefiltert, und die Eingabe wird in Kleinschreibung umgewandelt.
Nehmen wir an, der Benutzer hat "Schiffs-Ladung" eingetippt. Daraus wird zu Vergleichszwecken zunächst intern "schiffsladung" gemacht. Die Suchmaschine führt dann einen Suchvorgang in bis zu drei Durchgängen aus, wobei der nächste nur dann durchlaufen wird, wenn der vorherige erfolglos war. Dieses Verfahren ermöglicht einerseits Ergebnisse, die möglichst genau dem Suchbegriff entsprechen, liefert andererseits aber - falls nichts exakt Passendes gefunden wurde - in der Nähe liegende Themen.
Damit man als Benutzer weiß, welche Ergebnis-Links am besten dem gesuchten Begriff entsprechen, wird außer dem Titel der Datei auch das in ihr enthaltene Schlüsselwort angezeigt, z.B. "Ladung".
Jeder Web-Server liefert eine sogenannte Access-Log-Datei, in der alle Seiten-Anforderungen aufgezeichnet werden. Jede Zeile ist dabei etwa so aufgebaut:
217.5.19.187 - - [18/Sep/2002:00:04:44 +0200] "GET /tools.htm HTTP/1.1" 200 16413
www.shamrock.de "http://www.shamrock.de/tools.htm" "Mozilla/4.0 (compatible; MSIE 5.5;
Windows 98)"
Wenn man die Log-Datei mit einem Editor o.ä. ansieht, erkennt man Zusammenhänge nur schwer, da die Datei-Anforderungen unterschiedlicher Benutzer völlig durcheinander (entsprechend der zeitlichen Reihenfolge) darin stehen. Das in Topsite enthaltene Programm Analyze extrahiert aus einer Server-Logdatei einzelne Sessions und schreibt sie in eine Textdatei Analyze.txt, so daß die Aktivitäten der einzelnen Benutzer jeweils zusammenhängend sichtbar sind, z.B. so:
Start: 22:52:00 IP: 145.254.225.111
Browser: MSIE 6.0; Windows 98; QXW0340r
Referer: www.google.de/search Suche: D1 UCP Festnetz
> www.shamrock.de/dfu/dfu7.htm
> www.shamrock.de/dfu/index.htm?dfu7.htm
> www.shamrock.de/dfu/dfubalk.htm
Ende: 22:52:03
Nachdem Sie die Logdatei Ihres Webservers z..B. per FTP auf die lokale Festplatte kopiert haben, starten Sie das Programm Analyze, klicken Sie auf "Log öffnen" und wählen Sie die Logdatei aus (sie sollte nicht größer als 5...10 MByte sein). Anschließend wird eine Textdatei Analyze.txt erzeugt und im Editor geöffnet. Sie enthält alle Sessions. Der Übersichtlichkeit werden dabei Bilder- und Skript-Dateien weggelassen. Falls möglich, wird angezeigt, von welcher fremden Seite der Besucher kam; falls das eine der üblichen Suchmaschinen war, werden auch die benutzten Suchbegriffe angezeigt.
Falls das Programm nicht wie gewünscht funktioniert oder wenn Ihre Web-Site online nicht korrekt ansprechbar ist, obwohl TopSite keine Fehler meldete, prüfen Sie bitte folgendes:
Sie können auch gezielt Verzeichnisse und Dateien von der Überprüfung ausschließen, indem Sie eine Datei robots.txt ins Hauptverzeichnis stellen (also in jenes, das Sie in TopSite angeben). So kann robots.txt beispielsweise aussehen:
# Dies ist eine Kommentarzeile
Disallow: /cgi-bin/
Allow: /ownfiles/
Die Datei robots.txt wird übrigens auch von Suchmaschinen wie Altavista, Fireball oder Infoseek beachtet. Die darin genannten Verzeichnisse und Dateien werden von solchen Suchmaschinen nicht indiziert.
Zusätzliche Tips zur Gestaltung von Internet-Seiten finden Sie unter http://www.shamrock.de/dfu.
TopSite wurde von der Shamrock Software GmbH, Petershausen, entwickelt und unterliegt dem deutschen und internationalen Urheberrecht. Die Software wird als Freeware-Tool angeboten. Shamrock Software bietet für Freeware keine Hotline-Unterstützung an. Die Eignung für einen bestimmten Einsatzzweck wird nicht garantiert.
© Shamrock Software GmbH - http://www.shamrock.de