URL Checker

Der URL Checker ist ein kleines in Java realisiertes Programm. Es ist rein kommandozeilenorientiert, also bestens geeignet für das automatische Überprüfen von URLs im Hintergrund. Die Ausgabe erscheint im HTML-Format auf der Standard-Ausgabe. Die zu Überprüfenden Bereiche eines oder mehrerer server kann frei konfiguriert werden.

Installation

urlcheck.jar kopieren und diesen jar-file in den CLASSPATH eintragen.

Aufruf

java si.test.UrlCheck "absoluterURL"
überprüft nur das eine Web-Dokument.

java si.test.UrlCheck --help
listet die Optionen
java -oss5000k -ms5000k  si.test.UrlCheck --verbose \
        --ignore  "http://www.fh-wedel.de/~si/zettelkasten/fortune/" \
        --content "http://www.fh-wedel.de/~si/" \
        --exists  "http://www.fh-wedel.de/" \
        --illegal "file:" \
        --ignore  "mailto:" \
        --manual  "" \
        "http://www.fh-wedel.de/~si/index.html" > urlcheck.html
überprüft alle von http://www.fh-wedel.de/~si/index.html aus erreichbaren Dokumente. Hierbei werden die Dokumente unter http://www.fh-wedel.de/~si/zettelkasten/fortune/ vollständig ignoriert, der Inhalt der HTML-Dokumente unter http://www.fh-wedel.de/~si/ wird rekursiv überprüft, alle Verweise auf http://www.fh-wedel.de/ werden auf Existenz überprüft, der Inhalt wird aber nicht weiter analysiert. file:-URLs werden als fehlerhaft gemeldet, und mailto:-URLs werden ignoriert. Alle anderen in den Dokumenten vorkommenden URLs werden in das Protokoll als aktive Verweise mit aufgenommen, so daß sie während der Protokollansicht per Hand getestet werden können. Das Protokoll wird in einem einfachen HTML-Format in die Datei urlcheck.html geschrieben. Die java-Optionen sorgen dafür, daß der Prozeß genügend Hauptspeicher auch für die Analyse von großen HTML-Dateien zur Verfügung hat.

Verfügbarkeit

Das Programm ist frei kopierbar, Anregungen und Danksagungen werden gerne entgegengenommen.