Web Profiler

Web-Roboter zum Analysieren von HTML-Dokumenten und ganzen Dokumenten-Bäumen

Web Profiler
Ein Programm, das ein HTML-Dokument auf Größe, Anzahl der Bilder, Umfang des Textes und Größe der Bilder und Übertragungsanforderungen analysiert.

Es soll in einem HTML-Dokument festgestellt werden, wieviel signifikate Information darin enthalten ist, wie das Verhältnis Information zu Formatierungsanweisungen ist, wieviele (verschiedene) Bilder darin enthalten sind, wie groß die zu übertragenden Bilder sind. Aus diesen Daten können dann Abschätzungen über die Übertragungsdauer und Zugriffszeit gemacht werden, z.B. die Ladedauer für Modem, ISDN, ...

Diese Statistik ist nicht nur für eine Seite, z.B. eine Heimatseite sinnvoll, sondern auch für ganze Dokumentenbäume, in diesen Fällen können sich die Übertragungszeiten durch caching verbessern.

Programmiersprachen und Werkzeuge
100% Java, JDK 1.4
Umgebung
stand alone
Das Programm soll als Kommandozeilen-Anwendung aufrufbar sein: Eingabe nur über Kommandozeilenparameter, Ausgabe über die Standardausgabekanäle. Über Parameter soll gesteuert werden können, welche Teile eines Dokumentenbaumes analysiert werden und welche ausgeblendet werden sollen. Die Anzahl der Klicks ist hierbei eine nur unzureichende Variante. Die Ausgabe soll ein HTML-Dokument sein, in dem das Protokoll einschließlich der Programmparameter grafisch aufbereitet ausgegeben werden soll.
GUI
Das Programm soll in einer erweiterten Variante über eine grafische Benutzungsschnittstelle bedienbar sein. Diese soll mit den neueren Java GUI Klassen (swing) realisiert werden.

Hauptnavigation