[ Inhalt ] [ Index ] Kommunikation im Internet Grundlagen der Arbeit Tool Command Language -

Techniken des World Wide Web

Historie

Das Word Wide Web (WWW), kurz auch ,,das Web`` genannt, ist der Informationsdienst im Internet, mit der größten Wachstumsrate, und bietet von allen Diensten im Internet die größte graphische Orientierung. 1995 wurden ca. 24 Millionen Internetbenutzer geschätzt (*).  

Das Web und die zugehörigen Techniken finden ihren Ursprung 1989 im Europäischen Zentrum für Hochenergiephysik CERN in Genf unter der Leitung von Tim Berners-Lee. Der Kern der Arbeiten war die Definition des Client/Server-Protokolls HTTP, welches bis heute die Basis der WWW-Dienste ist und nach wie vor in der Version 1.0 eingesetzt wird. Zu den Arbeiten zählt auch die Entwicklung eines Beispielservers sowie einer Programmbibliothek in C mit dem Namen wwwlib (*).

Der Grundstein, der in Genf gelegt wurde und die Verfügbarkeit der wwwlib löste eine Innovation bei unzähligen Unternehmen, Universitäten und Privatpersonen aus. Nunmehr stehen die unterschiedlichsten kommerziellen und nichtkommerziellen Web-Browser und -Server für alle kleinen und großen Rechnersysteme zur Verfügung. Mittlerweile gibt es kaum noch größere Unternehmen, Fernsehsender oder Parteien, die sich nicht mit einer ,,Homepage`` schmücken oder ihren Mitarbeitern einen Zugriff auf das Internet über das hauseigene Netzwerk ermöglichen.

Auch die Zahl der Anwender insbesondere im privaten Bereich steigt beständig an, was dazu geführt hat, das trotz des Ausbaus der Bandbreiten durch die Netzanbieter, die im Zusammenhang mit dem Internet stets ,,Provider`` genannt werden, von einem ,,Information-Highway`` zu bestimmten Tageszeiten kaum mehr die Rede sein kann.  

Der ernorme Erfolg des World Wide Web überstieg die Möglichkeiten des CERN im Hinblick auf die Weiterentwicklung. Aus einer Kooperation des CERN mit dem Massachusetts Institute of Technology (MIT) entstand des World Wide Web Consortium (W3C), das bis heute die Weiterentwicklung, unterstützt durch Beiträge industrieller Mitglieder vorantreibt, und dessen Spezifkationen auch Basis dieser Diplomarbeit sind.

HTTP-Protokoll und Server

Das Hypertext Transfer Protocol

    Zur Kommunikation zwischen Web-Browser und Web-Server wird das HyperText Transfer Protocol (HTTP) eingesetzt. Das HTTP-Protokoll ist eine sogenanntes ,,lightweight``-Protokoll. Dies bedeutet, jede Anfrage des Clients an den Server mit der Bitte um ein Dokument stellt eine Verbindung her, über welche das Dokument übertragen wird, und baut diese anschließend wieder ab. Diese Eigenschaft war eines der gößten Probleme bei der Lösung der Aufgabenstellung, wie in [*] dargestellt wird.

Common Gateway Interface - CGI

Üblicherweise sind alle Seiten, die durch den Web-Browser angezeigt werden als Dateien auf dem Host gespeichert, auf dem der Web-Server aktiv ist. Dieser übergibt dem Browser auf Anfrage lediglich den Inhalt der Seite und dessen Format.

Diese sehr statische Vorgehensweise erlaubt in der Regel nicht die Abfrage von gezielten Informationen, und wird aufgebrochen durch das CGI-Gateway. Dies ist eine Schnittstelle zwischen dem Web-Server und externen Programmen, die anstelle vordefinierter Dateien, dynamisch eine Seite erzeugen und an den Browser übergeben. In der Regel werden diese Programme als kurze Shell-, Perl- oder TCL-Skripte realisiert und bearbeiten beispielsweise Suchanfragen oder Online-Bestellungen.

Hypertext Markup Language - HTML

HTML ist eine Seitenbeschreibungsprache, die vollständig durch SGML definiert ist. Es handelt sich in diesem Sinne um einer Untermenge von SGML, was jedoch nicht bedeutet, daß diese direkt zueinander kompatibel sind, sondern die Syntax von HTML wird lediglich mittels SGML festgelegt. Die HTML-Standards 2.0 und 3.0 wurden durch das W3-Consortium jeweils durch SGML-Dokumente herausgegeben.

HTML besteht aus Fließtext, der durch sogenannte ,,Tags`` formatiert wird. Ein Tag wird durch die Zeichen ,,<`` und ,,>`` eingeschlossen. Neben einfachen Tags zur Festlegung der Schriftgröße wie beispielsweise:

Normalschrift<H1>Grossschrift</H1>Normalschrift

lassen kompliziertere unter anderem auch das Einbinden von Bildern und anderen graphischen Elementen in den Text zu.

Der wichtigste Tag von HTML ist zweifelsohne derjenige, der erst die weltweite Verknüpfung von Dokumenten zuläßt. Die Adressierung von Dokumenten ist weltweit möglich und wird durch einen Uniform Resource Locater (URL) vorgenommen. Dieser Tag und der Aufbau des Tags mit einer URL ist wie folgt:

<A HREF=http://www.home.de/homepage>Welcome</A>

Die erste durch den Doppelpunkt getrennte Angabe spezifiziert das Protokoll, das verwendet werden soll. In obigem Beispiel ist dies das HTTP-Protokoll zur Verbindung mit einem Web-Server. Zu weiteren Protokollen, die anstelle von HTTP angegeben werden können, zählen telnet, ftp und andere. Dem Protokoll folgt die Internetadresse, oder der Name des Hosts(*) auf dem das Zieldokument, dessen Name dem Host folgt, abgelegt ist.

Multipurpose Internet Mail Extensions Protocol MIME

Ursprung von MIME

Als UNIX 1978 bei den Bell Laboratories in größerem Umfang eingesetzt wurde, war bald klar, daß eine Möglichkeit gesucht werden mußte, mit der Dateien von einem UNIX-Rechner auf einen anderen übertragen werden konnte. Zur Lösung dieses Problems entstand uucp (UNIX to UNIX Copy), ein Programm zur Datenfernübertragung über mehrere Etappen (hops) von UNIX-Systemen mit automatischer Wähfunktion(*).

Da uucp zunächst lediglich in der Lage war reinen Text zu versenden, dieser durch das store-and-forward Übertragungsverfahren den Zeichensatzbedingungen verschiedenster Systeme unterlag und dadurch gelegentlich verfälscht wurde, entstand Bedarf an einer Kodierung, die eine Untermenge aller bekannten Zeichensätze ist. Auch die Übertragung von Binärdaten wie Programmen stellte ein Problem dar, da auch bei diesen eine verlustfreie Übertragung nicht gesichert war und beispielsweise durch Abschneiden des höchstwertigen Bits gestört werden konnte. Die Probleme wurden durch Erweiterung des uucp Paketes um die Programme uuencode und uudecode gelöst, dessen Kodierung Vorläufer des MIME-Protokolls ist.      

Bedeutung von MIME für das Internet

  Das MIME Format selbst wird im Internet nach wie vor neben dem Format von UUCP vorwiegend für die Übertragung elektronischer Nachrichten verwendet. Neben dem Inhalt eines Dokumentes wird dessen Art durch seinen MIME-Typen beschrieben, der aus Haupt- und Untertypen besteht. Der Haupttyp legt fest um welche Art von Informationen es sich handelt, wie Text, Bilder, Töne oder Filme, der Untertyp legt fest in welchem Format diese Informationen vorliegen. Der Mime-Typ image/gif bezeichnet ein Bild im GIF-Format.

Für das HTTP-Protokoll ist weniger die MIME-Kodierung von Bedeutung, sondern lediglich der MIME-Typ ist fester Bestandteil des Protokolls. Jeder Art von Daten, die über das HTTP-Protkoll übertragen werden, wird der Typ vorangestellt. Für HTML-Dokumente ist dies text/html. CGI-Gateways wird vom Web-Server vor dem Aufruf mitgeteilt, welche Formate akzeptiert und geliefert werden dürfen. Für die Realisierung des Hypertext Informations- und Hilfesystems wurde das MIME-Format verwendet, um binäre Daten in der Klassenbibliothek hinterlegen zu können.


[ Inhalt ] [ Index ] Kommunikation im Internet Grundlagen der Arbeit Tool Command Language -

VDM Class Library