Entwicklung und Nutzen von XML
Was ist XML, was kann es?
Sinn und Zweck von XML
In diesem Abschnitt sollen die Grundsätze, die hinter der Schaffung von XML standen, erläutet werden:
- Anwendungsspezifische Auszeichnungen
- Eindeutige Stukturen
- Trennng von Inhalt und Layout
- Einfachheit
- Bestmögliche Fehlerüberprüfung
Anwendungsspezifische Auszeichnungen
XML schreibt keinen festen Satz von Auszeichnungselementen vor, wie etwa HTML. So wie HTML durch SGML definiert ist, so kann man mit XML seine eigene Auszeichnungssprache mit beliebigen Tags definieren. Man braucht nicht mehr auf Allzweck-Tags (z.B. einen Absatz) zurückgreifen und hoffen, dass diese immer und überall passen, sondern man hat es selbst in der Hand, welche Tags man verwenden möchte und wie diese formatiert werden sollen. Auszeichnungselemente wie
<GegliederteListe>, <RechnungsPosition> oder
<Kapitel> sind nun kein Problem mehr. Mit XML können Auszeichnungssprachen für spezielle Situationen, z.B. den Datenaustausch zwischen zwei Unternehmen, aber auch für allgemein relevante, internet-weite Anwendungsgebiete festgelegt werden.
Eindeutige Strukturen
Wenn es um die Struktur von Dokumenten geht, verfolgt XML eine strikte Linie. Dokumente sollten immer so ausgezeichnet werden, das sie immer auf die gleiche Weise interpretiert werden können in Bezug auf Namen, Reihenfolge und Hierarchie der Elemente. Dies reduziert die Komplexität des Codes und Möglichkeiten Fehler zu machen erheblich. Programme zur Verarbeitung von XML brauchen nun keine Syntaxfehler mehr zu korrigieren, wie es etwa HTML-Browser tun, sondern geben aussagekräftige Fehlermeldungen aus und ermahnen den Entwickler geradezu, diese strikten Strukturen und Syntaxregeln einzuhalten. Dadurch werden auch Inkonsistenzen verhindert, wenn beispielsweise Dokumente mit unterschiedlichen Programmen interpretiert oder verarbeitet werden. Entweder liefern alle Programme dasselbe Ergebnis oder sie werfen mit entsprechenden Fehlermeldungen um sich, bis das Ergebnis stimmt. Diese strengen Strukturen erschweren sicherlich das Auszeichnen von Dokumenten, da diese hinterher mit einem Überprüfungsprogramm, einem Parser, kontrolliert werden müssen. Es macht jedoch aus obigen Gründen Sinn, diese Strukturen einzuhalten und ein paar Minuten mehr Zeit zu investieren beim Erstellen solcher Dokumente.
Trennung von Inhalt und Layout
Damit Dokumente flexibel bleiben und für verschiedene Anwendungsgebiete optisch aufbereitet werden können, ist die Trennung von Inhalt und Layout einer der Kernpunkte bei XML. Es ist aus vielen Gründen sinnvoll, eine Kopplung von Inhalt und Layout, wie es bei HTML oft der Fall ist, aufzubrechen und die Formatierungsanweisungen aus dem Dokument fernzuhalten und in ein Stylesheet auszugliedern.
- Stylesheets können für unterschiedliche Dokumente wiederverwendert werden
- Ändeungen von Formatierungen können zentral im Stylesheet an einer einzigen Stelle vorgenommen werden
- Unterschiedliche Stylesheets sind für unterschiedliche Ausgabemedien möglich (Druck, Web, Monitor)
- Der Austausch von Stylesheets für ein Dokument ist problemlos "on the fly" möglich
- Inhalt und Struktur eines Dokumentes bleiben erhalten, egal wie man am Layout herumspielt
- Dokumente sind leicht zu lesen und nicht mit Formatierungsvokabular überladen (HTML)
- Ohne Formatangaben kann man passendere Namen für Auszeichnungen wählen
Einfachheit
Die Einfachheit von Dokumenten ist für die Anwendungsentwicklung essentiell, da der Öffentlichkeit umso mehr Programme zur Verfügung gestellt werden, je einfacher es ist, Software zur Be- und Verarbeitung von XML zu entwickeln. Diese Einfachheit ergibt sich aus der Tatsache, dass XML eine "schlanke Untermenge" von SGML ist und einiges der Komplexität von SGML weggelassen wurde bei XML. Diese Einfachheit führt auch zu einer gewissen Vielfalt. So können zum Beispiel die angesprochenen Stylesheets mit einer auf XML beruhenden Sprache (XSL) definiert werden oder Schemata (XML-Schema) zur Modellierung von Dokumenten als weitere Form von XML angegeben werden. Durch diese weite Verbreitung von XML kann man mit denselben Werkzeugen unterschiedliche Technologien verarbeiten.
Bestmögliche Fehlerüberprüfung
Auszeichnungssprachen wie HTML etwa gehen recht nachsichtlich mit Syntax-Fehlern von Entwicklern um, was zu Fehlern bei der Darstellung der Dokumente, falschem Verhalten von Programmen und Verlust von Informationen führen kann. Solche Fehlerfälle werden beim Überprüfen von XML-Dokumenten durch bereits erwähnte Parser abgefangen. Ein Parser überprüft die Wohlgeformheit von XML-Dokumenten, die nur gegeben ist, wenn die Dokumente den Auszeichnungsregeln von XML entsprechen. Zusätzlich kann die Gültigkeit bezüglich einer DTD oder einer Schemadefinition überprüft werden. Diese Gültigkeit ist gegeben, wenn das Dokument nicht gegen die in der DTD oder der Schemadefinition formulierten Regeln verstößt. Man mag anfangs ein wenig über die Strenge von XML verärgert sein, denn sie kostet letztendlich Entwicklungszeit und sicher auch Nerven, aber die Dauerhaftigkeit und Nützlichkeit von Dokumenten sprechen für sich.
Leistungsmerkmale von XML
Die folgende Liste gibt einen Überblick über die Leistungsmerkmale von XML:
- Mit XML können beliebige Informationen gespeichert und dargestellt werden, und zwar in einer Form, die auf die jeweilige Anwendungssituation angepasst ist.
- XML ist ein offener Standard und damit nicht an bestimmte Unternehmen oder Software gebunden.
- Durch die Benutzung von Unicode als Standard-Zeichensatz unterstützt XML eine sehr grosse Menge von Schriften.
- XML ist durch seine einfache und klare Syntax und seine eindeutige Struktur einfach von Menschen und Programmen zu lesen und analysieren.
- Durch die Fernhaltung der Formatinformationen aus dem Dokument mittels Stylesheets wird die Informationsstruktur nicht beeinflußt.
- XML-Dokumente sind weitestgehend selbstdokumentierend, was die Lesbarkeit enorm erhöht.
- Mit XML können Daten zwischen Benutzern und Programmen plattformunabhängig ausgetauscht werden