Es gibt zwei Typen von Sprachen: formale und natürliche Sprachen.
Eine formale Sprache (z.B. Prolog) ist fest definiert, wodurch sie einfacher
zu bearbeiten ist.
Eine formale Sprache ist definiert als eine Folge von Strings. Ein Sring ist
definiert als eine Sequenz von Terminal-Symbolen. Terminal-Symbole bilden die
endliche Menge (bei englisch ca. 400000) der verfügbaren Worte, also den
Wortschatz.
Ein String kann in Phrasen unterteilt werden (z.B. Nomen-Phrasen -
np, Verb-Phrasen - vp, etc). Diese Phrasen erlauben die
Erstellung von syntaktischen Regeln sowie eine Zuordnung von Semantik.
Eine natürliche Sprache (z.B. englisch) ist wesentlich umfangreicher,
wodurch eine höhere Flexibilität erreicht wird.
Wegen folgender Punkte lässt sich eine natürliche Sprache nicht als
eine einfache Folge von strings charakterisieren:
Die Sprache, die im Laufe dieses Vortrages erarbeitet wird, ist eine
definierte Untermenge der natürlichen Sprache englisch. Englisch wurde
wegen der Einfachheit der Sprache gewählt - deutsch ist wegen der
wesentlich umfangreicheren Grammatik zu komplex.
Durch diese "Mischung" der beiden Sprachtypen, ergibt sich die
Möglichkeit der Nutzung von Hilfsmitteln der formalen Sprach-Theorie bei
der Bearbeitung der "natürlichen" Sprache.
Ausserdem können durch die Definition einer eigenen Sprache eine Menge
Probleme umgangen werden :-)
Für die Definition einer eigenen Grammatik werden folgende Symbole benötigt:
Nicht-Terminal-Symbole
Mit Hilfe dieser Symbole lassen sich die Sprache definierende Regeln
aufstellen:
Diese Regeln besagen, dass eine als np kategorisierte Liste gefolgt
von einer als vp kategorisierten Liste einen gültigen Satz
s ergibt.