Grundsätzliches [AIMA]

Es gibt zwei Typen von Sprachen: formale und natürliche Sprachen.

Eine formale Sprache (z.B. Prolog) ist fest definiert, wodurch sie einfacher zu bearbeiten ist.
Eine formale Sprache ist definiert als eine Folge von Strings. Ein Sring ist definiert als eine Sequenz von Terminal-Symbolen. Terminal-Symbole bilden die endliche Menge (bei englisch ca. 400000) der verfügbaren Worte, also den Wortschatz.
Ein String kann in Phrasen unterteilt werden (z.B. Nomen-Phrasen - np, Verb-Phrasen - vp, etc). Diese Phrasen erlauben die Erstellung von syntaktischen Regeln sowie eine Zuordnung von Semantik.

Natürliche Sprache

Eine natürliche Sprache (z.B. englisch) ist wesentlich umfangreicher, wodurch eine höhere Flexibilität erreicht wird.
Wegen folgender Punkte lässt sich eine natürliche Sprache nicht als eine einfache Folge von strings charakterisieren:

es gibt unterschiedliche Wortschätze (aussie, kiwi, cockney, yank, ...)

die Sprache verändert sich mit der Zeit (z.B. Fräulein, Innovation...)
Wortkonstrukte sind verständlich obwohl falsch (z.B. Verona Feldbusch)
Wortkonstrukte sind weder richtig noch falsch (z.B. "next to whom did you stand?")

Sprache für Spracherkennung [SHOHAM]

Die Sprache, die im Laufe dieses Vortrages erarbeitet wird, ist eine definierte Untermenge der natürlichen Sprache englisch. Englisch wurde wegen der Einfachheit der Sprache gewählt - deutsch ist wegen der wesentlich umfangreicheren Grammatik zu komplex.
Durch diese "Mischung" der beiden Sprachtypen, ergibt sich die Möglichkeit der Nutzung von Hilfsmitteln der formalen Sprach-Theorie bei der Bearbeitung der "natürlichen" Sprache.
Ausserdem können durch die Definition einer eigenen Sprache eine Menge Probleme umgangen werden :-)

Für die Definition einer eigenen Grammatik werden folgende Symbole benötigt:

Nicht-Terminal-Symbole

s für Satz
np für Noun-Phrase
vp für Verb-Phrase

Terminal-Symbole

pronoun --> [i].
verb --> [go].

Mit Hilfe dieser Symbole lassen sich die Sprache definierende Regeln aufstellen:

Regeln (Definite Clause Grammar, bereits in Prolog implementiert)

s --> np,vp.
np --> pronoun.
vp --> verb.

Diese Regeln besagen, dass eine als np kategorisierte Liste gefolgt von einer als vp kategorisierten Liste einen gültigen Satz s ergibt.

[nach oben] [zum Index] [weiter]