Vergleich |
von Programmen, Quellen und Texten auf
Ähnlichkeit.
Mit unterschieldlichen Filtern, die frei kombiniert und konfiguriert
werden können, sollen Texte auf Ähnlichkeiten untersucht
werden.
Damit soll es möglich sein das Kopieren von
Software-Teilen zu erkennen, zum Beispiel für C und Java,
auch wenn in den Quellen Umbenennungen, Umformatierungen
und Änderungen in der Reigenfolge vorgenommen wurden.
Diese ist aber nicht das einzig denkbare Anwendungsfeld: Spam-Filter
können mit dieser Technik ebenfalls realisiert werden,
ebenso Filter, die Codeverdopplung in Programmen erkennen.
|