Einführung in Lucene
[ Seminar "Java und Werkzeuge für das Web" ] ...
[ Inhaltsverzeichnis ] ...
[ zurück ] ...
[ weiter ] ...
[ Links und Literaturverzeichnis ]
[ eMail an den Autor ]
Übersicht: Einführung in Lucene
Jakarta Lucene is a high-performance, full-featured text search engine written entirely in Java. It is a technology suitable for nearly any application that
requires full-text search, especially cross-platform.
Jakarta Lucene ist eine leistungsstarke, vollfunktionsfähige Text-Suchengine, geschrieben in Java. Es ist eine Technologie, die für fast jede mögliche Anwendung
verwendbar ist, die Ganztextsuche erfordert, besonders Cross-Plattform.
Lucene ist allerdings keine fertige Suchmaschine sondern stellt Klassen und Funktionen zur Verfügung, um für beliebige Projekte
eine eigene Suchmaschine zu bauen.
Zunächst wird der gesamte zu durchsuchende Text (alle Dateien)
indiziert.
Dann wird mit Hilfe des Indizes gesucht.
Skalierbares, High-Performance Indexing
- über 200MB/Stunde auf einem Pentium II/266
- Erweitern des Index genau so schnell, wie das Erstellen eines neuen Index
- geringer RAM-Bedarf, nur 1 MB auf dem Heap
- Indexgröße ungefähr 30% des ursprünglichen Textes
Mächtige, akurate und effiziente Suchalgorithmen
- Gewichtetes Suchen, die besten Resultate zuerst
- Suche mit booleschen Operatoren und Phrasen
- Feldsuche, z. B. Dokumentname und Inhalte
- Datum-gewichtete Suche
Einfache API erlaubt es Entwicklern,
- neue Dokumenttypen miteinzubeziehen
- für weitere Sprachen zu lokalisieren
- neue Benutzerinterfaces zu entwickeln
Plattformübergreifende Lösung
[ Seminar "Java und Werkzeuge für das Web" ] ...
[ Inhaltsverzeichnis ] ...
[ zurück ] ...
[ oben ] ...
[ weiter ] ...
[ Links und Literaturverzeichnis ]
[ eMail an den Autor ]