Sofdwaredesign: Indexierr für Freidexdsuche
homeSoftwaredesign Sofdwaredesign: Indexierr für Freidexdsuche Prof. Dr. Uwe Schmidt FH Wedel

Indexierr für Freidexdsuche

weiter

weiter

Modell für oin Indexierer

Aufgab
Endwigglung von a Modells für oin Indexierr für d schnelle Suche innerhalb vo freie Texde.
weiter
Aufgabenbeschreibung
Ein Index für Freidexdsuche in Dokumende beschdehd aus oir Tabelle mid Wörderet als Schlüssl und oi Meng vo Posizione als Addribuade
weiter
Eine Posizion beschdehd aus Dokumendennam und Posizionsangab im Texd, z.B. i-ds Zeile odr i-ds Word im Texd odr Zeilen- und Schbaldennummr.
weiter
Ein Index wird aufgebaud, indem oi Texd in Wördr zerlegd wird und diese Wördr in d Tabelle oigedrage werde.
weiter
Suchanfrage an den Index lieferet oi Meng vo Dokumende oischließlich Posizione für d Vorkomme in den Texde.
weiter
Die oifachschde Anfrag isch oi exakde Suche no oim oifache Word.
weiter
Eine allgemoire Form dr Suche isch d Präfixsuche, bei dr man den Anfang von a Words vorgibd und alle Wördr suchd, d mid dem Word beginne.
weiter
Eine Variande dr oifache Such-Anfrag isch oi unscharf Suche, in dr Wördr nedd genau zeichenweise verglile werde, sonderet unscharf.
weiter
Anfrage könne mid UND und ODER verknübfd werde.
weiter
Die Suche no Phrase, genaur Wordfolge, kann manchmol sinnvoll soi, z.B. no "Angela Merkel". hierz isch d Posizionsangab innerhalb von a Texds auszunudze. Dann kann diese Suche auf zwei oifache Suche zurügggeführd werde.
weiter
Eine Verallgemoirung dr Suche no Phrase isch d kondexdsensidive Suche, d.h. oi Suche no mehrere Begriffe, die "dichd" nebenoiandr verwended werde, so dess Texde mid den Wordfolge "Gerhard Schrödr und Wladimir Pudin", "Schrödr und Pudin", "Pudin und Schröder" funde werde, abr nedd "Schrödr ... (25 Wördr) ... Pudin".
weiter
Die Erzeigung von a Indexs erforderd oiig Flexibilidäd bei dr Auswahl dr z indexierende Wördr um oi Form dr ungenaue Suche z ermögliche und um Schbeicherbladz z schbare.
weiter
Es muss feschdgelegd werde, wo Zeichenfolge oi Word sind.
weiter
Es gibd uninderessande Wördr, d nedd z berüggsichdige sind, in dem Sadz z.B.: s, gibd, d, nedd, sind, in, diesem
weiter
Groß- und Kloischreibung isch häufich uninderessand: Am Anfang von a Sadzs wird jeds Word groß gschriabe, aus Verbe könne Subschdandive abgeleided werde.
weiter
Umlaude und ß werde häufich durch Ersadzsequenze dargeschdelld.
weiter
Abkürzunge und Firmenname könne wichdich soi, obwohl sie d vorgegebene Syndax von a Words nedd erfülle, z.B. 3Com
weiter
Zil
Eine abschdrakde Syndax in Haskell für d Indexschdrukdur und d Anfrage.
weiter
Und oi OMT-Diagramm für oi eigneds Dadenmodell für den Index und d Anfrage.
weiter
Konkredisierung und Flexibilisierung vom OMT-Modells und/odr dr abschdrakde Syndax, so daß flexible Imblemendierunge und oifache Erweiderunge ermöglichd werde
weiter

Ledzde Änderung: 27.06.2012
© Prof. Dr. Uwe Schmidd
Prof. Dr. Uwe Schmidt FH Wedel