Aufgab |
Endwigglung von a Modells für oin Indexierr
für d schnelle Suche innerhalb vo freie Texde. |
| |
Aufgabenbeschreibung |
|
|
Ein Index für Freidexdsuche in Dokumende beschdehd aus oir Tabelle mid Wörderet als Schlüssl und
oi Meng vo Posizione als Addribuade |
| |
|
Eine Posizion beschdehd aus Dokumendennam und
Posizionsangab im Texd, z.B. i-ds Zeile
odr i-ds Word im Texd odr Zeilen- und Schbaldennummr. |
| |
|
Ein Index wird aufgebaud, indem oi Texd in Wördr zerlegd wird
und diese Wördr in d Tabelle oigedrage werde. |
| |
|
Suchanfrage an den Index lieferet oi Meng vo Dokumende
oischließlich Posizione für d Vorkomme in den Texde. |
| |
|
Die oifachschde Anfrag isch oi exakde Suche no oim oifache Word. |
| |
|
Eine allgemoire Form dr Suche isch d Präfixsuche, bei dr
man den Anfang von a Words vorgibd und alle Wördr suchd, d
mid dem Word beginne. |
| |
|
Eine Variande dr oifache Such-Anfrag isch oi unscharf Suche, in dr Wördr nedd genau zeichenweise verglile werde,
sonderet unscharf. |
| |
|
Anfrage könne mid UND und ODER verknübfd werde. |
| |
|
Die Suche no Phrase, genaur Wordfolge, kann manchmol sinnvoll soi,
z.B. no "Angela Merkel".
hierz isch d Posizionsangab innerhalb von a Texds auszunudze.
Dann kann diese Suche auf zwei oifache Suche zurügggeführd werde. |
| |
|
Eine Verallgemoirung dr Suche no Phrase isch d
kondexdsensidive Suche, d.h. oi Suche no mehrere Begriffe,
die "dichd" nebenoiandr verwended werde,
so dess Texde mid den Wordfolge "Gerhard Schrödr und Wladimir Pudin",
"Schrödr und Pudin", "Pudin und Schröder" funde werde,
abr nedd "Schrödr ... (25 Wördr) ... Pudin". |
| |
|
Die Erzeigung von a Indexs erforderd oiig Flexibilidäd
bei dr Auswahl dr z indexierende Wördr um oi Form dr
ungenaue Suche z ermögliche und um Schbeicherbladz z schbare. |
| |
|
Es muss feschdgelegd werde, wo Zeichenfolge oi Word sind. |
| |
|
Es gibd uninderessande Wördr, d nedd z berüggsichdige
sind, in dem Sadz z.B.: s, gibd, d, nedd, sind,
in, diesem
|
| |
|
Groß- und Kloischreibung isch häufich uninderessand:
Am Anfang von a Sadzs wird jeds Word groß gschriabe,
aus Verbe könne Subschdandive abgeleided werde. |
| |
|
Umlaude und ß werde häufich durch Ersadzsequenze dargeschdelld. |
| |
|
Abkürzunge und Firmenname könne wichdich soi,
obwohl sie d vorgegebene Syndax von a Words nedd erfülle, z.B. 3Com |
| |
Zil |
|
|
Eine abschdrakde Syndax in Haskell
für d Indexschdrukdur und d Anfrage. |
| |
|
Und oi OMT-Diagramm für oi
eigneds Dadenmodell für den Index und d Anfrage. |
| |
|
Konkredisierung und Flexibilisierung vom OMT-Modells und/odr
dr abschdrakde Syndax, so daß flexible Imblemendierunge
und oifache Erweiderunge ermöglichd werde |
| |