Die Datenbank Medline mit der Suchsoftware Knowledge finder[2]
unterscheidet sich von den traditionellen Medline-Angeboten in einem
entscheidenden Bereich. Die Retrieval-Software arbeitet neben der
Anwendung der Booleschen Suchlogik nach dem Prinzip der Fuzzy set
theory, der Theorie der unscharfen Mengen. Die hier zur Anwendung
kommende Software baut auf der Erkenntnis der von Zadek in den
sechziger Jahren entwickelten Theorie auf, die die Berechnung des
Grades der Zugehörigkeit zu einer unscharfen Menge leistet und dem
Benutzer ein nach Relevanz geordnetes Retrievalergebnis anzeigt.[3] Für
den Benutzer bedeutet der Umgang mit dem Knowledge finder eine
optimale Abkehr von dem starren System der Booleschen Operatoren, auf
die bei einer Literaturrecherche gänzlich verzichtet werden kann.
Dem Benutzer wird auf einer farbigen, graphisch ansprechenden und
übersichtlichen Windows-Oberfläche ein sofort in das Auge springendes
großes Freitextfeld offeriert. In dieses Feld können
natürlich-sprachige Wörter oder auch ganze Sätze und Fragen eingegeben
werden. Mit einem Mausklick auf ein kleines grünes Männchen, dem
Search runner, wird die Suche gestartet. Während des Suchprozesses
werden die Stoppwörter automatisch aus der Anfrage eliminiert. In der
Bildmitte kann der Benutzer in blauer Schrift verfolgen, wie die
Software alle eingegebenen Wörter trunkiert und damit eine Suche nach
Wortvarianten ermöglicht. Bei unterschiedlichen Schreibweisen (z. B.
tumor, tumour) werden alle Schreibweisen bei der Suche mit
berücksichtigt. Da der Knowledge finder ein umfangreiches eingebautes
Regelwerk anwendet, ist er auch dazu in der Lage, nicht nur Begriffe
aus einer Wortfamilie, sondern auch verschiedene linguistische
Varianten einer Suchanfrage zu finden (foetus und fetal) und
gegenseitig zu substituieren. Der Search progress kann anhand einer
Skala auf der Oberfläche oben rechts mitverfolgt werden. Liegt ein
Schreibfehler in der Suchanfrage vor, wird der Suchprozeß
unterbrochen. Ein Wort-Index erscheint auf der Oberfläche und weist
den Benutzer auf die richtige Schreibweise hin. Mit einem Mausklick
auf das richtig geschriebene Wort wird die Suche fortgesetzt. Nach dem
Ende des Suchvorgangs werden Kurztitel angezeigt, die sich durch einen
Mausklick in eine Vollaufnahme mit Abstract verwandeln. Sowohl
dreidimensional dargestellte Pfeile als auch die Pfeiltasten der
Tastatur ermöglichen das Vor- und Rückwärtsblättern, ein Print- und
Save-Icon speichern nach einem Mausklick die gefundenen Dokumente ab
und ermöglichen auch einen späteren Ausdruck. Eine Graphik informiert
den Benutzer über das Ergebnis seiner Recherche. Auf einen Blick kann
anhand einer Relevanzkurve das Ergebnis jeder Recherche abgelesen
werden. Hier wird jedes Dokument nach dem Grad der Übereinstimmung mit
der Fragestellung gewichtet und in ein Ranking-System nach
absteigender Relevanz eingeordnet. Da nun die wichtigsten Dokumente
entsprechend der Fragestellung am Anfang stehen, wird es dem Benutzer
erspart, lange Listen mit gefundenen Dokumenten durchzusuchen. Bei der
Relevanzüberprüfung jedes Dokumentes erhalten gesuchte Wörter, die im
Titel stehen, eine Vorrangstellung gegenüber den Wörtern aus den
Abstracts. Begriffe aus dem Thesaurus werden gegenüber den
Abstractwörtern bevorzugt. Die Major subject headings werden mit den
Wörtern aus den Titeln gleichwertig gewichtet. Die Subheadings werden
vor den Wörtern im Kontext der Datenbank aus den Abstracts
berücksichtigt. Neben den Wortpositionen innerhalb eines Dokumentes
wird auch die Häufigkeit des Auftretens innerhalb der gesamten
Datenbank berücksichtigt, und zwar invers zu Wiederholungen eines
Begriffes im gleichen Dokument. Grundsätzlich wird also davon
ausgegangen, daß ein Dokument, in welchem ein gesuchtes Wort
wiederholt auftritt, einen höheren Stellenwert erhält als ein solches
mit einmaliger Erwähnung. Sehr häufig in der Datenbasis vorkommende
Wörter wie diseases oder pain erhalten in Verbindung mit einem
seltener vorkommenden Wort geringeres Gewicht, da das seltenere Wort
- einem allgemeinen informationstheoretischem Grundsatz gehorchend
- eine spezifischere Aussagekraft hat.
Nach jeder Literaturrecherche erhält der Benutzer aufgrund einer
Voreinstellung bis zu 100 Dokumente höchstens angezeigt. Wird eine
Erhöhung der anzuzeigenden Dokumente gewünscht, kann die
Voreinstellung entsprechend variiert werden. Durch die Verschiebung
eines Relevanz-Filters ist die Manipulation des Verhältnisses zwischen
Recall und Precision möglich. Der Relevanz-Filter ist standardmäßig
auf eine Relevanzschwelle von 50 Prozent eingestellt, d. h., daß
mindestens die Hälfte der in der Suchanfrage gestellten Begriffe im
Titel oder als Major subject heading vorkommen muß, um berücksichtigt
zu werden. Eine Verschiebung nach rechts bedeutet mehr Precision und
bewirkt entsprechend eine Verringerung des Recalls. Eine Verschiebung
nach links bedeutet weniger Precision und einen höheren Recall.
Die Suchergebnisse können vielfältig durch weitere Wahlmöglichkeiten
optimiert werden. Unter dem Freitextfeld können der komplette
MeSH-Thesaurus und weitere Verzeichnisse, geordnet nach Autorennamen,
Indexing dates, Zeitschriftentiteln, Sprachen und formalen
Gesichtspunkten (Subject check tags), aufgerufen werden. In diesem
Index greift der Knowledge finder wieder teilweise auf Boolesche
Prinzipien zurück. Mit Hilfe der Operatoren use only, try to use und
don't use können Freitextsuchen weiter gezielt mit einem
entsprechenden Mausklick eingeschränkt werden. Der Operator use only
entspricht dem Booleschen AND, der Operator don't use dem Booleschen
NOT. Der neue Operator try to use ist ein Produkt der probalistischen
Logik und bedeutet so viel wie: "Das hätte ich, falls möglich, am
liebsten mit berücksichtigt, muß aber nicht zwingend sein, falls es
keine Volltreffer gibt." Im Gegensatz zum Booleschen minimal or
handelt es sich hier um ein maximal or oder auch hyper or, welches bei
der Suche zum Beispiel nach Früchten wie Bananen, Birnen, Ananas und
Äpfeln automatisch und vorrangig nach einer möglichst vollen
Fruchtschale sucht und möglichst nicht nur eine Frucht als
Suchergebnis ausweist.
Unterhalb der Indizes befinden sich noch zwei alternative
Möglichkeiten der Spezifizierung (Reviews only, English only), die mit
der Maus angekreuzt werden können. Aus der Praxis ist bekannt, daß der
Benutzer während der Bearbeitung einer Recherche, insbesondere während
der Lektüre der Abstracts, zu weiteren für die Fragestellung wichtigen
Suchbegriffen angeregt wird. Der Knowledge finder bietet dem Benutzer
an, ein Wort, einen Satz oder auch eine ganze Textpassage aus einem
gefundenen Dokument in eine bestehenden Suchanfrage ohne
Rechtschreibfehler durch Kennzeichnung mit der Maus zu übernehmen.
In der neuen Version 3.20d7 des Knowledge finders (Beta-Version,
welche dem Rezensenten vorlag,) kommen auch die mit dem Umgang der
Booleschen Logik vertrauten Experten auf ihre Kosten. Die Fuzzy-Logic
kann auf Wunsch ausgeschaltet werden, um nur mit Hilfe der Booleschen
Operatoren suchen zu können (Feld im Freitextfeld mit der Möglichkeit
der Trunkierung und Klammerung und beliebig komplexer Schachtelung).
Neu an dieser Version ist auch, daß die Sortierung der gefundenen
Dokumente nach Relevanz durch eine Sortierung nach Aktualität
(Recency) ersetzt werden kann.
Der Produzent des Knowledge finder bietet weitere Zusatzsoftware zur
Erleichterung der Weiterverarbeitung der gefundenen Dokumente an (Easy
order, Library holdings, Aufbau eigener Datenbanken und
Bibliographien). Für den bibliothekarischen Bereich sind die
Easy-order-Funktion sowie das Library-holdings-Programm von
Interesse.[4] Aufgrund von Verträgen des Produzenten mit dem DIMDI und
verschiedenen Bibliotheken (bisher: Zentralbibliothek der Medizin,
Köln; Bayerische Staatsbibliothek, München; Technische
Informationsbibliothek, Hannover) sind die Standorte und Signaturen
von zahlreichen der in der Medline-Datenbank ausgewerteten
Zeitschriften nachgewiesen. Jedesmal, wenn bei einem Dokument ein
Bücherregal auf der Oberfläche links neben der Relevanzgraphik
erscheint, kann mit einem Mausklick auf das Bücherregal der Standort
der Zeitschrift einer Bibliothek ermittelt werden. Über das Programm
Easy order lassen sich dann die vorher abgespeicherten Dokumente
direkt in ein elektronisches Bestellformular übertragen, welches über
ein Modem an eine der besitzenden Bibliotheken übertragen werden kann.
Der Benutzer kann mit seiner Maus ankreuzen, ob er die Bestellung
eines Aufsatzes durch eine Postsendung (Eilauftrag, Brief) oder durch
eine unverzüglich zu erledigende Faxsendung wünscht. Das
Library-holdings-Programm bietet den Bibliotheken auch die
Möglichkeit, ihre eigenen Bestände an Zeitschriften dem Benutzer der
Medline-Datenbank durch Verzeichnung der lokalen Signaturen in diesem
Programm direkt bekanntzumachen.
Kürzlich durchgeführte Untersuchungen haben gezeigt, daß der Umgang
der Benutzer mit dem MeSH-Thesaurus problematisch ist. Die
Differenzierungen zwischen MeSH, Entry term, Non-MeSH-heading, Major
subject heading, Minor subject heading, Subheading, Floating
subheading, Tree down und MeSH explosion sind einer Großzahl der
Benutzer nicht bekannt. Die Folge ist ein fehlerhafter Umgang mit dem
MeSH-Thesaurus.[5] Der Knowledge finder bietet hier dem Benutzer durch
die Einbeziehung des MeSH-Thesaurus in einer natürlich-sprachlich
formulierten Suche eine Hilfestellung an. Die Boolesche Logik
unterscheidet ein Retrieval-Ergebnis lediglich in "wahrscheinlich
relevante Dokumente (= Treffermenge) und wahrscheinlich irrelevante
Dokumente (= Rest)",[6] der Knowledge finder berücksichtigt mit Hilfe
der probalistischen Suchlogik, durch die Gewichtung der einzelnen
Dokumente und Suchbegriffe (probalistisches Ranking), durch seine
automatisierte Wortvariantensuche und durch die Anzeige auch von
wahrscheinlich weniger relevanten Dokumenten das Umfeld einer
Fragestellung. In zahlreichen Fällen zeigt er zusätzlich noch weitere
relevante Dokumente an, die nach den strengen Booleschen Regeln nicht
gefunden worden wären.
Trotz des Lobes auf die hier angewandte probalistische Logik sollte
man auf die Boolesche Logik nicht verzichten. Bei manchen
Fragestellungen mit sehr konkreten Sachverhalten ziehen vor allem
geübte Benutzer und Experten die Anwendung der Booleschen Logik vor.
Der Knowledge finder ermöglicht dem Benutzer die Anwendung beider
Alternativen einschließlich ihrer Kombination.
Es sei an dieser Stelle noch erwähnt, daß die Datenbank Medline,
Knowledge finder in einer komprimierten Form auf CD-ROM gepreßt wurde.
So sind die letzten fünf Jahrgänge auf lediglich zwei CD-ROMs
erhältlich, wobei die Daten mit einem Einzel-CD-ROM-Laufwerk gelesen
werden können. Die vollständige Datenbank Medline seit 1966 ist auf
insgesamt sieben CD-ROMs reduziert worden. Der Knowledge finder kann
unter DOS, Windows und Macintosh mit gleichartiger
Programm-Funktionalität betrieben werden.
Seit der Knowledge finder im Sommer 1994 in der Benutzungsabteilung
der Universität Witten/Herdecke eingesetzt wurde, läßt sich ein
deutlicher Rückgang an Fragen der Benutzer gegenüber der Auskunft
verzeichnen. Diese Feststellung gilt sowohl für die Studenten als auch
für die Mitarbeiter und Dozenten der Universität. Die Umstellung auf
das Knowledge finder-System ist eindeutig von allen Benutzergruppen
begrüßt worden.
Der bestechend einfache Umgang mit der Retrieval-Software, die
übersichtliche, graphisch ansprechende Gestaltung der Oberfläche des
Knowledge finder, das Angebot des Online-Orderings der recherchierten
Dokumente sowie die hier gebotene Kombination von probalistischer und
Boolescher Logik charakterisieren den Knowledge finder als ein
durchdachtes, offenes und modulares System auf dem Gebiet des
medizinischen Information-Retrievals, welches auch für andere Bereiche
wie etwa für die OPACs in unseren Bibliotheken wichtige Anregungen
vermitteln könnte.
Zurück an den Bildanfang