Themadat V4.0 Assoziativ - Assoziatives Suchen am Puls der Zeit

Die erste assoziative Datenbank für den ATARI ST will sie sein, und damit sich unterscheiden von den bewährten und altbekannten Datenbankkonzepten à la Adimens oder dBASE. Themadat V4.0 ist ein typisches Aufsteigerprodukt, das in relativ kurzer Zeit schon einige Versionsänderungen auf dem Buckel hat. Begonnen hat die Entwicklung wohl als Public Domain-Software, bis der Programmierer, Hartmut von Tryller, beschloß, ein professionelles Datenbankprogramm zu schaffen. Zum Preis von DM 249,- können Anwender, die eben nicht das klassische Aufgabenspektrum von Datenbanken, wie Stammdaten- und Adreßverwaltung, gebrauchen müssen, ihren Assoziationen freien Lauf lassen.

Zum Leistungsumfang von Themadat V4.0 gehört neben einer Systemdiskette ein Ringbuchordner mit der etwa 120 Seiten umfassenden Dokumentation. Sie führt nicht bloß überblickgebend in die Arbeitsumgebung der verschiedenen Datenbankressorts wie Maskenaufbau, Suchorganisation oder Texteditor ein, sondern bietet auch die notwendigen Hintergrundinformationen zur Theorie der spezifizierten assoziativen Datenbankorganisation.

Themadat ist nicht kopiergeschützt. Man kann das Datenbankprogramm und die Beispieldokumentation ohne spezielle Kopieranweisungen in einen Ordner auf der Festplatte installieren, allerdings braucht das reine Datenbankprogramm mit rund 330 kB schon eine Menge Speicherplatz. Beim Arbeiten mit Themadat stellt sich aber heraus, daß es vorhandenen Arbeitsspeicherplatz sehr sorgsam verwaltet und ständig nachfragt und Lese-/Schreibvorgänge anmeldet. Nach dem Starten des Programmes erscheint auf dem Bildschirm als erstes die Lizenznummer des Benutzers, danach erscheint die grafische Benutzeroberfläche von Themadat mit der in GEM typischen Menüleiste und einigen iconisierten Funktionstasten für spezielle Funktionsverzweigungen.

Theorie

Bevor Sie den Dialog mit Themadat aufnehmen, möchte ich Sie auf der theoretischen Seite versierter machen. Um mit einer assoziativen Datenbank zu kooperieren, müssen einige Vorüberlegungen zu Aufbau und Organisation der Datenstruktur vorhergehen. Am besten, belehrt das Handbuch, plant man in altbewährter Manier die Datenbankanlage mit Papier und Bleistift. Der Datenbankname Themadat ist sprechend, indem er sich unverkennbar aus den beiden Teilwörtern „Thema“ und “Datei“ zusammensetzt. Die ersten Schritte bestehen im Aufbau und dem Erzeugen einer spezifischen, an der geplanten Anwendung orientierten Datenmaske und einer Überlegung, wie hoch die Kapazität der Datensätze angelegt werden soll. Themadat verfügt über einen Maskeneditor, mit dem Text- und Datenfelder festgelegt werden können.

Dazu muß das Programm TEXTMASK-Programm eingeladen werden. Es können bereits vorhandene Textmasken bearbeitet oder neue erstellt werden. Durch ein Hilfsmenü ist die Befehlsliste dieses Programmteils dokumentiert. Ich greife mir gleich die schwierigste Aufgabe heraus und versuche, eine spezielle Maske für die Verwaltung von Literaturdatensätze zu edieren. Nach Anklicken von Maske erstellen erscheint ein Leerformular in etwa halber Bildschirmgröße. Wer schon einmal mit dem INIT-Programm von Adimens gearbeitet hat, weiß, wie schwierig es ist, auf Anhieb die richtige Maskendefinition zu finden. Die Volldefinition einer Datenbank gestaltet sich aber hier nicht so schwierig wie bei Adimens. Zum einen entfällt hier die Festlegung von mehreren Masken für verschiedene „Karteikästen“, zum anderen arbeitet Themadat mit einer vom Volumen her begrenzten Datenmaske. Wie in besagtem INIT-Programm müssen die Text- und Datenfelder inklusive der verschiedenen Feldtypen eindeutig benannt und festgelegt sein. Allerdings wird dieser Entwicklungsschritt von Themadat nicht so luxuriös geleistet wie bei der relationalen Datenbank Adimens. Die maximale Kapazität der Standardmaske liegt bei zehn Zeilen mit bis zu zweiundsiebzig Zeichen. Für normale Anwendungen wie Adreßverwaltung oder Kundendateien müßte das Maskenvolumen ausreichen; bei einer qualifizierten Maske für die Literaturverwaltung mit Zeilen für den Autor und eventuelle Co-Autoren, zwei Zeilen für den Titel, zwei für den Quellenverweis sowie die anderen notwendigen Angaben wie Erscheinungsort und -jahr, Verlagsname, Seitenzahl und spezifische Begriffsdefinitionen, die sog. Deskriptoren, Indexfelder, können da schon einmal Probleme mit der Maskenkapazität auftreten.

Das aufgekommene Problembewußtsein darf man nun getrost wieder zurückstauchen, nachdem man sich mit den Besonderheiten des assoziativen Datenbankkonzepts ein wenig vertrauter gemacht hat. Man muß nämlich wissen, daß das assoziative Suchverfahren die einzelnen Datensätze nach festdefinierten Begriffen, sie werden hier als „Themen“ bezeichnet, durchforstet. Und das kann nur präzise und sicher im Zugriff funktionieren, wenn jeder Datensatz so viele Informationen wie nötig und so wenig wie möglich enthält. Eine Differenzierung des Maskenaufbaus in Schlüssel- und Inhaltsfelder findet nicht statt.

Maskenerstellung

Sie sollten im Hinblick auf einen Datentransfer zwischen verschiedenen Datenbanksystemen Ihre Maskenarchitektur standardisieren, denn Themadat stellt eine komfortable Im- und Exportfunktion zur Verfügung, womit der Austausch zwischen Datensätzen aus verschiedenen Datenbanken durchgeführt werden kann. In der Regel, es gibt dafür eine spezielle DIN-Norm, muß die Felderstruktur der Quell- und der Zieldokumentation identisch sein. Insofern man plant, die Im- und Exportfunktion zu benutzen, sollte man sich um die Normierung der Datenmasken für verschiedene Zwecke (Adreßverwaltung, Literaturverwaltung) bemühen. Die Datenmaske für die Literaturverwaltung, die Sie hier sehen, ist nicht normiert, ein Einlesevorgang von Fremddatensätzen der Literaturdokumentations-Software LIDOS ST wäre beispielsweise wegen der Inkompatibilität der Datenfelder vorderhand zum Scheitern verurteilt. Um die Felderdefinitionen zum Ex- bzw. Import von unterschiedlichen Maskenstrukturen einander anzupassen, muß man aber kein Spezialist sein. Besonders für die vielen Autoren, Journalisten und andere Textarbeiter, die mit ihren Modems Online-Recherchen in regionalen und überregionalen Datenbanken unternehmen müssen, lohnt es sich, ausgerüstet mit einer Standardmaske. auf die Suche nach Fachinformationen in Fremddatenbanken zu gehen. Die Frage, wie solche Suchmanöver durchorganisiert werden, verzweigt in weitere Detailprobleme, die von der anfänglichen Edierung der Datenmaske in Themadat noch weit entfernt sind. Themadat läßt drei Feldtypen, die sog. „Platzhalter”, zur Beschreibung der Zeilen zu. Es werden ein alphanumerischer Platzhalter ‚0’ und zwei numerische Platzhalter ‚1’ und ‚2’ mit verschiedenen Sonderzeichen unterschieden. Für die automatische Themensuche, dem noch zu beschreibenden Kernstück von THEM ADAT. müssen die spezifischen Suchfelder mit dem Zeichen ‚>’ markiert sein. Es wäre zum Beispiel vorstellbar, daß Sie sich als typische Anwendung für eine Textdatenbank einen Zitaten- und Exzerptenspeicher zusammenstellen wollen. Jeder Eintrag - einer Karteikarte vergleichbar - wird definiert durch seinen eindeutigen Verweis auf eine bibliographische Angabe. Bei der Verknüpfung des einzelnen Datensatzes mit archiviertem Textmaterial (Zitat, Exzerpt) kommt das assoziative Datenbank konzept zum Tragen. Das Suchmanöver organisiert Themadat über eine bei der Datenbankarchitektur festgelegte Themenliste. Nachdem die Datensatzmaske ein anwendungsorientiertes Outfit erhai ten hat. folgt Schritt N. 2: die Festlegung der Themenliste. Nachdem die Maskengestaltung meinen Ansprüchen an Ergonomie und Benutzerdienlichkeit entspricht, speichere ich das Elaborat unter dem Extender .MSK ab und verlasse das TEXTMASK-Programm.

Alle weiteren Schritte werden nach dem Aufruf des Hauptprogramms durchgeführt. Der Maskenball ist jedoch noch nicht beendet, sondern beginnt erst so richtig mit der Auswahl der Themen. Das Anlegen einer Themenmaske ist ein weiterer Schritt im Datenbankaufbau. Sich einfach an den Computer zu setzen und wie von selbst definierte Schlüsselbegriffe, eben Themen, über das Desktop auszustreuen, wird keinen Erfolg bringen. Da muß man schon einmal im Fachgebiet, das man datenbänkerisch verwalten möchte, bewandert sein, die entscheidenden Begriffe kennen und die wichtigen von den weniger wichtigen Informationen trennen können. Dann kann losgelegt werden, allerdings mit Papier und Bleistift. Doch Vorsicht: Das Themen-Layout der Datenbank, das hier formuliert wird, zeichnet später verantwortlich für die Effektivität einer assoziativen Suchoperation. Das Adjektiv “assoziativ” läßt sich einfach mit “durch Erinnerung verknüpft” ins Deutsche übersetzen. In der assoziativen Datenbank werden eben solche “Erinnerungen”, die jemand an einen Datensatz hat. durch bestimmte Themen widergespiegelt. Die Zuordung von Datensatz und Themen geschieht subjektiv, d.h. ein Datensatz, der prinzipiell unter vielen verschiedenen Gesichtspunkten gemerkt werden könnte, erhält durch die ausschlaggebende Themenzuordnung eine Platzhalterfunktion. Ein Thementripel mit den Begriffen Mönch - Italien - Inquisition verweist dann korrekt auf Umberto Ecos Roman “Der Name der Rose”, weil der Datensatz mit eben den drei Themen subjektiv - vom User ausgezeichnet worden ist. Voraussetzung natürlich bleibt, daß die Themen Mönch, Italien und Inquisition in die Themenverwaltung eingetragen wurden. Themadat erkennt Themen auf zwei Ebenen: Haupt- und Unterthemen. Hinsichtlich des Themen-Layouts mutet Themadat mit 31 * 31 Themen dem Benutzer eine für manche Anwendungen peinliche Beschränkung zu. Wie früher bei einem Karteikasten die roten Reiter als Ordnungsschilder eingesetzt wurden, legt Themadat seine 31 Themen auf je ein Bit des 68000er-Prozessors. Ein gesetztes Bit entspricht genau einem Thema. Jedes einzelne dieser (Haupt )-Themen gliedert sich wiederum in 31 Unterthemen, so daß insgesamt - nach Adam Riese - 961 Themen verwalten werden können. Die zugelassene Zeichenlänge für ein Thema beträgt 16 Buchstaben. Man mag sich leicht ausrechnen, daß mit einem volldefinierten Themenlayout für eine assoziative Datenbank schon ein halbes Megabyte Speicherplatz verbraucht ist. Nachdem also alle benötigten Begriffe und Namen aufgeschrieben worden sind, müssen unter dem Menüpunkt Themen erstellen im federführenden Menü Themen als erstes die Hauptthemen angegeben werden. Die Zeile für einen Themeneintrag beginnt prinzipiell mit dem Zeichen >. Hauptthemen werden generell in Großbuchstaben erfaßt. Unterthemen lassen Groß- und Kleinschreibung zu. So lassen sich die beiden Themensorten besser voneinander unterscheiden. Damit auch besonders kurze Wörter wie “Weg” oder Abkürzungen wie “IG” als Themen zugelassen werden können, hat man ein prozentuales Suchmanöver mit den beiden Werten 100% und 80% eingerichtet. Bei Angabe des Wertes 100% muß die Zeichenfolge eines Texteintrages hundertprozentig mit dem Thema übereinstimmen. Bei einer Einstellung von 80% werden zwanzigprozentige Zeichenabweichungen vom Thema toleriert. Ob ein Suchergebnis im Singular oder im Plural vorkommt, wird dann beispielsweise ignoriert. Das Suchmanöver unter beiden Prozenteinstellungen durchforstet Zeichenketten silbenweise und halt jede vorkommende Identität fest. Es gibt auch die Möglichkeit der wortweisen Suche, d.h. daß nur Themen wiedergefunden werden, die als einzelnes Wort mit beginnendem und abschließendem Leerzeichen im Datenbankbestand Vorkommen.

Abb. 1: Themadats Steuerung über Menüleiste und Funktionstasten
Abb. 2: Maskentest Experimente werden später mit Mehrarbeit quittiert.
Abb. 3: Fertig geschminkt zum Maskenball - Die Standardmaske
Abb. 4: Eine Fülle von Themen (keine Unterthemen) und ein kompletter Datensatz
Abb. 5: Differenzierte Suchoptionen
Abb. 6: Themenorientiertes Suche. Die Stärke
Abb. 7: Der TEDI-Editor zieht Register
Abb. 8: Assoziationen und Informationen. TEDI wird das Küchenlatein schon austreiben.
Abb. 9: Themenhäufigkeiten und prozentuale Auswertung
Abb. 10: Kein Idyll. Bild-Archive. Visuelle Perspektiven in der Datenbankanwendung

Ich möchte hier auf das Prinzip der assoziativen Suche den Fokus richten. Themadat bietet insgesamt drei Möglichkeiten, Dateneinträge aufzusuchen. An erster Stelle steht die assoziative Themensuche. Dazu gibt es ein eigenes Menü, in dem ein Suchauftrag per Mausklick durch die Auswahl aus dem vordefinierten Themenangebot vervollständigt und losgeschickt werden kann. Es ist sowohl erlaubt, Haupt- und Unterthemen miteinander zu kombinieren als auch gezielt Hauptthemen vom Suchmanöver auszuschließen. Durch die Formulierung des thematischen Zusammenhangs werden Eigenschaften eines fiktiven Datensatzes genannt, von dem zu diesem Zeitpunkt noch niemand weiß, obein solcher Datensatz mit den und den Eigenschaften existiert. Darin besteht die Erinnerungsarbeit, die Sie mit Themadat zu leisten haben. Sie nennen Eigenschaften, von denen Sie vermuten, daß mindestens ein Datensatz damit hinreichend charakterisiert ist. Um möglichst erfolgreich ein Suchmanöver durchführen und abschließen zu können. Denn Assoziieren kann man alles, ob man als Ergebnis einen nichtleeren Inhalt zurückerhält, ist eine andere Frage.

Das themenorientierte Suchmanöver erinnert stark an eine Volltextsuche; doch besteht ein Unterschied, denn die Volltextsuche greift nicht auf Eigenschaften, sondern auf existierende Zeichenketten zu. Hier kann man sich zwischen einer globalen Suche in allen Datensätzen und einer lokalen in einer Textmaske entscheiden. Des weiteren kann der Volltextsuchauftrag mit den beiden logischen Operatoren UND/ODER kombiniert und dadurch präzisiert werden. Man könnte die folgen de Suchzeile mit den Symbolen - (für “und”) und # (für oder) formulieren:

Computer~Datenträger#Schreibmaschine-Papier.

Nachdem ich mich ausgiebig mit der theoretischen Seite des assoziativen Datenbankkonzepts beschäftigt habe, möchte ich nun zur Praxis übergehen.

Bilder inklusive

Man hat alle Möglichkeiten offen, Themadat sowohl als Text- als auch als Bilddatenbank einzusetzen. Den Rezensenten erreichte zusammen mit dem Datenbankprogrammpaket die ebenfalls von dem Flensburger Software-Haus Shift vertriebene pixel- und vektororientierte Grafik-Software Arabesque. Dadurch erweitert sich das Anwendungsspektrum von Themadat entschieden. Vordem Hintergrund, daß Bilder mehr als tausend Worte sagen, kann Themadat als integrierte Text- und Bilddatenbank aufgebaut werden. Man legt dazu beispielsweise eine Bilddatei mit Scan-Vorlagen an und archiviert die einzelnen Bildtitel mit einer thematischen Beschreibung. Dazu trägt man den nach einer speziellen Bildmotivik ausgewählten Bildtitel in das Formular, die Blankodatenmaske, ein. Nach dem Prinzip der assoziativen Verknüpfung beschreibt man das Bild mit verschiedenen Eigenschaften. Zum Beispiel könnte man die Beschreibung nach formalen und inhaltlichen Gesichtspunkten aufgliedem. Der Verweis auf eine externe Bild- und Textdatei wird auf der “Beschreibungsmaske” als Zugriffspfad auf eine abgespeicherte Datei verzeichnet.

Texteditor

Themadat verfügt über einen speziell für Arvchivierungszwecke ausgerichteten Texteditor so daß Literaturzitate, Anmerkungen, Exzerpte, Querverweise, Indizes und andere Notizformen an jeden einzelnen integrierten Bild und Textdatensatz “angehängt” werden dürfen. Dazu schaltet man in den Texteditor TEDI um.

Auf den ersten Blick scheint diese kleine Textverarbeitung leistungsstark und für die Literaturverwaltung wie geschaffen zu sein. TEDI zeigt sogar eine eigene Menüleiste mit allen wichtigen Funktionen wie variablen Randeinstellungen, verschiedenen Modi zur Zeilenformatierung oder den üblichen Blockoperationen. Die mit diesem Editor im ASCII-Format erstellten und mit der Extension .DOC abgespeicherten Texte werden in einem speziellen Textordner zusammengestellt und als Appendices zu den verschiedenen Datensätzen gesammelt. Verweise auf externe Bild- und Textdateien müssen als Anhang zum Datensatz vermerkt sein. Wenn verschiedene Datensätze durch denselben Text kommentiert werden sollen. müssen bei der Konzeption der Textmaske entsprechend Datenfelder, die Verweise markieren, aufgenommen werden. Daran erkennt man, daß für die Anlage einer assoziativen Datenmaske weitreichende Überlegungen bezüglich des Masken-Layouts angestellt werden müssen. Leider ist TEDI nicht so leistungsstark, wie sein Menü-Outfit es verspricht. Besonders die Randeinstellungen machen bei strengem Blick auf eine exzerpierte Quelle schon sehr zu schaffen, wenn ganze Textstücke so einfach verschluckt werden. Im Notfall muß man den Zeilenumbruch manuell mit der Delete-Taste von Fall zu Fall wiederholen. Das sorgt für unnötige Verzögerungen beim Text erstellen. Mir ist das mehrmals passiert. Man kann immerhin nachträglich einen halbautomatischen Zeilenumbruch auslösen, damit das Zeilennotat in ordentlich lesbarer Form auf den Bildschirm (und auf den Datenträger) kommt. Zur leichteren Wiederauffindung eines Notats können Kopf-und Fußzeilen manuell eingestellt und mit Kennwörtern oder anderen Indexeinträgen beschriftet werden. Komfortable Lösungen einer vollwertigen Textverarbeitung wie automatische Silbentrennung oder Fußnotenverwaltung sucht man bei TEDI vergebens. Allerdings glänzt der Texteditor mit einer Sonderzeichenfunktion, womit der Anwender multilingual wäre. Selbstverständlich kann der Editor auch dazu verwendet werden, die üblichen Datenbankapplikationen wie die Erstellung von Serienbriefen oder Listen auszuführen. Bei der Listenschaltung hat man zu berücksichtigen, daß die zu beschreibenden Textfelder in Reihenfolge und Länge mit der Textmaske standardisiert sind. Daneben verfügt TEDI über eine Tastatursteuerung, mit der alle Editorfunktionen von Hand erreichbar sind.

Ein wichtiges Hilfsmittel zur Übersicht über die Datenbank ist der sogenannte Report, mit dem sich das Volumen und die Art der Belegungen mit Datensätzen lokalisieren lassen. Ein weiteres effektives Merkmal von Themadat, das für die Transparenz der Sicht auf die Datensätze sorgt, besteht in der alphabetischen und datumsorientierten Sortierung. Um den speziellen Sortierbefehl zu erteilen, erklärt man sich über entsprechende Funktionstasten zum Dialog bereit. Da man mir Arabesque mitgeliefert hat, möchte ich über den integrierten Grafikeditor von Themadat nicht berichten. Ein schwaches, aber mit allen notwendigen Operationen für die Bildverarbeitung ausgestattetes Konzept liegt hier zugrunde. Um sich zu emanzipieren, müßte der Grafikeditor noch mit einigen Versionen aufpoliert werden, wenn es da nicht Arabesque als eines von vielen sehr guten Zeichenprogrammen für den ST gäbe.

Damit man schließlich alles schwarz auf weiß besitzt, wird Themadat mit verschiedenen Druckertreibern ausgeliefert. Es besteht die Möglichkeit. Texte sowohl als .DOC-Files und Bildgrafiken als auch als komplette Datenbankreports auf dem Drucker ausgeben zu lassen.

Wenn auch Themadat im Hinblick auf die interne Organisation der Datenbank mit dem Maskeneditor Textmask, dem Texteditor TEDI und dem integrierten Grafikeditor noch einige Schwächen zeigt, so glaube ich, kann man diese unter dem Strich verschmerzen. Man erwirbt schließlich eine assoziative Datenbank, die nicht bloß im Titel ihre Exklusivität -verglichen mit alternativen Datenbankprogrammen - vortäuscht, sondern extrem schnell und zuverlässig auf intuitiv formulierte Suchaufträge reagiert und damit Überlegenheit beweist. Um zu erreichen, daß die angesagte Assoziationsvielfalt die angeforderten Resultate gezielt beschafft und nicht stattdessen im Chaos der Gedankenspielereien versiegen wird, müssen die Datenbankarchitektur und das Themenkonzept strenger als vielleicht bei Relationaldatenbanken vorüberlegt werden. Dann aber, wenn das logische und thematische Outfit der assoziativen Datenbank auf einer gutproportionierten Architektur sockelt, werden die Anwender mit pfeilschnellen und thematisch orientierten Suchmanövern belohnt werden.

Wie bereits erwähnt, stehen gutdokumentierte Im- und Exportfunktionen zum unbeschränkten Datenaustausch zur Verfügung. Nach ein wenig Vorarbeit beim Anpassen der unterschiedlichen Maskenarchitektoniken können beispielsweise Datensätze aus Adimens oder dem Literaturdokumentationssystem Lidos nach Themadat importiert oder daraus exportiert werden.

Nachteilig wirkt sich aus, daß Themadat ohne eine Wartungsfunktion oder Reorganisation der Datenbank auskommen muß. Dank des assoziativen Konzepts können Dubletten nur sehr selten auftauchen, denn es ist ja durchaus vorstellbar, daß ein und derselbe Datensatz in derselben Datenbank mit unterschiedlichen Themen “beschrieben würde. Dann könnte man kaum mehr von identischen Datensätzen sprechen. Eine Aussonderung von Datensatzdubletten, wobei man eine unterschiedliche Themenverteilung ignorierten würde, zöge dann verheerende Folgen nach sich.

Ich empfehle, probieren Sie doch einfach aus, ob es sich für Sie lohnt, den assoziativen Dialog mit Themadat aufzunehmen. Mit der schnellen und ungebundenen Verknüpfung von Themen und der Fähigkeit zur Formulierung spontaner Zusammenhänge werden Sie mit der assoziativen Datenbank einen Hauch Künstlicher Intelligenz auf Ihr vieluntersuchtes ST-Desktop bringen.

SHIFT Sonnenschein & Hansen
Unterer Lautrupweg 8
D-2390 Flensburg


Ralf Blittkowsky
Aus: ST-Computer 05 / 1990, Seite 69

Links

Copyright-Bestimmungen: siehe Über diese Seite