Themadat 4.0: Eine Datenbank für Menschen wie du und ich

Da hat man nun eine Datenbank-Abfragesprache gelernt, beherrscht 100 Kommandos, tippt gekonnt kryptische Sätze ein, und der dumme Computer findet das Gesuchte trotzdem nicht. Doch schimpfen Sie nicht auf den armen ST, der könnte schon, wenn man ihn nur ließe. Ist er jedoch zum elektronischen Karteikasten degradiert, ohne daß er die Intuition des Anwenders in dem Maße unterstützen darf, wie er es durchaus könnte, dann muß es wohl an der Software liegen.

Nichts gegen die klassischen Datenbanken, sie eignen sich hervorragend für die Buchhaltung oder die Fakturierung. Sie versagen aber kläglich, wenn man sie nicht mehr mit präzisen Fakten füttert, sondern nur vage Angaben macht.

Nehmen wir das Beispiel eines Fotografen. Der hat bekanntlich das Problem, von einer Bildbeschreibung zu dem Kasten zu kommen, in dem das Bild abgelegt ist. Nach seiner Erinnerung war auf dem Bild seine Frau mit Kind, das Auto war mit drauf, und Berge und eine Kirche oder Kapelle bildeten den Hintergrund. In einer Standard-Datenbank hätte er eine Chance, wenn das auch die Stichworte wären, mit denen das Bild abgelegt ist. Doch wenn er damals nur anstatt Frau Susanne oder für Auto VW getippt hätte, geht nichts mehr.

Bei Themadat gehen Sie zuerst in die sog. Hauptmaske und klicken dort die Begriffe Mensch, Technik, Landschaft oder Architektur an. Werden zu viele Bilder angeboten, gehen Sie in eine Untermaske Mensch und wählen dort Frau und Kind aus. Oder Sie grenzen weiter ein, indem Sie Technik auf Auto reduzieren und Architektur auf Kirche.

Die Technik ist nicht neu, auf Großrechnern gibt es sie, doch in der PC-Welt, ST inklusive, ist sie einmalig. Hier wird nicht mehr über Schlüssel und exakte Stichworte gesucht, sondern über Themen. Diese Themen sind nur Hilfsmittel, sozusagen Gedächnisstützen, mit denen der Anwender das eigentliche Suchziel in seiner Erinnerung verbindet, »assoziiert« heißt das Fremdwort dafür, daher der Begriff »assoziative« Datenbank.

Hier startet man nicht mit dem Aufbau der Datenbank-Struktur, sondern mit der Themenmaske. Das sind bis zu 31 Begriffe, die Sie frei wählen. Zu jedem Thema lassen sich bis zu 31 Unterthemen einrichten, womit sich insgesamt die riesige Zahl von T(31*31) Kombinationen ergibt.

Bild 1. Der Anwender klickt Themen an, die seiner Erinnerung nach etwas mit dem Objekt zu tun haben könnten. Themadat findet dann den Datensatz.

Zum Programm gehört natürlich ein Maskengenerator für neue Themen. Die Bedienung ist einfach. Nach dem Aufruf erscheint ein Themenfeld gleich dem aus Bild 1 (das obere Feld), nun allerdings leer. Sie tippen die Themen der Reihe nach ein. Die Cursorsteuerung für Korrekturen vorhandener Texte funktioniert, nur die Maus ist in diesem Fall ausgeschaltet.

Steht die Maske, beginnt man mit der Eingabe der Texte. Wir haben es wieder einmal — bereits 1987 stellten wir die Version 1.0 vor — mit diesem Text probiert: »Mensch am Computer testet Datenbank. Überlegt, wie er das Ding überlisten kann. Computer steht auf einem Baum hinter der alten Dorfkirche im Wald«.

Nach der Eingabe unterstreicht das System in der Maske automatisch diese Begriffe:Architektur, Eigenschaft, Landschaft, Mensch, Pflanzen, Stadt/ Land und Technik. Das funktioniert, weil Worte oder Teile davon in den Unterthemen definiert sind (es gilt die Maske von Bild 1). Beispielsweise wird Dorfkirche erkannt, weil es zum Hauptthema Architektur auch ein Unterthema Kirchen gibt.

Bild 2. Die Bedienoberfläche: GEM, Icons oder Tastatur wahlweise

Nach der Eingabe eines Satzes entscheiden Sie, ob Sie es dabei bewenden lassen oder andere, vielleicht erweiterte Beschreibungen zu diesem Thema vorgeben. Die Gegenkontrolle ist recht simpel. Sie klicken in der Maske die vorgenannten Begriffe an. Findet das Programm dann nur dieses Bild, liegen Sie richtig. Bietet das Programm außerdem ein oder zwei weitere Motive an, ist das ebenfalls noch vertretbar.

Die Maske mit ihren Themen bleibt ständig auf dem Bildschirm dargestellt. Die einfachste und sicherste Methode der Suche ist nun, die Schlagworte der Maske mit der Maus anzuklicken und so auch in den Untermasken zu verfahren. Sie können aber auch einen Text der Art »Frau UND Kind ODER Frau UND Berge« eintippen. Für das logische UND und ODER existieren Kürzel (ein Zeichen). Die Texte selbst müssen dabei nicht genau mit denen der Maskendefinition übereinstimmen. Das Programm ist auf eine 80prozentige Übereinstimmung voreingestellt, der Wert läßt sich aber noch ändern.

Das Datum ist ebenfalls als Suchkriterium zugelassen. Nicht nur Übereinstimmung, sondern auch Schwellen (z. B. jünger als) sind dabei zulässig.

Rasterfahndungen, wie sie das Bundeskriminalamt durchführt, sind nach diesem System ebenfalls denkbar. Da lautet dann die Aufgabe: Suche alle, die ihre Stromrechnung bar bezahlen, nicht älter als 30 sind und in den letzten zwei Jahren eine Wohnung gemietet haben. Sie werden vielleicht ziviler sagen »Suche alle Fotos, wo Susi oder wo ihr VW drauf ist«. Die müssen Sie nämlich dringend aussortieren, weil Ihre Freundin jetzt Birgit heißt.

300 KByte GFA-Basic

Themadat ist in GFA-Basic programmiert und compiliert. Der Quelltext umfaßt 280 KByte, der Code rund 320 KByte. Die GEM-Oberfläche, ergänzt durch diverse eigene Dialog-Boxen und Buttons, ist perfekt und so schnell, daß Unterschiede zu in C geschriebenen Programmen nicht feststellbar sind. Die Arbeitsgeschwindigkeit schlägt konzeptbedingt — wir kommen noch drauf — sowieso alle Rekorde. Bild 2 zeigt das User-Interface. Es läßt sich sowohl tastaturorientiert als auch mit der Maus arbeiten. Interessant sind die Icons der Funktionstasten unten im Bild. Die Funktion lösen Sie durch Druck auf eine Funktionstaste oder per Mausklick über das Icon aus. Das bieten viele Programme, doch Themadat kann mehr. Stellt man nämlich nur den Mauszeiger auf ein Icon, wird die Bedeutung der Taste oben im Bild erklärt.

Für jede Datenbank gibt es eine spezielle Maske. Mitgeliefert wird eine für Fotografen. Der Trick, der hinter der ganzen Geschichte steckt, ist, daß eine Hauptmaske und jede Untermaske je 31 Begriffe erlauben. Diese 31 Themen bzw. Unterthemen sind durch je ein Bit in einem Langwort der CPU repräsentiert. Das klappt natürlich gerade beim Atari mit seiner 68000-CPU sehr gut, da diese mit 32 Bit breiten Registern arbeitet. Die Masken selbst sind nur Texte, die sagen, welches Bit welche Bedeutung hat.

Beim Suchen vergleicht das Programm lediglich das Suchmuster mit dem Bestand. Da die Suchbegriffe Bits in Langworten sind, reicht es, diese Langworte über logisch »UND« miteinander zu verknüpfen. Das heißt, es laufen nicht endlose Abfrageketten der Art »IF A1 = B1 AND A2=B2 AND A3 = B3 AND .. A31 = B31«, sondern es gibt nur ein einziges »IF A AND B«. Das ist natürlich sehr schnell, zumal AND ein Maschinenbefehl ist, den der 68000 schon in seiner Muttersprache kennt.

Dieses kompakte Format wirkt sich natürlich auch auf die Suchgeschwindigkeit aus, zumal hier eine intelligente Organisation der Diskette oder Festplatte hinzukommt. Die Hauptthemen sind als Langworte (4 Byte) einfach der Reihe nach in einer Datei abgelegt. Ihr Index verweist auf die Unterthemen-Datei, von wo es wieder Zeiger auf die Text- oder Grafik-Files gibt. Damit belegen, ganz unabhängig von der Größe eines Datensatzes, seine 31 Hauptschlüssel immer nur 4 Byte. Durchsuchen Sie nun eine Datei von 1000 Sätzen, muß Themadat nur 4000 Byte (1000 Langworte) einlesen und gegen die Maske »unden«. Das geht sogar mit Diskette sehr schnell (100 Sätze/Sekunde, mehr als 1000 auf der Festplatte) und bietet gleich noch einen Vorteil. Die Schlüsseldatei ist unabhängig und darf sich somit auch über mehrere Dateien erstrecken.

Bild 3. Wie bei Macintoshs HyperCard: Texte und Bilder in einem Datensatz sind zulässig

Da es unfair ist, eine relationale mit einer assoziativen Datenbank zu vergleichen, um dann — nach geschickter Wahl der Aufgabe — zu behaupten, daß Themadat über hundertmal schneller sei, muß man vergleichbare Bedingungen schaffen. Das wäre hier die globale Textsuche.

Dieser Benchmark stammt von Dr. Stadlbauer, der zwei vergleichbare Dateien in Adimens und Themadat mit 1200 bzw. 1300 Sätzen eingerichtet hat. In Adimens wurde die Suche mit WAHL gestartet, wobei drei Begriffe über UND verknüpft wurden, Themadat arbeitete gleichfalls im Textsuch-Modus: Adimens: 250 Sekunden Themadat: 36 Sekunden Sie wissen ja, daß jeder Mann in seinem Leben einen Baum gepflanzt, ein Kind gezeugt und als Programmierer einen Editor geschrieben haben muß. So auch der Themadat-Entwickler. Dieser Tedi ist ein an Büro-Anwendungen orientiertes Programm mit allerhand nützlichen Features in diese Richtung, zum Beispiel Rechenfunktionen.

Gleichfalls integriert ist ein Grafik-Editor, der es durchaus erlaubt — Talent vorausgesetzt — so ein Gemälde, wie das von Bild 3, einem Datensatz zuzuordnen. Wer nicht so künstlerisch begabt ist, darf die Bilder aber auch scannen oder videodigitalisieren. Themadat akzeptiert die Formate von Image, Doodle, Degas und Stad. By the way: Themadat importiert auch Daten aus fremden Datenbanken.

Wie bei jedem großen Programm gibt es auch hier ein paar nützliche Utilities. So ist die Themenstatistik laut Bild 4 recht nützlich, kann es doch sein, daß der Fotograf noch gar nicht wußte, daß er hauptsächlich Landschaften fotografiert oder — effektiver — ein Experte erkennt, daß er zu bestimmten Themen noch zu wenig Informationen gesammelt hat.

Für viele Anwendungen, wie die hier geschilderte Lösung der Bildarchivierung, ist Themadat ideal. Aber nicht nur für Fotografen, auch für Bibliotheken, Juristen, Verlage, Rasterfahnder etc. ist Themadat eine große Erleichterung. Ohne Vorwissen über Datenbanken und mit minimalen Computerkenntnissen (Wo ist der Hauptschalter und wie bedient man die Maus?) können Sie sofort mit dem Programm arbeiten.

Die Version 1.0 von Themadat kam seinerzeit (1987) für 49 Mark auf den Markt. Die Version 4.0, kräftig erweitert und optimiert, kostet jetzt 248 Mark und wird damit immer noch deutlich unter Wert verkauft. Aber vielleicht lebt Try Soft aus einer ganz anderen Quelle? Es gibt nämlich unter den Kunden PC-An-wender, die Themadat im Paket kaufen, nämlich die Software und einen Atari ST dazu. Das ist dann immer noch billiger, als eine Super-PC-Datenbank, die doch nicht kann, was der Themadat-Kunde will.

Bild 4. Anhand der Themenstatistik erkennt man leicht, wo es der Datenbank noch an Wissen mangelt

Und diese Kunden haben dann noch ein Aha-Erlebnis. Mehr Leistung, ein Super-Bild, phantastisch einfache Bedienung und alles für viel weniger Geld. Da frage ich mich doch ernsthaft, warum es einige ST-Anwender via Emulator in die DOS-Welt zieht? Noch so ein paar Programme wie Themadat, und DOS-Leute schreien nach ST-Emulator. (wk)

Shift, Sonnenschein & Hansen, Unterer Lautrupweg 8,2390 Flensburg

Wertung

Name: Themadat V 4.0
Preis: 249 Mark
Hersteller: TrySoft

Stärken: □ sehr hohe Geschwindigkeit □ einfache Bedienung □ integrierter Text- und Grafik-Editor □ sehr flexibel im Aufbau

Schwächen: Im Test keine aufgetreten

Fazit: als assoziative Datenbank für viele Bereiche konkurrenzlos gut


Peter Wollschläger
Aus: ST-Magazin 02 / 1990, Seite 52

Links

Copyright-Bestimmungen: siehe Über diese Seite