Haben Sie sich manchmal schon darüber geärgert, daß Ihnen Ihr Atari nicht beim Abtippen von Dokumenten oder Zeitungsartikeln zur Hand gehen kann? Dann sind Sie ein klarer Fall für OCR (Optical Character Recognition) Software! Frisch aus den USA erreichte uns fetzt Migraphs Beitrag zu diesem Thema.
Ach so. Sie können mit dem Begriff »Optical Character Recognition« nicht allzu viel anfangen? Kein Problem, dieses Rätsel ist schnell gelöst. Simpel ausgedrückt ist es die Aufgabe von OCR-Software, gescannte, als Grafik vorliegende Texte (z.B. aus Zeitschriften) in das für Textverarbeitung geeignete ASCII-Format umzuwandeln. Daß hinter diesem für uns auf den ersten Blick trivial scheinenden Transfer ein immenser Rechenaufwand und ein nicht zu unterschätzender Anteil an Kl steckt, wird deutlich, wenn man sich nur einmal die Vielzahl an existierenden Fonts vor Augen führt.
Im Gegensatz zu vielen anderen Programmen auf diesem Sektor, die eine Datenbank von Pixelrastern zur Schrifterkennung heranziehen, bedient sich Migraph OCR der relativ neuen »Omnifont«-Technologie. Das Omnifont-Verfahren erkennt Buchstaben anhand einer mathematischen Definition und bietet bei ungleich höherer Effizienz zusätzlich noch den Vorteil geringeren Speicherplatzbedarfs. Daß unser Testkandidat dennoch ein Minimum von zwei MByte Hauptspeicher voraussetzt, liegt in der Größe der gescannten Texte begründet: eine mit 300 dpi digitalisierte DIN-A4-Seite benötigt ca. ein MByte. Sollte der Umfang einer Grafikdatei einmal die Grenzen Ihres RAMs sprengen, zieht Migraph OCR Ihre Festplatte als virtuellen Speicher heran.
Ihre Texte scannen Sie am bequemsten direkt in Migraph OCR, wobei sich bei Bedarf aber auch IMG- oder TIF-Dateien laden lassen. Haben Sie einen Text »im Kasten«, müssen Sie unserem Kandidaten noch mitteilen, welche Bereiche der Vorlage er konvertieren soll. Dazu rahmen Sie einfach die zu konvertierenden Passagen mit Hilfe von Maus und GEM-Gummi-band ein. Auf diese Weise lassen sich auch störende Grafiken von der Bearbeitung ausschließen. Um die Effizienz des OCR-Prozesses zu steigern, sollten Sie Migraph OCR jetzt noch verraten, ob es sich bei dem aktuellen Schrifttyp um Proportionalschrift handelt. Besonders wohl fühlt sich unser Proband bei einer Fonthöhe von 10-18 Punkten, doch vermag er auch kleinere Lettern zu erkennen, vorausgesetzt, sie wurden mit 400 dpi digitalisiert.
Ein Klick auf den OCR-Button startet die Schrifterkennung. Stößt das Programm dabei auf einen ihm unbekannten Buchstaben, geben Sie es bei Bedarf mit der »Learn«-Funktion in einem »Schriften-Lexikon« an. Etwa zwanzig verschiedene Schriftarten beherrscht das Programm bereits von Haus aus. Zusätzlich zu diesem Lexikon zieht Migraph OCR aber auch noch ein linguistisches Wörterbuch zu Rate. Diese auch in einer deutschen Version vorliegende Datenbank ermöglicht dem Programm, Buchstaben aus dem Wortzusammenhang heraus zu erkennen.
Die mit Migraph OCR zu erzielenden Ergebnisse sind durchweg brauchbar, auch wenn man keine Wunderdinge erwarten darf. Hat man dem Programm einmal einen Schrifttypus komplett beigebracht, geht die Konvertierung relativ unkompliziert in kurzer Zeit vonstatten, bei unbekannten Fonts ist schon etwas mehr Mühe vonnöten. Für Anwender, die gedruckten Text in Ihren Computer transferieren müssen, bietet Migraph, vor allem wegen der fixen Bearbeitung, in jedem Fall eine sehr gute Alternative zu bereits existierenden Lösungen. (wk)
WERTUNG
Name: MiGraph OCR
Preis: 299 US-Dollar
Hersteller: MiGraph
Stärken: einfaches Handling □ relativ sichere Zeichenerkennung □ lernfähig □ Omnifont-Technologie
Schwächen: vergleichsweise hoher Preis □ Laden von IMG-Bildern etwas langsam
Fazit: Eine interessante Neuerscheinung mit gehobenem Preisniveau