MINI-OCR: Lies mal!

Schrifterkennung ist momentan eines der interessantesten Aufgabengebiete für den leistungsfähigen Bürocomputer. Ein kleines PD-Programm bietet nun die Möglichkeit, erste Erfahrungen zu sammeln.

Das Zauberwort heißt OCR und steht für Optical Character Recognition, zu deutsch: optische Zeichenerkennung. Das, was Sie momentan ganz mühelos machen, nämlich in einer beliebigen Druckseite Grafik von Text zu unterscheiden und dort wiederum einzelne Buchstaben zu erkennen, ist für einen Computer eine ziemlich knifflige Angelegenheit. Im Alltag haben Sie damit wahrscheinlich schon einmal bei einem Bankformular Bekanntschaft gemacht, wenn Sie sich über merkwürdig eckige Buchstaben und Ziffern gewundert haben. Dabei handelt es sich um eine speziell für die Texterkennung entwickelte und genormte Schrifttype OCR A, die zunächst nur aus den Ziffern und einigen Sonderzeichen bestand. Erst später wurde sie um Großbuchstaben ergänzt. Die merkwürdige Form bei gleichzeitiger Beschränkung auf wenige Zeichen gewährleistet eine hohe Erkennungsrate. In Deutschland wurde ihre Normung in DIN 66 008 festgelegt.

Grundlagen

Heutzutage gehen die Bestrebungen allerdings dahin, bei der Schrifterkennung ohne spezielle Schrifttypen auszukommen und wirklich jeden beliebigen geschriebenen Text automatisch lesen zu können. Lesen heißt in diesem Zusammenhang allerdings zunächst nur, aus einem als Grafik gescannten Dokument mit Hilfe von raffinierten Suchschemen Buchstaben zu erkennen und von Trennungslinien oder Bildern zu unterscheiden. Es soll „einfach“ aus einem auf Papier vorliegenden Dokument ein ASCII-Text gemacht werden, der sich zum Beispiel in einer Textverarbeitung weiterverwenden läßt. Mit dem Inhalt des Textes hat es in diesem Fall nichts zu tun. Hohe Trefferquoten erzielt man bei ganz normalen Schreibmaschinentexten mit unproportionaler Schrift, da sich dort die Buchstaben eindeutig voneinander unterscheiden lassen. Proportionalschrift mit unregelmäßigen Abständen und Überlappungen bzw. Verschmelzungen erschwert die Erkennung ungemein. Eine echte Handschrift, bei der schon der Mensch mit seiner hochentwickelten „Texterkennung“ Schwierigkeiten hat, bleibt für den Computer momentan noch ein Rätsel. Allerdings konnte das Atari ST-PAD auf der CeBIT ’91 schon relativ sicher handgeschriebene Blockbuchstaben in Echtzeit erkennen.

Von praktischem Nutzen ist diese aufwendige Vorgehensweise, wenn große auf Papier vorliegende Datenmengen in eine elektronische Datenverarbeitung übertragen werden sollen. Ferner kann so Blinden die Möglichkeit gegeben werden, auch normale Bücher und Zeitschriften zu lesen, die nicht in der speziellen Braille-Schrift vorliegen. Der erkannte Text wird dann über Sprachsynthese entweder vorgelesen oder über ein spezielles Gerät ausgegeben, auf dem sich der Inhalt ertasten läßt.

MINI-OCR

Nach dieser kleinen Einführung in die Problematik der optischen Schrifterkennung ist einzusehen, daß MINI-OCR von Dietmar Schell sich nur mit einem stark beschränkten, aber nützlichen Aufgabengebiet befassen kann. Zur Vorgeschichte gehört wieder einmal die „eingebaute“ Hardcopy-Routine des Atari ST, mit der man den Bildschirminhalt auf den Drucker ausgeben kann. Da beim ST die Aufteilung älterer Computer in Text- und Grafikseiten entfällt, bietet sich bei der Programmgestaltung zunächst eine größere Freiheit. Beim Ausdrucken werden dann allerdings auch reine Textseiten als Grafik aufgefaßt, was lange Druck- und Wartezeiten bedingt. Ferner läßt oft auch die Ausgabequalität zu wünschen übrig (für 24-Nadler sei noch einmal auf die ST-PD 88, insbesondere das LQ 800-Accessory, hingewiesen).

Die logische Schlußfolgerung zur Lösung des Problems heißt OCR! Das vorliegende Programm MINI-OCR liest dazu bei Systemstart den aktuellen Systemzeichensatz als Vergleichsbasis für die spätere Erkennung. Es lernt sozusagen im Schnellverfahren eine Schriftart kennen. Das heißt, dieses Programm arbeitet auch mit geänderten Zeichensätzen zusammen, muß dann aber unbedingt nach deren Installation (als AUTO-Ordner-Programm oder ACC) gestartet werden, um richtig zu funktionieren. Leider beschränkt es sich dabei auf den 8*16 Pixel großen Zeichensatz.

Wichtige Voraussetzungen

Nach dem Aufruf über die Menüleiste zieht man mit der Maus lediglich den bekannten „Gummiband“-Rahmen um den zu identifizierenden Text herum auf. Dabei muß der Text Schwarz auf Weiß und darf nicht durch ein Muster hinterlegt sein. Das Programm geht ferner davon aus, daß der Buchstaben- und Zeilenabstand in dem markierten Bereich regelmäßig sind und nicht variieren. Sind diese Voraussetzungen gegeben, erfolgt die Erkennung innerhalb weniger Augenblicke. Das Ergebnis läßt sich dann sofort auf den Drucker ausgeben oder in eine Datei abspeichern. So kann man nach Ansicht des Programmautors einen zweispaltigen Ist WORD-Text Stück für Stück in ein normales Dokument zurückgewinnen. Dabei hilft einem auch die Besonderheit, daß beim Anwählen einer bereits existierenden Datei diese nicht überschrieben, sondern der neue Text angehängt wird.

In der neuesten Version 2.0 läßt sich darüber hinaus auch ein Ist WORD-Druckertreiber einbinden. Wer sich mit diesem Programm auskennt und entsprechende Treiber zur Verfügung hat, wird sich sicherlich darüber freuen. Andere müssen sich erst einmal eine entsprechende PRINTER.CFG besorgen, denn sonst verweigert MINI-OCR den Dienst (Treiber sind auf verschiedenen PD-Disketten zu finden). Da beim Ausdrucken die normalen ASCII-Codes an den Drucker gesendet werden, muß bei Verwendung von Sonderzeichen und geänderten Zeichensätzen immer mit einigen Überraschungen gerechnet werden. Auch Druckerfilter im Hintergrund gehen den Daten noch einmal an den Kragen. So funktioniert die von mir in einfachen Texteditoren Verwendete Markierung von zu unterstreichenden Passagen mit MINI-OCR.

Prima

Wenn die vom Programmautor vorgegebenen Rahmenbedingungen eingehalten werden, funktioniert das in GFA-BASIC 3.5 entwickelte MINI-OCR ganz hervorragend! Der Nutzen in der täglichen Arbeit wird allerdings durch die Konzeption als Accessory etwas getrübt, da neben TOS- und TTP-Programmen viele Anwendungen leider immer noch keine Accessorys zulassen. Gerade bei ARC oder ähnlichen Programmen könnte man so eine Texterkennung oft gut gebrauchen. Vielleicht sollte man den Aufruf der Routine doch lieber über einen „Hot Key“ realisieren.

thl

MINI-OCR
ST-PD 454



Aus: ST-Computer 10 / 1991, Seite 185

Links

Copyright-Bestimmungen: siehe Über diese Seite