OCR - Der ATARI lernt lesen

Wie oft ist es Ihnen schon passiert, daß Sie in einem Buch oder einer Zeitschrift einen Bericht gelesen haben, den Sie aus irgendeinem Grund auch gerne als Text auf dem Computer hätten. Natürlich könnten Sie ihn mit Ihrem Scanner einlesen und als Bild ablegen. Allerdings hilft Ihnen das auch nicht viel weiter, können Sie ihn doch nicht wie einen normalen Text mit Ihrer Textverarbeitung bearbeiten. Lesen müßte Ihr Computer können ...

Und wie für so Vieles, gibt es auch für dieses Problem bereits eine Lösung in Form eines Freeware-Programmes: OCR (von Optical Character Recognition. Optische Zeichenerkennung) von Alexander Clauss. OCR spaltet ein beliebiges gescanntes Bild in Zeilen und einzelne Buchstaben auf und versucht, daraus einen normalen ASCII-Text zusammenzustellen, der dann wie gewohnt weiterbearbeitet werden kann.

Hierzu vergleicht es Buchstaben für Buchstaben mit einer ganzen Reihe gespeicherter Muster, einer sogenannten Zeichensatzbibliothek. und fügt bei einem Treffer das gefundene Zeichen der ASCII-Textdatei hinzu. Gibt es keine Übereinstimmungen, so präsentiert es Ihnen das Bild des unbekannten Zeichens und fordert Sie auf. den passenden Buchstaben von Hand einzugeben. So lernt OCR immer mehr Zeichen und liest immer schneller und mit immer weniger Fehlern.

OCR ist eine sauber programmierte GEM-Anwendung, die auf Anhieb zu durchschauen und zu bedienen ist. Nach dem Laden des gescannten und zu lesenden Bildes muß lediglich der Bereich mit dem Text markiert und eventuell ein Zeichensatz geladen werden. Dies ist vor allem nützlich, falls bereits einmal ein Text mit derselben Schrift gelesen wurde, da so bereits alle gemachten „Erfahrungen“ verwendet werden können und das Lesen sehr viel sicherer und schneller abläuft. Durch weitere Parameter wie Leerzeichenabstand. Schräglage des Textes, Toleranz und Erkennungsgeschwindigkeit kann das Erkennen des Textes noch sicherer bzw. schneller gemacht werden. Doch es gilt die Faustregel: Je schneller, desto schlechter das Ergebnis! Für Besitzer eines Scanners ist OCR ein absolutes Muß. Es ist völlig unkompliziert zu bedienen, und es macht einfach Spaß, damit zu experimentieren und ein wenig zu spielen.

Autor: Alexander Clauss
ST-PD: 611
Status: ◇ PD ◆ Freeware ◇ Posteardware
Auflösung: ◆ hoch ◆ mittel ◇ niedrig ◆ sonstige

Positiv: GEM-Einbindung, gute Erkennung und wenige Fehlertreffer

Negativ: -


Eric Böhnisch
Aus: ST-Computer 06 / 1994, Seite 112

Links

Copyright-Bestimmungen: siehe Über diese Seite