← ST-Computer 06 / 1994

OCR - Der ATARI lernt lesen

Public Domain

Wie oft ist es Ihnen schon passiert, daß Sie in einem Buch oder einer Zeitschrift einen Bericht gelesen haben, den Sie aus irgendeinem Grund auch gerne als Text auf dem Computer hĂ€tten. NatĂŒrlich könnten Sie ihn mit Ihrem Scanner einlesen und als Bild ablegen. Allerdings hilft Ihnen das auch nicht viel weiter, können Sie ihn doch nicht wie einen normalen Text mit Ihrer Textverarbeitung bearbeiten. Lesen mĂŒĂŸte Ihr Computer können ...

Und wie fĂŒr so Vieles, gibt es auch fĂŒr dieses Problem bereits eine Lösung in Form eines Freeware-Programmes: OCR (von Optical Character Recognition. Optische Zeichenerkennung) von Alexander Clauss. OCR spaltet ein beliebiges gescanntes Bild in Zeilen und einzelne Buchstaben auf und versucht, daraus einen normalen ASCII-Text zusammenzustellen, der dann wie gewohnt weiterbearbeitet werden kann.

Hierzu vergleicht es Buchstaben fĂŒr Buchstaben mit einer ganzen Reihe gespeicherter Muster, einer sogenannten Zeichensatzbibliothek. und fĂŒgt bei einem Treffer das gefundene Zeichen der ASCII-Textdatei hinzu. Gibt es keine Übereinstimmungen, so prĂ€sentiert es Ihnen das Bild des unbekannten Zeichens und fordert Sie auf. den passenden Buchstaben von Hand einzugeben. So lernt OCR immer mehr Zeichen und liest immer schneller und mit immer weniger Fehlern.

OCR ist eine sauber programmierte GEM-Anwendung, die auf Anhieb zu durchschauen und zu bedienen ist. Nach dem Laden des gescannten und zu lesenden Bildes muß lediglich der Bereich mit dem Text markiert und eventuell ein Zeichensatz geladen werden. Dies ist vor allem nĂŒtzlich, falls bereits einmal ein Text mit derselben Schrift gelesen wurde, da so bereits alle gemachten „Erfahrungen“ verwendet werden können und das Lesen sehr viel sicherer und schneller ablĂ€uft. Durch weitere Parameter wie Leerzeichenabstand. SchrĂ€glage des Textes, Toleranz und Erkennungsgeschwindigkeit kann das Erkennen des Textes noch sicherer bzw. schneller gemacht werden. Doch es gilt die Faustregel: Je schneller, desto schlechter das Ergebnis! FĂŒr Besitzer eines Scanners ist OCR ein absolutes Muß. Es ist völlig unkompliziert zu bedienen, und es macht einfach Spaß, damit zu experimentieren und ein wenig zu spielen.

Autor: Alexander Clauss
ST-PD: 611
Status: ◇ PD ◆ Freeware ◇ Posteardware
Auflösung: ◆ hoch ◆ mittel ◇ niedrig ◆ sonstige

Positiv: GEM-Einbindung, gute Erkennung und wenige Fehlertreffer

Negativ: -

Eric Böhnisch