Beim Lesen von Handschriften sind Computer fast ausnahmslos ĂŒberfordert. DaĂ die Sache bei Druckvorlagen bereits hervorragend klappt, ist auch ein Verdienst des ausgezeichneten OCR-Programms »Sherlook Professional« von 3K.
Texterkennung, kurz OCR (Optical Character Recognition), ist ein Verfahren zur Digitalisierung gedruckter Texte. Trotz gĂ€nzlich anderslautender Prognosen: An der marktbeherrschenden PrĂ€senz von Gedrucktem konnten auch ausgefeilte Texterkennungssysteme bisher nicht rĂŒtteln. Im Gegenteil: Computer sind stĂ€rker denn je an der Vorbereitung und Herstellung von Druckerzeugnissen beteiligt und sorgen in Belichtungsstudios fĂŒr volle AuftragsbĂŒcher. Zudem sichern Digitalisierungstechniken in Bibliotheken und Archiven das Material bibliophiler RaritĂ€ten.
Dennoch: Der Vorsprung des geschriebenen Wortes schmilzt. Mittlerweile gibtâs einen florierenden Handel mit Digitalliteratur: Die Computerversion der Elberfelder BibelĂŒbersetzung ist nur ein Beispiel von vielen. Beteiligt an der zunehmend komfortableren Digitalisierung von Gebrauchstexten sind neben leistungsfĂ€higen Scannern vor allem ausgeklĂŒgelte OCR-Systeme, die Buchstaben in fĂŒr den Computer lesbare Daten verwandeln. MĂŒhsames Abtippen gehört fĂŒr OCR-Anwender heute bereits der Vergangenheit an.
Vorbei auch die Zeit, als man sich glĂŒcklich schĂ€tzen durfte, trotz OCR die Tipparbeit auf die HĂ€lfte zu reduzieren. Wie bei Textsystemen gibtâs auch bei Texterkennungs-Software je nach Art der Anwendung unterschiedliche Lösungen. Nicht alles, was mit dem Etikett OCR wirbt, wird hohen AnsprĂŒchen gerecht.
Sherlook verdient das Attribut Professional zu Recht. Zugunsten hoher Trefferquoten wurde aufschnelle LernfĂ€higkeit der Software verzichtet. Kein Programm also fĂŒr den spontanen Gelegenheitsscan, sondern ein Spezialist zur Massenerfassung gleicher oder Ă€hnlicher Textvorlagen.
Dabei verzichtet das Programm vollstĂ€ndig auf Dropdown-MenĂŒs. Alle Funktionstasten befinden sich im unteren Bildschirmabschnitt (Abb. 1). Zwischen drei verschiedenen MenĂŒs " HauptmenĂŒ, ZeichenmenĂŒ und TextmenĂŒ " lĂ€Ăt sich jederzeit per Mausklick oder Funktionstaste umschalten.
Nach Einlesen der Vorlage " Scanner verwandeln Textvorlagen zunĂ€chst in eine Image-Bilddatei " erscheint die Grafik im rechten oberen Fenster. Vorm Start des Erkennungsvorgangs sollten zunĂ€chst einige Parameter eingestellt werden. Sherlooks einschlĂ€giges MenĂŒangebot signalisiert alles andere als Schmalkost.
Wichtigstes Utensil des Werkzeugkastens sind Bildbearbeitungsfunktionen: Ist das gescannte Bild etwa zu hell " Buchstaben erscheinen dann zu dĂŒnn und sind an manchen Stellen unterbrochen ", verwandelt die Funktion »Verdicken« dĂŒnne Lettern in dicke.
Ob es sich um Text, Rahmen oder Zeichnungen handelt " Buchstaben werden vom Scanner in Pixel-Form wiedergegeben. Auch Staubpartikel oder beim Fotokopieren entstandene Unsauberkeiten zeichnet der Belichter auf: Sie erscheinen als verwaiste Pixel und lassen sich " bevor das Texterkennungsprogramm vergeblich versucht, sie zu identifizieren " durch die Funktion »Filtern« eliminieren.
Auch die VorlagenqualitĂ€t, die beim Original logischerweise immer besser als bei einer Fotokopie ist, sollte angegeben werden. Diese Einstellungen wirken sich besonders auf die Erkennungsgeschwindigkeit aus. Bei schlechten Vorlagen vergleicht das Programm, bei gleichzeitig sinkender Geschwindigkeit, entsprechend grĂŒndlicher.
Sherlook erwartet schlieĂlich noch Eingaben zum Zeilen- und Zeichenabstand sowie zu Leerstellen und Ligaturen. Angaben dazu beeinflussen die PrĂ€zision der Texterkennung. Beim ersten Einsatz von Sherlook sind Experimente, bis Scanner und Software perfekt harmonieren, kaum zu vermeiden. Es gehört schon etwas Erfahrung dazu, auf Anhieb prĂ€zise die richtige Einstellung fĂŒr eine beliebige Textvorlage herauszufinden.
Bei der Buchstabenidentifikation arbeitet Sherlook mit der »Matrix-Matching«-Methode. Dabei werden fĂŒr einen Buchstaben typische Pixel-Muster in einer Bibliothek gesammelt. FĂŒr jede neue Schriftart legt das Programm eine gesonderte Vergleichsbibliothek an. Zu erkennende Buchstaben werden spĂ€ter mit den Mustern in solchen Bibliotheken verglichen.
Dabei geht Sherlook durchaus neue Wege. Buchstaben werden nicht nur ein einziges Mal gelernt. Von einer einstellbaren Anzahl von Mustern eines Buchstabens wird ein Mittelwert errechnet. Erst das gemittelte Muster kommt ins Archiv. So werden kleine Abweichungen im Muster «eines Buchstabens schon wÀhrend der Lernphase ausgeglichen. Obwohl sich durch bessere Kontrolle die Trefferquote deutlich erhöht, gibt es zweierlei zu beachten:
- Die Lernphase, das Zuordnen von Pixel-Mustern zu Buchstaben, verlÀngert sich.
- Hohe Treffsicherheit des Programms ist nur bei vollstÀndigen Bibliotheken gewÀhrleistet. Im Lernmodus werden zunÀchst noch zahlreiche Buchstaben falsch interpretiert.
Bei kompletten Bibliotheken erreicht Sherlook dann allerdings verblĂŒffende Trefferquoten. Wenn Sie Vorlagen mit neuer Schriftcharakteristik bearbeiten, sucht das Programm im Schriftenarchiv automatisch nach geeigneten Bibliotheken frĂŒherer Texterkennungssitzungen. Gleichzeitig wird prozentual aufgelistet, mit welcher bestehenden Bibliothek die Trefferquote voraussichtlich am höchsten ist. Eine sinnvolle Funktion, wenn Sie eine Times-Schrift bearbeiten und die Bibliothek bereits eine andere Serifenschrift enthĂ€lt. Zu beachten ist auch hier, daĂ die zu erwartende Erkennungsgenauigkeit nicht unter 50 Prozent liegen sollte. Ansonsten empfiehlt sich der Aufbau einer neuen Bibliothek. Die Erkennung mit vollstĂ€ndiger Bibliothek ist das HerzstĂŒck des Programms. Die Funktion lĂ€Ăt sich nur starten, wenn der bearbeitete Bereich der Grafik mit einem Rahmen markiert ist. Sherlook unterstĂŒtzt bis zu 99 solcher TextkĂ€sten. Sinnvoll ist das Verfahren besonders beim Spaltenumbruch. Rahmen verhindern, daĂ eine zu unterschiedlichen Spalten gehörende Zeile nicht durchgehend waagerecht analysiert wird.
Einspaltige Buchseiten lassen sich auch automatisch per Mausklick mit Rahmen versehen. ZusĂ€tzlich gibtâs noch fixe Rahmen, z.B. fĂŒr Karteikarten mit gleichem Format, die nach Laden einer neuen Grafik vollautomatisch aufgezogen werden.
Beim ersten Programmstart finden sie noch keine Bibliotheken vor. Beginnen Sie den Texterkennungsvorgang zunĂ€chst im Lernmodus. HierfĂŒr gibt es zwei Grundeinstellungen:
- Lernen
- Lernen und gleichzeitiges Erkennen
Im Modus 1 werden nur wenige Zeilen eingerahmt und charakteristische Eigenschaften der Schrift gelernt. Erst danach erhĂ€lt die gesamte Grafikseite einen Rahmen und das Programm schaltet in Modus 2. Nun erkennt Sherlook " immer noch in der Studienphase " gleichzeitig Text und legt ihn als ASCII-Zeichen im Textpuffer ab. Das Lernen funktioniert wie bei allen intelligenten OCR-Programmen: In einem Fenster werden Buchstaben als Pixel-Muster angezeigt, in einem anderen ĂŒberschauen Sie die gesamte Textumgebung. Ăber die Tastatur wird den Pixel-Mustern ein Buchstabe zugeordnet.
Bei schlechteren Vorlagen kleben Lettern hÀufig aneinander. In der Typografie werden miteinander verbundene Buchstaben Ligaturen genannt. HÀufig sind davon eine Reihe typischer Zweierkombinationen, z.B. »fi« oder »ft« betroffen. Sherlook ermöglicht sogar die Trennung von Dreiergruppen.
Eine weitere Besonderheit: Verwaschene Buchstaben lassen sich per Undo-Taste in den Text ĂŒbernehmen. Sie werden dann allerdings, um das Spektrum möglicher Pixel-Muster nicht zu verfĂ€lschen, nicht in die Bibliothek eingefĂŒgt.
Allerdings kann man bei Sherlook im Lernmodus, der sich jederzeit abschalten lĂ€Ăt, falsche Eingaben nicht auf direktem Weg korrigieren. Ersatzweise gibt es Funktionen zur nachtrĂ€glichen Bearbeitung der Bibliothek. Bei nichterkannten Zeichen fĂŒgt das Programm an deren Stelle eine freiwĂ€hlbare Zeichenfolge in den ASCII-Text ein, die anzeigt, daĂ ein Zeichen keinem Pixel-Muster der Bibliothek zugeordnet werden konnte. Alle Parameter, Suchpfade, Bibliotheksnamen und Rahmen lassen sich in einer Job-Datei speichern. Bei identischen Vorlagen sind damit keine ParameterverĂ€nderungen mehr -notwendig. Job-Dateien steuern auch die gesamte Texterkennungsprozedur. Notwendige Voraussetzung: Gescannte Bilder mĂŒssen durchgehend numeriert werden. Erkannter Text wird dann an bestehende ASCII-Dateien angehĂ€ngt. Bei groĂen Festplatten scannen Sie zunĂ€chst alle Texte ein " Sherlook liest ĂŒber Nacht nach.
DarĂŒber hinaus lassen sich Texte zur Weiterverarbeitung im »1st Word Plus«-Format, als ASCII mit oder ohne CR, oder in verschiedenen Datenbankformaten speichern.
Zum AbschluĂ das unvermeidliche Wort zum Handbuch. Der gewichtige DIN-A5-Ringordner lĂ€Ăt Gutes vermuten. Auf rund 50 Seiten erfahren Anwender allerdings gerade das Allernötigste. Obwohl das Programm nach kurzer Einarbeitung komfortabel zu handhaben ist " die Abhandlung möglicher Probleme auf eine einzige Handbuchseite ist unangemessen. Zudem verweisen die Autoren wiederholt auf frĂŒhere Textstellen. Ein Index zum schnellen Auffinden fehlt allerdings.
Letztlich konnte aber auch die spĂ€rliche Dokumentation den hervorragenden Gesamteindruck, den Sherlook hinterlieĂ, nicht schmĂ€lern. Das Programm gehört zur Creme ambitionierter OCR-Software. (em)
Sherlook Professional
Hersteller: 3K Computer
Preis:** 1000 Mark
StĂ€rken: schnelle Texterkennung mit hoher Trefferquote, Automatisierung alter ArbeftsgĂ€nge, durchdachte BenutzerfĂŒhrung
SchwÀchen: mangelhafte Dokumentation
Fazit: ideale OCE-Software fĂŒr groĂe Textmengen mit gleicher typografischer Charakteristik