Signum!, Script und Scarabus im Dienste der Sprachwissenschaft

Die Text- und Dokumentverarbeitungsprogramme Signum! und Script sowie der Font-Editor Scarabus ermöglichen auf dem Gebiet der Phonologie und Phonetik, nämlich im Bereich der Transkription und Transliteration, sowohl für Sprachwissenschaftler, Lexikologen und Dolmetscher als auch für Bibliothekare eine sensationelle Arbeitserleichterung. Ihre Verwendung macht eine vollautomatische Transliteration und eine teil- bis vollautomatische Transkription zwischen vielen Laut- und Schriftsystemen möglich.

Phonologie ist eine Teildisziplin der Linguistik, die sich mit dem semiotischen Aspekt der Laute und deren Merkmalen beschäftigt. Phonetik (Lautlehre) ist ebenfalls eine Teildisziplin der Linguistik, die die physikalischen (akustischen) und physiologischen (artikulatorischen) Eigenschaften der Laute und Lautgebilde untersucht. Es werden phonetische und phonologische Transkriptionen (oder Umschriften und Lautschriften) unterschieden. Unter phonetischer Transkription versteht man die genaue schriftliche Wiedergabe der gesprochenen Sprache mit dem Ziel, jeden Laut eindeutig zu bezeichnen. Bei der phonologischen Transkription handelt es sich um die genaue und eindeutige schriftliche Wiedergabe jedes Phonems (der kleinsten linearen bedeutungsdiffenzierenden sprachlichen Einheit, wie z.B. ‘d’ und ‘t’ in danken und tanken).

Unter Transliteration versteht man die Wiedergabe der Buchstaben eines Alphabets mit den Buchstaben eines anderen Alphabets nach festgelegten Entsprechungen. Die Transliteration wird z.B. zwi schen der russische und der deutschen Sprache, nämlich zwischen der kyrillischen und der lateinischen Schrift, verwendet. Vor allem wird die Transliteration zwischen diesen beiden Schriften in der wissenschaftlichen Spezialliteratur zur Information und Dokumentation (besonders im Bibliothekenwesen) angewendet.

Wissenschaftliche Textverarbeitung

Zur Zeit gibt es zahlreiche Textverarbeitungsprogramme, und ihre Zahl steigt weiter. Viele dieser Programme bieten vergleichbare Möglichkeiten, sind aber eher für einfache Büroarbeiten gedacht und wer den auch hauptsächlich für solche Zwecke verwendet. Wenn jedoch ein Geistes- oder Naturwissenschaftler besondere wissenschaftliche Texte gestalten will, über schreitet dies vielfach die Möglichkeiten gewöhnlicher Textverarbeitungsprogramme. Dies gilt z.B für Sprachwissenschaftler bei Verwendung von Sonderzeichen oder fremden Schriften oder für Naturwissenschaftler bei der Gestaltung mathematischer oder chemischer Formeln.

Es wird heute häufig behauptet, daß es für wissenschaftliche Manuskripte geeignete Spezial-Software gäbe. Die vorhandenen Textprogramme können nach ihren Eigenschaften und Verwendungsmöglichkeiten in drei Anwendungsgruppen aufgeteilt wer den:

Bisher hat man versucht, Textverarbeitungsprogramme als Allzweckprogramme zu entwickeln. Das Ergebnis ist, daß neue und moderne Textprogramme häufig 15 bis 20 oder mehr Programmdisketten haben. Die dazugehörigen Handbücher und Dokumentationen werden immer dicker und haben manchmal mehr als 1000 Seiten. Sekretärinnen und sogar Wissenschaftler verlieren beim Anblick so vieler Disketten und derartig umfangreicher Dokumentationen oft die Lust, mit solchen Textprogrammen zu arbeiten. Ein Naturwissenschaftler, der häufig Formeln konstruieren muß, braucht natürlich eine Spezial-Software. Ein Geisteswissenschaftler, der Sprachen untersucht und sich mit fremden Schriften beschäftigt, braucht wiederum eine andere Spezial-Software. Glücklicherweise gibt es für Naturwissenschaftler immerhin einige Textprogramme, mit denen man Formeln konstruieren kann. Einige dieser Programme enthalten sogar griechische 3 Buchstaben. Hierzu gehören:TeX,T3, Stark Windows, Wi-Tex, Scientex Publisher und andere.

Für Geisteswissenschaftler, z.B. für Sprachwissenschaftler, gibt es leider keine Spezial-Software. Es gibt kaum Textverarbeitungsprogramme, mit denen man Wortlisten fremder Sprachen sortieren könnte, und zwar weder in normaler Reihenfolge noch rückläufig. Es ist eine Seltenheit, ein Textprogramm zu finden, mit dem man das Graphemsystem (die Buchstaben) einer Sprache automatisch phonemisieren bzw. in Lautschrift umsetzen kann. Wissenschaftler, die sich mit der Herstellung von Wörterbüchern beschäftigen, wünschen sich Programme, die mehrere Zeichensätze anbieten und Texte mehrspaltig, und zwar in mehreren Schriften (z.B. Latein, Griechisch, Hebräisch usw.) sortiert, ausdrucken können.

Signum! und Script gehören zu der Software-Gruppe, die zumindest einige dieser Wünsche er füllt.

Automatische Transkription und Transliteration

Man kann zwischen interner und externer automatischer Transkription und Transliteration unterscheiden. Bei der internen Transkription und Transliteration handelt es sich um Vorgänge zwischen verschiedener Atari-Software und bei der externen zwischen der Software zweier unterschiedlicher Systeme, z.B. zwischen Atari-und IBM-Software.

Die automatische Transkription und Transliteration werden im folgenden schrittweise dargestellt:

Interne Transkription und Transliteration

Bild 2

Zur internen Transkription und Transliteration werden die Textverarbeitungsprogramme Signum! und Script sowie der Font-Editor Scarabus verwendet.

Nehmen wir an, wir wollen einen in der Kyrillschrift geschriebenen Text in die Lateinschrift transliterieren bzw. die russische Sprache mit Hilfe der Latein schrift transkribieren. Für die Kyrillschrift, Transkriptions- und Transliterationssymbole benötigen wir drei Zeichensätze. Den Zeichensatz der Kyrillschrift nennen wir „KYRIL“, den Zeichensatz für die Transkription „KYRILTRA“ und den für die Transliteration „KYRILLIT“. Diese Zeichensätze werden mit dem Font-Editor Scarabus editiert bzw. generiert. Man kann hierzu den Zeichensatz „Rusantik (Kyrillschrift)“ von Diskette Nr. 19 der Sifox-Disketten benutzen. Die Zeichensätze für die Transkripti on und Transliteration können z.B. auf der Basis des Zeichensatzes „Antikro“ editiert werden, und zwar nach folgendem Muster (die Editierung der dargestellten Schriftzeichen basiert auf dem graphemischen bzw. phonologischen System der russischen Sprache, das in „Die russische Sprache der Gegenwart, Band 1 Phonologie, von Kurt Gabka 1975“ dargestellt worden ist).

Wie die drei Zeichensätze veranschaulicht werden können, kann man Bild 2 (KYRIL für die Kyrillschrift), Bild 3 (KYRILTRA zur Transkription der russischen Sprache, die Groß- und Kleinschreibung werden in der Transkription nicht unterschieden) und Bild 4 (KYRILLIT zur Transliteration der Kyrillschrift) entnehmen.

Der kurze russische Text aus Bild 5 kann jetzt mit dem Zeichensatz KYRIL im Textverarbeitungsprogramm Signum!geschrieben wer den. Der Text wird unter KYRIL.SDO gespeichert. Da er sowohl transkribiert als auch transliteriert werden soll, wird er auch im ASCII-Lormat unter TRA.SDO gespeichert. Um den Text zu transkribieren, geht man nun wie folgt vor:

Da es hier nur um eine Demonstration der Umschreibung geht, wird ein vereinfachtes Transkriptionssystem verwendet. Da nicht alle phonetischen bzw. phonologischen Eigenschaften der Laute im Zeichensatz übertragbar sind, muß man bis zu 5% des Textes nachkorrigieren. Bei Anwendung eines ähnlichen Verfahrens und Wahl des Zeichensatzes LIT.SDO würden wir den russischen Text als Transliterationsform (siehe Bild 7).

Bei der Transliteration, also der Wiedergabe von Schriftzeichen des Kyrillischen in lateinischen Schriftzeichen, gibt es eine systematische Entsprechung. Deshalb ist eine Nachverbesserung des Transliterationstextes nicht nötig.

Ähnliche Verfahren kann man auch mit linksläufigen Schriften wie Arabisch-Persisch und Hebräisch anwenden. Bei solchen Schriften entsteht z.B.die lateinische Transkription in umgekehrter Zeichenfolge. Dies läßt sich durch ein Umkehrprogramm, das man in einer Programmiersprache schreibt, beseitigen. Übersetzung des Textes:

Einige Tage nach der Ankunft des Lehrers erinnerte sich Trojekurow seiner und beschloß, ihm eine Kostprobe von dem Bärenzimmer zu geben; er ließ ihn deshalb eines Morgens rufen und führte ihn durch dunkle Gänge.
(aus: Dubrowskij von A.S. Puschkin.)

Mit dem Textverarbeitungsprogramm SCRIPT können die Transkriptions- und Transliterationsverfahren viel einfacher und eleganter durchgeführt werden:

Um die Transkription und Transliteration dieses Textes in Script zu erzeugen, braucht man nur den Originaltext zu selektieren, zu kopieren und den nötigen Zeichensatz in der Menüleiste anzuklicken.

Wenn man den wieder Kyrillschrift geschriebenen Text selektiert und den Zeichensatz Kyrillit unter Font in der Menü leiste anklickt, erscheint als Resultat die Transliteration des Textes.

Externe Transkription und Transliteration

Zur externen Transkription und Transliteration werden folgende zwei Möglichkeiten dargestellt: Zwischen IBM und Atari bzw. zwischen WordPerfect und Signum!

Da der Atari-Computer mit MS-DOS formatierte Disketten lesen kann, ist eine Art Datenaustausch zwischen beiden Geräten möglich. Durch diesen Datenaustausch können sowohl Transkriptions als auch Transliterationsverfahren durchgeführt werden.

Als Beispiel für diese beide Verfahren wird über folgenden Datenaustausch, der vom Verfasser dieses Artikel durchgeführt wurde, berichtet. In WordPerfect wurden vom Verfasser etwa 30.000 persische Wörter mit Hilfe der Software Printer Polyglott vom Software-Haus Mikado (Berlin) in persisch-arabischer Schrift eingegeben, mit dem Ziel, ein rückläufiges Wörterbuch des Neu persischen herzustellen. Da das Wörterbuch dreispaltig (parallel) in drei verschiedenen Schrifttypen ausgedruckt werden mußte, war es unmöglich, es mit WordPerfect zu erstellen. Da der IBM-Zeichensatz aus 28 = 256 Zeichen besteht, können in Printer Polyglott nur zwei Zeichensätze gleichzeitig verwendet werden. Es mußte also ein anderes Textverarbeitungsprogramm gefunden werden. Nach langem Suchen wurde klar, daß das einzige Textverarbeitungsprogramm, das diese Aufgabe bewältigen könnte, Signum! Wäre.

Die Übertragung von 30.000 persischen Wörter wurde durch automatische Transliteration, und zwar in folgenden Schritten durchgeführt:

Transkription und Transliteration durch Digitalisierung

(mit Scanner und OCR-Software)

Die Verwendung des Scanner und der OCR-Software ist dann sinnvoll, wenn eine größere Datenmenge verarbeitet werden soll. Bis vor kurzem war nur das Lesen genormter Schriften möglich. Jetzt gibt es omnifont-fähige OCR-Software wie Readstar 6 (von der Firma Inovik, Freiburg), die alle Schriftarten, wie z.B. Griechisch, Kyrillisch, Sonderzeichen usw., erkennen und erfassen kann.

Der Scanner und die OCR-Software können in der automatischen Transkription und Transliteration folgendermaßen eingesetzt werden. Nehmen wir an, daß 50 Seiten eines in der Kyrillschrift gedruckten Textes oder einer Wörter- oder Namensliste transkribiert bzw. transliteriert wer den sollen. Dies geschieht in folgenden Schritten:

Das Ergebnis ist wie erwartet die Transkription bzw. Transliteration des in Kyrillschrift geschriebenen Textes. Beim Scannen und der Texterfassung muß man mit bis zu 3% Fehlern rechnen. Diese Fehlerquote kann aber als Entwicklungsproblem betrachtet werden, das allmählich beseitigt werden wird. Der Einsatz der OCR-Software und des Scanners in der automatischen Transkription, Transliteration und der Sprachwissenschaft im allgemeinen kann als Bahnbrecher in der Entwicklung neuerer und intelligenterer Software betrachtet wer den. Die OCR-Software, die Lesegeräte (Scanner) und Textverarbeitungsprogramme wie Signum! und Script sowie Font-Editoren wie Scarabus können in computerunterstützten graphematischen Untersuchungen, bei der automatischen phonetisch-phonologischen Transkription geschriebener und gedruckter Texte so wie bei der Transliteration eine große Rolle spielen.

Dr. Mohammed-Reza Majidi

Literatur:

Batori, Istvan S. u.a. (Hrsg. 1989): Computerlinguistik, Berlin, New York

Gabka, Kurt (Hrsg. 1975): Die russische Sprache der Gegenwart, Band 1 Phonologie, Düsseldorf

Göckel, Harald (1988): WordPerfect, 2. erweiterte Auflage, Heidelberg

Majidi, Mohammad-Reza (1990): „Signum!, ein leistungsfähiges Werkzeug für Geistes- und Naturwissenschaftler“: RZ MEMO (Rechenzentrums Memo der Universität Hamburg, 3:10-11.

Schmerbeck, Franz (1987): Signum!, ein System zur Textverarbeitung, Heidelberg.

WordPerfect für IBM-Computer (Version 4.2. 1987), WordPerfect Corporation, Orem



Aus: ST-Computer 02 / 1992, Seite 12

Links

Copyright-Bestimmungen: siehe Über diese Seite