GFA-Statistik bringt Durchblick und System in Ihre Zahlenkolonnen
Eine der wichtigsten Anwendungen im wissenschaftlichen Bereich sind Statistikprogrammpakete. Die großen Programmnamen in diesem Bereich sind BMDP, SAS und das wohl bekannteste SPSS. Die verschiedensten Fachgebiete, wie Medizin, Psychologie, Biologie, Physik, Chemie, etc. benötigen solche Programme für die Auswertung von Untersuchungen.
Neben den Anwendungsmöglichkeiten im wissenschaftlichen Bereich, finden solche Programme im Wirtschaftsbereich Verwendung, etwa in Marktforschungsbüros. Daneben gibt es große Einsatzgebiete im industriellen und technischen Bereich. Bei der Produktion von elektronischen Bauteilen interessiert man sich für den Anteil fehlerhafter Teile oder für das Ausmaß der Abweichung von Sollwerten. Mit Hilfe statistischer Verfahren untersucht man, wie solche Eigenschaften mit verschiedenen Fertigungsmethoden Zusammenhängen.
Um mit den existierenden Statistikprogrammpaketen, etwa mit SPSS, eine Auswertung durchzuführen, muß man neben statistischen Kenntnissen auch die Kommandosprache dieses Programms beherrschen. Diese ist so komplex, daß die Rechenzentren von Universitäten semesterlange Kurse darüber durchführen.
Das Programm »GFA-Statistik« verzichtet auf eine eigene Kommandosprache. Es besitzt eine einfache GEM-Oberfläche, die lange Einarbeitungszeit erspart und dem Benutzer gestattet, die gewünschten Verfahren mit Hilfe der Maus oder über einfache Tastaturkommandos aufzurufen. Bevor wir jedoch den Leistungsumfang des Programms beschreiben, geben wir Ihnen noch einige Hintergrundinformationen über die Autoren.
Die Auswahl der Verfahren, die in GFA-Statistik enthalten sind, hat ein international bekannter Fachmann durchgeführt. Prof. Dr. Krauth lehrt am psychologischen Institut der Universität Düsseldorf, ist aber von seiner Ausbildung her Mathematiker und wurde bekannt durch die Entwicklung der Konfigurations-Frequenzanalyse zusammen mit Prof. Lienert. Er beschäftigt sich mit sogenannten nichtparametrischen Verfahren und hat in diesem Gebiet vor kurzem das Buch »Distribution-free Statistics: An Application-oriented Approach« veröffentlicht.
Prof. Krauth führte die Auswahl und Tests der implementierten Verfahren durch und verfaßte die rund 230 Seiten lange Beschreibung der statistischen Verfahren, die zum Handbuch von GFA-Statistik gehört. Der Hauptautor des Programms ist Dr. Wolfgang Buscher, der als wissenschaftlicher Mitarbeiter bei Prof. Krauth arbeitet. Er hatte praktisch mit statistischen Auswertungen im Bereich der Lern- und Pharmaforschung zu tun. Bei dieser Arbeit wurde er immer wieder mit den Unzulänglichkeiten bestehender Statistikprogramme konfrontiert, so daß der Gedanke entstand, selbst ein solches Programmpaket zu entwickeln. Der dritte Entwickler, Gottfried Engels, war einige Zeit am Lehrstuhl von Prof. Krauth als wissenschaftlicher Mitarbeiter beschäftigt und arbeitet zur Zeit für die GFA-Systemtechnik als Programmierer und Buchautor.
Nun zum Programm selbst. Was leistet es und wie bedient man es? Nach dem Starten des Programms gelangen Sie zunächst in den integrierten Dateneditor, mit dem Sie Daten eingeben und bearbeiten. Die Daten sind in Form einer zweidimensionalen Matrix verwaltet. Im Bild 1 erkennen Sie unter der Menüleiste die Zeile mit den Spaltennamen. Diese Namen sind beispielsweise die Namen von untersuchten Gruppen, Versuchstierkennungen oder Variablennamen. Darunter sind jeweils drei Spalten der Datenmatrix dargestellt.
Die Anzahl der darzustellenden Nachkommastellen stellt der Benutzer ein. Verläßt er eine Zelle der Datenmatrix, nachdem er einen Wert hineingeschrieben hat, formatiert das Programm den Wert auf die entsprechende Nachkommastellenzahl. Um fehlende Werte einzugeben, dient die Tilde als »Missing-Value-Code«.
Die Größe der Datenmatrix wählt der Benutzer relativ frei. Dabei stößt er natürlich irgendwann an die Grenze der Speicherkapazität seines Computers, da GFA-Statistik immer alle Daten im Speicher hält, um sie besonders schnell zu verarbeiten. Verfügen Sie über die Mindestanforderung von einem Megabyte Speicherplatz, verwaltet das Programm etwa 5000 Werte.
Alle Funktionen des Dateneditors, die in den Pull-Down-Menüs untergebracht sind, rufen Sie auch über Tastatur ab. Editiermöglichkeiten, wie man sie von Texteditoren kennt, sind ebenfalls vorhanden, also Cursorsteuerung, Backspace und Delete, bildschirmweises Blättern sowie eine UNDO-Funktion und ein Kommando, um eine beliebige Position der Datenmatrix anzuspringen.
Im Menü mit dem Namen »Datei« finden sich die Einträge zum Laden und Speichern von Daten. Dabei erkennt das Programm das eigene STA-Format. Es ist mit anderen Programmen nicht kompatibel, erlaubt jedoch eine besonders schnelle und platzsparende Speicherung auf Diskette oder Festplatte. Zu dem Zeitpunkt, als dieser Artikel geschrieben wurde, stand die Liste der Fremdformate noch nicht vollständig fest, aber es gehören dazu die Formate gängiger Spreadsheets, Datenbanken und anderer Statistikprogramme.
Das nächste Pull-Down-Menü trägt die Überschrift »Werte«. Die ersten beiden Einträge dieses Menüs dienen dem Suchen und Ersetzen von Werten. Nach ihrem Aufruf erscheinen entsprechende Dialogboxen, die die Eingabe von Such-und Ersatzwert sowie einiger Einstellungen bietet. Die nächsten beiden Einträge ^ dienen dem Löschen und Einfügen von Werten in die Datenmatrix. Geübte Benutzer rufen diese häufig benötigten Funktionen über Tastatur auf.
Der folgende Menüpunkt gestattet die Transformation von Werten. In Bild 2 ist das entsprechende Eingabefeld zu sehen. Neben Transformationen wie der Logarithmierung der Daten, finden sich hier auch Einträge, mit deren Hilfe Sie die Werte einer Datenspalte sortieren oder in ihre Ränge überführen. Transformationen benötigen Statistiker dann, wenn der Zusammenhang zwischen zwei Variablen nicht linear ist, sondern etwa exponentiell verläuft. Durch eine geeignete Transformation linearisieren Sie solche Zusammenhänge und vereinfachen so die Analyse und Interpretation der Daten.
Im Bild 2 erkennt man außerdem einen Eintrag zur Behandlung fehlender Werte (Missing Value). Hier ersetzen arithmetische oder harmonische Mittel der restlichen Werte die fehlenden Einträge der Datenspalte. Es ist dem Benutzer nicht gestattet, mit fehlenden Werten in den Auswertungsteil zu wechseln, er muß zunächst festlegen, auf welche Art und Weise GFA-Statistik mit den fehlenden Werten umgehen soll. Der letzte Eintrag im Menü »Werte« ist der Druckbefehl. Hier nehmen Sie verschiedene Einstellungen für die Ausgabe der Daten auf dem Drucker vor, etwa die Anzahl der Druckspalten sowie die Vor- und Nachkommastellenzahl.
Im Menü »Gruppe« finden sich Einträge zur Einrichtung neuer Gruppen und zum Zerlegen sowie Zusammenfügen von Gruppen. Unter einer Gruppe versteht das Programm immer eine Spalte der Datenmatrix. Die Zerlegung einer Gruppe ermöglicht es, Teile einer Datenspalte getrennt auszuwerten. Der nächste Eintrag dient dazu, aus einer anderen Datenmatrix Gruppen, also Spalten, herauszuschneiden und an die im Speicher befindliche Matrix anzuhängen. Der letzte Eintrag dieses Menüs erlaubt die Änderung von Gruppennamen.
Das Menü »Lösche« bietet zunächst Befehle zum Löschen einzelner oder aller Gruppen der Datenmatrix. Hinter einem Eintrag mit dem Namen »Gruppenteil löschen« befindet sich eine Funktion, mit der man Teile einer Datenspalte löscht. Davon muß man die nächste Funktion zum Löschen von Wertebereichen innerhalb einer Gruppe unterscheiden. Mit ihr geben Sie an, daß alle Daten, die innerhalb eines bestimmten Wertebereichs liegen, zu löschen sind, unabhängig davon, an welcher Position sie in der Gruppe stehen. Eine solche Funktion ist sinnvoll, wenn man Meßfehler aus seinen Daten beseitigt. Verwenden Sie etwa ein Blutdruckmeßgerät, das mehrmals aufgrund von Fehlbedienungen Blutdruckwerte von 10 mm Hg meldete, dann beseitigen Sie diese Werte, indem man das Programm auffordert, alle Werte, die kleiner als 20 sind, aus der Datengruppe zu entfernen. Im letzten Pull-Down-Menü findet man Einträge zur Veränderung der Datenmatrixgröße und zur Einstellung verschiedener Programmparameter.
Der Auswertungsteil von GFA-Statistik besitzt drei große Pull-Down-Menüs. Das erste dieser Menüs trägt den Namen »Deskriptive Statistik«. Die deskriptive (beschreibende) Statistik hat das Ziel, Datenmengen übersichtlich zusammenzufassen. Dies kann auf numerische Art geschehen, durch die Berechnung von Mittelwerten oder mit Hilfe von Grafiken. Die ersten beiden Einträge des Menüs enthalten deskriptive Verfahren für eine und zwei Gruppen. Wenn man den Eintrag »Zwei Stichproben« wählt, erscheint ein Pop-Up-Menü, in dem Sie die gewünschten Gruppen anwählen. Das Programm berechnet die deskriptiven Kennwerte für diese Gruppen, die in drei Arten zerfallen, nämlich in Lage-, Streu-ungs- und Zusammenhangsmaße.
Die berechneten Lagemaße sind das arithmetische, geometrische und harmonische Mittel sowie Median, Minimum und Maximum. Als Streuungsmaße werden Varianz, Standardabweichung, Standardfehler, Variationskoeffizient, Medianabweichung und Spannweite berechnet. Auf einer zweiten Bildschirmseite findet der Benutzer Schiefe und Exzeß der Daten beider Gruppen und die Konfidenzintervalle für den Erwartungswert, Varianz und Standardabweichung. Auf dieser zweiten Seite sind auch die Zusammenhangsmaße aufgeführt. Dies sind die Kovarianz, Pearsons Produkt-Moment-Korrelation, der Spearmansche Rangkorrelationskoeffizient und Kendalls Tau. Auch für Pearsons-Korrelationskoeffizient wird ein Konfidenzintervall berechnet. Zusätzlich erzeugt das Programm eine einfache lineare Regression zwischen den beiden ausgewählten Gruppen.
Immer dann, wenn GFA-Statistik Ergebnisse auf dem Bildschirm darbietet, gelangen Sie mit Hilfe einer Tastenkombination in den sogenannten Druckeditor des Programms. Dabei handelt es sich um einen einfachen Texteditor, der die angezeigten Ergebnisse übernimmt. Hier editieren und drucken Sie oder speichern die Daten als ASCII-Datei. Zwei weitere Menüpunkte erlauben es, Lage-und Streuungsmaße für mehr als zwei Gruppen zu berechnen oder Korrelationsmatrizen beliebig vieler Gruppen anzufertigen. Auch die Berechnung von Phi-Koeffizienten ist möglich.
In diesem ersten Pull-Down-Menü befinden sich außerdem zwei Einträge zur Berechnung von p-Werten und Quantilen verschiedener Verteilungen. Beliebige Quantile bestimmen Sie für die Normal-und Standardnormalverteilung sowie für die t-, Chi-Quadrat-, F- und Exponentialverteilung. Die p-Werte ermitteln Sie darüber hinaus noch für die Binomial-, Poisson-, und die hypergeometrische Verteilung.
Der letzte Menüpunkt enthält das Grafikmenü. In diesem Menü sind rund 15 Grafiktypen vorhanden, wie Histogramme für die absolute oder relative Häufigkeit und die empirische Dichte, Stab- und Tortendiagramme, etc. Außerdem gibt es weitere Grafiken in Verbindung mit der Regressionsanalyse und der Analyse von Verlaufskurven. Es handelt sich bei GFA-Statistik jedoch nicht um ein Programm zur grafischen Darstellung von Daten. Statistiker sind fast ausschließlich an einer numerischen Analyse von Daten interessiert, Grafiken spielen dabei nur eine kleine Nebenrolle. Zu GFA-Statistik erscheint noch ein Grafikprogramm, das sich derzeit in der Planung befindet. Dieses Programm dient ausschließlich der bildhaften Präsentation von Daten.
Das zweite Pull-Down-Menü dieses Programmteils trägt den Namen Inferenzstatistik. Dieser Begriff bedeutet soviel wie »schließende«, man könnte auch sagen, schlußfolgernde Statistik. Ein typisches Beispiel für diese Form der Statistik ist der Vergleich von zwei Gruppen, etwa von zwei unterschiedlich behandelten Patientengruppen, um herauszufinden, welche Behandlungsform erfolgreicher war.
Das Pull-Down-Menü Inferenzstatistik enthält zwei Einträge mit den Namen »parametrisch« und »nicht-parametrisch«. Wenn man einen dieser Einträge aufruft, so erscheint eine große Dialogbox, die eine Auswahl von Signifikanztests darbietet. Im Bild 3 ist die Dialogbox für den Menüpunkt »nicht parametrisch« abgebildet. Der Unterschied zwischen den parametrischen und den nicht parametrischen Signifikanztests besteht darin, daß die parametrischen eine bestimmte Verteilungen der Daten voraussetzen, in der Regel eine Normalverteilung. An parametrischen Signifikanztests bietet GFA-Statistik für eine Stichprobe den Einstichproben t-Test und seine robustifizierte Variante.
Bei der Robustifizierung handelt es sich um ein einfaches Verfahren, mit dessen Hilfe man auch Werte aus Datensätzen untersucht, in denen Ausreißer, also atypisch extreme Werte, vorliegen. Außerdem gibt es den Chi-Quadrat-Test für die Varianz einer Stichprobe. Die Zwei-Stichproben-Tests sind unterteilt in solche für abhängige und für unabhängige Stichproben. Bei den abhängigen Tests gibt es den paarigen t-Test in seiner normalen und robustifizierten Variante, den Morgan-Test für den Varianzvergleich und für die Untersuchung des Zusammenhangs der Gruppen den t- und z-Test für den Korrelationskoeffizienten.
Für zwei unabhängige Stichproben liegt wiederum der entsprechende t-Test in seiner normalen und robustifizierten Form vor, sowie der Welch-Test, der im Unterschied zu den t-Tests keine gleichen Stichprobenvarianzen voraussetzt. Die Varianzen vergleichen Sie mit Hilfe des F-Tests für Varianzen, die Korrelation der Gruppen prüfen Sie mit dem z-Test für Korrelationen auf Signifikanz. Für mehr als zwei Stichproben gibt es den Bartlett-Test für Varianzvergleiche und den Chi-Quadrat-Test für die Korrelation. Tests für den Erwartungswertvergleich sind hier nicht zu finden, da dies für mehr als zwei Stichproben das Testproblem der einfaktoriellen Varianzanalyse ist.
Bei den nicht-parametrischen Signifikanztests kann der Benutzer des Programms natürlich Besonderes erwarten, da hier das Hauptinteresse von Prof. Dr. Krauth lag. Für eine Stichprobe errechnet das Programm einen exakten Binomialtest und den Wilcoxon-Vorzeichen-Rangtest. Um zu prüfen, ob die Daten mit der Annahme einer Normalverteilung verträglich sind, besteht noch die Möglichkeit, einen Chi-Quadrat-Anpassungstest auf Vorliegen einer Normalverteilung durchzuführen.
Die nächste Rubrik umfaßt Tests für zwei abhängige Stichproben. Der McNemar- und der Fisher-Test dienen der Untersuchung von Vierfeldertafeln. Cohens Kappa vergleicht die Beurteilung von zwei unabhängigen Gutachtern, etwa zwei ärztliche Diagnosen. Der Lam-Longnecker-Test ist das nicht parametrische Äquivalent zum paarigen t-Test. Der Chi-Quadrat-Test auf Unabhängigkeit dient zur Überprüfung der Unabhängigkeit in Kontingenztafeln, während Spearmans- und Kendalls-Rangkorrelationstests die Abhängigkeitsstruktur der beiden Gruppen untersuchen. In der Zeile der nicht-parametrischen Signifikanztests für zwei unabhängige Gruppen, findet der Programmbenutzer den entsprechenden Fisher-Test, den Vorzeichen-Test und den vielleicht bekanntesten nichtparametrischen Test, den Wilcoxon-Mann-Whitney-U-Test.
Zu guter Letzt gibt es für den Vergleich von mehr als zwei unabhängigen Stichproben den Kruskal-Wallis- und den Terpstra-Jonckheere-Test als Verallgemeinerungen des U-Tests. Der Pfanzagl-Test ist ein Trend-Test für Wahrscheinlichkeiten (nimmt z.B. die Wahrscheinlichkeit für die Akzeptanz einer neu entwickelten Werbung mit wachsendem Bildungsniveau ab?). Der hier aufgeführte Chi-Quadrat-Test prüft die Homogenität in Kontingenztafeln und der Friedman-Test vergleicht die Verteilungen der Daten mehrerer, intern möglichst homogener, Gruppen.
Der Ablauf bei der Durchführung eines Signifikanztests ist für die verschiedenen Tests sehr ähnlich. Wird beispielsweise der paarige t-Test gewählt, so erscheint ein Pop-Up-Menü mit den Gruppennamen, in dem der Anwender die beiden zu vergleichenden Gruppen wählt. Danach zeigt ein zweites Pop-Up-Menü die möglichen testbaren Hypothesen. Wenn er sich für eine Hypothese entschieden hat, führt das Programm den Test durch und zeigt als Ergebnis die Zahl der Freiheitsgrade, den Testwert und den exakten p-Wert des Testergebnisses. Der Benutzer braucht also kein Signifikanzniveau anzugeben, weil ihm ja nicht nur die Information signifikant oder nicht signifikant geboten werden soll, sondern eben der exakte p-Wert. Er braucht dann nur zu kontrollieren, ob dieser Wert ihm »signifikant genug« ist oder nicht.
Das dritte große Pull-Down-Menü enthält komplexere Auswertungsverfahren, nämlich Regressions-, Varianz- und Kovarianzanalyse sowie Verfahren zur Analyse von Verlaufskurven. Mancher Leser wird jetzt möglicherweise Verfahren wie Faktor-, Diskriminanz- und Clusteranalyse vermissen. Solche und weitere Analyseverfahren sind für ein zweites Programmpaket geplant. Die Regressionsanalyse zerfällt in folgende Teile: einfache lineare, multiple lineare und polynomial Regression. Darüber hinaus gibt es einen Untermenüpunkt für den Vergleich von mehreren unabhängigen Regressionsgeraden. Im Bild 4 ist als Beispiel das Ergebnis einer polynomialen Regression dritter Ordnung abgebildet. Neben den Regressionskoeffizienten erhält man eine Fülle weiterer Informationen, wie die Konfidenzintervalle oder Maße für den Anteil aufgeklärter Varianz.
Rechts oben in Bild 4 sind die Buchstaben T, G, V und ein Pfeil nach links zu sehen. Durch das Anklicken dieser Zeichen mit der Maus oder das Drücken der entsprechenden Tasten gelangt man zu weiteren Informationen. Hinter dem T verbergen sich weitere Signifikanztests, nämlich ein Test auf polynomiale Regression, ein Test für die Regressionsbeziehung und Tests für die einzelnen partiellen Regressionskoeffizienten. Durch die Wahl des Buchstaben G erreicht man die grafische Darstellung der Meßwerte und des Polynoms. Mit Hilfe des Menüpunktes V kann man Vorhersagen für Werte durchführen. Der Pfeil nach links blättert auf eine zweite Seite, auf der die Standardabweichungen, die t-Werte und die oberen p-Werte der partiellen Regressionskoeffizienten zu finden sind. Auf die anderen regressionsanalytischen Verfahren wollen wir hier nicht näher eingehen. Wichtig ist, daß GFA-Statistik nicht einfach nur die Koeffizienten berechnet, sondern ein hohes Maß an weiteren Informationen gibt, die eine sinnvolle Interpretation der Ergebnisse erst zulassen.
Die Varianzanalyse führen Sie mit maximal drei Faktoren durch, Meßwiederholungen sind dabei auf allen drei Faktoren vorgesehen. Bild 5 zeigt das Ergebnis einer dreifachen Varianzanalyse mit Meßwiederholung auf allen Faktoren. Mit Hilfe der eingeblendeten Pfeile holen Sie die im Bild noch fehlenden Ergebnisse heran. Das Anwählen des rechts oben zu sehenden S ruft die Scheffe-Tests für den Vergleich einzelner Faktorstufen auf. Die einfaktorielle Kovarianzanalyse berechnet sich mit beliebig vielen Kovariaten. Mit Hilfe entsprechender Signifikanztests überprüfen Sie Haupteffekte, Kovariableneinfluß etc. Verlaufskurven untersuchen Sie durch die Berechnung der Autokorrelationsfunktion und der partiellen Autokorrelationsfunktion, wobei auch eine grafische Darstellung vorhanden ist. ARIMA-Modellidentifikationen sind ebenfalls durchführbar.
Weitere Menüpunkte erlauben es, die Verlaufskurve mit Hilfe einer Fourier-Reihenentwicklung in periodische Schwingungen zu zerlegen oder die Kurve durch orthogonale Polynome zu approximieren. Zum Schluß bleibt noch die Frage, was GFA-Statistik kostet. Die normale Version ist für 998 Mark zu haben. Daneben gibt es eine abgespeckte Studentenversion für 398 Mark. (wk)