Multivariate Verfahren
Mit Multivariaten Verfahren werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer Variablen zugleich, ihre Abhängigkeitsstruktur.
Häufig verwendete Multivariate Methoden sind
- Diskriminanzanalyse
- Hauptkomponentenanalyse
- Faktorenanalyse
- Clusteranalyse
- Multidimensionale Skalierung
Meist wird auch die Multiple Regression dazugezählt.
Die klassischen Verfahren sind durchwegs lineare Modelle, die besondere Anforderungen an die verwendeten Daten stellen. So sollten die Daten ausreißerfrei und nicht asymmetrisch verteilt sein. Bei Abweichen der Daten von der geforderten Struktur behilft man sich beispielsweise, indem man vorhandene Ausreißer entfernt oder die Daten einer nichtlinearen Transformation, etwa Logarithmieren unterzieht. Es existieren auch vielfach alternative Methoden, die iterativ gewonnene Lösungen ermöglichen.
Häufig verwendete Kriterien für eine optimale Lösung sind
- Distanzen zwischen Punkten in einem mehrdimensionalen Raum. Erwähnenswert ist hier vor allem die Mahalanobis-Distanz, die man grob vereinfacht als Quadrat der Euklidischen Distanz bezeichnen könnte.
- Varianzen, die minimiert bzw. maximiert werden. Die Varianz dient in der Informationstheorie als Maß für den Informationsgehalt von Daten.
Die manuelle Berechnung Multivariater Verfahren ist meistens sehr aufwändig. Daher erfuhren diese Methoden erst mit der Entwicklung der EDV ihren Aufschwung. Auch können häufig bei berechneten Ergebnissen nur wenig Angaben über zu Grunde liegende Wahrscheinlichkeitsverteilungen gemacht werden.
Beispiele
Beispiele für Verwendung von Multivariaten Verfahren:
- Um psychologische Profile zu erstellen und aufgrund von Vergleichen herauszufinden, wer der wahrscheinlichste Täter/Sprecher/Autor ist (Kriminologie, Sprachwissenschaft).
- Um den Text eines anonymen Autors zu vergleichen mit Texten von bekannten Autoren und den wahrscheinlichsten Autor zu finden (eine Spielart des zuerst genannten Punktes).
- Data Mining: Große Datenmengen in Datenbanken werden auf unbekannte Strukturen hin analysiert. Man erhofft sich hier Erkenntnisse über das Zusammenwirken verschiedener Aspekte, beispielsweise die Konsumausgaben von Kunden in Abhängigkeit vom sozialen Status durch Herausfinden von Ähnlichkeitsstrukturen.
- Entwicklung von sozialen Abstimmungsprozessen (Politische Soziologie) und der Einfluss einzelner Akteure darauf.
- Kreditwürdigkeitsprüfungen von Schuldnern (Diskriminanzanalyse).
- Bei der Wertpapieranalyse: Welche Unternehmenszahlen beeinflussen hauptsächlich die Ertragskraft eines Unternehmens? (Faktorenanalyse)
- Bei der Suche nach Ursachen für die Eiszeiten (Faktorenanalyse).
Literatur
- Peter Atteslander u.a.: Methoden der empirischen Sozialforschung. Gruyter-Verlag, 2003, ISBN 3110178176 (Grundlagenwissen)
- Anthony P.M. Coxon/P.M. Davies: The User's Guide to Multidimensional Scaling. London, 1984, (Heinemann Educational Books), ISBN 0435822519 und ISBN 0435822527 (bislang beste englischsprachige Darstellung)
