Statistik: Faktorenanalyse

Aus viel mach wenig: Eine Kurzeinführung in die Faktorenanalyse
Der Ausgangspunkt der Analyse, die mit SPSS durchgeführt wurde, ist die Frage nach den Gründen, die jemanden dazu bewegen können, bei schönem Wetter durch den Wald zu rennen, d.h. sich als Jogger zu betätigen. Um diese Frage zu beantworten, wurde diversen Personen eine Liste vorgelegt, die Motive zusammenstellt, die als Begründung für das durch-den-Wald-Rennen dienen können. Jeder “Befragte” konnte auf einer Likert-Skala, das heißt auf einer Skala, die fünf Antwortmöglichkeiten vorsieht und von der Bewertung “sehr wichtig” über “weniger wichtig” bis zu “völlig unwichtig” reicht, seine Bewertung vornehmen.

Ergebnis vorweggenommen

Die Faktorenanalyse wurde zur Datenreduktion entwickelt. Da man sich gewöhnlich ziemlich hilflos fühlt, wenn man sich einem Datenberg gegenüber sieht, der aus mehr als drei Variablen oder items besteht, ist die Faktorenanalyse zum beliebten Mittel avanciert, um den Berg in nette kleine Hügel zu zerlegen, wobei jeder Hügel mehrere der ursprünglichen Items umfasst, von denen angenommen wird, dass sie eine gemeinsame Dimension besitzen. Und so wie die Variablen, Diäten, Sektempfang, Rede, Parteitag, Berlin und private Krankenversicherung geeignet sind, die gemeinsame Dimension Mitglied des Bundestages zu konstituieren, so wird von den Items, die in einer Faktorenanalyse auf demselben Faktor laden, angenommen, dass sie eine gemeinsame Dimension, eine sogenannte latente Variable verbindet. Das war “die Theorie” und nun folgt die Praxis.

Mit dem rechts dargestellten Befehl wird eine explorative Faktorenanalyse angefordert. Grundlage der Analyse sind alle Motive, die ein Jogger für das durch-den-Wald-Rennen angeben konnte. Explorativ ist die Faktorenanalyse deswegen, weil die Anzahl der Faktoren, die am Ende der Analyse steht, dem Programm überlassen bleibt und nicht vorgegeben wird, was durchaus möglich ist; dann spricht man von einer konfirmatorischen Faktorenanalyse. Mit einer Faktorenanalyse wird – wie gesagt – untersucht, ob sich in den Daten gemeinsame Dimensionen (Faktoren) finden lassen, d.h. ob sich hinter mehreren beobachteten Variablen eine unbeobachtete latente Variable verbirgt. Zudem zeigt sich im vorliegenden Fall die wichtige Funktion der Datenreduktion, die die Faktorenanalyse erfüllt: Wer kann schon 25 Motive aufeinander beziehen und interpretieren! Die im Folgenden dargestellte Faktorenanalyse ist die gebräuchlichste Form, die Hauptkomponentenanalyse.

Die erste Frage, die interessiert, lautet: Ist das Ergebnis der Faktorenanalyse überhaupt brauchbar? Um diese Frage zu beantworten, gibt es einige Tests. Die zwei gebräuchlichsten sind im Folgenden dargestellt.

KMO- und Bartlett-Test
Maß der Stichprobenneigung nach Kaiser-Meyer-Olkin .666
Bartlett-Test auf Sphärizität ungefähres chi-Quadrat 1537,948
Freiheitsgrade 300
Signifikanz nach Bartlett ,000

Technisch betrachtet untersucht das Kaiser-Meyer-Olkin Maß (KMO), ob die Summe der quadrierten partiellen Korrelationskoeffizienten auf den unterschiedlichen Dimensionen (oder Faktoren) im Vergleich zur Summe der quadrierten Korrelationskoeffizienten, die nicht auf den Faktoren abgebildet werden, klein ist. Die Summe sollte klein sein, denn sie gibt den nicht erklärten Teil der Varianz an. KMO-Werte können von 0 bis 1 variieren. Dabei hat sich folgende Daumenregel durchgesetzt: Werte von unter 0,5 gelten als inakzeptabel, Werte von 0,5 bis unter 0,6 als schlecht, Werte von 0,6 bis unter 0,7 als mäßig, Werte von 0,7 bis unter 0,8 als mittelprächtig, Werte von 0,8 bis unter 0,9 als recht gut und über 0,9 gelten sie gemeinhin als fabelhaft.

Beim Bartlett-Test auf Sphärizität wird geprüft ob die Korrelationskoeffizienten der Korrelationsmatrix signifikant voneinander abweichen. Da eine Faktorenanalyse auf der Grundlage von Korrelationskoeffizienten errechnet wird, ist es natürlich nicht sinnvoll, eine solche durchzuführen, wenn die Korrelationen nicht signifikant sind. Dass die Korrelationen zwischen den Motiven signifikant sind, kann man auch dadurch überprüfen, dass man sich eine Korrelationsmatrix ausgeben lässt. Der Unterbefehl “/print” wäre entsprechend durch das Schlüsselwort “correlation” zu ergänzen.

Ergebnis: Die gute Nachricht: Der Bartlett-Test auf Sphärizität ergibt die Zurückweisung der Nullhypothese, wonach zwischen den Variablen in der Analyse keine Korrelationen bestehen. D.h. das Rechnen einer Faktorenanalyse ist sinnvoll. Der KMO-Wert zeigt jedoch, dass mit einem mäßigen Ergebnis zu rechnen ist, da das Residuum also der Anteil der Varianz, der durch die partiellen Korrelationen nicht erklärt werden kann, relativ hoch ist. KMO-Wertung daher: mäßig.

Kommunalitäten
Motive für das Durch-den-Wald-Rennen Anfänglich Extraktion
körperliche Fitness 1.000 .662
gesundh. Vorbeugen 1.000 .588
Gesunheit verbessern 1.000 .758
wohlfühlen 1.000 .490
Stress abbauen 1.000 .900
seelischer Ausgleich 1.000 .893
sportliche Figur 1.000 .681
Gewicht regulieren 1.000 .710
Körper erfahren 1.000 .615
messen u. vergleichen 1.000 .512
sich verbessern 1.000 .627
sich anstrengen 1.000 .701
Erfahrungen machen 1.000 .711
pers. Herausforderung 1.000 .577
spannende Situation erleben 1.000 .689
Natur erleben 1.000 .629
Wald spüren 1.000 .468
Stille spüren 1.000 .639
zeigen, wie attraktiv Sport ist 1.000 .623
zeigen, was ich bin 1.000 .695
mit Leuten zusammen sein 1.000 .689
Kontakte knüpfen 1.000 .749
Kontakte pflegen 1.000 .730
sich als Jogger fühlen 1.000 .762
von anderen unterscheiden 1.000 .775

Kommunalitäten, das hat schon Amitai Etzoni gewusst, sind Gemeinsamkeiten. Nimmt man jedes der Motive und packt es gleichwertig in die Faktorenanalyse (mit dem Wert 1,000), extrahiert und dimensioniert, dann kommen einige gemeinsame Faktoren heraus, an denen die einzelnen Motive mehr oder weniger stark beteiligt sind. Die Kommunalitäten nach der Extraktion kann man daher als Prozentwerte interpretieren. So ist die Variable “Wald spüren” zu 46,8% an der Faktorenlösung beteiligt, die gleich präsentiert wird. D.h. jedoch auch, dass der nicht erklärte Teil der Varianz der Variable “Wald spüren” nach der Faktorenanalyse 53,2% beträgt.

Das Ergebnis der Faktorenanalyse kann wie folgt beschrieben werden:

25 Motive sind in die Analyse eingegangen. Jede der Variablen hat eine anfängliche Kommunalität von 1,000 mitgebracht. Gibt es keine gemeinsame Dimension zwischen den Motiven, dann sind 25 Faktoren als Ergebnis zu erwarten. Im vorliegenden Fall sind 7 Dimensionen extrahiert worden. Sieben Dimensionen deshalb, weil man sich geeinigt hat, die Kappungsgrenze bei einem Eigenwert von 1,000 zu ziehen. Das macht auch Sinn, weil Faktoren, die einen Eigenwert von weniger als 1,000 haben, weniger erklären als die ursprünglich ins Modell gepackten Variablen (Kommunalitäten waren alle 1,000!). Im vorliegenden Modell werden 67,498% der Gesamtvarianz durch die sieben Faktoren erklärt und 32,502% nicht!

Nun möchte man gerne wissen, welche Variablen welchen gemeinsamen Faktor bilden und wie stark die einzelnen Variablen am gemeinsamen Faktor beteiligt sind Darüber gibt die Komponentenmatrix Auskunft.

Die Komponentenmatrixgibt die Korrelation eines Motivs mit der zugrundeliegenden Dimension oder dem entsprechenden Faktor an. Anders formuliert: Der “factorscore” zeigt an, wie stark das entsprechende Motiv/die entsprechende Variable an einem gemeinsamen Faktor beteiligt ist. Der “factorscore” hat einen Wertbereich von -1 bis +1, je höher der “factorscore”, desto stärker der Zusammenhang zwischen Motiv und gemeinsamem Faktor. Dargestellt sind nur Wert die größer als .5 sind. Werte, die geringer sind, sollte man nicht interpretieren. Daher kann man sagen, dass “Gewicht regulieren”, “Gesundheit verbessern”, “sportliche Figur”, “körperliche Fitness” und “gesundheitliches Vorbeugen” einen gemeinsamen Faktor bilden, an dem “Gewicht regulieren” (.832) und “Gesundheit verbessern” (.827) am stärksten beteiligt sind. Zum Interpretieren dieses Ergebnisses muss man die Häufigkeitsverteilung auf den einzelnen Variablen in Erinnerung behalten und vor allem, die Kodierung: “völlig unwichtig” war mit dem Wert 1 codiert, “sehr wichtig” mit dem Wert 5. Bei Gewicht regulieren haben 79,5% der Befragten gesagt, dieses Motiv sei “völlig unwichtig”, bei “Gesundheit verbessern” 55,7%. D.h. die gemeinsame Dimension ist eine der Ablehnung der entsprechenden Motive. In Worten: Wer durch den Wald rennt, der hat keine Gewichtsprobleme und muss seine Gesundheit nicht verbessern.

Die Komponentenmatrix ist zunächst in unrotierter Form, d.h. geometrisch gesprochen befinden sich die Faktoren in keinem 90 Grad Winkel zueinander. Um dies zu erreichen und die Faktoren statistisch unabhängig voneinander zu machen, rotiert man Faktorenanalysen mit der VARIMAX-Rotation. (VARIationMAXimation = Größtmögliche Distanz zwischen den Faktoren)

Das Ergebnis der Faktorenanalyse muss nunmehr interpretiert werden, d.h. die Faktoren, die von den einzelnen Items konstituiert werden, müssen zunächst einmal sinnvoll benannt werden. So könnte man den Faktor, der durch die Items “Körper erfahren” und “zeigen, was ich bin” konstituiert wird, als “expressives Verhalten” ansehen und entsprechend benennen. Wie die anderen Faktoren benannt werden können, kann sich nunmehr jeder selbst überlegen, und wer mag, kann das Ergebnis seiner Überlegung an Ghostwriter-24 schicken

Leave a Reply

  

  

  

1 + 4 =


Herzlich Willkommen bei Ghostwriter-24!

Ghostwriter-24 ist ein besonderer Ghostwriter.

Alle Mitarbeiter von Ghostwriter-24 sind seit Jahren als Ghostwriter aktiv.

Wir sind Profis mit entsprechender Expertise.

Ca. 70% unserer Kunden kommen durch Empfehlungen zu uns

oder sind Stammkunden.

Bei Ghostwriter-24 haben Sie direkten Kontakt mit Ihrem Autor, kein Mittelsmann erschwert die Kommunikation.

Kontaktieren Sie uns, um die Vorteile von Ghostwriter-24 zu nutzen.

Einen Überblick über unser Leistungsangebot erhalten Sie hier oder

wenn Sie in unserem Blog vorbeischauen und die Breite der Themen,

die wir bearbeiten, genießen!