Statistik: SPSS-Tricks

SPSS ist heute menugeführt. Wer etwas mit Daten anstellen will, der kann dies recht einfach tun. Manches kann er tun, aber nicht alles. Was macht man z.B. wenn, wie es in letzter Zeit häufiger bei uns angekommen ist, ein Künstler einen Datensatz erstellt, in dem zwei oder mehrere Variablen für dieselben Fragen abgelegt sind, so dass man die entsprechenden Variablen, weil sie in SPSS als nicht nur unterschiedliche Variable, sondern auch von unterschiedlichen Befragten beantwortete Variablen behandelt werden, erst einmal nicht gemeinsam analysieren kann.

Was also tun.

Unsere Tricks finden Sie übrigens in keinem Lehrbuch!

Beispiel: Ein Datensatz enthält zwei Variablen A und B mit jeweils sechs Antwortkategorien. Die beiden Variablen enthalten Antworten von Befragten mit dem Merkmal X und dem Merkmal Y zur jeweils SELBEN Fragen.

Wie schafft man es, Variable A und B zu einer Variablen C zu kombinieren, die alle Antworten auf die Frage enthält?

Nehmen wir an, die Fragen A und B haben die Kategorien 1 bis 7 als valide Antwortkategorien. Die Befragten deren Antworten auf A abgelegt wurden, haben notwendig ein “sysmis” auf Frage B, da sie zu B keine Angabe gemacht haben. Für die Befragten, die auf Variable B abgelegt wurden, ist es umgekehrt.

Manche Künstler verteilen nun für fehlende Werte, die vom System zugewiesen werden, eigene Werte, wie z.B. -99.

Das ist der Ausgangspunkt für unser kleines Beispiel, in dem wir die Variable C, die alle validen Antworten von A und B erfasst, erstellen:

SPSS-Befehl Bedeutung
Compute C=0. Die neue Variable C wird erstellt und in alle Zeilen der Datenmatrix wird für C eine “0” eingetragen. Dieser Befehl zu beginn der Befehlsreihe erweist sich vor allem dann als nützlich, wenn man einen Fehler macht und von vorne beginnen muss.
missing values A B (). Mit diesem Befehl werden vereinbarte “Missing Values” aufgehoben und als valide Werte behandelt.
recode A B (-99 = 0). Da die Missing Values mit dem letzten Befehl valide gesetzt wurden, können sie nun rekodiert werden, so dass sie keinen Schaden anrichten. Beide Variablen bestehen nun aus acht Katehorien, die von 0 bis 7 reichen, wobei auf der 0 Befragte sitzen, die keine Angaben gemacht haben, darunter für A alle, die bei B eine Angabe gemacht haben und bei B alle, die bei A eine Angabe gemacht haben. Diese Eigenart der Datenverarbeitung von SPSS, kann man sich nun zunutze machen, um die Variable C zu erstellen.
compute C = (A + B). Mit diesem simplen Befehl werden die beiden Variablen nun zusammengespielt, und zwar so, dass alle Befragten, die auf A oder B den Wert “1” zugewiesen bekommen haben, auch auf C den Wert “1” erhalten. Dies wird durch den kleinen Trick mit der Null ermöglicht, denn Befragten, die z.B. auf A einen validen Wert, sagen wir “2” haben, wird auf C der Wert für A +B zugewiesen. Da die Befragten, die auf A einen validen Wert von 1 bis 7 haben auf B den Wert “0” von uns zugewiesen bekommen haben, erhalten sie auch auf C den Wert 1.

So einfach ist das.