Die Beantwortung von Fragen in einem Fragebogen wird durch die Beschäftigung der Probanten mit den jeweils vorangegangenen Fragen beeinflusst!

Dieser Fragekontexteffekt kann je nach Zweck der Befragung erwünscht sein (Manipulation) oder auch nicht. Ist man an einem unverfälschten Meinungsbild interessiert, so muss man die Beeinflussung erkennen und in der Bewertung berücksichtigen. Eine Möglichkeit dazu besteht in der Erstellung von zwei oder mehr Varianten des Fragebogens mit unterschiedlicher Anordnung der ansonst gleichen Fragen.
Anhand einer realen Umfrage wird dieses "Split-Ballot" genannte Verfahren nachfolgend mit den notwendigen statistischen Prüfungen skizziert.

 


Die Frage nach der Zufriedenheit mit ihrer Abend- bzw. Samstags-Mensa

wurde Studierenden an der Uni Trier entsprechend einem Split-Ballot-Verfahren bei einem Teil am Anfang und bei dem anderen Teil am Ende eines Fragebogens gestellt. Insgesamt wurde folgende Gesamtzufriedenheit entsprechend den Schulnoten von eins bis sechs ermittelt.

Bei der Umfrage vor Ort wurden 168 Fragebögen mit jeweils 40 Fragen und insgesamt rund 60 Items von den Studierenden beantwortet. Betrachtet man nur die Fragebögen, bei denen die Gesamtzufriedenheit am Anfang gestellt wurde und im Vergleich dazu die Teilmenge bei denen diese Frage am Ende stand, erkennt man die unterschiedlichen Verteilungen.

 


Ob sich diese Unterschiede nur zufällig ergeben oder ob es sich um eine signifikante Abweichung handelt, läßt sich mit dem Test von Kruskal - Wallis prüfen.

Wie aus den Histogrammen ersichtlich, weichen die Verteilungen der Zufriedenheitsnoten stark von einer Normalverteilung ab, so daß die einfache Analyse der Varianzen ersetzt wird durch die Rangsummenbetrachtung nach Kruskal, die ohne die Voraussetzung der Normalverteilung auskommt.

 

Alle abgegebenen Zufriedenheitsnoten werden zunächst der Größe nach geordnet. Dann werden allen 55 Einser der mittlere Rang zwischen 1 und 55, also 28 zugeordnet.
Den folgenden Zweier von Platz 56 bis 131 wird der mittlere Rang 93,5 zugeordnet. Den 3er der Rang 142. Den 4er der Rang 158.Den 5er den Rang 164,5 und schließlich den 6er den Rang 167.
Bei dem Rangsummentest von Kruskal-Wallis wird die Hypothese

H0="Die Teilstichproben stammen aus derselben Grundgesamtheit und unterscheiden sich nur zufällig" gegen
H1="Die Teilstichproben unterscheiden sich signifikant"

mit der Testfunktion

T=12*(N1*(Mittelwert(R_Anfang)-Mittelwert(R_Gesamt))2 + N2*(Mittelwert(R_Ende)-Mittelwert(R_Gesamt))2)/(N1+N2)/(N1+N2+1)

getestet, die approximativ Chi-Quadrat mit k-1 Freiheitsgraden (hier k=1) verteilt ist.
H0 wird abgelehnt und eine signifikante Abweichung unterstellt, wenn die Testfunktion größer als der Chi-Quadratwert bei 1-Alpha ist. Hier ist

T0=12*(90*(70,7-84,5)2 + 78*(100,4-84,5)2 )/168/169 = 15,5902

Wenn Ränge mehrfach besetzt sind, wie in diesem Fall, ist der Wert noch durch einen Korrekturfaktor f zu teilen

f=1 - 1/(1683-168) * (553 -55 + 763 - 76 +213 - 21 + 113 - 11 +23 -2 + 33 - 3) = 0,8701224

T = T0 / f = 17,9172.
Der kritische Wert der Chi-Quadrat-Verteilung mit einem Freiheitsgrad zum Niveau 0,95 beträgt 3,841 und wird damit von der Testfunktion überschritten.
Damit ist die H0-Hypothese abzulehnen und die Abweichung zwischen der Zufriedenheitsabfrage am Anfang und am Ende des Fragebogens ist signifikant.
Der Mittelwert bei der Abfrage am Anfang beträgt Zuf_Anfang=1,9. Bei der Abfrage am Ende beträgt der Mittelwert Zuf_Ende=2,2.



Untersucht man die Zufriedenheitsnoten auf Unterschiede zwischen der Abend- und der Samstagsmensa, ergiben sich aufgrund der Stichprobe mit diesem Test keine signifikanten Abweichungen:

 

 

Wenn es Sie interessiert können Sie selbst überprüfen ,ob es signifikante Unterschiede in der Bewertung durch Männer und Frauen bei dieser Umfrage ergaben.

Die Bewertung der männlichen Befragten war: 31(1),33(2),11(3),6(4),1(5),3(6)

Die Bewertung der weiblichen Befragten war: 24(1),32(2),10(3),5(4),1(5),0(6)

 

Zur Kontrolle: Rq_m=84,97, Rq_w=83,87 und Korrfaktor=0,87