ILMES - Internet-Lexikon der Methoden der empirischen Sozialforschung |
Artikel drucken |
S. steht in der empirischen Sozialforschung im allgemeinen für statistische Signifikanz und bezieht sich auf das Problem des Schlusses von einer (Zufalls-)Stichprobe auf die Grundgesamtheit. Als signifikant in diesem Sinne gilt das Ergebnis eines Hypothesentests – des Signifikanztests –, wenn die Annahme berechtigt ist, dass ein theoretisch angenommener und in den Daten vorgefundener Zusammenhang zwischen Merkmalen oder Unterschied zwischen Gruppen nicht alleine durch die Unschärfe erklärt werden kann, die mit der Stichprobenziehung verbunden ist. Die Berechtigung dieser Annahme kann nie mit Sicherheit erwiesen werden, sondern nur mit einer gewissen, vorab festzulegenden (Irrtums-)Wahrscheinlichkeit. Diese bezeichnet man in diesem Kontext als Signifikanzniveau. In den Sozialwissenschaften übliche Signifikanzniveaus sind 0,05, 0,01 und 0,001, also 5, 1 oder 0,1 Prozent. Ein Signifikanzniveau von 0,05 festzulegen bedeutet, dass man ein Ergebnis als signifikant akzeptiert, welches rein zufällig nur in 5 Prozent aller Stichprobenziehungen auftreten würde, wenn der vermutete Zusammenhang "in Wahrheit", d. h. in der Grundgesamtheit, gar nicht besteht.
Allgemein liegt dem S.-test eine Forschungshypothese zugrunde, die sich auf einen Zusammenhang, einen Unterschied oder einen Einfluss (etwa in Form eines Koeffizienten einer Regressionsgleichung) bezieht. Diese wird mit einer Nullhypothese konfrontiert, welche meist besagt, dass kein Zusammenhang/Unterschied/Einfluss besteht; es sind aber auch Nullhypothesen der Art denkbar, dass der Zusammenhang usw. einen bestimmten Betrag nicht überschreitet. (Die Nullhypothese wird oft als H0 bezeichnet, die Forschungshypothese – auch Alternativhypothese genannt – als H1). Es wird nun eine Teststatistik berechnet, deren Art von der Fragestellung und der Art der vorliegenden Daten (vor allem deren Messniveau) abhängt. Diese Teststatistik stellt eine Zufallsvariable dar und gibt die Wahrscheinlichkeit an, das Stichprobenergebnis zu erhalten, wenn in der Grundgesamtheit die Nullhypothese gilt. Je nach gewähltem Signifikanzniveau ergibt sich ein kritischer Wert für diese Teststatistik, der dem entsprechenden Quantil der Verteilung der betreffenden Zufallsvariablen entspricht (ist z. B. ein Signifikanzniveau von 5 Prozent oder 0,05 gewählt worden, so trennt der kritische Wert die 95 Prozent unter der Nullhypothese wahrscheinlichsten von den 5 Prozent am wenigsten wahrscheinlichen Werten ab). Ist die aus den Daten errechnete Teststatistik (gegebenenfalls: im Absolutbetrag) größer als dieser kritische Wert (man sagt dann auch: sie liegt im Ablehnungsbereich), so wird die Nullhypothese verworfen, andernfalls wird sie (bis auf weiteres) beibehalten. Genauer ist hier zwischen einseitigen und zweiseitigen Hypothesen zu unterscheiden. Im ersteren Fall trennt der kritische Wert typischerweise (bei einem gewählten Signifikanznviveau von α Prozent) die unteren 100−α von den oberen α Prozent der Verteilung ab bzw. im Falle negativer Unterschiede/Zusammenhänge die unteren α von den oberen 100−α Prozent; im zweiteren Fall gibt es zwei kritische Werte, nämlich einen beim α/2-Quantil und einem beim 100−(α/2)-Quantil.
Häufig verwendete S.-tests sind z. B. der t-Test, der F-Test der Varianzanalyse oder der Chi-Quadrat-Test für Kreuztabellen.
Ob ein statistischer Test signifikant ausfällt oder nicht, hängt neben dem Signifikanzniveau (der Irrtumswahrscheinlichkeit) vor allem von der Größe der Stichprobe ab. Mit zunehmender Größe lassen sich auch kleine und unbedeutende Zusammenhänge oder Unterschiede als signifikant absichern. Ein signifikantes (Test-)Ergebnis kann daher nicht ohne nähere Prüfung mit einem wichtigen (Forschungs-)Ergebnis gleichgesetzt werden.
Man beachte, dass der Begriff "Signifikanztest" in der statistischen Literatur nicht ganz einheitlich gebraucht wird. Die hier verwendete Erläuterung entspricht etwa dem Sprachgebrauch bei Fahrmeir et al. oder Hartung et al. Kühnel & Krebs hingegen reservieren den Begriff nur für Tests, bei denen die Nullhypothese lautet, dass in der Grundgesamtheit kein Zusammenhang (oder Unterschied) besteht, die Alternativhypothese hingegen, dass der Zusammenhang (oder Unterschied) von Null verschieden ist. Dieser Sprachgebrauch dürfte in der Statistik am weitesten verbreitet sein; er entspricht auch demjenigen, der den immer wiederkehrenden Auseinandersetzungen über den Sinn und Zweck von Signifikantests zu Grunde liegt (siehe Morrison et al. 1970 und Harlow et al. 1997). Daly et al. schließlich sprechen von Signifikanztest, wenn anhand der errechneten Teststatistik das "empirische Signifikanzniveau", d. h. die Wahrscheinlichkeit, bei Gültigkeit der Nullhypothese einen Testwert der errechneten Größe zu erhalten, bestimmt wird. (Das hier in Übereinstimmung mit der übrigen Literatur skizzierte Vorgehen, eine Nullhypothese zu verwerfen, wenn die vorher festgelegte Irrtumswahrscheinlichkeit bzw. das Signifikanzniveau unterschritten wird, wird dort als "fixed-level testing" bezeichnet).
Siehe auch: Fehler 1. und 2. Art, Inferenzstatistik, Konfidenzintervall.
© W. Ludwig-Mayerhofer, ILMES | Last update: 28 Dec 2003