Die Normalverteilungsannahme beim t-Test

0
2245
Praktikum

Jeder lernt in im Psychologiestudium den t-Test kennen und hat ihn vermutlich sogar das ein oder andere Mal angewandt. Und eigentlich kennen alle Psychologiestudenten die Voraussetzungen des t-Tests. Eine dieser Voraussetzungen, die im Vorfeld geprüft werden müssen, ist die Normalverteilung des zu untersuchenden Merkmals bei kleinen Stichproben. Bei größeren Stichproben (N > 30 beim Ein-Stichprobentest sowie dem Test für abhängige Stichproben und N > 50 beim Zwei-Stichproben-Test) kann nach dem zentralen Grenzwerttheorem eine Normalverteilung angenommen werden (Bortz & Schuster, 2010).

Soweit dürfte Klarheit herrschen. Nun haben jedoch einige womöglich den Einwand gehört, dass man unabhängig von der Stichprobengröße auf Normalverteilung testen sollte, da man auch bei großen Stichproben nie ausschließen könne, dass das untersuchte Merkmal nicht doch irgendwie schief, multimodal oder sonst wie unnormal verteilt sein könnte. Dieser Einwand ist insofern korrekt, als dass eine Variable in der Tat auch bei einer großen Anzahl von Fällen nicht automatisch normalverteilt sein muss. Dennoch ist es falsch zu behaupten, dass man den t-Test in solchen Fällen nicht anwenden kann, da die Normalverteilung des untersuchten Merkmals nicht zu seinen Voraussetzungen gehört. Um dies zu verstehen, muss man sich folgendes ins Gedächtnis rufen: Grundlage für den t-Test ist die Verteilung der statistischen Kennwerte.

Um zu verdeutlichen, was damit gemeint ist, habe ich ein hier kleines Beispiel: Mit Microsoft Excel 2010 habe ich eine Zufallsvariable mit 4000 Fällen erstellt und diese mit IBM SPSS Statistics 22 ausgewertet. Wie man bereits an Abbildung 1 erkennt, liegt definitiv keine Normalverteilung vor.

Abbildung 1: Histogramm für die Verteilung der Zufallsvariable
Abbildung 1: Histogramm für die Verteilung der Zufallsvariable

Im nächsten Schritt habe ich den Datensatz in 100 gleichgroße Gruppen aufgeteilt mit n = 40 und für jede Gruppe den entsprechenden Mittelwert bestimmt. Die Verteilung dieser 100 Mittelwerte ist in Abbildung 2 dargestellt. Man sieht, dass diese Mittelwerteverteilung stärker einer Normalverteilung entspricht. Auch der Kolmogorov-Smirnov-Test bestätigt diese Verteilungsannahme (dmax = .054, p = .919). Vergleicht man nun den Mittelwert der Zufallsvariable mit dem Durchschnitt der Mittelwerteverteilung, so stellt man fest, dass diese beiden identisch sind (µ = 0,497).

Abbildung 2: Histogramm für die Verteilung der Gruppenmittelwerte
Abbildung 2: Histogramm für die Verteilung der Gruppenmittelwerte

Dieses Beispiel veranschaulicht die Grundannahme des t-Test: Wenn ich eine intervallskalierte Variable in einer Stichprobe messe und aus diesen Daten den Mittelwert bilde, dann kann ich davon ausgehen, dass dieser selbst aus einer Population normalverteilter Mittelwerte stammt und dass das arithmetische Mittel dieser Verteilung dem wahren Mittelwert des zu untersuchenden Merkmals entspricht (zwei weitere Beispiele hierzu finden sich in Bortz & Döring, 2006 auf S. 411f). Das ist es, worauf es beim t-Test ankommt. Die Verteilung des Merkmals, das man untersucht, spielt hierbei zunächst keine Rolle, solange die Stichprobe groß genug ist. Erst bei zu kleinen Stichproben ist die Merkmalsverteilung wichtig, da man in einem solchen Fall nicht mehr automatisch von einer Normalverteilung der Mittelwerte ausgehen kann.
Fazit: Wenn ihr einen t-Test durchführen wollt und eure Stichprobe ausreichend hoch ist, dann führt den Test durch und macht euch nicht unnötig das Leben schwer.

Bortz, J. & Döring, N. (2006). Forschungsmethoden und Evaluation. Für Human- und Sozialwissenschaftler (SpringerLehrbuch Bachelor, Master, 4., überarb. Aufl.). Heidelberg: Springer Medizin Verlag.
Bortz, J. & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (Springer-Lehrbuch, 7., vollst. überarb. u. erw. Aufl.). Berlin, Heidelberg, New York: Springer-Verlag.