So berechnen Sie Konfidenzintervalle

Schritt-für-Schritt-Anleitung zur Berechnung von Konfidenzintervallen. Erfahren Sie, wann z- vs. t-Intervalle verwendet werden und wie Sie ein Konfidenzniveau wählen.

Was ist ein Konfidenzintervall?

Ein Konfidenzintervall gibt einen Bereich an, in dem der wahre Populationsparameter mit einer bestimmten Wahrscheinlichkeit liegt. Statt zu sagen "der Durchschnitt ist 50", sagt ein 95 %-Konfidenzintervall: "Wir sind zu 95 % sicher, dass der wahre Durchschnitt zwischen 47 und 53 liegt." Die Breite des Intervalls spiegelt die Unsicherheit der Schätzung wider -- größere Stichproben erzeugen schmalere Intervalle. Konfidenzintervalle sind informativer als einzelne Punktschätzungen, da sie die Präzision der Messung kommunizieren.

Das Konfidenzniveau erklärt

Das Konfidenzniveau (typisch 90 %, 95 % oder 99 %) gibt an, wie oft das Intervall den wahren Parameter enthalten würde, wenn man die Studie viele Male wiederholen würde. Ein 95 %-Konfidenzniveau bedeutet nicht, dass der wahre Wert mit 95 % Wahrscheinlichkeit im Intervall liegt -- er liegt entweder drin oder nicht. Es bedeutet, dass 95 % aller so berechneten Intervalle den wahren Wert enthalten würden. Höhere Konfidenzniveaus erzeugen breitere Intervalle: 99 % CI ist breiter als 95 % CI, das wiederum breiter ist als 90 % CI.

Die z-Intervall-Formel

Wenn die Populationsstandardabweichung (sigma) bekannt ist oder n > 30: CI = x_bar ± z * (sigma / sqrt(n)), wobei x_bar der Stichprobenmittelwert, z der kritische z-Wert (1,645 für 90 %, 1,96 für 95 %, 2,576 für 99 %), sigma die Populationsstandardabweichung und n die Stichprobengröße ist. Beispiel: x_bar = 72, sigma = 10, n = 100, 95 % CI: 72 ± 1,96 * (10/sqrt(100)) = 72 ± 1,96 = [70,04; 73,96].

Die t-Intervall-Formel

Wenn die Populationsstandardabweichung unbekannt ist und n < 30: CI = x_bar ± t * (s / sqrt(n)), wobei s die Stichprobenstandardabweichung und t der kritische t-Wert (abhängig vom Konfidenzniveau und den Freiheitsgraden df = n - 1) ist. Die t-Verteilung hat breitere Enden als die Normalverteilung, was breitere Intervalle erzeugt, um die zusätzliche Unsicherheit bei kleinen Stichproben auszugleichen. Für große n nähert sich die t-Verteilung der Normalverteilung an.

Die richtige Stichprobengröße wählen

Die erforderliche Stichprobengröße hängt von der gewünschten Präzision (Fehlerspanne E), dem Konfidenzniveau und der erwarteten Variabilität ab: n = (z * sigma / E)². Für eine Fehlerspanne von 2 Punkten bei sigma = 10 und 95 % Konfidenz: n = (1,96 * 10 / 2)² = 96,04 → 97 Personen. Eine Halbierung der Fehlerspanne erfordert eine Vervierfachung der Stichprobe. Eine Erhöhung von 95 % auf 99 % Konfidenz erfordert (2,576/1,96)² ≈ 1,73-mal so viele Teilnehmer.

Konfidenzintervalle für Anteile

Für Proportionen/Anteile (z.B. Prozentsatz der Wähler): CI = p_hat ± z * sqrt(p_hat * (1-p_hat) / n), wobei p_hat der Stichprobenanteil ist. Beispiel: In einer Umfrage mit n = 400 befürworten 55 % (p_hat = 0,55) eine Maßnahme. 95 % CI: 0,55 ± 1,96 * sqrt(0,55 * 0,45 / 400) = 0,55 ± 0,049 = [0,501; 0,599] oder 50,1 % bis 59,9 %. Diese Intervallbreite von ±4,9 Prozentpunkten ist die "Fehlerspanne", die in Umfragen oft angegeben wird.

Häufige Fehler und Fehlinterpretationen

Der häufigste Fehler ist die Aussage "Es besteht eine 95 %-ige Wahrscheinlichkeit, dass der wahre Wert im Intervall liegt." Korrekt ist: "Bei wiederholter Stichprobenziehung würden 95 % der berechneten Intervalle den wahren Wert enthalten." Weitere Fehler: Konfidenzintervalle als Vorhersageintervalle interpretieren (sie gelten für den Parameter, nicht für Einzelwerte), nicht-repräsentative Stichproben verwenden (das Intervall ist nur so gut wie die Stichprobe), und die Normalverteilungsannahme nicht prüfen.

Praktische Beispiele

Medizin: In einer klinischen Studie mit 200 Patienten senkt ein Medikament den Blutdruck um durchschnittlich 8 mmHg (s = 12 mmHg). 95 % CI: 8 ± 1,96 * 12/sqrt(200) = 8 ± 1,66 = [6,34; 9,66]. Da 0 nicht im Intervall liegt, ist die Wirkung statistisch signifikant. Qualitätskontrolle: 50 Teile einer Produktionslinie haben ein durchschnittliches Gewicht von 100,2 g (s = 0,5 g). 99 % CI: 100,2 ± 2,576 * 0,5/sqrt(50) = 100,2 ± 0,18 = [100,02; 100,38] g.