Standardabweichung verstehen – Vollständiger Leitfaden
Erfahren Sie, was die Standardabweichung ist, wie Sie sie Schritt für Schritt berechnen und warum sie wichtig ist. Behandelt Grundgesamtheit vs. Stichprobe.
Was ist die Standardabweichung?
Die Standardabweichung ist ein Maß dafür, wie weit eine Menge von Zahlen um ihren Mittelwert (Durchschnitt) gestreut ist. Eine niedrige Standardabweichung bedeutet, dass die Werte eng um den Mittelwert gruppiert sind, während eine hohe Standardabweichung bedeutet, dass sie über einen weiten Bereich verteilt sind. Sie ist eines der wichtigsten Konzepte in der Statistik, da sie die Variabilität in einer einzigen Zahl quantifiziert. Zum Beispiel haben Testergebnisse von {70, 72, 68, 71, 69} eine niedrige Standardabweichung, da sie alle nahe bei 70 liegen, während {40, 95, 60, 85, 20} eine hohe Standardabweichung haben, da sie stark variieren.
Grundgesamtheit vs. Stichproben-Standardabweichung
Es gibt zwei Versionen der Standardabweichung, je nachdem, ob Ihre Daten eine gesamte Population oder nur eine Stichprobe aus einer größeren Population darstellen. Die Populations-Standardabweichung (bezeichnet mit dem griechischen Buchstaben Sigma) teilt durch N, die Gesamtzahl der Datenpunkte. Die Stichproben-Standardabweichung (bezeichnet mit s) teilt stattdessen durch N - 1, eine Korrektur bekannt als Bessel-Korrektur, die den Umstand kompensiert, dass eine Stichprobe dazu neigt, die wahre Variabilität zu unterschätzen. In der Praxis verwenden Sie fast immer die Stichprobenversion.
Schritt-für-Schritt-Berechnung
Um die Standardabweichung von Hand zu berechnen, folgen Sie diesen Schritten. Erstens: Finden Sie den Mittelwert Ihrer Daten, indem Sie alle Werte addieren und durch die Anzahl teilen. Zweitens: Subtrahieren Sie den Mittelwert von jedem Datenpunkt, um die Abweichungen zu erhalten. Drittens: Quadrieren Sie jede Abweichung. Viertens: Finden Sie den Durchschnitt dieser quadrierten Abweichungen (teilen Sie durch N für die Population oder N - 1 für die Stichprobe). Dieser Durchschnitt der quadrierten Abweichungen heißt Varianz. Fünftens: Ziehen Sie die Quadratwurzel der Varianz, um die Standardabweichung zu erhalten.
Varianz und ihre Beziehung zur Standardabweichung
Die Varianz ist das Quadrat der Standardabweichung. Während die Varianz mathematisch praktisch ist, weil sie die Komplikationen von Quadratwurzeln in Beweisen und Formeln vermeidet, wird sie in quadrierten Einheiten ausgedrückt, die schwer zu interpretieren sein können. Wenn Ihre Daten in Euro gemessen werden, ist die Varianz in „Quadrat-Euro", was keine intuitive Bedeutung hat. Die Standardabweichung bringt das Maß zurück in die ursprünglichen Einheiten und macht es direkt interpretierbar. Sie können sich die Standardabweichung als „die typische Entfernung eines Datenpunkts vom Mittelwert" vorstellen.
Die empirische Regel (68-95-99,7)
Für Daten, die einer Normalverteilung (Glockenkurve) folgen, bietet die empirische Regel eine leistungsstarke Interpretationshilfe für die Standardabweichung. Etwa 68 % der Daten fallen innerhalb einer Standardabweichung vom Mittelwert, etwa 95 % innerhalb von zwei Standardabweichungen und ungefähr 99,7 % innerhalb von drei. Das bedeutet: Wenn der mittlere Testwert 75 bei einer Standardabweichung von 10 beträgt, haben etwa 68 % der Studierenden zwischen 65 und 85 Punkte erzielt, etwa 95 % zwischen 55 und 95, und nahezu alle zwischen 45 und 105. Diese Regel wird vielfach in der Qualitätskontrolle, Benotung und Risikobewertung verwendet.
Praktische Anwendungen
Die Standardabweichung erscheint in praktisch jedem Bereich, der mit Daten arbeitet. In der Finanzwelt misst sie das Anlagerisiko: Eine Aktie mit einer Standardabweichung von 2 % bei täglichen Renditen ist weniger volatil als eine mit 5 %. In der Fertigung ist sie zentral für die Qualitätskontrolle, wo die Six-Sigma-Methodik darauf abzielt, Defekte innerhalb von sechs Standardabweichungen vom Zielwert zu halten. In der Bildung werden standardisierte Testergebnisse oft in Standardabweichungen vom Mittelwert angegeben. In der Wissenschaft wird die Messunsicherheit typischerweise als Standardabweichung ausgedrückt.
Standardabweichung vs. andere Streuungsmaße
Die Standardabweichung ist nicht das einzige Maß für die Streuung. Die Spannweite (Maximum minus Minimum) ist das einfachste Maß, aber sehr empfindlich gegenüber Ausreißern. Der Interquartilsabstand (IQR), die Differenz zwischen dem 75. und 25. Perzentil, ist robuster gegenüber Extremwerten. Die mittlere absolute Abweichung (MAD) mittelt die Absolutwerte der Abweichungen statt sie zu quadrieren, was sie weniger empfindlich gegenüber Ausreißern macht. Trotz dieser Alternativen bleibt die Standardabweichung das am häufigsten verwendete Maß wegen ihrer tiefen Verbindungen zur Wahrscheinlichkeitstheorie und Normalverteilung.
Häufige Fallstricke
Ein häufiger Fehler ist die Verwendung der Populations-Standardabweichung, wenn die Stichproben-Standardabweichung angebracht wäre, was die wahre Streuung unterschätzt. Ein weiterer Fehler ist die Interpretation der Standardabweichung ohne Berücksichtigung der Verteilungsform: Die empirische Regel gilt nur für annähernd normalverteilte Daten. Schiefe oder multimodale Daten erfordern andere Interpretationsrahmen. Seien Sie vorsichtig beim Vergleich von Standardabweichungen verschiedener Datensätze mit sehr unterschiedlichen Mittelwerten; in solchen Fällen gibt der Variationskoeffizient (Standardabweichung geteilt durch den Mittelwert) einen aussagekräftigeren Vergleich.