Streuung (Statistik) - LinkFang.de





Streuung (Statistik)


Unter Streuung (auch Dispersion) fasst man in der deskriptiven Statistik und in der Stochastik verschiedene Maßzahlen zusammen, die die Streubreite von Werten einer Häufigkeitsverteilung oder Wahrscheinlichkeitsverteilung um einen geeigneten Lageparameter herum beschreiben. Die verschiedenen Berechnungsmethoden unterscheiden sich prinzipiell durch ihre Beeinflussbarkeit beziehungsweise Empfindlichkeit gegenüber Ausreißern. Die Streuung der Häufigkeitsverteilung wird als Standardfehler bezeichnet.

Definition

Es sei [math]x_1, \dots, x_n \in \mathbb{R}[/math] eine Stichprobe und [math]s: \mathbb{R}^n \rightarrow \mathbb{R}[/math] eine Funktion. [math]s[/math] heißt ein Streuungsmaß, wenn [math]s[/math] translationsinvariant ist.[1] Es muss also folgendes gelten:

[math]s(x_1 + a, \dots, x_n + a) = s(x_1, \dots, x_n) \;\;\; \forall a \in \mathbb{R}[/math]

Maßzahlen

Spannweite

Die Spannweite (englisch range) [math]R[/math] berechnet sich als Differenz zwischen dem größten und dem kleinsten Messwert:

[math] R = x_{\max} - x_{\min} [/math]

Da die Spannweite nur aus den zwei Extremwerten berechnet wird, ist sie nicht robust gegenüber Ausreißern.

Siehe auch: gleitende Spannweite (engl. moving range)

Quantilsabstand

Der Quantilsabstand ist die Differenz zwischen dem [math]p[/math]- und [math]\left(1-p\right)[/math]-Quantil:

[math]QA_p = Q_{1-p}-Q_p[/math] mit [math]0\leq p \lt 0{,}5[/math]

Innerhalb des [math]QA_p[/math] liegen [math]100 \cdot (1-2p)[/math] Prozent aller Messwerte.

(Inter-)Quartilsabstand

Der Interquartilsabstand (engl. interquartile range), abgekürzt IQR, wird als Differenz der Quartile Q.25 und Q.75 berechnet:

[math] IQR = Q_{.75} - Q_{.25} [/math]

Innerhalb des IQR liegen 50 % aller Messwerte. Er ist – wie auch der Median bzw. Q.50 – unempfindlich gegenüber Ausreißern. Es lässt sich zeigen, dass er einen Bruchpunkt von [math]\epsilon^*=0{,}25[/math] hat.

Der Interquartilsabstand ist gleich dem Quantilsabstand [math]QA_{.25}[/math]

Mittlere absolute Abweichung

Die mittlere absolute Abweichung [math]e[/math] einer Zufallsvariable [math]X[/math] von ihrem Erwartungswert [math]\mu = \operatorname{E}(X)[/math] ist definiert durch

[math] \mathit{e} = \operatorname{E} \left(\left|X - \mu\right|\right).[/math]

Damit ist sie das erste absolute zentrierte Moment der Zufallsvariable [math] X [/math]. Im Falle einer konkreten Stichprobe [math]x_1, \dots, x_n[/math] mit Stichprobenmittelwert [math]\bar{x}[/math] wird sie errechnet durch

[math] \mathit{e} = \frac{1}{n}\sum_{i=1}^n \left|x_i - \bar{x}\right|.[/math]

Die mittlere absolute Abweichung wird in der mathematischen Statistik meist zugunsten der quadratischen Abweichung umgangen, welche analytisch leichter zu behandeln ist. Die in der Definition verwendete Betragsfunktion ist nicht überall differenzierbar, was die Berechnung des Minimums erschwert.

Aufgrund der Ungleichung vom arithmetisch-quadratischen Mittel ist die mittlere absolute Abweichung kleiner oder gleich der Standardabweichung (Gleichheit gilt nur für konstante Zufallsgrößen).

Für symmetrische Verteilungen, d. h. Verteilungen mit der Eigenschaft [math]f(\mu-x)=f(\mu+x)[/math] für alle reellen [math]x[/math], mit monoton fallender Dichte für [math]x\gt\mu[/math], gilt

[math]IQR \le 2\mathit{e}[/math].

Für die stetige Gleichverteilung gilt das Gleichheitszeichen.

Mittlere absolute Abweichung bezüglich des Medians

Die mittlere absolute Abweichung (engl. mean deviation from the median, abgekürzt MD) vom Median [math]\tilde{x}[/math] ist definiert durch

[math] \mathit{MD} = \operatorname{E}\left(\left|X - \tilde{x}\right|\right) [/math]

Im Falle einer konkreten Stichprobe wird sie errechnet durch

[math] \mathit{MD} = \frac{1}{n}\sum_{i=1}^n \left|x_i - \tilde{x}\right| [/math]

Aufgrund der Extremaleigenschaft des Medians gilt im Vergleich mit der mittleren absoluten Abweichung stets

[math] \mathit{MD} \le \mathit{e} [/math],

d. h. die mittlere absolute Abweichung bezüglich des Medians ist erst recht kleiner als die Standardabweichung.

Für symmetrische Verteilungen stimmen Median und Erwartungswert und damit auch [math]\mathit{MD}[/math] und [math]\mathit{e}[/math] überein.

Für die Normalverteilung gilt:

[math]\mathit{MD} = \mathit{e} = \sqrt{\frac{2}{\pi}} \cdot \sigma \approx 0{,}80 \cdot \sigma [/math]

Median der absoluten Abweichungen

Die mittlere absolute Abweichung (engl. median absolute deviation, auch MedMed), abgekürzt MAD, ist definiert durch

[math] P(\left|X - \tilde{x}\right| \leq \mathit{MAD}) = 0{,}5 [/math]

Im Falle einer konkreten Stichprobe wird sie errechnet durch

[math] \mathit{MAD} = \operatorname{median}{\left|x_i - \tilde{x}\right|} [/math]

Durch die Definition ergibt sich im Falle von normalverteilten Daten folgender Zusammenhang zur Standardabweichung:

[math]\mathit{MAD} = z_{0{,}75} \cdot \sigma [/math]

[math]z_{0{,}75}[/math] ist das 0,75-Quantil der Standardnormalverteilung und beträgt ca. 0,6745.

Die mittlere absolute Abweichung ist ein robuster Schätzer für die Standardabweichung. Es lässt sich zeigen, dass sie einen Bruchpunkt von [math]\varepsilon^* = 0{,}5[/math] hat.

Varianz und Standardabweichung

Die Varianz (engl. variance) und die Standardabweichung (engl. standard deviation) sind die wichtigsten und am meisten verwendeten Streuungsmaße. Mit dem Mittelwert [math]\bar{x}[/math] bzw. dem Erwartungswert [math]\operatorname{E}(X)[/math] ergeben sich folgende Streuungen:

  • [math]\textstyle {s'}^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2[/math] als Maß in der deskriptiven Statistik,
  • [math]\textstyle s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2[/math] als Schätzung der Varianz der Grundgesamtheit
  • [math]\operatorname{Var}(X)=\operatorname{E}\bigl((X-\operatorname{E}(X))^2\bigr) =\operatorname{E}(X^2) - (\operatorname{E}(X))^2[/math] als die Varianz einer Zufallsvariablen
Hauptartikel: Varianz (Stochastik)

Daraus ergeben sich folgende Standardabweichungen:

  • [math]\textstyle s' = \sqrt{\frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2}[/math] bzw. [math]\textstyle s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2}[/math]
  • [math]\sigma_X := \sqrt{\operatorname{Var}(X)} = \sqrt{\operatorname{E}\bigl((X-\operatorname{E}(X))^2\bigr)}[/math].

Variationskoeffizient

Der Variationskoeffizient [math]\operatorname{VarK}(X)[/math] einer Zufallsvariable [math]X[/math] mit [math]\operatorname{E}(X) \gt 0[/math] ist definiert als das Verhältnis ihrer Standardabweichung zu ihrem Erwartungswert

[math] \operatorname{VarK}(X) = \frac{\sqrt{\operatorname{Var}(X)}}{\operatorname{E}(X)}. [/math]

Liegt anstelle der Verteilung der Zufallsvariablen eine konkrete Messreihe von Werten [math]x_1,\dots,x_n[/math] vor, so bildet man den empirischen Variationskoeffizienten [math]\operatorname{VarK}[/math] als Quotienten aus empirischer Standardabweichung und arithmetischem Mittelwert.

Graphische Darstellungsformen

Einzelnachweise

  1. Andreas Büchter, H.-W. Henn: Elementare Stochastik - Eine Einführung. 2. Auflage. Springer, 2007, ISBN 978-3-540-45382-6, S. 83.

Literatur

  • Günter Buttler, Norman Fickel (2002), „Einführung in die Statistik“, Rowohlt Verlag
  • Jürgen Bortz (2005), Statistik: Für Human- und Sozialwissenschaftler (6. Auflage), Springer Verlag, Berlin
  • Bernd Rönz, Hans G. Strohe (1994), Lexikon Statistik, Gabler Verlag

Weblinks

 Wiktionary: Streuung – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Kategorien: Deskriptive Statistik

Quelle: Wikipedia - http://de.wikipedia.org/wiki/Streuung (Statistik) (Vollständige Liste der Autoren des Textes [Versionsgeschichte])    Lizenz: CC-by-sa-3.0

Änderungen: Alle Bilder mit den meisten Bildunterschriften wurden entfernt. Ebenso alle zu nicht-existierenden Artikeln/Kategorien gehenden internen Wikipedia-Links (Bsp. Portal-Links, Redlinks, Bearbeiten-Links). Entfernung von Navigationsframes, Geo & Normdaten, Mediadateien, gesprochene Versionen, z.T. ID&Class-Namen, Style von Div-Containern, Metadaten, Vorlagen, wie lesenwerte Artikel. Ansonsten sind keine Inhaltsänderungen vorgenommen worden. Weiterhin kann es durch die maschinelle Bearbeitung des Inhalts zu Fehlern gerade in der Darstellung kommen. Darum würden wir jeden Besucher unserer Seite darum bitten uns diese Fehler über den Support mittels einer Nachricht mit Link zu melden. Vielen Dank!

Stand der Informationen: August 201& - Wichtiger Hinweis: Da die Inhalte maschinell von Wikipedia übernommen wurden, ist eine manuelle Überprüfung nicht möglich. Somit garantiert LinkFang.de nicht die Richtigkeit und Aktualität der übernommenen Inhalte. Sollten die Informationen mittlerweile fehlerhaft sein, bitten wir Sie darum uns per Support oder E-Mail zu kontaktieren. Wir werden uns dann innerhalb von spätestens 10 Tagen um Ihr Anliegen kümmern. Auch ohne Anliegen erfolgt mindestens alle drei Monate ein Update der gesamten Inhalte.