Wahrscheinlichkeitsmaß - LinkFang.de





Wahrscheinlichkeitsmaß


Dieser Artikel beschäftigt sich mit Abbildungen, die Mengen eine Wahrscheinlichkeit zuordnen. Für die Übertragung eines Wahrscheinlichkeitsmaßes durch eine Zufallsvariable in einen neuen Messraum siehe Verteilung einer Zufallsvariablen.

Ein Wahrscheinlichkeitsmaß, kurz W-Maß oder synonym[1] Wahrscheinlichkeitsverteilung beziehungsweise kurz W-Verteilung oder einfach Verteilung genannt, ist ein grundlegendes Konstrukt der Stochastik und Wahrscheinlichkeitstheorie. Seltener findet sich auch die Bezeichnung Wahrscheinlichkeitsgesetz. Wahrscheinlichkeitsmaße dienen dazu, Mengen eine Zahl zwischen null und eins zuzuordnen. Diese Zahl ist dann die Wahrscheinlichkeit, dass das durch die Menge beschriebene Ereignis eintritt. Typisches Beispiel hierfür wäre das Werfen eines fairen Würfels: Der Menge {2}, also dem Ereignis, dass die Augenzahl 2 geworfen wird, wird von der Wahrscheinlichkeitsverteilung die Wahrscheinlichkeit [math] \tfrac 16 [/math] zugeordnet.

Im Rahmen der Maßtheorie entsprechen die Wahrscheinlichkeitsmaße speziellen endlichen Maßen, die sich durch ihre Normiertheit auszeichnen.

Insbesondere in der Physik werden manche Wahrscheinlichkeitsverteilungen auch als Statistiken bezeichnet. Beispiel hierfür sind die Boltzmann-Statistik und die Bose-Einstein-Statistik.

Definition

Gegeben sei

Dann heißt eine Abbildung

[math] P\colon \Sigma \to [0,1] [/math]

mit den Eigenschaften

  • Normiertheit: Es ist [math] P(\Omega)=1 [/math]
  • σ-Additivität: Für jede abzählbare Folge von paarweise disjunkten Mengen [math] A_1, A_2, A_3, \dots [/math] aus [math] \Sigma [/math] gilt
[math] P \left( \bigcup_{i=1}^\infty A_i \right)= \sum_{i=1}^\infty P(A_i) [/math]

ein Wahrscheinlichkeitsmaß oder eine Wahrscheinlichkeitsverteilung.

Die drei Forderungen Normiertheit, σ-Additivität und Werte im Intervall zwischen 0 und 1 werden auch die Kolmogorow-Axiome genannt.

Elementares Beispiel

Ein elementares Beispiel für ein Wahrscheinlichkeitsmaß ist durch den Wurf eines fairen Würfels gegeben. Der Ergebnisraum ist gegeben durch

[math] \Omega:= \{1,2,3,4,5,6\} [/math]

und enthält alle möglichen Ausgänge des Würfelns. Das Ereignissystem enthält alle Teilmengen des Ergebnisraumes, denen man eine Wahrscheinlichkeit zuordnen will. In diesem Fall will man jeder Teilmenge des Ergebnisraumes eine Wahrscheinlichkeit zuordnen, daher wählt man als Ereignissystem die Potenzmenge, also die Menge aller Teilmengen von [math] \Omega [/math]

[math] \Sigma := \mathcal P(\Omega) [/math].

Das Wahrscheinlichkeitsmaß lässt sich nun definieren als

[math] P(\{i\}):= \tfrac 16 \text{ für } i=1, \dots, 6 [/math],

da man von einem fairen Würfel ausgeht. Jede Augenzahl ist demnach gleich wahrscheinlich. Interessiert man sich nun für die Frage, wie groß die Wahrscheinlichkeit ist, eine gerade Zahl zu würfeln, folgt aus der σ-Additivität

[math] P(\{2,4,6\})= P(\{2\})+P(\{4\})+P(\{6\}) = 3 \cdot \tfrac 16= \tfrac 12.[/math]

Wichtig ist hier, dass Wahrscheinlichkeitsmaße keine Zahlen, sondern nur Mengen als Argumente nehmen. Daher sind Schreibweisen wie [math] P(2) [/math] streng genommen falsch und müssten korrekterweise [math] P(\{2\}) [/math] lauten.

Wahrscheinlichkeitsverteilungen und Verteilungen von Zufallsvariablen

In der Literatur wird nicht immer streng zwischen einer Wahrscheinlichkeitsverteilung – also einer Abbildung, die auf einem Mengensystem definiert ist und den Kolmogorow-Axiomen genügt – und der Verteilung einer Zufallsvariablen unterschieden.

Verteilungen von Zufallsvariablen entstehen, wenn man eine Zufallsvariable auf einem Wahrscheinlichkeitsraum definiert, um relevante Informationen zu extrahieren. Beispiel hierfür wäre eine Lotto-Ziehung: Der Wahrscheinlichkeitsraum modelliert die Wahrscheinlichkeit, eine ganz bestimmte Zahlenkombination zu ziehen. Interessant ist aber nur die Information über die Anzahl der richtigen Zahlen. Diese wird von der Zufallsvariablen extrahiert. Die Verteilung dieser Zufallsvariablen ordnet nur dieser neuen Information aufgrund der ursprünglichen Wahrscheinlichkeiten im Wahrscheinlichkeitsraum eine neue Wahrscheinlichkeit zu.

Das Wahrscheinlichkeitsmaß wird durch die Zufallsvariable vom originären Wahrscheinlichkeitsraum in einen neuen „künstlichen“ Wahrscheinlichkeitsraum übertragen und induziert dort als Bildmaß unter der Zufallsvariablen ein neues Wahrscheinlichkeitsmaß. Im maßtheoretischen Sinne handelt es bei einer Zufallsvariablen um eine Abbildung

[math] X\colon (\Omega,\Sigma,P) \to (\mathbb{R},\mathcal{B}(\mathbb{R}), P_X), \quad \omega \mapsto X(\omega) [/math]

zwischen dem originären Wahrscheinlichkeitsraum und den reellen Zahlen, versehen mit der Borelschen [math]\sigma[/math]-Algebra. Da eine Zufallsvariable zudem per Definition die [math] \Sigma-\mathcal{B}(\mathbb{R})[/math]-Messbarkeit erfüllt, also für jede messbare Menge [math]B \in \mathcal{B}(\mathbb{R})[/math] gilt

[math] X^{-1}(B) \in \Sigma, [/math]

ergibt sich für alle [math]B \in \mathcal{B}(\mathbb{R})[/math] durch

[math] P_X(B) := P(X^{-1}(B)) \equiv P(\{\omega \in \Omega \mid X(\omega) \in B\}) [/math]

auf natürliche Weise das Bildmaß von [math]P[/math] unter [math]X[/math] oder kurz die Verteilung der Zufallsvariablen [math]X[/math].

Jede Verteilung einer Zufallsvariablen ist eine Wahrscheinlichkeitsverteilung. Umgekehrt kann jede Wahrscheinlichkeitsverteilung als Verteilung einer nicht näher präzisierten Zufallsvariablen angesehen werden. Einfachstes Beispiel für solch eine Konstruktion ist, von einem vorgegebenen Wahrscheinlichkeitsraum [math] (\Omega, \Sigma, P) [/math] eine identische Abbildung

[math] X\colon \Omega \to \Omega \text{, definiert durch } X(\omega)= \omega [/math]

zu definieren. Die Verteilung [math] P_X [/math] der Zufallsvariablen [math] X [/math] entspricht also in diesem Fall genau dem Wahrscheinlichkeitsmaß [math] P.[/math]

Da sich demnach abstrakte und komplizierte Wahrscheinlichkeitsmaße durch Zufallsexperimente als konkrete Verteilungen von Zufallsvariablen aufzufassen lassen, ergeben sich die üblichen Notationen

[math] P(X \leq k ) \equiv P(\{\omega \in \Omega \mid X(\omega) \leq k\}) \equiv P_X((- \infty, k]) [/math]

für die Verteilungsfunktion von [math] X [/math]. Diese entspricht also offensichtlich der Verteilung eingeschränkt auf das System der Halbstrahlen – ein konkreter schnittstabiler Erzeuger der Borelschen [math]\sigma[/math]-Algebra. Über den Maßeindeutigkeitssatz ergibt sich unmittelbar, dass durch die Verteilungsfunktion einer Zufallsvariablen immer auch die Verteilung in eindeutiger Weise bestimmt wird.

Eigenschaften als Maß

Die folgenden Eigenschaften folgen aus der Definition.

  • Es ist [math] P(\emptyset)=0 [/math]. Dies folgt aus der σ-Additivität und der Tatsache, dass die leere Menge disjunkt zu sich selbst ist.
  • Subtraktivität: Für [math]A, B \in \Sigma[/math] mit [math]B \subseteq A[/math] gilt
[math]P(A \setminus B) = P(A) - P(B)[/math].
  • Monotonie: Ein Wahrscheinlichkeitsmaß ist eine monotone Abbildung von [math] (\Sigma, \subset) [/math] nach [math] ([0,1], \leq ) [/math], das heißt, für [math]A, B \in \Sigma[/math] gilt
[math] B \subseteq A \implies P(B) \leq P(A) [/math].
  • Endliche Additivität: Aus der σ-Additivität folgt direkt, dass für paarweise disjunkte Mengen [math]A_1, \dotsc, A_m \in \Sigma[/math] gilt:
[math]P\left(\bigcup_{n=1}^m A_n\right) = \sum_{n=1}^m P(A_n)[/math]
  • σ-Subadditivität: Für eine beliebige Folge [math](A_n)_{n\in\N}[/math] von Mengen aus [math]\Sigma[/math] gilt
[math] P\left(\bigcup_{n=1}^{\infty} A_n\right) \leq \sum_{n=1}^{\infty} P(A_n)[/math].
[math]P\left(\bigcup_{i=1}^nA_i\right) = \sum_{k=1}^n\left((-1)^{k+1}\!\!\sum_{I\subseteq\{1,\dots,n\},\atop |I|=k}\!\!\!\! P\left(\bigcap_{i\in I}A_i\right)\right)[/math]
sowie
[math]P\left(\bigcap_{i=1}^nA_i\right) = \sum_{k=1}^n\left((-1)^{k+1}\!\!\sum_{I\subseteq\{1,\dots,n\},\atop |I|=k}\!\!\!\! P\left(\bigcup_{i\in I}A_i\right)\right)[/math].
Im einfachsten Fall entspricht dies
[math]P(A \cup B) + P(A \cap B) = P(A) + P(B).[/math]

Konstruktion von Wahrscheinlichkeitsmaßen

Verfahren bei Wahrscheinlichkeitsmaßen auf den ganzen oder reellen Zahlen

Wahrscheinlichkeitsfunktionen

Auf einer endlichen oder abzählbar unendlichen Grundmenge [math] M [/math], versehen mit der Potenzmenge als σ-Algebra, also [math] \Sigma= \mathcal P(M) [/math] lassen sich Wahrscheinlichkeitmaße durch Wahrscheinlichkeitsfunktionen definieren. Dies sind Abbildungen

[math] f\colon M \to [0,1] \text{, für die gilt: } \sum_{i \in M} f(i)=1 [/math].

Die zweite Forderung liefert die Normiertheit des Wahrscheinlichkeitsmaßes. Dieses wird dann definiert durch

[math]P(\{i\})=f(i) \text{ sowie } P(A)= \sum_{i \in A} f(i) \text{ für } A \in \Sigma [/math].

Beispielsweise wäre im Falle eines fairen Würfels die Wahrscheinlichkeitsfunktion definiert durch

[math] f\colon \{1, \dots, 6\} \to [0,1], \quad f(i)=\tfrac 16 \text{ für } i=1, \dotsc, 6 [/math].

Ein Beispiel für eine Wahrscheinlichkeitsfunktion auf einer abzählbar unendlichen Menge liefert die geometrische Verteilung, eine ihrer Varianten besitzt die Wahrscheinlichkeitsfunktion

[math] f(i)= (1-q) q^i \text{, wobei } i=0,1,2,\dotsc [/math].

Dabei ist [math] q \in (0,1) [/math]. Die Normiertheit folgt hier mittels der geometrischen Reihe. Aus formaler Sicht ist wichtig, dass Wahrscheinlichkeitsfunktionen nicht wie Wahrscheinlichkeitsmaße Mengen als Argumente nehmen, sondern Elemente der Grundmenge [math] M [/math]. Daher wäre die Schreibweise [math] f(\{i\}) [/math] falsch, korrekterweise heißt es [math] f(i) [/math].

Aus maßtheoretischer Sicht lassen sich Wahrscheinlichkeitsfunktionen auch als Wahrscheinlichkeitsdichten auffassen. Sie sind dann die Wahrscheinlichkeitsdichten bezüglich des Zählmaßes. Daher werden Wahrscheinlichkeitsfunktionen auch als Zähldichten bezeichnet. Trotz dieser Gemeinsamkeit wird streng zwischen den Wahrscheinlichkeitsfunktionen (auf diskreten Grundräumen) und den Wahrscheinlichkeitsdichten (auf stetigen Grundräumen) unterschieden.

Wahrscheinlichkeitsdichtefunktionen

Auf den reellen Zahlen [math] \R [/math], versehen mit der Borelschen σ-Algebra [math] \mathcal B (\R) [/math] lassen sich Wahrscheinlichkeitsmaße über Wahrscheinlichkeitsdichtefunktionen definieren. Dies sind integrierbare Funktionen [math] f [/math], für die gilt:

  • Positivität: [math] f(x) \geq 0 \text{ für alle } x \in \R [/math]
  • Normiertheit: [math] \int_\R f(x) \mathrm d \lambda(x) =1 [/math]

Das Wahrscheinlichkeitsmaß wird dann für [math]A \in \mathcal B (\R)[/math] durch

[math] P(A):=\int_A f(x) \mathrm d \lambda(x) [/math]

definiert.

Das Integral ist hier ein Lebesgue-Integral. In vielen Fällen ist jedoch ein Riemann-Integral ausreichend, man schreibt dann [math] \mathrm d x [/math] anstelle von [math] \mathrm d \lambda(x) [/math]. Typisches Beispiel eines Wahrscheinlichkeitsmaßes, das auf diese Art definiert wird, ist die Exponentialverteilung. Sie besitzt die Wahrscheinlichkeitsdichtefunktion

[math]f_{\lambda}(x)= \begin{cases}\displaystyle \lambda{\rm e}^{-\lambda x} & x\geq 0, \\ 0 & x \lt 0. \end{cases}[/math]

Es ist dann beispielsweise

[math] P((-1,1])=\int_{(-1,1]}f_{\lambda}(x) \mathrm dx= \int_{[0,1]} \lambda{\rm e}^{-\lambda x} \mathrm dx = 1-\mathrm{e}^{-\lambda } [/math]

für einen Parameter [math] \lambda \gt 0 [/math]. Das Konzept von Wahrscheinlichkeitsdichtefunktionen kann auch auf den [math] \R^n [/math] ausgeweitet werden. Es lassen sich aber nicht alle Wahrscheinlichkeitsmaße durch eine Wahrscheinlichkeitsdichte darstellen, sondern nur diejenigen, die absolutstetig bezüglich des Lebesgue-Maßes sind.

Verteilungsfunktionen

Auf den reellen Zahlen [math] \R [/math], versehen mit der Borelschen σ-Algebra [math] \mathcal B (\R) [/math] lassen sich Wahrscheinlichkeitsmaße auch mit Verteilungsfunktionen definieren. Eine Verteilungsfunktion ist eine Funktion

[math] F \colon \R \to [0,1] [/math]

mit den Eigenschaften

[math] \lim_{x \to - \infty} F(x)=0 \text{ und } \lim_{x \to \infty} F(x)=1 [/math].

Für jede Verteilungsfunktion gibt es ein eindeutig bestimmtes Wahrscheinlichkeitsmaß [math]P[/math] mit

[math] P((- \infty, x]) = F(x) [/math].

Umgekehrt kann mittels der obigen Identität jedem Wahrscheinlichkeitsmaß eine Verteilungsfunktion zugeordnet werden. Die Zuordnung von Wahrscheinlichkeitsmaß und Verteilungsfunktion ist bijektiv. Die Wahrscheinlichkeiten eines Intervalles enthält man dann über

[math] P((a,b])= F(b)-F(a) [/math].

Insbesondere lässt sich auch jedem Wahrscheinlichkeitsmaß auf [math] \N [/math] oder [math] \Z [/math] eine Verteilungsfunktion zuordnen. So ist die Bernoulli-Verteilung auf der Grundmenge [math] \{0,1\} [/math] definiert durch [math] P(\{0\})=1-p, P(\{1\})=p [/math] für einen reellen Parameter [math] p \in (0,1) [/math]. Aufgefasst als Wahrscheinlichkeitsmaß auf den reellen Zahlen besitzt sie die Verteilungsfunktion

[math] F(x)=\begin{cases} 0 & \text{ falls } x \lt0 \\ 1-p & \text{ falls } 0 \leq x \lt 1 \\ 1 & \text{ falls } x \geq 1 \end{cases} [/math].

Verteilungsfunktionen können auch für den [math] \R^n [/math] definiert werden, man spricht dann von mehrdimensionalen Verteilungsfunktionen.

Allgemeine Verfahren

Verteilungen

Mittels der Verteilung einer Zufallsvariablen kann ein Wahrscheinlichkeitsmaß über eine Zufallsvariable in einen zweiten Messraum übertragen werden und erzeugt dort wieder eine entsprechend der Zufallsvariablen transformierte Wahrscheinlichkeitsverteilung. Dieses Vorgehen entspricht der Konstruktion eines Bildmaßes in der Maßtheorie und liefert viele wichtige Verteilungen wie beispielsweise die Binomialverteilung.

Normierung

Jedes endliche Maß kann durch Normierung in ein Wahrscheinlichkeitsmaß umgewandelt werden. Ebenso kann man ein σ-endliches Maß [math] \mu [/math] in ein Wahrscheinlichkeitsmaß transformieren, dies ist aber nicht eindeutig. Ist [math] A_n [/math] eine Zerlegung des Grundraumes in Mengen endlichen Maßes wie in der Definition des σ-endlichen Maßes gefordert, so liefert beispielsweise

[math] P(A):=\sum_{n=1}^\infty \frac{1}{2^n} \frac{\mu_\sigma (A_n \cap A)}{\mu_\sigma(A_n)} [/math]

das Geforderte.

Produktmaße

Eine wichtige Möglichkeit, Wahrscheinlichkeitsmaße auf großen Räumen zu definieren, sind die Produktmaße. Dabei bildet man das kartesische Produkt zweier Grundmengen und fordert, dass das Wahrscheinlichkeitsmaß auf dieser größeren Menge (auf gewissen Mengen) genau dem Produkt der Wahrscheinlichkeitsmaße auf den kleineren Mengen entspricht. Insbesondere unendliche Produktmaße sind wichtig für die Existenz stochastischer Prozesse.

Eindeutigkeit der Konstruktionen

Bei der Konstruktion von Wahrscheinlichkeitsmaßen werden diese häufig nur durch ihre Werte auf wenigen, besonders einfach zu handhabenden Mengen definiert. Beispiel hierfür ist die Konstruktion mittels einer Verteilungsfunktion, die nur die Wahrscheinlichkeiten der Intervalle [math] (- \infty, a] [/math] vorgibt. Die Borelsche σ-Algebra enthält aber weitaus komplexere Mengen als diese Intervalle. Um die Eindeutigkeit der Definitionen zu garantieren, muss man zeigen, dass kein zweites Wahrscheinlichkeitsmaß existiert, das auf den Intervallen die geforderten Werte annimmt, sich aber auf einer weiteren, möglicherweise sehr komplexen Menge der Borelschen σ-Algebra von dem ersten Wahrscheinlichkeitsmaß unterscheidet. Dies liefert der folgende Satz aus der Maßtheorie:

Ist [math] P [/math] ein Wahrscheinlichkeitsmaß auf der σ-Algebra [math] \Sigma [/math] und ist [math] \mathcal E [/math] ein durchschnittsstabiler Erzeuger dieser σ-Algebra, also [math] \sigma(\mathcal E)= \Sigma [/math], so ist [math] P [/math] bereits durch seine Werte auf [math] \mathcal E [/math] eindeutig bestimmt. Genauer: Ist [math] P^* [/math] ein weiteres Wahrscheinlichkeitsmaß und ist

[math] P|_{\mathcal E}= P^*|_{\mathcal E}, [/math]

so ist [math] P=P^* [/math]. Typische Erzeuger von σ-Algebren sind

  • für endliche oder abzählbar unendliche Mengen [math] M [/math], versehen mit der Potenzmenge das Mengensystem der Elemente von [math] M [/math], also
[math] \mathcal E:= \{ \{e \}\, | \, e \in M \} [/math],
  • für die Borelsche σ-Algebra [math] \mathcal B [/math] auf [math] \R [/math] das System der Intervalle
[math] \mathcal E=\{ I \, | \, I=(- \infty, a] \text{ für ein } a \in \R \} [/math],

Diese Erzeuger liefern somit die Eindeutigkeit der Konstruktion von Wahrscheinlichkeitsmaßen mittels Wahrscheinlichkeitsfunktionen, Verteilungsfunktionen und Produktmaßen.

Typen von Wahrscheinlichkeitsverteilungen

Diskrete Verteilungen

Als diskrete Verteilungen werden Wahrscheinlichkeitsverteilungen auf endlichen oder abzählbar unendlichen Grundräumen bezeichnet. Diese Grundräume werden fast immer mit der Potenzmenge als Mengensystem versehen, die Wahrscheinlichkeiten werden dann meist über Wahrscheinlichkeitsfunktionen definiert. Diskrete Verteilungen auf den natürlichen oder ganzen Zahlen können in den Messraum [math] (\R, \mathcal B(\R)) [/math] eingebettet werden und besitzen dann auch eine Verteilungsfunktion. Diese zeichnet sich durch ihre Sprungstellen aus.

Stetige Verteilungen

Verteilungen auf den reellen Zahlen, versehen mit der borelschen σ-Algebra werden als stetige Verteilung bezeichnet, wenn sie eine Wahrscheinlichkeitsdichtefunktion besitzen, sich also in der Form

[math] P((- \infty, x])=\int_{(- \infty, x]} f_P \, \mathrm d \lambda [/math]

darstellen lassen für eine integrierbare Funktion [math] f_P [/math]. Hierbei handelt es sich um ein Lebesgue-Integral, das aber in den meisten Fällen durch ein Riemann-Integral ersetzt werden kann. Die Verteilungsfunktion von stetigen Verteilungen ist stetig. Umgekehrt gibt es aber Wahrscheinlichkeitsverteilungen mit stetigen Verteilungsfunktionen, die keine stetigen Verteilungen sind wie beispielsweise die Cantor-Verteilung.

Diese Definition kann auch auf Verteilungen auf dem [math] \R^n [/math] entsprechend ausgeweitet werden. Aus maßtheoretischer Sicht handelt es sich nach dem Satz von Radon-Nikodým bei den stetigen Verteilungen genau um die absolutstetigen Maße bezüglich des Lebesgue-Maßes.

Mischformen und singuläre Verteilungen

Außer den oben genannten Reinformen von Wahrscheinlichkeitsverteilungen existieren noch Mischformen. Diese entstehen beispielsweise, wenn man Konvexkombinationen von diskreten und stetigen Verteilungen bildet.

Des Weiteren existieren noch die sogenannten singulären Verteilungen. Diese besitzen weder eine Wahrscheinlichkeitsfunktion noch eine Wahrscheinlichkeitsdichte noch sind sie eine Konvexkombination von beidem. Bekanntestes Beispiel für solch eine Verteilung ist die Cantor-Verteilung.

Univariate und multivariate Verteilungen

Wahrscheinlichkeitsverteilungen, die sich in mehrere Raumdimensionen erstrecken, werden multivariate Verteilungen genannt. Im Gegensatz dazu nennt man die eindimensionalen Verteilungen univariate Wahrscheinlichkeitsverteilungen. Die Dimensionalität bezieht sich hier nur auf den Grundraum, nicht auf die Parameter, welche die Wahrscheinlichkeitsverteilung beschreiben. So ist die (gewöhnliche) Normalverteilung eine univariate Verteilung, auch wenn sie durch zwei Formparameter [math] \mu, \sigma^2 [/math] bestimmt wird.

Charakterisierung durch Kennzahlen

Wahrscheinlichkeitsverteilungen können unterschiedliche Kennzahlen zugeordnet werden. Diese versuchen jeweils, eine Eigenschaft einer Wahrscheinlichkeitsverteilung zu quantifizieren und damit kompakte Aussagen über die Eigenheiten der Verteilung zu ermöglichen. Beispiele hierfür sind:

Kennzahlen, die auf den Momenten beruhen:

  • Erwartungswert, die Kennzahl für die mittlere Lage einer Wahrscheinlichkeitsverteilung
  • Varianz und die daraus berechnete Standardabweichung, Kennzahl für den Grad der „Streuung“ der Verteilung
  • Schiefe, Kennzahl für die Asymmetrie der Verteilung
  • Wölbung, Kennzahl für die „Spitzigkeit“ der Verteilung

Des Weiteren gibt es

Wichtige Wahrscheinlichkeitsmaße

Hier sind einige der wichtigen Wahrscheinlichkeitsverteilungen aufgezählt. Weitere finden sich in der Liste univariater Wahrscheinlichkeitsverteilungen oder über die Navigationsleiste am Artikelende einer beliebigen Wahrscheinlichkeitsverteilung.

Diskret

Eine der elementaren Wahrscheinlichkeitsverteilungen ist die Bernoulli-Verteilung. Sie modelliert einen Münzwurf mit einer möglicherweise gezinkten Münze. Dementsprechend gibt es zwei Ausgänge: Kopf oder Zahl, häufig der Einfachheit halber mit 0 und 1 codiert. Darauf aufbauend ist die Binomialverteilung. Sie gibt die Wahrscheinlichkeit an, bei n Würfen mit einer Münze k-mal Kopf zu werfen.

Eine weitere wichtige Wahrscheinlichkeitsverteilung ist die diskrete Gleichverteilung. Sie entspricht dem Würfeln mit einem fairen, n-flächigen Würfel. Jede Fläche hat demnach dieselbe Wahrscheinlichkeit. Ihr Bedeutung kommt daher, dass sich aus der diskreten Gleichverteilung über das Urnenmodell eine große Anzahl weiterer Wahrscheinlichkeitsverteilungen als Verteilung von entsprechenden Zufallsvariablen erzeugen lassen. Auf diese Weise lassen sich beispielsweise die hypergeometrische Verteilung, die geometrische Verteilung und die negative Binomialverteilung erzeugen.

Stetig

Herausragend unter den stetigen Verteilungen ist die Normalverteilung. Diese Sonderstellung ist auf den zentralen Grenzwertsatz zurückzuführen. Er besagt, dass unter gewissen Umständen eine Überlagerung zufälliger Ereignisse sich immer mehr der Normalverteilung annähert. Dementsprechend wichtig ist die Normalverteilung in der Statistik. Direkt aus ihr abgeleitet sind die Chi-Quadrat-Verteilung und die Studentsche t-Verteilung, die zur Parameterschätzung in der Statistik verwendet werden.

Verteilungsklassen

Häufig betrachtet man nicht nur einzelne Wahrscheinlichkeitsmaße, sondern ganze Mengen von Wahrscheinlichkeitsmaßen mit speziellen Eigenschaften, die dann Verteilungsklassen genannt werden. Beispiel hierfür wären:

Des Weiteren gibt es beispielsweise noch Verteilungsklassen mit monotonem Dichtequotienten oder alpha-stabile Verteilungen.

Konvergenz von Wahrscheinlichkeitsmaßen

Die Konvergenz von Wahrscheinlichkeitsmaßen wird Konvergenz in Verteilung oder schwache Konvergenz genannt. Dabei betont die Benennung als

  • Konvergenz in Verteilung, dass es sich um die Konvergenz von Verteilungen von Zufallsvariablen handelt,
  • schwache Konvergenz, dass es sich um einen Spezialfall der schwachen Konvergenz von Maßen aus der Maßtheorie handelt.

Meist wird die Konvergenz in Verteilung als Bezeichnung bevorzugt, da dies einen besseren Vergleich mit den Konvergenzarten der Stochastik (Konvergenz in Wahrscheinlichkeit, Konvergenz im p-ten Mittel und fast sichere Konvergenz) ermöglicht, die alle Konvergenzarten von Zufallsvariablen und nicht von Wahrscheinlichkeitsmaßen sind.

Es existieren viele äquivalente Charakterisierungen der schwachen Konvergenz / Konvergenz in Verteilung. Diese werden im Portmanteau-Theorem aufgezählt.

Auf den reellen Zahlen

Die Konvergenz in Verteilung wird auf den reellen Zahlen über die Verteilungsfunktionen definiert:

  • Eine Folge von Wahrscheinlichkeitsmaßen [math] P_1, P_2, \dots [/math] konvergiert genau dann schwach gegen das Wahrscheinlichkeitsmaß [math] P [/math], wenn die Verteilungsfunktionen [math] F_{P_1}, F_{P_2}, \dots [/math] an jeder Stetigkeitsstelle der Verteilungsfunktion [math] F_P [/math] punktweise gegen diese konvergieren.
  • Eine Folge von Zufallsvariablen [math] X_1, X_2, \dots [/math] heißt konvergent in Verteilung gegen [math] X [/math], wenn die Verteilungsfunktionen [math] F_{X_1}, F_{X_2}, \dots [/math] an jeder Stetigkeitsstelle der Verteilungsfunktion [math] F_X [/math] punktweise gegen diese konvergieren.

Diese Charakterisierung der schwachen Konvergenz / Konvergenz in Verteilung ist eine Folgerung aus dem Satz von Helly-Bray, wird aber oft als Definition genutzt, da sie leichter zugänglich ist als die allgemeine Definition. Die obige Definition entspricht der schwachen Konvergenz von Verteilungsfunktionen für den Spezialfall von Wahrscheinlichkeitsmaßen, wo sie der Konvergenz bezüglich des Lévy-Abstandes entspricht. Der Satz von Helly-Bray liefert die Äquivalenz der schwachen Konvergenz von Verteilungsfunktionen und der schwachen Konvergenz / Konvergenz in Verteilung auf [math] \R [/math].

Allgemeiner Fall

Im allgemeinen Fall wird die schwache Konvergenz / Konvergenz in Verteilung durch eine trennende Familie charakterisiert. Ist [math] (\Omega,d) [/math] ein metrischer Raum, sei als σ-Algebra immer die Borelsche σ-Algebra gewählt und sei [math] C_b(\Omega) [/math] die Menge der beschränkten stetigen Funktionen. Dann heißt

  • eine Folge von Wahrscheinlichkeitsmaßen [math] (P_n)_{n \in \N} [/math] schwach konvergent gegen das Wahrscheinlichkeitsmaß [math] P [/math], wenn
[math]\lim_{n\to \infty}\int_\Omega f \mathrm dP_n = \int_\Omega f \mathrm dP \text{ für alle } f \in C_b(\Omega),[/math]
  • eine Folge von Zufallsvariablen [math] (X_n)_{n \in \N} [/math] konvergent in Verteilung gegen [math] X [/math], wenn
[math]\lim_{n \to \infty } \operatorname E ( f \circ X_n )= \operatorname E ( f \circ X ) \text{ für alle } f \in C_b(\Omega).[/math]

Meist werden noch weitere strukturelle Eigenschaften von der Grundmenge gefordert, um gewisse Eigenschaften der Konvergenz zu garantieren.

Räume von Wahrscheinlichkeitsmaßen

Die Eigenschaften der Menge von Wahrscheinlichkeitsmaßen hängen maßgeblich von den Eigenschaften des Grundraumes und der σ-Algebra ab. Im Folgenden wird eine Übersicht über die wichtigsten Eigenschaften der Menge der Wahrscheinlichkeitsmaße gegeben. Dabei sind die allgemeinsten Eigenschaften zuerst genannt und folgen, soweit nicht explizit anders erwähnt, auch für alle weiter unten stehenden Abschnitte. Als Notation sei vereinbart:

  • [math] \mathcal B [/math] ist die Borelsche σ-Algebra, falls [math] \Omega [/math] mindestens ein topologischer Raum ist.
  • [math] \mathcal M_f(\Omega, \Sigma) [/math] ist die Menge der endlichen signierten Maße auf dem Messraum [math] (\Omega, \Sigma) [/math].
  • [math] \mathcal M_f^+(\Omega, \Sigma) [/math] ist die Menge der endlichen Maße auf dem entsprechenden Messraum.
  • [math] \mathcal M_{\leq 1}^+(\Omega, \Sigma) [/math] ist die Menge der Sub-Wahrscheinlichkeitsmaße auf dem entsprechenden Messraum.
  • [math] \mathcal M_1^+(\Omega, \Sigma) [/math] ist die Menge der Wahrscheinlichkeitsmaße auf dem entsprechenden Messraum.

Allgemeine Grundräume

Auf allgemeinen Mengen sind die Wahrscheinlichkeitsmaße eine Teilmenge des reellen Vektorraumes der endlichen signierten Maße. Es gelten demnach die Inklusionen

[math] \mathcal M_1^+(\Omega, \Sigma) \subset \mathcal M_{\leq 1}^+(\Omega, \Sigma) \subset \mathcal M_f^+(\Omega, \Sigma)\subset\mathcal M_f(\Omega, \Sigma) [/math].

Der Vektorraum der endlichen signierten Maße wird mit der Totalvariationsnorm [math] \|\cdot \|_{TV} [/math] zu einem normierten Vektorraum. Da die Wahrscheinlichkeitsmaße aber nur eine Teilmenge und kein Untervektorraum der signierten Maße sind, sind sie selbst kein normierter Raum. Anstelle dessen werden sie mit dem Totalvariationsabstand

[math] d_{TV}(P_1,P_2):= \|P_1-P_2\|_{TV} [/math]

zu einem metrischen Raum. Ist [math] \mathcal D \subset \mathcal M_1^+(\Omega, \Sigma)[/math] eine dominierte Verteilungsklasse, besitzen also alle Maße in dieser Menge eine Wahrscheinlichkeitsdichtefunktion bezüglich eines einzigen σ-endlichen Maßes, so ist die Konvergenz bezüglich des Totalvariationsabstandes äquivalent zur Konvergenz bezüglich des Hellingerabstandes.

Metrische Räume

Ist [math] \Omega [/math] ein metrischer Raum, so lässt sich auf [math] \mathcal M_f^+(\Omega, \mathcal B) [/math] die schwache Konvergenz definieren. Bezeichnet man die von der schwachen Konvergenz erzeugten Topologie mit [math] \tau_f [/math] und die entsprechenden Spurtopologie auf den Wahrscheinlichkeitsmaßen als [math] \tau_1 [/math], so wird [math] (\mathcal M_1^+(\Omega, \mathcal B), \tau_1) [/math] zu einem topologischen Raum, der sogar ein Hausdorff-Raum ist. Außerdem sind Limites schwach konvergenter Folgen von Wahrscheinlichkeitsmaßen immer selbst Wahrscheinlichkeitsmaße (setze dazu [math] f \equiv 1 [/math] in der Definition). Die Konvergenz bezüglich des Totalvariationsabstandes impliziert immer die schwache Konvergenz, die Umkehrung gilt aber im Allgemeinen nicht. Somit ist die vom Totalvariationsabstand erzeugte Topologie [math] \tau_{TV} [/math] stärker als [math] \tau_1 [/math].

Des Weiteren lässt sich noch die Prochorow-Metrik [math] d_P [/math] auf [math] \mathcal M_1^+(\Omega, \mathcal B) [/math] definieren. Sie macht [math] (\mathcal M_1^+(\Omega, \mathcal B), d_P) [/math] zu einem metrischen Raum. Außerdem impliziert die Konvergenz bezüglich der Prochorow-Metrik in allgemeinen metrischen Räumen die schwache Konvergenz. Die von ihr erzeugte Topologie ist demnach stärker als [math] \tau_1 [/math].

Separable metrische Räume

Ist [math] \Omega [/math] ein separabler metrischer Raum, so ist auch [math]( \mathcal M_f^+(\Omega, \mathcal B) , d_P) [/math] ein separabler metrischer Raum (tatsächlich gilt auch der Umkehrschluss). Da sich bei metrischen Räumen die Separabilität auf Teilmengen überträgt, ist auch [math] \mathcal M_1^+(\Omega, \mathcal B) [/math] separabel.

Außerdem sind auf separablen metrischen Räumen die schwache Konvergenz und die Konvergenz bezüglich der Prochorow-Metrik äquivalent. Die Prochorow-Metrik metrisiert also [math] \tau_1 [/math].

Polnische Räume

Ist [math] \Omega [/math] ein polnischer Raum, so ist auch [math]( \mathcal M_f^+(\Omega, \mathcal B) , d_P) [/math] ein polnischer Raum. Da [math] \mathcal M_1^+(\Omega, \mathcal B) [/math] abgeschlossen ist in [math] \mathcal M_f^+(\Omega, \mathcal B) [/math], ist auch [math] \mathcal M_1^+(\Omega, \mathcal B) [/math] ein polnischer Raum.

Literatur

Einzelnachweise

  1. Georgii: Stochastik. 2009, S. 13.

Weblinks

 Wikibooks: Einführung in Zufallsvariablen – Lern- und Lehrmaterialien

Kategorien: Keine Kategorien vorhanden!

Quelle: Wikipedia - http://de.wikipedia.org/wiki/Wahrscheinlichkeitsmaß (Vollständige Liste der Autoren des Textes [Versionsgeschichte])    Lizenz: CC-by-sa-3.0

Änderungen: Alle Bilder mit den meisten Bildunterschriften wurden entfernt. Ebenso alle zu nicht-existierenden Artikeln/Kategorien gehenden internen Wikipedia-Links (Bsp. Portal-Links, Redlinks, Bearbeiten-Links). Entfernung von Navigationsframes, Geo & Normdaten, Mediadateien, gesprochene Versionen, z.T. ID&Class-Namen, Style von Div-Containern, Metadaten, Vorlagen, wie lesenwerte Artikel. Ansonsten sind keine Inhaltsänderungen vorgenommen worden. Weiterhin kann es durch die maschinelle Bearbeitung des Inhalts zu Fehlern gerade in der Darstellung kommen. Darum würden wir jeden Besucher unserer Seite darum bitten uns diese Fehler über den Support mittels einer Nachricht mit Link zu melden. Vielen Dank!

Stand der Informationen: August 201& - Wichtiger Hinweis: Da die Inhalte maschinell von Wikipedia übernommen wurden, ist eine manuelle Überprüfung nicht möglich. Somit garantiert LinkFang.de nicht die Richtigkeit und Aktualität der übernommenen Inhalte. Sollten die Informationen mittlerweile fehlerhaft sein, bitten wir Sie darum uns per Support oder E-Mail zu kontaktieren. Wir werden uns dann innerhalb von spätestens 10 Tagen um Ihr Anliegen kümmern. Auch ohne Anliegen erfolgt mindestens alle drei Monate ein Update der gesamten Inhalte.