Die momenterzeugende Funktion ist eine Funktion, die in der Wahrscheinlichkeitstheorie einer Zufallsvariablen zugeordnet wird. In vielen Fällen ist diese Funktion in einer Umgebung des Nullpunktes in den reellen bzw. komplexen Zahlen definiert und kann dann mittels Ableitung zur Berechnung der Momente der Zufallsvariablen verwendet werden, woraus sich ihr Name erklärt.
Die momenterzeugende Funktion einer Zufallsvariablen [math]X[/math] ist definiert durch[1]
wobei für [math]t[/math] reelle bzw. komplexe Zahlen eingesetzt werden können, sofern der Erwartungswert auf der rechten Seite existiert. Dieser Ausdruck ist mindestens für [math]t=0[/math] definiert. In vielen Fällen, siehe unten, ist diese Funktion in einer Umgebung der 0 definiert, und kann dann wie folgt in eine Potenzreihe entwickelt werden.
Dabei gilt [math]0^0 := 1 [/math] und die [math]m_X^n=E(X^n)[/math] sind die Momente von [math]X[/math].
Die momenterzeugende Funktion hängt nur von der Verteilung von [math]X[/math] ab. Wenn die momenterzeugende Funktion einer Verteilung in einer Umgebung von 0 existiert, so sagt man, etwas unpräzise aber allgemein gebräuchlich, die Verteilung habe eine momenterzeugende Funktion. Existiert [math]M_X(t)[/math] nur für [math]t=0[/math], so sagt man entsprechend, dass die Verteilung keine momenterzeugende Funktion habe.
Falls [math]X[/math] eine stetige Wahrscheinlichkeitsdichte [math]f[/math] hat, kann man obigen Erwartungswert mittels dieser Dichte schreiben und erhält für die momenterzeugende Funktion
gegeben, wobei [math]m_X^k[/math] das [math]k[/math]-te Moment von [math]X[/math] ist. Der Ausdruck [math]M_X\left(-t\right)[/math] ist also gerade die zweiseitige Laplacetransformation des durch [math]X[/math] festgelegten Wahrscheinlichkeitsmaßes.
Die Bezeichnung momenterzeugend bezieht sich darauf, dass die [math]k[/math]-te Ableitung von [math]M_X[/math] im Punkt 0 (Null) gleich dem [math]k[/math]-ten Moment der Zufallsvariablen [math]X[/math] ist:
Das liest man direkt an der oben angegebenen Potenzreihe ab. Durch die Angabe aller nicht verschwindenden Momente ist jede Wahrscheinlichkeitsverteilung vollständig festgelegt, falls die momenterzeugende Funktion auf einem offenen Intervall [math](-\varepsilon,\varepsilon)[/math] existiert [math](\varepsilon \gt 0)[/math].
Die momenterzeugende Funktion steht in engem Zusammenhang mit der charakteristischen Funktion [math]\varphi_X(t) = E\left(e^{\mathrm{i}t X}\right)[/math]. Es gilt [math]\varphi_X(t) = M_{iX}(t)=M_X(\mathrm{i}t)[/math], falls die momenterzeugende Funktion existiert. Im Gegensatz zur momenterzeugenden Funktion existiert die charakteristische Funktion für beliebige Zufallsvariablen.
Des Weiteren besteht noch ein Zusammenhang zur wahrscheinlichkeitserzeugenden Funktion. Diese ist jedoch nur für [math] \mathbb{N}_0 [/math]-wertige Zufallsvariablen definiert und zwar als [math] m_X(t)=\operatorname{E}(t^X) [/math]. Damit gilt [math] m_X(e^t)=M_X(t)[/math] für diskrete Zufallsvariablen.
Die kumulantenerzeugende Funktion wird als natürlicher Logarithmus der momenterzeugenden Funktion definiert. Aus ihr wird der Begriff der Kumulante abgeleitet.
Die momenterzeugende Funktion einer Summe unabhängiger Zufallsvariablen ist das Produkt ihrer momenterzeugenden Funktionen: Sind [math]X_1, \dotsc, X_n[/math] unabhängig, dann gilt für [math]Y = X_1 + \dotsb + X_n[/math]
wobei beim vorletzten Gleichheitszeichen verwendet wurde, dass der Erwartungswert eines Produktes unabhängiger Zufallsvariablen gleich dem Produkt ihrer Erwartungswerte ist.
Ist die momenterzeugende Funktion einer Zufallsgröße [math]X[/math] in einer Umgebung von [math]0[/math] endlich, so bestimmt sie die Verteilung von [math]X[/math] eindeutig.[2] Formal bedeutet das:
Seien [math]X[/math] und [math]Y[/math] zwei Zufallsgrößen mit momenterzeugenden Funktionen [math]M_X[/math] und [math]M_Y[/math] derart, dass es ein [math]\varepsilon \gt 0[/math] gibt mit [math]M_X (s), M_Y (s) \lt \infty[/math] für alle [math]s \in (-\varepsilon,\varepsilon)[/math]. Dann gilt [math]P_X = P_Y[/math] genau dann, wenn [math]M_X(s) = M_Y(s)[/math] für alle [math]s \in (-\varepsilon,\varepsilon)[/math] gilt.
Für viele Verteilungen kann man die momenterzeugende Funktion direkt angeben:
Verteilung | Momenterzeugende Funktion MX(t) |
---|---|
Bernoulli-Verteilung [math]\mathrm{B}(p)[/math] | [math]M_X(t) = 1-p+pe^t[/math] |
Betaverteilung [math]\mathrm{B}(a,b,p,q)[/math][3] | [math]M_X(t) = 1+\sum_{n=1}^{\infty} \left( \prod_{k=0}^{n-1} \frac{a+k}{a+b+k} \right) \frac{t^n}{n!}[/math] |
Binomialverteilung [math]\mathrm{B}(p)[/math] | [math]M_X(t) = (1-p+pe^t)^n[/math] |
Cauchy-Verteilung | Die Cauchy-Verteilung hat keine momenterzeugende Funktion.[4] |
Chi-Quadrat-Verteilung [math]\chi_n^2[/math] [5] | [math]M_X(t) = \frac{1}{(1-2 t)^{n/2}}[/math] |
Erlang-Verteilung [math]\mathrm{Erlang}(\lambda,n)[/math] | [math]M_X(t) = \left(\frac{\lambda}{\lambda-t}\right)^n[/math] für [math]t \lt \lambda[/math] |
Exponentialverteilung [math]\mathrm{Exp}(\lambda)[/math] | [math]M_X(t) = \frac{\lambda}{\lambda-t}[/math] für [math]t \lt \lambda[/math] |
Gammaverteilung [math]\gamma(p,b)[/math] | [math]M_X(t) = \left(\frac{b}{b-t}\right)^p[/math] |
Geometrische Verteilung mit Parameter [math]p[/math] | [math]M_X(t) = \frac{pe^t}{1-(1-p)e^t}[/math] |
Gleichverteilung über [math][0,a][/math] | [math]M_X(t) = \frac{e^{ta}-1}{ta}[/math] |
Laplace-Verteilung mit Parametern [math]\mu, \sigma[/math][6] | [math]M_X(t) = \frac{e^{\mu t}}{1-\sigma^2 t^2}[/math] |
Negative Binomialverteilung [math]\mathrm{NB}(r,p)[/math] | [math]M_{X}(t) = \left(\frac{p e^{t}}{1-(1-p) e^{t}}\right)^{r}[/math] für [math]t\lt|\ln(1-p)|[/math] |
Normalverteilung [math]\mathrm{N}(\mu,\sigma^2)[/math] | [math]M_X(t) = \exp{\left(\mu t+\frac{\sigma^2 t^2}{2}\right)}[/math] |
Poisson-Verteilung mit Parameter [math]\lambda[/math] | [math]M_X(t) = \exp(\lambda(e^t-1))[/math] |
Die momenterzeugende Funktion lässt sich auf [math]\ell[/math]-dimensionale reelle Zufallsvektoren [math]\mathbf{X} = (X_1, \dotsc , X_\ell)[/math] wie folgt erweitern:
wobei [math]\langle t,\mathbf{X}\rangle = \sum\limits_{j=1}^{\ell} t_j X_j[/math] das Standardskalarprodukt bezeichnet.