Students t-Verteilung

Students t-Verteilung ist eine Wahrscheinlichkeitsverteilung und wurde 1908 von William Sealey Gosset (Pseudonym Student) entwickelt. Er hatte festgestellt, dass standardisierte normalverteilte Daten nicht mehr normalverteilt sind, wenn die Varianz des Merkmals unbekannt ist und mit der Stichprobenvarianz geschätzt werden muss. Man könnte also die t-Verteilung gewissermaßen als "Designerverteilung" bezeichnen.

Inhaltsverzeichnis

Definition

Die t-Verteilung beschreibt die Verteilung eines Ausdruckes

\mathrm{ t_m=\frac{N(0,1)}{\sqrt{\frac{\chi_m^2}{m}}} }

wobei N(0,1) eine standardnormalverteilte Zufallsvariable bedeutet und \mathrm{\chi_m^2} eine χ²-verteilte mit m Freiheitsgraden. Die Zählervariable muss unabhängig von der Nennervariable sein. Die Dichtefunktion der t-Verteilung ist dann symmetrisch bezüglich ihres Erwartungswertes 0. Die Werte der Verteilungsfunktion können nicht analytisch berechnet werden und liegen in der Regel tabelliert vor.

Beispielsweise ist die Prüfgröße für den statistischen Test H0: μ = μ0 des Erwartungswertes einer normalverteilten Zufallsvariablen mit unbekannter Varianz

t= \sqrt{n} \frac { \bar X_n - \mu_0 } {S_n} = \sqrt{n} \frac { \bar X_n - \mu_0}{\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\bar X_n)^2}}

t-verteilt mit n-1 Freiheitsgraden. Sn ist der Schätzer für die Standardabweichung und \bar X_n ist der Stichprobenmittelwert.

Parameter

Median \mathrm{\tilde{x}=0}
Modus xmod = 0
Erwartungswert:

\mathrm{ E(t_m)=\left\{ {{\emptyset|m=\leq1}\atop {0|m\geq2} } \right. }

Varianz:

\mathrm{ \sigma^2(t_m)=\left\{ { {\emptyset|m=\leq2}\atop {\frac{m}{m-2}|m\geq3} } \right. }

Schiefe:

\mathrm{ v(t_m)=\left\{ { {\emptyset|m=\leq3}\atop {0|m\geq4} } \right. }

Wölbung:

\mathrm{ \beta_2(t_m)=\left\{ { {\emptyset|m=\leq4}\atop {\frac{6}{m-4}|m\geq5} } \right. }

Skizze

thumb|Dichten von t-verteilten Zufallsgrößen

Eine Skizze der t-Verteilung erhält man in GNU R mit dem Befehl

plot(x,dt(x,df=f))
 

Zu beachten ist, dass

Nichtzentrale t-Verteilung

Ist der Zähler der t-verteilten Zufallsvariablen normalverteilt mit einem Erwartungswert μ ≠ 0, handelt es sich um eine so genannte nichtzentrale t-Verteilung mit dem Nichtzentralitätsparameter μ. Diese Verteilung wird vor allem zur Bestimmung des β-Fehlers bei Hypothesentests mit t-verteilter Prüfgröße verwendet.

Näherung durch die Normalverteilung

Ab dreißig Freiheitsgraden kann anstelle der t-Verteilung näherungsweise die Standardnormalverteilung verwendet werden.

See also: Students t-Verteilung, 1908, Erwartungswert, Freiheitsgrad, GNU R, Median, Merkmal, Modus, Normalverteilung, Parameter (Statistik)