|
Die Betaverteilung ist eine kontinuierliche Wahrscheinlichkeitsverteilung über dem Intervall [0,1]. Sie ist definiert durch die Wahrscheinlichkeitsdichte

Außerhalb des Intervalls [0,1] wird sie durch f(x)=0 fortgesetzt. Sie besitzt die Parameter p und
q; um ihre Normierbarkeit zu garantieren, wird p,q > 0 gefordert.
Der Vorfaktor 1/B(p;q) dient der korrekten Normierung; der Ausdruck

steht für die Betafunktion, nach der die Verteilung auch benannt ist;
?(p) steht für die Gammafunktion.
Erwartungswert und Varianz der Betaverteilung sind

Beispiel
Die Betaverteilung kann aus zwei Gammaverteilungen erhalten
werden: Der Quotient X = U/(U+V) aus den stochastisch unabhängigen Zufallsvariablen U und V, die beide gammaverteilt sind mit den
Parametern b und pu bzw. pv, ist betaverteilt mit den Parametern pu und pv. U und V
lassen sich als Chi-Quadrat-Verteilungen mit
2pu bzw. 2pv Freiheitsgraden interpretieren.
Mit Hilfe der Linearen Regression wird eine
Regressionsgerade y = a + bx durch eine Punktwolke mit n Wertepaaren (xi;yi) (i=1,...,n)zweier
statistischer Merkmale x und y gelegt, und zwar so, dass die Quadratsumme der senkrechten Abstände der yi-Werte von
der Geraden minimiert wird.
Die totale Streuung von y (TSS) lässt sich mit der Streuungszerlegung aufteilen
in die so genannte erklärte Streuung der durch die Gerade geschätzten Werte y* (ESS) und die nichterklärte Streuung der Residuen
(RSS) zerlegen:
- TSS = ESS + RSS.
Das Bestimmtheitsmaß, der Anteil der erklärten Streuung an
der Gesamtstreuung

beziehungsweise

ist also betaverteilt. Da das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten von x und y darstellt, ist auch das Quadrat des Korrelationskoeffizienten
betaverteilt.
Allerdings kann die Verteilung des Bestimmtheitsmaßes beim Modelltest der Regression durch die F-Verteilung angegeben werden,
die tabelliert vorliegt.
|