Methoden der Datenanalyse - Varianzanalyse

\underbrace {\sum _{i=1}^{k}\sum _{j=1}^{n_{1}}\left(y_{ij}-{\hat {\mu }}\right)^{2}} _{\mathrm {QT} }=\underbrace {\sum _{i=1}^{k}\sum _{j=1}^{n_{1}}\left(y_{ij}-{\hat {\mu }}_{i}\right)^{2}} _{\mathrm {QI} }+\underbrace {\sum _{i=1}^{k}n_{i}\left({\hat {\mu }}_{i}-{\hat {\mu }}\right)^{2}} _{\mathrm {QZ} }

QT…Quadratsumme „Total“

QI…Quadratsumme „Innerhalb“

QZ…Quadratsumme „Zwischen“

Die Gesamtvariabilität der Daten QT kann also in zwei additive Teile gespalten werden. Dadurch bietet sich als weitere deskriptive Größe analog zur Regressionsanalyse das Bestimmtheitsmaß an, welches als Quotient aus QZ und QT berechnet wird und wieder den Anteil an der durch das Modell erklärten Varianz an der Zielgröße angibt.

Aufgabe 4 Denken Sie sich zwei Datensätze aus (je drei Gruppen mit je fünf Beobachtungen pro Gruppe). Einen, bei dem das Bestimmtheitsmaß 100% beträgt und einen, bei dem das Bestimmtheitsmaß 0% beträgt. Welche Charakteristik haben die Daten jeweils.

Vier Datenreihen mit je zwei Gruppen,
die gut bzw. schlecht getrennt werden können

Um nun inferenzstatistische Aussagen zu machen, wird nun die Quadratsumme „Zwischen“ nicht zur totalen Quadratsumme, sondern zur Quadratsumme „Innerhalb“ in Beziehung gesetzt. Dies liefert auch dann die Prüfgröße F ^[1] für unsere Hypothese:

F={\frac {MQZ}{MQI}}={\frac {{\frac {1}{k-1}}QZ}{{\frac {1}{N-k}}QI}}={\frac {(N-k)QZ}{(k-1)QI}}\qquad {\left[N=n_{1}+n_{2}+n_{3}\right]}

Es kann gezeigt werden, dass $F$ unter Gültigkeit der Nullhypothese (die Erwartungswerte aller Gruppen sind gleich) und den anderen vorher erwähnten Modellannahmen (Normalverteilung der Fehler) nach einer F-Verteilung mit $k-1$ und $N-k$ Freiheitsgraden verteilt ist. Dadurch werden Schranken definiert, bis zu welchen Werten von eine Entscheidung für die Nullhypothese und ab wann eine Entscheidung für die Alternativhypothese erfolgt. Was man weiters wie bei jedem statistischen Test benötigt, ist $\alpha$ , die “Irrtumswahrscheinlichkeit“ (=die Wahrscheinlichkeit, die $H_{0}$ zu verwerfen, obwohl sie zutrifft).

Fortsetzung Beispiel 2

QT=(9-11,717)^{2}+\cdots (14,1-11,717)^{2}=323,105

QI=(9-8,771)^{2}+\cdots +(6,8-8,771)^{2}+\cdots +(14,1-14,950)^{2}=199,361

QZ=QT-QI=323,105-199,361=123,744

F={\frac {{\frac {1}{3-1}}*123,744}{{\frac {1}{18-3}}*199,361}}={\frac {61,872}{13,291}}=4,655

Aufgabe 5

↑ Die Prüfgröße F bzw. die Prüfverteilung ist benannt nach Sir Ronald A. Fisher, der erstmals im Jahre 1935 mit Erscheinen seines Buches „The Design of Experiments“ eine ausführliche Darstellung von Varianzanalyse und Versuchsplanung veröffentlichte (Hartung, 1998, S.12).

[1] Die Prüfgröße F bzw. die Prüfverteilung ist benannt nach Sir Ronald A. Fisher, der erstmals im Jahre 1935 mit Erscheinen seines Buches „The Design of Experiments“ eine ausführliche Darstellung von Varianzanalyse und Versuchsplanung veröffentlichte (Hartung, 1998, S.12).

[1]

Methoden der Datenanalyse - Varianzanalyse

Navigationsmenü

Suche