Technischer Hinweis: Links in den Übungen öffnen Sie, indem sie darauf rechtsklicken und “Link in neuem Tab/Fenster öffnen” wählen.
Runden Sie Kennzahlen und z-Werte auf zwei Stellen nach dem Komma, p-Werte auf drei Stellen nach dem Komma.
Nehmen wir an, wir hätten heute die Aufgabe, die durchschnittliche Körpergrösse der Studentinnen PHY13-PHY17 zu bestimmen. Die Studentinnen PHY13-PHY17 wären demnach unsere Population und die durchschnittliche Körpergrösse das Merkmal, dessen wahrer Wert üblicherweise unbekannt ist. Wir wissen bereits, dass die Körpergrösse normal verteilt ist. Wir suchen also
Beachte: Die unbekannten Populationskennzahlen werden in griechischen Buchstaben angegeben im Gegensatz zu den Stichproben-Kennzahlen, die in lateinischen Buchstaben angegeben werden (\(\bar{x}\) für Mittelwert und \(s\) für Standardabweichung).
Zur Erinnerung hier nochmals die wichtigsten Kennzahlen zur Körpergrösse der Studentinnen:
##
## DESCRIPTIVES
##
## Descriptives
## ──────────────────────────────────
## Groesse
## ──────────────────────────────────
## N 183
## Missing 0
## Mean 166.9235
## Median 167.0000
## Standard deviation 5.664100
## Minimum 148.0000
## Maximum 183.0000
## ──────────────────────────────────
Für die folgenden Überlegungen nehmen wir unsere 183 Studentinnen als Population. Weil wir einen Datensatz mit den Körpergrössen von allen diesen Studentinnen haben, kennen wir in unserem Fall den wahren Mittelwert \(\mu\) = 166.92 und die wahre Standardabweichung \(\sigma\) = 5.66. Um die theoretischen Grundlagen zu überprüfen, tun wir jetzt aber so, als ob wir das nicht wüssten!.
Um unsere Fragestellung zu untersuchen, ziehen wir aus dieser Population mehrere Zufallsstichproben \(sample_1\) bis \(sample_n\) (Üblicherweise zieht man nur eine einzige Stichprobe, aber wir machen das hier, um die theoretischen Grundlagen zu erläutern). Von jeder dieser Stichproben bestimmen wir den Mittelwert und die Standardabweichung.
Wir dürfen erwarten, dass der Mittelwert von den Stichprobenmittelwerten \(\bar{x}_1\) bis \(\bar{x}_n\) etwa dem wahren Mittelwert in der Population \(\mu\) enspricht:
\[\mu \approx \frac{\bar{x}_1+\bar{x}_2+...+\bar{x}_n}{n}\]
Vermutlich wird keiner der Stichprobenmittelwerte \(\bar{x}_1\) bis \(\bar{x}_n\) exakt den Populationsmittelwert \(\mu\) treffen. Wir erhalten also eine Verteilung der Stichprobenmittelwerte um den Populationsmittelwert \(\mu\). Die Standardabweichung des Mittelwerts der einzelnen Stichprobenmittelwerte wird als Standardfehler SE (engl. standard error) bezeichnet.
Bevor Sie jetzt weiterfahren, empfehle ich ihnen ein Video: Bunnies, Dragons and the ‘Normal’ World: Central Limit Theorem | The New York Times Youtube, 3m38s
Jetzt führen wir ein Experiment durch: Ihre Aufgabe ist es, die Körpergrösse von Studentinnen der Physiotherapie PHY13 bis PHY17 zu bestimmen. Sie können unmöglich alle 183 Studentinnen messen, da diese an verschiedenen Orten verteilt sind und der Aufwand unverhältnismässig gross ist. Zum Glück haben Sie 30 Kolleg:innen, die jeweils von 10 Studentinnen PHY13-PHY17 die Kontaktdaten haben. Sie bitten diese 30 Kolleg:innen darum, bei den 10 Studentinnen die Körpergrösse zu erfragen. Am Schluss haben Sie somit 30 Stichproben aus ihrer Population im Umfang von 10 Studentinnen. Sie berechnen von jeder Stichprobe den Mittelwert und die Standardabweichung. Das Ergebnis sieht folgendermassen aus:
| Sample | n | m | s |
|---|---|---|---|
| 1 | 10 | 168.1 | 7.61 |
| 2 | 10 | 163.2 | 5.73 |
| 3 | 10 | 166.2 | 5.31 |
| 4 | 10 | 162.8 | 4.87 |
| 5 | 10 | 166.5 | 6.29 |
| 6 | 10 | 165.2 | 3.33 |
| 7 | 10 | 168.3 | 6.33 |
| 8 | 10 | 167.9 | 5.24 |
| 9 | 10 | 166.9 | 6.05 |
| 10 | 10 | 167.6 | 3.47 |
| 11 | 10 | 165.9 | 3.60 |
| 12 | 10 | 168.4 | 6.93 |
| 13 | 10 | 165.4 | 5.60 |
| 14 | 10 | 170.9 | 5.22 |
| 15 | 10 | 167.6 | 6.72 |
| 16 | 10 | 166.5 | 5.56 |
| 17 | 10 | 165.7 | 5.27 |
| 18 | 10 | 163.6 | 2.80 |
| 19 | 10 | 166.5 | 5.82 |
| 20 | 10 | 167.2 | 7.10 |
| 21 | 10 | 164.1 | 5.74 |
| 22 | 10 | 169.7 | 5.54 |
| 23 | 10 | 170.2 | 5.59 |
| 24 | 10 | 168.5 | 5.85 |
| 25 | 10 | 165.0 | 3.50 |
| 26 | 10 | 165.6 | 5.56 |
| 27 | 10 | 168.7 | 5.76 |
| 28 | 10 | 166.7 | 4.64 |
| 29 | 10 | 164.5 | 3.24 |
| 30 | 10 | 166.8 | 5.67 |
Beachte: In jeder Stichprobe liegt der Mittelwert in der Nähe des Populationsmittelwertes \(\mu = 166.92\) und die Standardabweichung in der Nähe der Populationsstandardabweichung \(\sigma = 5.66\).
Betrachten wir jetzt die Verteilung der Stichprobenmittelwerte im Histogramm:
Wir sehen, dass sich die Stichprobenmittelwerte wie erwartet um den wahren Populationsmittelwert herum verteilen. Die Verteilung von Stichprobenkennzahlen, hier von Stichprobenmittelwerten, erfolgt annähernd einer Normalverteilung.
Zusammenfassung (Zentraler Grenzwertsatz, central limit theorem, CLT)
Die Verteilung einer Stichprobenkennzahl (hier der Mittelwerte aller Stichproben \(\bar{x}_1\) bis \(\bar{x}_n\) folgt annähernd einer Normalverteilung mit einem Mittelwert um den Populationsmittelwert \(\mu\) und einer Standardabweichung SE, die gleich der Populationsstandardabweichung \(\sigma\) dividiert durch die Quadratwurzel der Stichprobenumfänge n ist. Als Formel ausgedrückt:
\[\bar{x} \sim N(\bar{x} = \mu, SE = \frac{\sigma}{\sqrt{n}})\]
Wenn die Standardabweichung der Population unbekannt ist, was meist der Fall ist, setzen wir für die Berechnung des Standardfehlers \(SE\) anstelle von \(\sigma\) die Standardabweichung der Stichprobe \(s\) ein:
\[SE = \frac{s}{\sqrt{n}})\]
Wir arbeiten mit einer Simulations-App. Rufen Sie den Link Central Limit Theorem for Means auf (Rechtsklick auf den Link > “Link in neuem Tab öffnen”).
Vergrössern Sie jetzt die Sample Size auf 100. Hat der Stichprobenumfang einen Einfluss …
Wiederholen Sie die Übung mit Stichprobenumfängen von 200 und 400.
Wir arbeiten weiter mit der Simulations-App Central Limit Theorem for Means.
Vergrössern Sie jetzt die Sample Size schrittweise. Hat der Stichprobenumfang einen Einfluss …
Merke: Unabhängig davon, wie die Daten in der Population verteilt sind (normal, rechtsschief, linksschief, irregulär), nähert sich mit steigendem Umfang die Verteilung der Stichprobenkennzahlen der Normalverteilung an.
Wir wollen untersuchen, ob es einen Unterschied gibt in der körperlichen Aktivität zwischen Männern und Frauen. Eine Zufallstichprobe ergibt, dass Männer an \(\bar{x}_{maenner} = 4.3\) und Frauen an \(\bar{x}_{frauen} = 3.2\) Tagen pro Woche körperlich aktiv sind. Was wäre eine gute Punktschätzung für die Differenz der körperlichen Aktivität zwischen Männern und Frauen?
Wir können die Differenz der beiden Stichprobenkennzahlen verwenden: \(4.3 - 3.2 = 1.1\). Männer sind im Durchschnitt 1.1 Tage/Woche häufiger körperlich aktiv als Frauen.
In einer Stichprobe von n = 100 Studentinnen ist die Standardabweichung für die Körpergrösse \(s = 0.1\) Meter. Die Beobachtungseinheiten sind unabhängig voneinander und der Stichprobenumfang ist kleiner als 10% der Population.
Hinweis: Beachten Sie an diesem Beispiel, dass für eine Halbierung des Standardfehlers, der Stichprobenumfang vervierfacht werden muss (Wurzel-n-Gesetz)
Wenn wir eine Population untersuchen, können wir normalerweise nicht mehrere Stichproben analysieren und müssen uns auf eine einzige Stichprobe verlassen. Aber wie präzise lässt sich der wahre Populationsmittelwert \(\mu\) mit einer einzelnen Stichprobe bestimmen?
Nehmen wir als Beispiel die erste Stichprobe von unserem Versuch oben:
| Sample | Kohorte | Groesse |
|---|---|---|
| 1 | phy13 | 160 |
| 1 | phy13 | 167 |
| 1 | phy14 | 169 |
| 1 | phy13 | 181 |
| 1 | phy17 | 172 |
| 1 | phy16 | 158 |
| 1 | phy17 | 178 |
| 1 | phy13 | 162 |
| 1 | phy17 | 163 |
| 1 | phy13 | 171 |
| m | s |
|---|---|
| 168.1 | 7.61 |
Wie wir aus dem zentralen Grenzwertsatz gelernt haben, ist die Standardabweichung für den Mittelwert der Stichprobenmittelwerte der Standardfehler \(SE\). Wir haben im Moment (und auch in der Regel) zwar nur eine einzige Stichprobe, daher müssen wir die Kennzahlen unserer Stichprobe als besten Schätzer verwenden. D.h.
\[\mu \approx \bar{x}\]
\[SE = \frac{\sigma}{\sqrt{n}} \approx \frac{s}{\sqrt{n}}\]
Wie wir auch aus der Geometrie der Normalverteilung wissen, umfasst der Bereich \(\bar{x} \pm 1.96s\) 95% der zu erwartenden Werte. Für die Schätzung der Vorhersagegenauigkeit unseres Mittelwertes kombinieren wir jetzt diese Kenntnisse und berechnen das 95%-Vertrauensintervall (\(CI_{95}\)) für den Mittelwert.
\[CI_{95} = \bar{x} \pm 1.96 \times SE\]
\[CI_{95} = 168.1 \pm 1.96 \times \frac{7.61}{\sqrt{10}} = [163.38, 172.82]\]
Interpretation des 95% CI Wenn wir 100 Stichproben mit gleichem Stichprobenumfang aus der Population untersuchen, werden 95% der Vertrauensintervalle den wahren Populationsmittelwert \(\mu\) enthalten.
Nach diesen Erläuterungen müsste das 95%-Konfidenzintervall in 95% von unseren 30 Stichproben den Populationsmittelwert enthalten (95% von 30 = 28.5).
Von den 30 Stichproben enthalten 27 den Populationsmittelwert und 3 Stichproben (Sample 4, 14 und 17), also 10%, enthalten ihn nicht. Diese Abweichung von den erwarteten 5% ist auf zufällige Variation zurückzuführen. Je mehr Stichproben wir nehmen würden, desto mehr würden wir uns dem theoretischen Modell annähern.
Quintessenz: Wir wissen zwar nicht, ob ein 95%-Konfidenzintervall den wahren Populationsparameter enthält, aber wir können zu 95% darauf vertrauen, dass ein bestimmtes 95%-Konfidenzintervall den wahren Parameter enthält.
Wenn wir sicher sein wollen, dass unser Vertrauensintervall den Populationsparameter beinhaltet, sollten wir dann eher ein breites (z.B. 95%-CI) oder eher ein schmales Vertrauensintervall (60%-CI) verwenden?
Wenn wir sicher sein wollen, einen Fisch zu fangen, müssen wir ein grösseres Netz wählen. Genau gleich verhält es sich mit Vertrauensintervallen: Wenn wir ein grösseres Vertrauensintervall wählen, können wir eher darauf vertrauen, dass es den Populationsparameter beinhaltet.
Verwenden Sie für diese Aufgaben die Angaben aus Tabelle 2 oben.
\(\bar{x} = 166.2, s = 5.31, n = 10\)
Für die Berechnung des Vertrauensintervalls benötigen Sie den Standardfehler SE:
\[SE = \frac{s}{\sqrt{n}} = \frac{5.31}{\sqrt{10}} = \frac{5.31}{3.16} = 1.679\]
Die Formel für die Berechnung des 95%-Vertrauensintervalls lautet
\[CI_{95} = \bar{x} \pm 1.96 SE = 166.2 \pm 1.96 \times 1.679 = [162.91, 169.50]\]
Wie oft wird das 95%-Vertrauensintervall erwartungsgemäss den wahren Populationsmittelwert verfehlen, wenn Sie a) 20, b) 60, c) 120 Stichproben mit dem gleichen Stichprobenumfang untersuchen.
Wie können Sie die Präzision ihrer Schätzung des wahren
Populationsmittelwerts durch eine Anpassung des Untersuchungsdesigns
erhöhen?
Durch die Erhöhung des Stichprobenumfangs \(n\). Da der Standardfehler \(SE\) u.a. vom Stichprobenumfang abhängig ist, verkleinert sich das 95%-Vertrauensintervall proportional zur \(\sqrt{n}\). Eine schöne Animation zu dieser Frage liefert https://seeing-theory.brown.edu/frequentist-inference/index.html#section2 . Verändern Sie in den Einstellungen den Stichprobenumfang \(n\) und beachten Sie, wie sich die Breite der Konfidenzintervalle verändert.