Situation

Zur Reduktion der Schwellung nach Knieoperationen werden häufig Quarkwickel eingesetzt. In einer (fiktiven) Multizenterstudie wurden insgesamt 30 Stichproben mit je 30 Patient*innen untersucht. Dabei wurde der Knieumfang direkt nach einem Knieprotheseneinsatz und drei Tage später gemessen. In der Grafik unten ist für jede dieser Stichproben die mittlere Umfangsreduktion (in cm) und das entsprechende 95% Vertrauensintervall (auch Konfidenzintervall, kurz CI) dargestellt.

mu <- 7
sigma <- 3

m <- vector()
s <- vector()
ll <- vector()
ul <- vector()

for(i in 1:30){
  set.seed(100-i)
  x <- rnorm(30, mu, sigma)
  m[i] <- mean(x)
  s[i] <- sd(x)
  t <- t.test(x)
  ll[i] <- t$conf.int[1]
  ul[i] <- t$conf.int[2]
}

df <- data.frame(Studie = 1:30, m, s, ll, ul)

library(ggplot2)
ggplot(df, aes(x = Studie, y = m)) + geom_point() +
  geom_errorbar(aes(ymin = ll, ymax = ul), width = 1) + 
  geom_hline(yintercept = 7, col = "red") + 
  labs(y = "Umfangreduktion nach 3 Tagen [cm]", title = "95% CIs von 30 Studien mit n = 30")


Übung 1

Aufgabe

  1. Wie viele der 30 CIs schliessen den wahren Populationsmittelwert (rote Linie) ein?

Lösung

Alle 30 CIs schliessen den wahren Populationsmittelwert mit ein. Man sieht dies daran, dass alle CIs die rote Linie schneiden.


Übung 2

Aufgaben

  1. Welche untere Grenze hat das 95% CI der 20. Studie mit der t-Verteilung und mit der z-Verteilung? (\(\bar{x} = 7.4, s = 2.9\))
  2. Welche obere Grenze hat das 95% CI der 15. Studie mit der t-Verteilung und mit der z-Verteilung? (\(\bar{x} = 5.9, s = 3.1\))
  3. Welche obere Grenze hat das 99% CI der 7. Studie mit der t-Verteilung und mit der z-Verteilung? (\(\bar{x} = 7.6, s = 2.8\))

Lösungen

  1. Welche untere Grenze hat das 95% CI der 20. Studie mit der t-Verteilung und mit der z-Verteilung? (\(\bar{x} = 7.4, s = 2.9\))
mean = 7.4
s = 2.9
n = 30
se = s/sqrt(n)
qz = 1.96 # siehe z-Tabelle
qt = 2.0452 # siehe t-Tabelle

ll_z = mean - qz * se
ll_t = mean - qt * se

Mit der z-Verteilung liegt die untere Grenze bei 6.3622483 und mit der t-Verteilung (df = n-1) liegt diese bei 6.3171379.


  1. Welche obere Grenze hat das 95% CI der 15. Studie mit der t-Verteilung und mit der z-Verteilung? (\(\bar{x} = 5.9, s = 3.1\))
mean = 5.9
s = 3.1
n = 30
se = s/sqrt(n)
qz = 1.96 # siehe z-Tabelle
qt = 2.0452 # siehe t-Tabelle

ul_z = mean + qz * se
ul_t = mean + qt * se

Mit der z-Verteilung liegt die obere Grenze bei 7.0093208 und mit der t-Verteilung (df = n-1) liegt diese bei 7.0575422.


  1. Welche obere Grenze hat das 99% CI der 15. Studie mit der t-Verteilung und mit der z-Verteilung? (\(\bar{x} = 5.9, s = 3.1\))
mean = 5.9
s = 3.1
n = 30
se = s/sqrt(n)
qz = 2.5758 # siehe z-Tabelle
qt = 2.7563 # siehe t-Tabelle

ul_z = mean + qz * se
ul_t = mean + qt * se

Mit der z-Verteilung liegt die obere Grenze des 99% CIs bei 7.3578512 und mit der t-Verteilung (df = n-1) liegt diese bei 7.4600106.


Übung 3

Aufgabe

  1. Wie oft wird das 95% CI erwartungsgemäss den wahren Populationsmittelwert (rote Linie) verfehlen, wenn man a) 40, b) 100, c) 120 Stichproben mit dem gleichen Stichprobenumfang untersucht?

Lösung

Ein 95% CI sagt aus, dass von 100, auf die gleiche Art untersuchten Stichproben, 95% den wahren Populationsmittelwert miteinschliessen. Somit verfehlen ihn 5%. Also \(40*0.05 = 2\), \(100*0.05 = 5\) und \(120*0.05 = 6\).


Übung 3

Aufgabe

  1. Warum sind die CIs unterschiedlich breit, obwohl die Stichprobengrösse immer n = 30 ist?

Lösung

Die Stichproben haben unterschiedliche Standardabweichungen. Nebst der Stichprobengrösse hat nur noch die Standardabweichung einen Einfluss auf den Standardfehler. Je grösser der Standardfehler, desto breiter das CI.


Übung 4

Aufgabe

  1. Warum ist die mittlere Umfangreduktion in jeder Stichprobe leicht anders? Was bedeutet das?

Lösung

Die Stichproben werden zufällig gewählt und unterliegen daher zufälligen Schwankungen. In der Realität ist keine Stichprobe genau gleich wie eine andere. Dies führt dazu, dass sich die Mittelwerte zwischen den Stichproben unterscheiden. Man sagt dem “Stichprobenvariation” (engl. sampling variation). Dies hat zur Folge, dass nicht alle Stichprobenmittelwerte dem wahren Populationsmittelwert entsprechen. Gewisse Stichprobenmittelwerte weichen stark, andere weniger stark vom wahren Populationsmittelwert ab. Man sagt dem “Stichprobenfehler” (engl. sampling error). In der Statistik können wir also nie beurteilen, ob ein gefundener Effekt wahr oder nicht wahr ist. Wie können lediglich Bereiche schätzen, in welchen wir die Wahrheit erwarten.


Übung 5

Aufgabe

  1. Wie können Sie die Präzision ihrer Schätzung des wahren Populationsmittelwerts durch eine Anpassung des Untersuchungsdesigns erhöhen?

Lösung

Durch die Erhöhung des Stichprobenumfangs n. Da der Standardfehler \(se\) insbesondere vom Stichprobenumfang abhängig ist, verkleinert sich das CI proportional zu \(\sqrt{n}\). Wenn ich beispielsweise den Stichprobenumfang vervierfache, dann halbiert sich der Standardfehler und somit wird ein CI halb so breit.


Übung 6

Aufgabe

  1. Das 95% CI der 30. Stichprobe geht von 5.8 bis 7.8. Wie gross ist die Standardabweichung in dieser Stichprobe (unter der t-Verteilung)?

Lösung

95% CIs von Mittelwerten sind symmetrisch. Somit muss der Mittelwert bei 6.8 ligen. Der Standardfehler ist somit \(1/qt\), also \(1/2.0452 = 0.4889\). Um die Standardabweichung zu erhalten, multipliziert man diesen Wert mit \(\sqrt{n}\), also \(0.4889*\sqrt{30} = 2.6778\)