Übung 1

Sie sehen hier die Schlafdauer von 10 Personen aus New York (die Stadt, die nie schläft…):

sleep <- c(7.0, 8.6, 7.6, 7.7, 6.4, 7.2, 9.6, 8.2, 8.3, 8.0)
print(sleep)
##  [1] 7.0 8.6 7.6 7.7 6.4 7.2 9.6 8.2 8.3 8.0

Aufgabe

Besteht aus diesen Daten Evidenz dagegen, dass New Yorker im Durchschnitt 8 Stunden pro Nacht schlafen?

  1. Formulieren Sie die Nullhypothese H0 und die Alternativhypothese HA
  2. Prüfen Sie ihre Hypothese mit einem nicht-parametrischen statistischen Test.
  3. Fassen Sie ihr Resultat in ein bis zwei Sätzen zusammen.
  4. Kommen Sie zu einer anderen Schlussfolgerung, wenn Sie einen t-Test machen?

Lösung

  1. Formulieren Sie die Nullhypothese H0 und die Alternativhypothese HA:
  • H0: Die durchschnittliche Schlafdauer von New Yorkern beträgt 8 Std. –> \(μ = 8\)
  • HA: Die durchschnittliche Schlafdauer von New Yorkern beträgt nicht 8 Std. –> \(μ ≠ 8\)

  1. Prüfen Sie ihre Hypothese mit einem statistischen Test.

Zuerst müssen die Differenzen berechnet werden.

diff <- round(sleep - 8,1)
diff
##  [1] -1.0  0.6 -0.4 -0.3 -1.6 -0.8  1.6  0.2  0.3  0.0

Nun müssen die Ränge der Differenzen bestimmt werden.

df <- data.frame(sleep, diff, diff_abs = c(1, 0.6, 0.4, 0.3, 1.6, 0.8, 1.6, 0.2, 0.3, 0))
library(tidyverse)
df <- df %>% 
  mutate(rang = rank(diff_abs)) %>% 
  mutate(Pos = c(0, 6, 0, 0, 0, 0, 9.5, 2, 3.5, 0.5)) %>% 
  mutate(Neg = c(8, 0, 5, 3.5, 9.5, 7, 0, 0, 0, 0.5)) 

df %>% 
  kable() %>% 
  kable_styling()
sleep diff diff_abs rang Pos Neg
7.0 -1.0 1.0 8.0 0.0 8.0
8.6 0.6 0.6 6.0 6.0 0.0
7.6 -0.4 0.4 5.0 0.0 5.0
7.7 -0.3 0.3 3.5 0.0 3.5
6.4 -1.6 1.6 9.5 0.0 9.5
7.2 -0.8 0.8 7.0 0.0 7.0
9.6 1.6 1.6 9.5 9.5 0.0
8.2 0.2 0.2 2.0 2.0 0.0
8.3 0.3 0.3 3.5 3.5 0.0
8.0 0.0 0.0 1.0 0.5 0.5
Sum_p <- sum(df$Pos)
Sum_n <- sum(df$Neg)

Die Rangsummen sind R+ = 21.5 und R- = 33.5

Der kritische Werte für alpha = 0.05 und n = 10 ist 8 (siehe Tabelle).

Da die Teststatistik grösser ist als der kritische Wert fällt er in den Nicht-Verwerfungsbereich.


  1. Fassen Sie ihr Resultat in ein bis zwei Sätzen zusammen.

Da der p-Wert somit > .05 ist, haben wir keine Evidenz dafür, dass sich die mittlere Schlafdauer von New Yorkern von 8 Stunden unterscheidet und verwerfen die H0 nicht.


So könnte der Output für einen Wilcoxon-Test einer Statistiksoftware aussehen:

wilcox.test(sleep, mu = 8)
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  sleep
## V = 17.5, p-value = 0.5936
## alternative hypothesis: true location is not equal to 8

Anmerkung: Das exakte vorgehen bei einem Wilcoxon Test unterscheidet sich je nach Quelle. Meine Statistiksoftware berechnet z.B. die Teststatistik V, welche nicht mit W übereinstimmt.


  1. Kommen Sie zu einer anderen Schlussfolgerung, wenn Sie einen t-Test machen?

Nein (siehe Übung t-Tests)


Übung 2

Patientenedukation nimmt in der medizinischen Behandlung eine immer wichtigere Rolle ein. In einer Studie wurde untersucht, ob bei Personen mit einem neu diagnostizierten Diabetes mellitus Typ II ein Edukationsvideo das Wissen der Patient:innen rund um ihre Krankheit beeinflusst. Alle Studienteilnehmer:innen haben vor und vier Wochen nach einen Edukationsvideo einen Wissenstest zum Thema “Diabetes Typ II” absolviert. Maximal konnten 100 Punkte erreicht werden.

Hier sehen sie den Datensatz:

ID <- c(1:15)
Score_pre <- c(41, 41, 29, 47, 34, 41, 43, 29, 18, 30, 40, 37, 60, 38, 39)
Score_post <- c(47, 48, 41, 34, 35, 57, 61, 54, 27, 43, 63, 48, 57, 43, 54)
DM <- data.frame(ID, Score_pre, Score_post)
DM %>% 
  kable() %>%
  kable_styling()
ID Score_pre Score_post
1 41 47
2 41 48
3 29 41
4 47 34
5 34 35
6 41 57
7 43 61
8 29 54
9 18 27
10 30 43
11 40 63
12 37 48
13 60 57
14 38 43
15 39 54

Aufgabe

  1. Formulieren Sie die Nullhypothese H0 und die Alternativhypothese HA.
  2. Prüfen Sie ihre Hypothese mit einem nicht-parametrischen statistischen Test.
  3. Fassen Sie ihr Resultat in ein bis zwei Sätzen zusammen.