Einleitung

Ein 2-Stichproben-t-Test wird verwendet, um zu vergleichen, ob die Mittelwerte von zwei unabhängigen Gruppen signifikant unterschiedlich sind. Hier sind die Hauptschritte:

  1. Hypothesen aufstellen:
  • Nullhypothese \(\left(H_0\right)\) : Es gibt keinen Unterschied zwischen den Mittelwerten der beiden Gruppen.
  • Alternativhypothese \(\left(H_1\right)\) : Es gibt einen Unterschied zwischen den Mittelwerten der beiden Gruppen.
  1. Daten vorbereiten:
  • Sammle die Daten für die beiden Gruppen, die du vergleichen möchtest.
  • Speichere die Daten in zwei Vektoren.
  1. Daten beschreiben:
  • Berechne die Mittelwerte und Standardabweichungen der beiden Gruppen.
  • Überprüfe die Daten auf Normalverteilung (optional, aber empfohlen).
  1. t-Test durchführen:
  • Verwende die t.test()-Funktion in R, um den t-Test durchzuführen.
  • Gib an, ob die Varianzen der beiden Gruppen gleich sind (var. equal = TRUE oder FALSE).
  1. Ergebnisse interpretieren:
  • Überprüfe die t-Statistik und den p-Wert.
  • Vergleiche den p-Wert mit dem Signifikanzniveau (z.B. 0.05), um die Nullhypothese zu akzeptieren oder abzulehnen.

Übung 1 (gepaarter t-Test)

Ein Stichprobentest mit verbundenen Variablen wird oft als gepaarter t-Test oder abhängiger t-Test bezeichnet. Dieser Test wird verwendet, um zu vergleichen, ob es einen signifikanten Unterschied zwischen den Mittelwerten von zwei verwandten Gruppen gibt. Hier ist ein einführendes Beispiel:

Ein Forscher möchte untersuchen, ob ein spezielles Diätprogramm das Gewicht von Teilnehmern reduziert. Die Gewichte der gleichen Gruppe von Personen wurden vor und nach dem Diätprogramm gemessen. Die Daten sind wie folgt:

  • Vor dem Programm: 85, 90, 78, 92, 88, 95, 80, 85, 89, 91, 87, 93, 84, 86, 90, 88, 92, 94, 89, 91
  • Nach dem Programm: 82, 87, 76, 89, 85, 92, 78, 82, 86, 88, 84, 90, 81, 83, 87, 85, 89, 91, 86, 88

Aufgaben

  1. Formulieren Sie die Hypothesen:
  • Nullhypothese (H0)
  • Alternativhypothese (H1)
  1. Berechnen Sie die statistischen Kennzahlen:
  • Differenzen zwischen den Gewichten vor und nach dem Programm
  • Mittelwert der Differenzen
  • Standardabweichung der Differenzen
  1. Erstellen Sie die Graphen:
  • Boxplot der Gewichte vor und nach dem Programm
  • Histogramm der Differenzen
  • QQ-Plot der Differenzen
  1. Führen Sie den gepaarten t-Test in R durch:
  • Geben Sie den R-Code an, um die Daten einzugeben und den gepaarten t-Test durchzuführen
  1. Interpretieren Sie die Ergebnisse:
  • Interpretation des gepaarten t-Tests

Lösung

  1. Hypothesen
  • Nullhypothese ( H 0\(): \mu_D=0\)
  • Alternativhypothese (H1): \(\mu_D \neq 0\)
  1. Berechnen Sie die statistischen Kennzahlen:
  • Differenzen zwischen den Gewichten vor und nach dem Programm
# Daten eingeben
vor <- c(85, 90, 78, 92, 88, 95, 80, 85, 89, 91, 87, 93, 84, 86, 90, 88, 92, 94, 89, 91)
nach <- c(82, 87, 76, 89, 85, 92, 78, 82, 86, 88, 84, 90, 81, 83, 87, 85, 89, 91, 86, 88)
differenzen <- vor - nach 
differenzen
  • Mittelwert der Differenzen
mean(differenzen)
  • Standardabweichung der Differenzen
sd(differenzen)
  1. Erstellen Sie die Graphen:
  • Boxplot der Gewichte vor und nach dem Programm
boxplot(vor, nach, names = c("Vor dem Programm", "Nach dem Programm"), main = "Gewicht vor und nach dem Programm")

  • Histogramm der Differenzen
hist(differenzen, main = "Histogramm der Differenzen", xlab = "Differenzen", breaks = 4)

* QQ-Plot der Differenzen

# QQ-Plot der Differenzen
qqnorm(differenzen, main = "QQ-Plot der Differenzen")
qqline(differenzen)

  • Boxplot: Zeigt die Verteilung der Gewichte vor und nach dem Programm. Eine Verschiebung nach unten deutet auf eine Gewichtsreduktion hin.

  • Histogramm: Zeigt die Verteilung der Gewichtsveränderungen. Eine Konzentration der Differenzen um -3 zeigt eine konsistente Gewichtsreduktion.

  • QQ-Plot: Überprüft die Normalverteilung der Differenzen. Wenn die Punkte ungefähr auf der Linie liegen, sind die Differenzen normalverteilt.

  1. Führen Sie den gepaarten t-Test in R durch:
  • Geben Sie den R-Code an, um die Daten einzugeben und den gepaarten t-Test durchzuführen
# Gepaarter t-Test
t.test(vor, nach, paired = TRUE)
  1. Interpretation
  • Gepaarter t-Test:

  • t-Statistik: 42.136

  • p-Wert: p-value < 2.2e-16 (sehr klein)

  • Konfidenzintervall: [2.755948, 3.044052]

Da der p-Wert (2.2e-16 ) viel kleiner als 0.05 ist, lehnen wir die Nullhypothese ab. Das bedeutet, dass sas Diätprogramm einen signifikanten Einfluss auf das Gewicht der Teilnehmer hat

Übung 2

Ein Forscher möchte untersuchen, ob ein neues Medikament die Blutdruckwerte signifikant senkt. Die Patienten wurden in zwei Gruppen aufgeteilt:

  • Gruppe A: Patienten, die das neue Medikament erhalten haben.
  • Gruppe B: Patienten, die ein Placebo erhalten haben.

Die gemessene Blutdrucksenkung (in mmHg) ist wie folgt:

  • **Gruppe A*: 10.5, 12.3, 11.8, 13.1, 12.9, 11.5, 12.7, 13.0, 11.4, 12.2
  • **Gruppe B*: 5.5, 6.1, 5.8, 6.5, 5.9, 6.3, 5.7, 6.0, 5.6, 6.2

Führen Sie einen 2-Stichproben-t-Test durch, um zu bestimmen, ob es einen signifikanten Unterschied in der durchschnittlichen Blutdrucksenkung zwischen dem neuen Medikament und dem Placebo gibt. Verwenden Sie ein Signifikanzniveau von 0.05.

Aufgaben

  1. Formulieren Sie die Nullhypothese und die Alternativhypothese
  2. Berechnen Sie die Mittelwerte und Standardabweichungen der beiden Gruppen.
  3. Erstellen Sie Boxplots für die Blutdrucksenkung in beiden Gruppen.
  4. Erstellen Sie QQ-Plots für die Blutdrucksenkung in beiden Gruppen, um die Normalverteilung der Daten zu überprüfen.
  5. Führen Sie den 2-Stichproben-t-Test in R durch und geben Sie die t-Statistik und den p-Wert an.
  6. Treffen Sie eine Entscheidung basierend auf dem p-Wert und dem Signifikanzniveau. Interpretieren Sie das Ergebnis.

Lösung

  1. Formulieren Sie die Nullhypothese und die Alternativhypothese
  • Nullhypothese: Es gibt keinen Unterschied in der durchschnittlichen Blutdrucksenkung zwischen dem neuen Medikament und dem Placebo.

  • Alternativhypothese: Es gibt einen Unterschied in der durchschnittlichen Blutdrucksenkung zwischen dem neuen Medikament und dem Placebo.

  1. Berechnen Sie die Mittelwerte und Standardabweichungen der beiden Gruppen.
# Blutdrucksenkung in mmHg
gruppe_A <- c(10.5, 12.3, 11.8, 13.1, 12.9, 11.5, 12.7, 13.0, 11.4, 12.2)
gruppe_B <- c(5.5, 6.1, 5.8, 6.5, 5.9, 6.3, 5.7, 6.0, 5.6, 6.2)

# Mittelwerte und Standardabweichungen berechnen
mean_A <- mean(gruppe_A)
mean_B <- mean(gruppe_B)
sd_A <- sd(gruppe_A)
sd_B <- sd(gruppe_B)
  1. Erstellen Sie Boxplots für die Blutdrucksenkung in beiden Gruppen.
# Boxplots erstellen
boxplot(gruppe_A, gruppe_B, names = c("Gruppe A", "Gruppe B"), main = "Blutdrucksenkung bei Patienten", ylab = "Blutdrucksenkung (mmHg)")

  1. Erstellen Sie QQ-Plots für die Blutdrucksenkung in beiden Gruppen, um die Normalverteilung der Daten zu überprüfen.
# QQ-Plots erstellen
par(mfrow = c(1, 2))  # Zwei Plots nebeneinander
qqnorm(gruppe_A, main = "QQ-Plot Gruppe A")
qqline(gruppe_A)
qqnorm(gruppe_B, main = "QQ-Plot Gruppe B")
qqline(gruppe_B)

par(mfrow = c(1, 1))  # Zurück zu einem Plot
  1. Führen Sie den 2-Stichproben-t-Test in R durch und geben Sie die t-Statistik und den p-Wert an.
#t-Test durchführen
t_test_result <- t.test(gruppe_A, gruppe_B, var.equal = TRUE)

# Ergebnisse anzeigen
t_test_result
  1. Entscheidung und Interpretation:
#   Two Sample t-test

# data:  gruppe_A and gruppe_B
# t = 21.747, df = 18, p-value = 2.258e-14
# alternative hypothesis: true difference in means is not equal to 0
# 95 percent confidence interval:
#  5.58297 6.77703
# sample estimates:
# mean of x mean of y 
#     12.14      5.96 
  • t-Statistik: 21.747
  • p-Wert: 2.258e-14 (sehr klein)
  • Konfidenzintervall: [5.58297, 6.77703]

Da der p-Wert (2.258e-14) viel kleiner als 0.05 ist, lehnen wir die Nullhypothese ab. Das bedeutet, dass es einen signifikanten Unterschied in der durchschnittlichen Blutdrucksenkung zwischen dem neuen Medikament und dem Placebo gibt.

Übung 3

Ein Forscher möchte untersuchen, ob es einen signifikanten Unterschied in der Gewichtszunahme bei Ratten gibt, die mit zwei verschiedenen Diäten gefüttert wurden. Die Ratten wurden in zwei Gruppen aufgeteilt:

  • Gruppe A: Ratten, die Diät A erhalten haben.

  • Gruppe B: Ratten, die Diät B erhalten haben. Die gemessene Gewichtszunahme (in Gramm) ist wie folgt:

  • Gruppe A: 25.5, 26.3, 24.8, 27.1, 25.9, 26.5, 25.7, 26.0, 25.4, 26.2

  • Gruppe B: 23.5, 24.1, 23.8, 24.5, 23.9, 24.3, 23.7, 24.0, 23.6, 24.2

Führen Sie einen 2-Stichproben-t-Test durch, um zu bestimmen, ob es einen signifikanten Unterschied in der durchschnittlichen Gewichtszunahme zwischen den beiden Diäten gibt. Verwenden Sie ein Signifikanzniveau von 0.05.

Aufgaben

  1. Formulieren Sie die Nullhypothese und die Alternativhypothese
  2. Berechnen Sie die Mittelwerte und Standardabweichungen der beiden Gruppen.
  3. Erstellen Sie Boxplots für die Gewichtszunahme in beiden Gruppen.
  4. Erstellen Sie QQ-Plots für die Gewichtszunahme in beiden Gruppen, um die Normalverteilung der Daten zu überprüfen.
  5. Führen Sie den 2-Stichproben-t-Test in R durch und geben Sie die t-Statistik und den p-Wert an.
  6. Treffen Sie eine Entscheidung basierend auf dem p-Wert und dem Signifikanzniveau. Interpretieren Sie das Ergebnis.

Lösung

  1. Formulieren Sie die Nullhypothese und die Alternativhypothese

Nullhypothese: Es gibt keinen Unterschied in der durchschnittlichen Gewichtszunahme zwischen den beiden Diäten.

Alternativhypothese: Es gibt einen Unterschied in der durchschnittlichen Gewichtszunahme zwischen den beiden Diäten.

  1. Berechnen Sie die Mittelwerte und Standardabweichungen der beiden Gruppen.
# Gewichtszunahme in Gramm
gruppe_A <- c(25.5, 26.3, 24.8, 27.1, 25.9, 26.5, 25.7, 26.0, 25.4, 26.2)
gruppe_B <- c(23.5, 24.1, 23.8, 24.5, 23.9, 24.3, 23.7, 24.0, 23.6, 24.2)

# Mittelwerte und Standardabweichungen berechnen
mean_A <- mean(gruppe_A)
mean_B <- mean(gruppe_B)
sd_A <- sd(gruppe_A)
sd_B <- sd(gruppe_B)
  1. Erstellen Sie Boxplots für die Gewichtszunahme in beiden Gruppen.
# Boxplots erstellen
boxplot(gruppe_A, gruppe_B, names = c("Gruppe A", "Gruppe B"), main = "Gewichtszunahme bei Ratten", ylab = "Gewichtszunahme (g)")

  1. Erstellen Sie QQ-Plots für die Gewichtszunahme in beiden Gruppen, um die Normalverteilung der Daten zu überprüfen.
# QQ-Plots erstellen
par(mfrow = c(1, 2))  # Zwei Plots nebeneinander
qqnorm(gruppe_A, main = "QQ-Plot Gruppe A")
qqline(gruppe_A)
qqnorm(gruppe_B, main = "QQ-Plot Gruppe B")
qqline(gruppe_B)

par(mfrow = c(1, 1))  # Zurück zu einem Plot
  1. Führen Sie den 2-Stichproben-t-Test in R durch und geben Sie die t-Statistik und den p-Wert an.
# t-Test durchführen
t_test_result <- t.test(gruppe_A, gruppe_B, var.equal = TRUE)

# Ergebnisse anzeigen
t_test_result
  1. Entscheidung und Interpretation:

t-Statistik: 8.7315 p-Wert: 6.897e-08 (sehr klein) Konfidenzintervall: [1.503585 2.456415] Da der p-Wert (6.897e-08) viel kleiner als 0.05 ist, lehnen wir die Nullhypothese ab. Das bedeutet, dass es einen signifikanten Unterschied in der durchschnittlichen Gewichtszunahme zwischen den beiden Diäten gibt.

Übung 4

Ein Forscher möchte untersuchen, ob es einen signifikanten Unterschied in der Pflanzenhöhe zwischen zwei verschiedenen Düngemitteln gibt. Die Pflanzen wurden in zwei Gruppen aufgeteilt:

  • Gruppe A: Pflanzen, die mit Dünger A behandelt wurden.
  • Gruppe B: Pflanzen, die mit Dünger B behandelt wurden.

Die gemessenen Pflanzenhöhen (in cm) sind wie folgt:

  • Gruppe A: 15.2, 14.8, 15.5, 16.0, 15.3, 14.9, 15.1, 15.4, 15.0, 15.6
  • Gruppe B: 14.5, 14.7, 14.8, 14.6, 14.9, 14.4, 14.8, 14.7, 14.6, 14.5

Führen Sie einen 2-Stichproben-t-Test durch, um zu bestimmen, ob es einen signifikanten Unterschied in der durchschnittlichen Pflanzenhöhe zwischen den beiden Düngemitteln gibt. Verwenden Sie ein Signifikanzniveau von 0.05.

Aufgaben:

  1. Formulieren Sie die Nullhypothese und die Alternativhypothese?
  2. Berechnen Sie die Mittelwerte und Standardabweichungen der beiden Gruppen.
  3. Führen Sie den 2-Stichproben-t-Test in R durch und geben Sie die t-Statistik und den p-Wert an.
  4. Treffen Sie eine Entscheidung basierend auf dem p-Wert und dem Signifikanzniveau. Interpretieren Sie das Ergebnis.

Lösung

  1. Formulieren Sie die Nullhypothese und die Alternativhypothese?
  • Nullhypothese: Es gibt keinen Unterschied in der durchschnittlichen Pflanzenhöhe zwischen den beiden Düngemitteln.
  • Alternativhypothese: Es gibt einen Unterschied in der durchschnittlichen Pflanzenhöhe zwischen den beiden Düngemitteln.
  1. Berechnen Sie die Mittelwerte und Standardabweichungen der beiden Gruppen.
#Pflanzenhöhe in cm
gruppe_A <- c(15.2, 14.8, 15.5, 16.0, 15.3, 14.9, 15.1, 15.4, 15.0, 15.6)
gruppe_B <- c(14.5, 14.7, 14.8, 14.6, 14.9, 14.4, 14.8, 14.7, 14.6, 14.5)

# Mittelwerte und Standardabweichungen berechnen
mean_A <- mean(gruppe_A)
mean_B <- mean(gruppe_B)
sd_A <- sd(gruppe_A)
sd_B <- sd(gruppe_B)
  1. Führen Sie den 2-Stichproben-t-Test in R durch und geben Sie die t-Statistik und den p-Wert an.
# t-Test durchführen
t_test_result <- t.test(gruppe_A, gruppe_B, var.equal = TRUE)

# Ergebnisse anzeigen
t_test_result
  1. Entscheidung und Interpretation:
  • t-Statistik:5.0494
  • p-Wert: 8.343e-05 (sehr klein)
  • Konfidenzintervall: [ 0.3678754 0.8921246]

Da der p-Wert (p-value = 8.343e-05) viel kleiner als 0.05 ist, lehnen wir die Nullhypothese ab. Das bedeutet, dass es einen signifikanten Unterschied in der Pflanzenhöhe zwischen den beiden Düngemitteln gibt.

Übung 5

Ein Sportwissenschaftler möchte untersuchen, ob es einen signifikanten Unterschied in der durchschnittlichen Laufzeit zwischen zwei verschiedenen Trainingsprogrammen gibt. Die Läufer wurden in zwei Gruppen aufgeteilt:

  • Gruppe A: Läufer, die Trainingsprogramm A absolviert haben.

  • Gruppe B: Läufer, die Trainingsprogramm B absolviert haben. Die gemessenen Laufzeiten (in Minuten) sind wie folgt:

  • Gruppe A: 12.5, 11.8, 12.0, 11.5, 12.2, 11.9, 12.1, 11.7, 12.3, 11.6

  • Gruppe B: 13.0, 12.8, 13.2, 12.9, 13.1, 12.7, 13.3, 12.8, 13.0, 12.9

Führen Sie einen 2-Stichproben-t-Test durch, um zu bestimmen, ob es einen signifikanten Unterschied in der durchschnittlichen Laufzeit zwischen den beiden Trainingsprogrammen gibt. Verwenden Sie ein Signifikanzniveau von 0.05.

Aufgaben

  1. Formulieren Sie die Nullhypothese und die Alternativhypothese
  2. Berechnen Sie die Mittelwerte und Standardabweichungen der beiden Gruppen.
  3. Führen Sie den 2-Stichproben-t-Test in R durch und geben Sie die t-Statistik und den p-Wert an.
  4. Treffen Sie eine Entscheidung basierend auf dem p-Wert und dem Signifikanzniveau. Interpretieren Sie das Ergebnis.

Lösung

  1. Formulieren Sie die Nullhypothese und die Alternativhypothese

Nullhypothese: Es gibt keinen Unterschied in der durchschnittlichen Laufzeit zwischen den beiden Trainingsprogrammen.

Alternativhypothese : Es gibt einen Unterschied in der durchschnittlichen Laufzeit zwischen den beiden Trainingsprogrammen.

  1. Berechnen Sie die Mittelwerte und Standardabweichungen der beiden Gruppen.
gruppe_A <- c(12.5, 11.8, 12.0, 11.5, 12.2, 11.9, 12.1, 11.7, 12.3, 11.6)
gruppe_B <- c(13.0, 12.8, 13.2, 12.9, 13.1, 12.7, 13.3, 12.8, 13.0, 12.9)


mean_A <- mean(gruppe_A) #Mittelwerte
mean_B <- mean(gruppe_B)
sd_A <- sd(gruppe_A)     #Standardabweichung
sd_B <- sd(gruppe_B)
  1. Führen Sie den 2-Stichproben-t-Test in R durch und geben Sie die t-Statistik und den p-Wert an.
# t-Test durchführen
t_test_result <- t.test(gruppe_A, gruppe_B, var.equal = TRUE)

# Ergebnisse anzeigen
t_test_result
  1. Entscheidung und Interpretation:
  • t-Statistik: t = -8.5873
  • p-Wert:p-value = 8.808e-08 (sehr klein)
  • Konfidenzintervall: [-1.2571003 -0.7628997]

Da der p-Wert (8.808e-08) viel kleiner als 0.05 ist, lehnen wir die Nullhypothese ab. Das bedeutet, dass es einen signifikanten Unterschied in der durchschnittlichen Laufzeit zwischen den beiden Trainingsprogrammen gibt.

Übung

Untersuche den Einfluss von drei verschiedenen Lichtquellen (Sonnenlicht, LED-Licht und fluoreszierendes Licht) auf den Chlorophyllgehalt in Pflanzen. Verwende eine einweg-ANOVA, um festzustellen, ob es signifikante Unterschiede zwischen den Gruppen gibt.

Aufgaben

  1. Erstelle einen Datensatz mit den Lichtquellen und den gemessenen Chlorophyllgehalten.
  2. Führe eine ANOVA durch.
  3. Interpretiere die Ergebnisse.

Lösung

  • Beispiel-Datensatz
data <- data.frame(
  Lichtquelle = factor(rep(c("Sonnenlicht", "LED-Licht", "Fluoreszierendes Licht"), each = 10)),
  Chlorophyllgehalt = c(2.5, 2.7, 2.6, 2.8, 2.9, 2.7, 2.6, 2.8, 2.7, 2.9,  # Sonnenlicht
                        2.1, 2.2, 2.3, 2.4, 2.2, 2.3, 2.1, 2.2, 2.3, 2.4,  # LED-Licht
                        1.8, 1.9, 1.7, 1.8, 1.9, 1.7, 1.8, 1.9, 1.7, 1.8)  # Fluoreszierendes Licht
)
#ANOVA durchführen:

anova_model <- aov(Chlorophyllgehalt ~ Lichtquelle, data = data)

# Zusammenfassung der Ergebnisse

summary(anova_model)
  1. Ergebnisse interpretieren
# Beispielausgabe
# Df Sum Sq Mean Sq F value Pr(>F)
# Lichtquelle  2  1.24  0.62  15.5  0.0001
# Residuals   27  1.08  0.04

In diesem Beispiel zeigt der p-Wert (0.0001), dass es signifikante Unterschiede im Chlorophyllgehalt zwischen den verschiedenen Lichtquellen gibt.

  • Zusätzliche Aufgaben

  • Erstelle ein Boxplot, um die Verteilung des Chlorophyllgehalts für jede Lichtquelle zu visualisieren.

  • Führe einen Post-hoc-Test (z.B. TukeyHSD) durch, um zu sehen, welche Gruppen sich signifikant voneinander unterscheiden.

# Boxplot erstellen
boxplot(Chlorophyllgehalt ~ Lichtquelle, data = data,
        main = "Chlorophyllgehalt nach Lichtquelle",
        xlab = "Lichtquelle", ylab = "Chlorophyllgehalt")

* ost-hoc-Test durchführen:

# Post-hoc-Test
posthoc <- TukeyHSD(anova_model)

# Ergebnisse anzeigen
posthoc

Interpretation: Alle p-Werte sind kleiner als 0.05, was darauf hinweist, dass es signifikante Unterschiede im Chlorophyllgehalt zwischen allen Paaren von Lichtquellen gibt. Insbesondere zeigt der Test, dass:

Pflanzen unter Sonnenlicht einen höheren Chlorophyllgehalt haben als unter LED-Licht und fluoreszierendem Licht. Pflanzen unter LED-Licht einen höheren Chlorophyllgehalt haben als unter fluoreszierendem Licht.