Ein 2-Stichproben-t-Test wird verwendet, um zu vergleichen, ob die Mittelwerte von zwei unabhängigen Gruppen signifikant unterschiedlich sind. Hier sind die Hauptschritte:
Ein Stichprobentest mit verbundenen Variablen wird oft als gepaarter t-Test oder abhängiger t-Test bezeichnet. Dieser Test wird verwendet, um zu vergleichen, ob es einen signifikanten Unterschied zwischen den Mittelwerten von zwei verwandten Gruppen gibt. Hier ist ein einführendes Beispiel:
Ein Forscher möchte untersuchen, ob ein spezielles Diätprogramm das Gewicht von Teilnehmern reduziert. Die Gewichte der gleichen Gruppe von Personen wurden vor und nach dem Diätprogramm gemessen. Die Daten sind wie folgt:
# Daten eingeben
vor <- c(85, 90, 78, 92, 88, 95, 80, 85, 89, 91, 87, 93, 84, 86, 90, 88, 92, 94, 89, 91)
nach <- c(82, 87, 76, 89, 85, 92, 78, 82, 86, 88, 84, 90, 81, 83, 87, 85, 89, 91, 86, 88)
differenzen <- vor - nach
differenzen
mean(differenzen)
sd(differenzen)
boxplot(vor, nach, names = c("Vor dem Programm", "Nach dem Programm"), main = "Gewicht vor und nach dem Programm")
hist(differenzen, main = "Histogramm der Differenzen", xlab = "Differenzen", breaks = 4)
* QQ-Plot der Differenzen
# QQ-Plot der Differenzen
qqnorm(differenzen, main = "QQ-Plot der Differenzen")
qqline(differenzen)
Boxplot: Zeigt die Verteilung der Gewichte vor und nach dem Programm. Eine Verschiebung nach unten deutet auf eine Gewichtsreduktion hin.
Histogramm: Zeigt die Verteilung der Gewichtsveränderungen. Eine Konzentration der Differenzen um -3 zeigt eine konsistente Gewichtsreduktion.
QQ-Plot: Überprüft die Normalverteilung der Differenzen. Wenn die Punkte ungefähr auf der Linie liegen, sind die Differenzen normalverteilt.
# Gepaarter t-Test
t.test(vor, nach, paired = TRUE)
Gepaarter t-Test:
t-Statistik: 42.136
p-Wert: p-value < 2.2e-16 (sehr klein)
Konfidenzintervall: [2.755948, 3.044052]
Da der p-Wert (2.2e-16 ) viel kleiner als 0.05 ist, lehnen wir die Nullhypothese ab. Das bedeutet, dass sas Diätprogramm einen signifikanten Einfluss auf das Gewicht der Teilnehmer hat
Ein Forscher möchte untersuchen, ob ein neues Medikament die Blutdruckwerte signifikant senkt. Die Patienten wurden in zwei Gruppen aufgeteilt:
Die gemessene Blutdrucksenkung (in mmHg) ist wie folgt:
Führen Sie einen 2-Stichproben-t-Test durch, um zu bestimmen, ob es einen signifikanten Unterschied in der durchschnittlichen Blutdrucksenkung zwischen dem neuen Medikament und dem Placebo gibt. Verwenden Sie ein Signifikanzniveau von 0.05.
Nullhypothese: Es gibt keinen Unterschied in der durchschnittlichen Blutdrucksenkung zwischen dem neuen Medikament und dem Placebo.
Alternativhypothese: Es gibt einen Unterschied in der durchschnittlichen Blutdrucksenkung zwischen dem neuen Medikament und dem Placebo.
# Blutdrucksenkung in mmHg
gruppe_A <- c(10.5, 12.3, 11.8, 13.1, 12.9, 11.5, 12.7, 13.0, 11.4, 12.2)
gruppe_B <- c(5.5, 6.1, 5.8, 6.5, 5.9, 6.3, 5.7, 6.0, 5.6, 6.2)
# Mittelwerte und Standardabweichungen berechnen
mean_A <- mean(gruppe_A)
mean_B <- mean(gruppe_B)
sd_A <- sd(gruppe_A)
sd_B <- sd(gruppe_B)
# Boxplots erstellen
boxplot(gruppe_A, gruppe_B, names = c("Gruppe A", "Gruppe B"), main = "Blutdrucksenkung bei Patienten", ylab = "Blutdrucksenkung (mmHg)")
# QQ-Plots erstellen
par(mfrow = c(1, 2)) # Zwei Plots nebeneinander
qqnorm(gruppe_A, main = "QQ-Plot Gruppe A")
qqline(gruppe_A)
qqnorm(gruppe_B, main = "QQ-Plot Gruppe B")
qqline(gruppe_B)
par(mfrow = c(1, 1)) # Zurück zu einem Plot
#t-Test durchführen
t_test_result <- t.test(gruppe_A, gruppe_B, var.equal = TRUE)
# Ergebnisse anzeigen
t_test_result
# Two Sample t-test
# data: gruppe_A and gruppe_B
# t = 21.747, df = 18, p-value = 2.258e-14
# alternative hypothesis: true difference in means is not equal to 0
# 95 percent confidence interval:
# 5.58297 6.77703
# sample estimates:
# mean of x mean of y
# 12.14 5.96
Da der p-Wert (2.258e-14) viel kleiner als 0.05 ist, lehnen wir die Nullhypothese ab. Das bedeutet, dass es einen signifikanten Unterschied in der durchschnittlichen Blutdrucksenkung zwischen dem neuen Medikament und dem Placebo gibt.
Ein Forscher möchte untersuchen, ob es einen signifikanten Unterschied in der Gewichtszunahme bei Ratten gibt, die mit zwei verschiedenen Diäten gefüttert wurden. Die Ratten wurden in zwei Gruppen aufgeteilt:
Gruppe A: Ratten, die Diät A erhalten haben.
Gruppe B: Ratten, die Diät B erhalten haben. Die gemessene Gewichtszunahme (in Gramm) ist wie folgt:
Gruppe A: 25.5, 26.3, 24.8, 27.1, 25.9, 26.5, 25.7, 26.0, 25.4, 26.2
Gruppe B: 23.5, 24.1, 23.8, 24.5, 23.9, 24.3, 23.7, 24.0, 23.6, 24.2
Führen Sie einen 2-Stichproben-t-Test durch, um zu bestimmen, ob es einen signifikanten Unterschied in der durchschnittlichen Gewichtszunahme zwischen den beiden Diäten gibt. Verwenden Sie ein Signifikanzniveau von 0.05.
Nullhypothese: Es gibt keinen Unterschied in der durchschnittlichen Gewichtszunahme zwischen den beiden Diäten.
Alternativhypothese: Es gibt einen Unterschied in der durchschnittlichen Gewichtszunahme zwischen den beiden Diäten.
# Gewichtszunahme in Gramm
gruppe_A <- c(25.5, 26.3, 24.8, 27.1, 25.9, 26.5, 25.7, 26.0, 25.4, 26.2)
gruppe_B <- c(23.5, 24.1, 23.8, 24.5, 23.9, 24.3, 23.7, 24.0, 23.6, 24.2)
# Mittelwerte und Standardabweichungen berechnen
mean_A <- mean(gruppe_A)
mean_B <- mean(gruppe_B)
sd_A <- sd(gruppe_A)
sd_B <- sd(gruppe_B)
# Boxplots erstellen
boxplot(gruppe_A, gruppe_B, names = c("Gruppe A", "Gruppe B"), main = "Gewichtszunahme bei Ratten", ylab = "Gewichtszunahme (g)")
# QQ-Plots erstellen
par(mfrow = c(1, 2)) # Zwei Plots nebeneinander
qqnorm(gruppe_A, main = "QQ-Plot Gruppe A")
qqline(gruppe_A)
qqnorm(gruppe_B, main = "QQ-Plot Gruppe B")
qqline(gruppe_B)
par(mfrow = c(1, 1)) # Zurück zu einem Plot
# t-Test durchführen
t_test_result <- t.test(gruppe_A, gruppe_B, var.equal = TRUE)
# Ergebnisse anzeigen
t_test_result
t-Statistik: 8.7315 p-Wert: 6.897e-08 (sehr klein) Konfidenzintervall: [1.503585 2.456415] Da der p-Wert (6.897e-08) viel kleiner als 0.05 ist, lehnen wir die Nullhypothese ab. Das bedeutet, dass es einen signifikanten Unterschied in der durchschnittlichen Gewichtszunahme zwischen den beiden Diäten gibt.
Ein Forscher möchte untersuchen, ob es einen signifikanten Unterschied in der Pflanzenhöhe zwischen zwei verschiedenen Düngemitteln gibt. Die Pflanzen wurden in zwei Gruppen aufgeteilt:
Die gemessenen Pflanzenhöhen (in cm) sind wie folgt:
Führen Sie einen 2-Stichproben-t-Test durch, um zu bestimmen, ob es einen signifikanten Unterschied in der durchschnittlichen Pflanzenhöhe zwischen den beiden Düngemitteln gibt. Verwenden Sie ein Signifikanzniveau von 0.05.
#Pflanzenhöhe in cm
gruppe_A <- c(15.2, 14.8, 15.5, 16.0, 15.3, 14.9, 15.1, 15.4, 15.0, 15.6)
gruppe_B <- c(14.5, 14.7, 14.8, 14.6, 14.9, 14.4, 14.8, 14.7, 14.6, 14.5)
# Mittelwerte und Standardabweichungen berechnen
mean_A <- mean(gruppe_A)
mean_B <- mean(gruppe_B)
sd_A <- sd(gruppe_A)
sd_B <- sd(gruppe_B)
# t-Test durchführen
t_test_result <- t.test(gruppe_A, gruppe_B, var.equal = TRUE)
# Ergebnisse anzeigen
t_test_result
Da der p-Wert (p-value = 8.343e-05) viel kleiner als 0.05 ist, lehnen wir die Nullhypothese ab. Das bedeutet, dass es einen signifikanten Unterschied in der Pflanzenhöhe zwischen den beiden Düngemitteln gibt.
Ein Sportwissenschaftler möchte untersuchen, ob es einen signifikanten Unterschied in der durchschnittlichen Laufzeit zwischen zwei verschiedenen Trainingsprogrammen gibt. Die Läufer wurden in zwei Gruppen aufgeteilt:
Gruppe A: Läufer, die Trainingsprogramm A absolviert haben.
Gruppe B: Läufer, die Trainingsprogramm B absolviert haben. Die gemessenen Laufzeiten (in Minuten) sind wie folgt:
Gruppe A: 12.5, 11.8, 12.0, 11.5, 12.2, 11.9, 12.1, 11.7, 12.3, 11.6
Gruppe B: 13.0, 12.8, 13.2, 12.9, 13.1, 12.7, 13.3, 12.8, 13.0, 12.9
Führen Sie einen 2-Stichproben-t-Test durch, um zu bestimmen, ob es einen signifikanten Unterschied in der durchschnittlichen Laufzeit zwischen den beiden Trainingsprogrammen gibt. Verwenden Sie ein Signifikanzniveau von 0.05.
Nullhypothese: Es gibt keinen Unterschied in der durchschnittlichen Laufzeit zwischen den beiden Trainingsprogrammen.
Alternativhypothese : Es gibt einen Unterschied in der durchschnittlichen Laufzeit zwischen den beiden Trainingsprogrammen.
gruppe_A <- c(12.5, 11.8, 12.0, 11.5, 12.2, 11.9, 12.1, 11.7, 12.3, 11.6)
gruppe_B <- c(13.0, 12.8, 13.2, 12.9, 13.1, 12.7, 13.3, 12.8, 13.0, 12.9)
mean_A <- mean(gruppe_A) #Mittelwerte
mean_B <- mean(gruppe_B)
sd_A <- sd(gruppe_A) #Standardabweichung
sd_B <- sd(gruppe_B)
# t-Test durchführen
t_test_result <- t.test(gruppe_A, gruppe_B, var.equal = TRUE)
# Ergebnisse anzeigen
t_test_result
Da der p-Wert (8.808e-08) viel kleiner als 0.05 ist, lehnen wir die Nullhypothese ab. Das bedeutet, dass es einen signifikanten Unterschied in der durchschnittlichen Laufzeit zwischen den beiden Trainingsprogrammen gibt.
Untersuche den Einfluss von drei verschiedenen Lichtquellen (Sonnenlicht, LED-Licht und fluoreszierendes Licht) auf den Chlorophyllgehalt in Pflanzen. Verwende eine einweg-ANOVA, um festzustellen, ob es signifikante Unterschiede zwischen den Gruppen gibt.
data <- data.frame(
Lichtquelle = factor(rep(c("Sonnenlicht", "LED-Licht", "Fluoreszierendes Licht"), each = 10)),
Chlorophyllgehalt = c(2.5, 2.7, 2.6, 2.8, 2.9, 2.7, 2.6, 2.8, 2.7, 2.9, # Sonnenlicht
2.1, 2.2, 2.3, 2.4, 2.2, 2.3, 2.1, 2.2, 2.3, 2.4, # LED-Licht
1.8, 1.9, 1.7, 1.8, 1.9, 1.7, 1.8, 1.9, 1.7, 1.8) # Fluoreszierendes Licht
)
#ANOVA durchführen:
anova_model <- aov(Chlorophyllgehalt ~ Lichtquelle, data = data)
# Zusammenfassung der Ergebnisse
summary(anova_model)
# Beispielausgabe
# Df Sum Sq Mean Sq F value Pr(>F)
# Lichtquelle 2 1.24 0.62 15.5 0.0001
# Residuals 27 1.08 0.04
In diesem Beispiel zeigt der p-Wert (0.0001), dass es signifikante Unterschiede im Chlorophyllgehalt zwischen den verschiedenen Lichtquellen gibt.
Zusätzliche Aufgaben
Erstelle ein Boxplot, um die Verteilung des Chlorophyllgehalts für jede Lichtquelle zu visualisieren.
Führe einen Post-hoc-Test (z.B. TukeyHSD) durch, um zu sehen, welche Gruppen sich signifikant voneinander unterscheiden.
# Boxplot erstellen
boxplot(Chlorophyllgehalt ~ Lichtquelle, data = data,
main = "Chlorophyllgehalt nach Lichtquelle",
xlab = "Lichtquelle", ylab = "Chlorophyllgehalt")
* ost-hoc-Test durchführen:
# Post-hoc-Test
posthoc <- TukeyHSD(anova_model)
# Ergebnisse anzeigen
posthoc
Interpretation: Alle p-Werte sind kleiner als 0.05, was darauf hinweist, dass es signifikante Unterschiede im Chlorophyllgehalt zwischen allen Paaren von Lichtquellen gibt. Insbesondere zeigt der Test, dass:
Pflanzen unter Sonnenlicht einen höheren Chlorophyllgehalt haben als unter LED-Licht und fluoreszierendem Licht. Pflanzen unter LED-Licht einen höheren Chlorophyllgehalt haben als unter fluoreszierendem Licht.