Aufgabe 4: Unterschiedshypothese
Datensatz:
Var 1 = Pclass Var 2 = Age
Aufgabenstellung
Hypothese
H0: Es gibt keinen Altersunterschied zwischen der ersten und dritten klasse. H1: Es gibt einen Altersunterschied zwischen der ersten und dritten klasse.
Voraussetzungen
3.1) Die Variablen sind nominalskaliert (survived) und ordinal skaliert (Pclass).
3.2) Es liegt eine unabhängige Variable vor, mittels der die beiden zu vergleichenden Gruppen gebildet werden. -> Die Klassen sind untereinander unabhängig
3.3) Das untersuchte Merkmal ist in den Grundgesamtheiten der beiden Gruppen normalverteilt -> wie Histogram darunter.
3.4) Homogenität der Varianzen: Die Gruppen kommen aus Grundgesamtheiten mit annähernd identischer Varianz (siehe Levene-Test)
3.5) Die einzelnen Messwerte sind voneinander unabhängig (das Verhalten einer Versuchsperson hat keinen Einfluss auf das Verhalten einer anderen)
Grundlegende Konzepte: Was ist t-Test für unabhängige Stichproben?
Der t-Test für unabhängige Stichproben testet, ob die Mittelwerte zweier unabhängiger Stichproben verschieden sind.
Deskriptive Statistiken
library(readr)
titanic <- read_csv("titanic.csv")
titanic <- titanic[titanic$Pclass != 2 & !is.na(titanic$Age),]
#library(dplyr)
titanic %>%
group_by(Pclass) %>%
summarize(Anzahl = n(), Mittelwert = mean(Age), Median = median(Age), Standardabweichung = sd(Age)) %>%
mutate_if(is.numeric, round, 2)
library(fitdistrplus)
hist(titanic$Age, xlab = "Differenz in der Age", ylab = "Anzahl", main = "Histogramm der Age", breaks = 20, col = "lightblue")

fit.norm <- fitdist(titanic$Age, "norm")
plot(fit.norm)

#library(dplyr) -> # Gruppierung der Daten
#library(ggplot2) -># Diagramm
h <- titanic %>%
group_by(Pclass ) %>% #Legendary vs. Nicht-Legendary
ggplot(aes(Age)) + # AV angeben
geom_histogram(aes(fill = Pclass), bins = 20) + # Histogramm mit 20 Bins(Säulen) und Info für die Legende
facet_wrap(~Pclass ) + # Trennung in zwei Grafen
theme_classic()+ # Standardfarbprofil
labs(x= "Age",y = "Anzahl" ) # Beschriftung der Achsen
Fehler in ggplot(., aes(Age)) : konnte Funktion "ggplot" nicht finden
In diesem Abschnitt wird der Altersunterschied zwischen der Passagierklasse 1. und 3. miteinander verglichen ob es sich einen signifikanten Unterschied in der Altersstruktur innerhalb der Passagierklassen befindet. Nachdem wir alle nicht vorhanden Werte gelöscht haben können wir den Mittelwert der 1. Klasse von 38.23 Jahren mit dem Mittelwert der 3. Klasse mit 25.14 Jahren vergleichen.
Auf Basis des einfachen Mittelwertvergleiches können wir bereits erkennen dass es einen Unterschied gibt, aber ist dieser auch signifikant untr der Annahme von H0, dass kein Unterschied in der Passagierklassen besteht.
Test auf Varianzhomogenität (Levene-Test)
library(car)
leveneTest(titanic$Age, titanic$Pclass, center = mean)
titanic$Pclass coerced to factor.
Levene's Test for Homogeneity of Variance (center = mean)
Df F value Pr(>F)
group 1 12.108 0.0005426 ***
539
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
p < 0.05 => Ergebnis signifikant –> Varianzen heterogen -> Welch-Korrektur p > 0.05 => Ergebnis nicht sig. –> Varianzen homogen –> H0 mit Annahme
Im ersten Schritt müssen wir die Varianz der beiden Passagierklassen vergleichen um zu prüfen ob wir von identischer Varianz ausgehen können. Hierfür wird ein Levene-Test durchgeführt. Wenn wir den Levene-Test durchführe für den Vergleich der beiden Varianzen erhalten wir für eine beidseitige Betrachtung eine Prüfgrösse von 12.11 und einen p-Wert von 0.0005. Dieser Wert ist kleiner als unsere Irrtumswahrscheinlichkeit von 0.05. Im Fall des Levene-Tests verwerfen wir somit die H0 bezüglich der Annahme der identischen Varianzen und nehmen H1 mit der Annahme der nicht identischen Varianzen.
Aus diesem Grund müssen wir für den Mittelwertsvergleich einen doppelten t-Test mit Welch-Korrektur vornehmen zur Berücksichtigung der verschiedenen Varianzen.
Ergebnisse des t-Tests für unabhängige Stichproben
mitwelchUngerichtet<- t.test(titanic$Age~titanic$Pclass, var.eq = F, con= 0.95, alt = "two.sided")
mitwelchUngerichtet
Welch Two Sample t-test
data: titanic$Age by titanic$Pclass
t = 10.293, df = 325.23, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
10.59050 15.59515
sample estimates:
mean in group 1 mean in group 3
38.23344 25.14062
Für den gemeinsamen t-Test auf Mittelwertsvergleich mit Welch Korrektur erhalten wir eine Prüfgrösse von 10.2933 und einen P-Wert mit 1.07322e-21. Da der P-Wert kleiner als unser 0.05 ist, können wir die Hypothese H0 mit identischen Mittelwerten verwerfen und wir nehmen unsere Alternativhypothese mit den verschiedenen Mittelwerte an. Da der Mittelwert der Gruppe der 3. Klasse deutlich geringer ist, können wir auch bei der Stärke des p-Wertes auch sagen dass die 3. Klasse deutlich jünger ist als die Passagiere der 1. Klasse.
Berechnung der Effektstärke
library(effsize) -> Effeltstärke
cohen.d(d = titanic$Age, f= titanic$Pclass)
Cohen's d
d estimate: 2.623278 (large)
95 percent confidence interval:
lower upper
2.460562 2.785995
\[\begin{align}
\text{Schwacher Effekt: } 0.20 &< ||d|| < 0.50 \\
\text{Schwacher bis mittlerer Effekt: } 0.50 &= ||d|| \\
\text{Mittlerer Effekt: } 0.50 &< ||d|| < 0.80 \\
\text{Mittlerer bis starker Effekt: }0.80 &= ||d|| \\
\text{Starker Effekt: } 0.80 &< ||d||
\end{align}\]
Zur Beurteilung der Groesse des Effektes dient die Einteilung von Cohen (1992), sodass wir mit einer Effektgrösse von 2.62 wir einen Starker Effekt erhalten.
Eine Aussage
Es gibt einen Altersunterschied zwischen der ersten und dritten klasse.
LS0tDQp0aXRsZTogInQtVGVzdHMgZsO8ciB1bmFiaMOkbmdpZ2UgU3RpY2hwcm9iZW4iDQojIHJ1bnRpbWU6IHNoaW55DQpvdXRwdXQ6IA0KICBodG1sX25vdGVib29rOg0KICAgIGNvZGVfZm9sZGluZzogaGlkZQ0KICAgIG51bWJlcl9zZWN0aW9uczogVFJVRQ0KICAgIHRvYzogdHJ1ZQ0KICAgIHRvY19kZXB0aDogMw0KICAgIHRvY19mbG9hdDogdHJ1ZQ0KLS0tDQoNCg0KIyBBdWZnYWJlIDQ6IFVudGVyc2NoaWVkc2h5cG90aGVzZSAgDQoNCkRhdGVuc2F0ejogDQoNClZhciAxID0gUGNsYXNzDQpWYXIgMiA9IEFnZQ0KDQpBdWZnYWJlbnN0ZWxsdW5nIA0KDQojCUh5cG90aGVzZSANCg0KSDA6IEVzIGdpYnQga2VpbmVuIEFsdGVyc3VudGVyc2NoaWVkIHp3aXNjaGVuIGRlciBlcnN0ZW4gdW5kIGRyaXR0ZW4ga2xhc3NlLg0KSDE6IEVzIGdpYnQgZWluZW4gQWx0ZXJzdW50ZXJzY2hpZWQgendpc2NoZW4gZGVyIGVyc3RlbiB1bmQgZHJpdHRlbiBrbGFzc2UuDQoNCg0KIwlWb3JhdXNzZXR6dW5nZW4NCg0KDQogIDMuMSkgRGllIFZhcmlhYmxlbiBzaW5kIG5vbWluYWxza2FsaWVydCAoc3Vydml2ZWQpIHVuZCBvcmRpbmFsIHNrYWxpZXJ0IChQY2xhc3MpLg0KICANCiAgMy4yKSBFcyBsaWVndCBlaW5lIHVuYWJow6RuZ2lnZSBWYXJpYWJsZSB2b3IsIG1pdHRlbHMgZGVyIGRpZSBiZWlkZW4genUgdmVyZ2xlaWNoZW5kZW4gR3J1cHBlbiBnZWJpbGRldCB3ZXJkZW4uIC0+IERpZSBLbGFzc2VuIHNpbmQgdW50ZXJlaW5hbmRlciB1bmFiaMOkbmdpZw0KDQoNCiAgMy4zKQlEYXMgdW50ZXJzdWNodGUgTWVya21hbCBpc3QgaW4gZGVuIEdydW5kZ2VzYW10aGVpdGVuIGRlciBiZWlkZW4gR3J1cHBlbiBub3JtYWx2ZXJ0ZWlsdCAtPiB3aWUgSGlzdG9ncmFtIGRhcnVudGVyLg0KICANCiAgMy40KQlIb21vZ2VuaXTDpHQgZGVyIFZhcmlhbnplbjogRGllIEdydXBwZW4ga29tbWVuIGF1cyBHcnVuZGdlc2FtdGhlaXRlbiBtaXQgYW5uw6RoZXJuZCBpZGVudGlzY2hlciBWYXJpYW56IChzaWVoZSBMZXZlbmUtVGVzdCkNCiAgDQogIDMuNSkJRGllIGVpbnplbG5lbiBNZXNzd2VydGUgc2luZCB2b25laW5hbmRlciB1bmFiaMOkbmdpZyAoZGFzIFZlcmhhbHRlbiBlaW5lciBWZXJzdWNoc3BlcnNvbiBoYXQga2VpbmVuIEVpbmZsdXNzIGF1ZiBkYXMgVmVyaGFsdGVuIGVpbmVyIGFuZGVyZW4pDQogIA0KDQojIEdydW5kbGVnZW5kZSBLb256ZXB0ZTogV2FzIGlzdCB0LVRlc3QgZsO8ciB1bmFiaMOkbmdpZ2UgU3RpY2hwcm9iZW4/DQoNCkRlciB0LVRlc3QgZsO8ciB1bmFiaMOkbmdpZ2UgU3RpY2hwcm9iZW4gdGVzdGV0LCBvYiBkaWUgTWl0dGVsd2VydGUgendlaWVyIHVuYWJow6RuZ2lnZXIgU3RpY2hwcm9iZW4gdmVyc2NoaWVkZW4gc2luZC4NCg0KIwlEZXNrcmlwdGl2ZSBTdGF0aXN0aWtlbg0KDQpgYGB7ciByZXN1bHRzPSdoaWRlJ30NCmxpYnJhcnkocmVhZHIpDQp0aXRhbmljIDwtIHJlYWRfY3N2KCJ0aXRhbmljLmNzdiIpDQoNCnRpdGFuaWMgPC0gdGl0YW5pY1t0aXRhbmljJFBjbGFzcyAhPSAyICYgIWlzLm5hKHRpdGFuaWMkQWdlKSxdDQoNCmBgYA0KDQpgYGB7cn0NCiNsaWJyYXJ5KGRwbHlyKQ0KdGl0YW5pYyAlPiUNCmdyb3VwX2J5KFBjbGFzcykgJT4lDQogIHN1bW1hcml6ZShBbnphaGwgPSBuKCksIE1pdHRlbHdlcnQgPSBtZWFuKEFnZSksIE1lZGlhbiA9IG1lZGlhbihBZ2UpLCBTdGFuZGFyZGFid2VpY2h1bmcgPSBzZChBZ2UpKSAlPiUNCiAgbXV0YXRlX2lmKGlzLm51bWVyaWMsIHJvdW5kLCAyKQ0KYGBgDQoNCmBgYHtyIHJlc3VsdHM9J2hpZGUnfQ0KbGlicmFyeShmaXRkaXN0cnBsdXMpDQoNCmhpc3QodGl0YW5pYyRBZ2UsIHhsYWIgPSAiRGlmZmVyZW56IGluIGRlciBBZ2UiLCB5bGFiID0gIkFuemFobCIsIG1haW4gPSAiSGlzdG9ncmFtbSBkZXIgQWdlIiwgYnJlYWtzID0gMjAsIGNvbCA9ICJsaWdodGJsdWUiKQ0KZml0Lm5vcm0gPC0gZml0ZGlzdCh0aXRhbmljJEFnZSwgIm5vcm0iKQ0KcGxvdChmaXQubm9ybSkNCmBgYA0KDQoNCg0KYGBge3J9DQojbGlicmFyeShkcGx5cikgLT4gIyBHcnVwcGllcnVuZyBkZXIgRGF0ZW4NCiNsaWJyYXJ5KGdncGxvdDIpIC0+IyBEaWFncmFtbQ0KDQogIGggPC0gdGl0YW5pYyAlPiUNCiAgZ3JvdXBfYnkoUGNsYXNzICkgJT4lICNMZWdlbmRhcnkgdnMuIE5pY2h0LUxlZ2VuZGFyeQ0KICAgIA0KICBnZ3Bsb3QoYWVzKEFnZSkpICsgIyBBViBhbmdlYmVuDQogIGdlb21faGlzdG9ncmFtKGFlcyhmaWxsID0gUGNsYXNzKSwgYmlucyA9IDIwKSArICMgSGlzdG9ncmFtbSBtaXQgMjAgQmlucyhTw6R1bGVuKSB1bmQgSW5mbyBmw7xyIGRpZSBMZWdlbmRlIA0KICBmYWNldF93cmFwKH5QY2xhc3MgKSArICMgVHJlbm51bmcgaW4gendlaSBHcmFmZW4NCiAgdGhlbWVfY2xhc3NpYygpKyAjIFN0YW5kYXJkZmFyYnByb2ZpbA0KICBsYWJzKHg9ICJBZ2UiLHkgPSAiQW56YWhsIiApICMgQmVzY2hyaWZ0dW5nIGRlciBBY2hzZW4NCiAgDQogaA0KYGBgDQoNCg0KSW4gZGllc2VtIEFic2Nobml0dCB3aXJkIGRlciBBbHRlcnN1bnRlcnNjaGllZCB6d2lzY2hlbiBkZXIgUGFzc2FnaWVya2xhc3NlIDEuIHVuZCAzLiBtaXRlaW5hbmRlciB2ZXJnbGljaGVuIG9iIGVzIHNpY2ggZWluZW4gc2lnbmlmaWthbnRlbiBVbnRlcnNjaGllZCBpbiBkZXIgQWx0ZXJzc3RydWt0dXIgaW5uZXJoYWxiIGRlciBQYXNzYWdpZXJrbGFzc2VuIGJlZmluZGV0LiBOYWNoZGVtIHdpciBhbGxlIG5pY2h0IHZvcmhhbmRlbiBXZXJ0ZSBnZWzDtnNjaHQgaGFiZW4ga8O2bm5lbiB3aXIgZGVuIE1pdHRlbHdlcnQgZGVyIDEuIEtsYXNzZSB2b24gMzguMjMgSmFocmVuIG1pdCBkZW0gTWl0dGVsd2VydCBkZXIgMy4gS2xhc3NlIG1pdCAyNS4xNCBKYWhyZW4gdmVyZ2xlaWNoZW4uDQoNCkF1ZiBCYXNpcyBkZXMgZWluZmFjaGVuIE1pdHRlbHdlcnR2ZXJnbGVpY2hlcyBrw7ZubmVuIHdpciBiZXJlaXRzIGVya2VubmVuIGRhc3MgZXMgZWluZW4gVW50ZXJzY2hpZWQgZ2lidCwgYWJlciBpc3QgZGllc2VyIGF1Y2ggc2lnbmlmaWthbnQgdW50ciBkZXIgQW5uYWhtZSB2b24gSDAsIGRhc3Mga2VpbiBVbnRlcnNjaGllZCBpbiBkZXIgUGFzc2FnaWVya2xhc3NlbiBiZXN0ZWh0Lg0KDQojCVRlc3QgYXVmIFZhcmlhbnpob21vZ2VuaXTDpHQgKExldmVuZS1UZXN0KQ0KDQpgYGB7cn0NCmxpYnJhcnkoY2FyKQ0KbGV2ZW5lVGVzdCh0aXRhbmljJEFnZSwgdGl0YW5pYyRQY2xhc3MsIGNlbnRlciA9IG1lYW4pDQpgYGANCg0KcCA8IDAuMDUgPT4gRXJnZWJuaXMgc2lnbmlmaWthbnQg4oCTPiBWYXJpYW56ZW4gaGV0ZXJvZ2VuIC0+IFdlbGNoLUtvcnJla3R1cg0KcCA+IDAuMDUgPT4gRXJnZWJuaXMgbmljaHQgc2lnLiDigJM+IFZhcmlhbnplbiBob21vZ2VuIOKAkz4gSDAgbWl0IEFubmFobWUNCg0KDQpJbSBlcnN0ZW4gU2Nocml0dCBtw7xzc2VuIHdpciBkaWUgVmFyaWFueiBkZXIgYmVpZGVuIFBhc3NhZ2llcmtsYXNzZW4gdmVyZ2xlaWNoZW4gdW0genUgcHLDvGZlbiBvYiB3aXIgdm9uIGlkZW50aXNjaGVyIFZhcmlhbnogYXVzZ2VoZW4ga8O2bm5lbi4gSGllcmbDvHIgd2lyZCBlaW4gTGV2ZW5lLVRlc3QgZHVyY2hnZWbDvGhydC4gV2VubiB3aXIgZGVuIExldmVuZS1UZXN0IGR1cmNoZsO8aHJlIGbDvHIgZGVuIFZlcmdsZWljaCBkZXIgYmVpZGVuIFZhcmlhbnplbiBlcmhhbHRlbiB3aXIgZsO8ciBlaW5lIGJlaWRzZWl0aWdlIEJldHJhY2h0dW5nIGVpbmUgUHLDvGZncsO2c3NlIHZvbiAxMi4xMSB1bmQgZWluZW4gcC1XZXJ0IHZvbiAwLjAwMDUuIERpZXNlciBXZXJ0IGlzdCBrbGVpbmVyIGFscyB1bnNlcmUgSXJydHVtc3dhaHJzY2hlaW5saWNoa2VpdCB2b24gMC4wNS4gSW0gRmFsbCBkZXMgTGV2ZW5lLVRlc3RzIHZlcndlcmZlbiB3aXIgc29taXQgZGllIEgwIGJlesO8Z2xpY2ggZGVyIEFubmFobWUgZGVyIGlkZW50aXNjaGVuIFZhcmlhbnplbiB1bmQgbmVobWVuIEgxIG1pdCBkZXIgQW5uYWhtZSBkZXIgbmljaHQgaWRlbnRpc2NoZW4gVmFyaWFuemVuLg0KDQpBdXMgZGllc2VtIEdydW5kIG3DvHNzZW4gd2lyIGbDvHIgZGVuIE1pdHRlbHdlcnRzdmVyZ2xlaWNoIGVpbmVuIGRvcHBlbHRlbiB0LVRlc3QgbWl0IFdlbGNoLUtvcnJla3R1ciB2b3JuZWhtZW4genVyIEJlcsO8Y2tzaWNodGlndW5nIGRlciB2ZXJzY2hpZWRlbmVuIFZhcmlhbnplbi4NCg0KDQojCUVyZ2Vibmlzc2UgZGVzIHQtVGVzdHMgZsO8ciB1bmFiaMOkbmdpZ2UgU3RpY2hwcm9iZW4NCg0KDQoNCmBgYHtyfQ0KDQptaXR3ZWxjaFVuZ2VyaWNodGV0PC0gdC50ZXN0KHRpdGFuaWMkQWdlfnRpdGFuaWMkUGNsYXNzLCB2YXIuZXEgPSBGLCBjb249IDAuOTUsIGFsdCA9ICJ0d28uc2lkZWQiKQ0KbWl0d2VsY2hVbmdlcmljaHRldA0KYGBgDQpGw7xyIGRlbiBnZW1laW5zYW1lbiB0LVRlc3QgYXVmIE1pdHRlbHdlcnRzdmVyZ2xlaWNoIG1pdCBXZWxjaCBLb3JyZWt0dXIgZXJoYWx0ZW4gd2lyIGVpbmUgUHLDvGZncsO2c3NlIHZvbiAxMC4yOTMzIHVuZCBlaW5lbiBQLVdlcnQgbWl0IDEuMDczMjJlLTIxLiBEYSBkZXIgUC1XZXJ0IGtsZWluZXIgYWxzIHVuc2VyIDAuMDUgaXN0LCBrw7ZubmVuIHdpciBkaWUgSHlwb3RoZXNlIEgwIG1pdCBpZGVudGlzY2hlbiBNaXR0ZWx3ZXJ0ZW4gdmVyd2VyZmVuIHVuZCB3aXIgbmVobWVuIHVuc2VyZSBBbHRlcm5hdGl2aHlwb3RoZXNlIG1pdCBkZW4gdmVyc2NoaWVkZW5lbiBNaXR0ZWx3ZXJ0ZSBhbi4gRGEgZGVyIE1pdHRlbHdlcnQgZGVyIEdydXBwZSBkZXIgMy4gS2xhc3NlIGRldXRsaWNoIGdlcmluZ2VyIGlzdCwga8O2bm5lbiB3aXIgYXVjaCBiZWkgZGVyIFN0w6Rya2UgZGVzIHAtV2VydGVzIGF1Y2ggc2FnZW4gZGFzcyBkaWUgMy4gS2xhc3NlIGRldXRsaWNoIGrDvG5nZXIgaXN0IGFscyBkaWUgUGFzc2FnaWVyZSBkZXIgMS4gS2xhc3NlLg0KDQoNCiMJQmVyZWNobnVuZyBkZXIgRWZmZWt0c3TDpHJrZQ0KDQoNCmBgYHtyfQ0KbGlicmFyeShlZmZzaXplKSAtPiBFZmZlbHRzdMOkcmtlIA0KDQpjb2hlbi5kKGQgPSB0aXRhbmljJEFnZSwgZj0gdGl0YW5pYyRQY2xhc3MpDQoNCmBgYA0KJCRcYmVnaW57YWxpZ259DQpcdGV4dHtTY2h3YWNoZXIgRWZmZWt0OiB9IDAuMjAgJjwgfHxkfHwgPCAwLjUwICAgICAgICAgICAgIFxcDQpcdGV4dHtTY2h3YWNoZXIgYmlzIG1pdHRsZXJlciBFZmZla3Q6IH0gMC41MCAmPSB8fGR8fCAgICAgIFxcDQpcdGV4dHtNaXR0bGVyZXIgRWZmZWt0OiB9IDAuNTAgJjwgfHxkfHwgPCAwLjgwICAgICAgICAgICAgIFxcDQpcdGV4dHtNaXR0bGVyZXIgYmlzIHN0YXJrZXIgRWZmZWt0OiB9MC44MCAmPSB8fGR8fCAgICAgICAgIFxcDQpcdGV4dHtTdGFya2VyIEVmZmVrdDogfSAwLjgwICY8IHx8ZHx8ICAgICAgICANClxlbmR7YWxpZ259JCQNCg0KWnVyIEJldXJ0ZWlsdW5nIGRlciBHcm9lc3NlIGRlcyBFZmZla3RlcyBkaWVudCBkaWUgRWludGVpbHVuZyB2b24gQ29oZW4gKDE5OTIpLCBzb2Rhc3Mgd2lyIG1pdCBlaW5lciBFZmZla3RncsO2c3NlIHZvbiAyLjYyIHdpciBlaW5lbiBTdGFya2VyIEVmZmVrdCBlcmhhbHRlbi4NCg0KDQojCUVpbmUgQXVzc2FnZQ0KDQpFcyBnaWJ0IGVpbmVuIEFsdGVyc3VudGVyc2NoaWVkIHp3aXNjaGVuIGRlciBlcnN0ZW4gdW5kIGRyaXR0ZW4ga2xhc3NlLg0KICANCiAgDQogIA0KICA=