TITANIC

Hem yorumlaması keyifli hem de gerçek hayat senaryosu olan “Titanic” veri seti ile “Cinsiyet ve yolcu sınıfı, hayatta kalma şansını nasıl etkiledi?” sorusuna yanıt aramaya çalıştım.

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
df <- as.data.frame(Titanic)
# Veriyi analiz edilebilir formata (her satır bir kişi) çevirelim
titanic_data <- df[rep(1:nrow(df), df$Freq), -5]

Lojistik Regresyon Modeli(Hayatta kalma üzerinde Cinsiyetin etkisi)

# 1. Lojistik Regresyon Modeli: Hayatta kalma üzerinde Cinsiyetin etkisi
# (Survived: Yes/No, Sex: Male/Female)
model_titanic <- glm(Survived ~ Sex, family = binomial, data = titanic_data)

# Katsayılar
summary(model_titanic)
## 
## Call:
## glm(formula = Survived ~ Sex, family = binomial, data = titanic_data)
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept)  -1.3128     0.0588  -22.32   <2e-16 ***
## SexFemale     2.3172     0.1196   19.38   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 2769.5  on 2200  degrees of freedom
## Residual deviance: 2335.0  on 2199  degrees of freedom
## AIC: 2339
## 
## Number of Fisher Scoring iterations: 4
# Odds Oranlarını (exp) 
exp(coef(model_titanic))
## (Intercept)   SexFemale 
##   0.2690616  10.1469660

Titanic örneğinde SexMale katsayısının negatif çıkması (veya Odds Oranının 1’den küçük olması), erkek olmanın hayatta kalma şansını azalttığını gösterir.R, Erkekleri (Male) referans grup seçmiş.Bu yüzden tabloda gördülen SexFemale katsayısı, “Erkeklere kıyasla kadın olmanın etkisi”dir.

  1. Matematiksel Yön (Log-Odds)Modeldeki katsayı (slope) negatif ise doğrusal çizgi aşağı doğru bakıyor demektir. Yani değişkendeki artış (kadından erkeğe geçiş), sonuç değişkenini (hayatta kalma log-odds’unu) aşağı çeker.

  2. Oransal Yön (Odds Ratio)Negatif bir katsayının e^x (exp) değerini aldığımızda sonuç her zaman 0 ile 1 arasında çıkar.Sonuç 0.08 (1’den küçük) çıktığı için: Erkeklerin hayatta kalma “şansı”, kadınlara kıyasla ciddi şekilde düşüktür.

Titanic’te “Önce kadınlar ve çocuklar” kuralı uygulandığı için veriler bize şunu söylüyor:“Kadın olmaktan erkek olmaya geçtiğinizde, hayatta kalma odds’unuz bir anda 0.08 katına düşer.”

e^{2.3172} = 10.14 olup Kadınların hayatta kalma odds’u (şansı), erkeklerin 10.14 katıdır diyebiliriz.

Titanic örneğinde “Erkek olmanın Odds Oranı 0.08” demek, erkeklerin hayatta kalma şansının kadınlara kıyasla %92 daha düşük olduğu anlamına gelir.

3.sınıfta yolculuk yapmak nasıl etkiledi

# Model 2: Hem Cinsiyet hem de Sınıf (1. Sınıf, 2. Sınıf vb.)
model_final <- glm(Survived ~ Sex + Class, family = binomial, data = titanic_data)

# Odds oranlarını alalım
exp(coef(model_final))
## (Intercept)   SexFemale    Class2nd    Class3rd   ClassCrew 
##   0.7024929  11.2608090   0.3857379   0.1904747   0.4144459

Diğer tüm değişkenler (yolcu sınıfı vb.) sabit tutulduğunda, kadınların hayatta kalma odds’u (şansı), erkeklerin tam 11.26 katıdır.Titanic’te hayatta kalma mücadelesinde “kadın olmak” devasa bir avantaj sağlamıştır. Şansın 11 katından fazla olması, bu değişkenin modeldeki belirleyici gücünü gösterir.

R, 1. Sınıf (Class1st) yolcuları referans (baz) grup olarak seçmiş. Yani buradaki tüm rakamlar “1. sınıfa göre” ne kadar şans kaybedildiğini anlatıyor.

Class2nd (0.38): 2. sınıf yolcuların hayatta kalma şansı, 1. sınıftakilerin sadece 0.38 katıdır. Yani şansları yaklaşık %62 (1 - 0.38) daha düşüktür.

Class3rd (0.19): İşte en dramatik rakam bu. 3. sınıftaki bir yolcunun hayatta kalma şansı, 1. sınıftakinin sadece 0.19 katıdır. (Yaklaşık 5’te 1’i kadar şans). Bu da şansın %81 oranında azaldığını gösterir.

ClassCrew (0.41): Mürettebatın şansı da 1. sınıfa göre düşüktür (0.41 katı), ancak 3. sınıf yolcular kadar dezavantajlı değildirler.

Analiz sonuçlarına göre; hem cinsiyet hem de yolcu sınıfı sağkalım üzerinde kritik bir role sahiptir. Özellikle kadın olma avantajı (11.26 kat), sınıf farkından daha baskın bir etki sergilemektedir. Öte yandan, 1. sınıftan 3. sınıfa doğru gidildikçe sağkalım odds’unun 0.19’a kadar gerilemesi (%81’lik bir kayıp), gemideki hiyerarşinin hayatta kalma ihtimalini nasıl dramatik şekilde zayıflattığını ortaya koymaktadır.