ANALISIS FAKTOR DETERMINASI
KELANGSUNGAN HIDUP PENUMPANG KAPAL TITANIC


Vina Rohamiyanti
3338240007


Tugas
sebagai salah satu penilaian pada mata kuliah
Pengantar Data Sains
Mahasiswa

Logo Universitas

PROGRAM STUDI STATISTIKA
FAKULTAS TEKNIK
UNIVERSITAS SULTAN AGENG TIRTAYASA

2025


Abstrak

Tragedi tenggelamnya RMS Titanic pada 15 April 1912 menjadi salah satu peristiwa sejarah yang menarik untuk dianalisis dari sisi kelangsungan hidup penumpang. Dataset Titanic bawaan R memuat informasi tentang kelas tiket, jenis kelamin, kelompok usia, dan status survival penumpang. Laporan ini menganalisis bagaimana faktor faktor tersebut memengaruhi peluang bertahan hidup, dengan pendekatan kuantitatif observasional yang menggabungkan uji Chi Square, Cramer’s V, serta berbagai visualisasi data, seperti pie chart, bar plot, mosaic plot, dan stacked bar plot.

Hasil analisis menunjukkan bahwa kelas tiket dan jenis kelamin memiliki pengaruh paling besar terhadap peluang survival, sementara usia berperan lebih kecil. Visualisasi interaksi antara kelas tiket dan jenis kelamin menyoroti bahwa perempuan kelas 1 memiliki tingkat kelangsungan hidup tertinggi, sedangkan laki-laki kelas 3 paling rendah. Secara keseluruhan, analisis ini tidak hanya menegaskan faktor-faktor yang memengaruhi kelangsungan hidup penumpang Titanic, tetapi juga menunjukkan pentingnya metode Reproducible Research untuk memastikan seluruh proses analisis dapat direplikasi dengan konsisten.

Kata Kunci: Titanic, Kelangsungan Hidup, Analisis Data, Reproducible Research

1 .Pendahuluan

Dataset Titanic merupakan salah satu dataset bawaan R yang banyak digunakan dalam pembelajaran analisis data. Dataset ini memuat empat variabel utama yang menggambarkan karakteristik penumpang, yaitu kelas penumpang (Class), jenis kelamin (Sex), kelompok usia (Age), serta status kelangsungan hidup (Survived). Struktur data yang ringkas namun informatif menjadikan dataset ini relevan untuk dikaji dalam analisis hubungan antarvariabel kategorikal.

Kapal RMS Titanic adalah kapal penumpang terbesar dan paling mewah pada zamannya, yang tenggelam pada pelayaran perdananya tanggal 15 April 1912 setelah menabrak gunung es di Samudra Atlantik Utara. Tragedi ini mengakibatkan kematian sebanyak 1.514 orang meninggal, sementara hanya sekitar sepertiga penumpang yang selamat. Perbedaan tingkat kelangsungan hidup ini, yang dipengaruhi oleh faktor-faktor seperti kelas penumpang, usia, dan jenis kelamin, menjadi dasar pembentukan dataset Titanic.

Berdasarkan konteks tersebut, laporan ini bertujuan menganalisis hubungan antara variabel- variabel tersebut, khususnya bagaimana kelas penumpang, jenis kelamin, dan kelompok usia memengaruhi peluang bertahan hidup. Laporan ini juga menerapkan konsep Reproducible Research melalui integrasi R dan LaTeX menggunakan Sweave, sehingga seluruh proses analisis mulai dari pemanggilan data, pembuatan tabel, hingga visualisasi dapat direplikasi secara konsisten. Dengan demikian, analisis ini diharapkan memberikan gambaran yang jelas mengenai faktor - faktor penentu kelangsungan hidup penumpang.

2 .Metode Analisis

2.1 Jenis Penelitian

Penelitian ini merupakan penelitian kuantitatif observasional yang menggunakan data sekunder dari dataset Titanic bawaan R. Analisis difokuskan untuk melihat hubungan antara variabel kategorikal (Class, Sex, Age) terhadap status kelangsungan hidup penumpang (Survived) menggunakan pendekatan statistik deskriptif dan inferensial.

2.2 Variabel Penelitian

Dataset Titanic terdiri dari empat variabel utama yang digunakan dalam analisis, yaitu:

a.Variabel Dependen (Y):

  • Survived : status kelangsungan hidup penumpang terdiri dari dua kategori (Selamat / Tidak Selamat)

b.Variabel Independen (X):

  • Class : kelas tiket penumpang (1st, 2nd, 3rd, Crew)

  • Sex : jenis kelamin penumpang (Male, Female)

  • Age : kelompok usia penumpang (Adult, Child)

2.3 Pra-Pemrosesan Data

Pra-pemrosesan dilakukan untuk memastikan bahwa dataset Titanic dapat dianalisis dengan menggunakan uji Chi-Square dan visualisasi data. Langkah yang dilakukan meliputi pemanggilan dataset, konversi struktur data, pengubahan tipe variabel menjadi faktor, hingga pembuatan tabel kontingensi.

1.Pemanggilan Dataset Titanic

Dataset Titanic merupakan dataset bawaan R yang tersedia dalam format array 4 dimensi. Dataset ini dipanggil menggunakan fungsi data(“Titanic”).

# Load dataset Titanic
data("Titanic")

# Lihat dataset asli (array 4 dimensi)
Titanic
## , , Age = Child, Survived = No
## 
##       Sex
## Class  Male Female
##   1st     0      0
##   2nd     0      0
##   3rd    35     17
##   Crew    0      0
## 
## , , Age = Adult, Survived = No
## 
##       Sex
## Class  Male Female
##   1st   118      4
##   2nd   154     13
##   3rd   387     89
##   Crew  670      3
## 
## , , Age = Child, Survived = Yes
## 
##       Sex
## Class  Male Female
##   1st     5      1
##   2nd    11     13
##   3rd    13     14
##   Crew    0      0
## 
## , , Age = Adult, Survived = Yes
## 
##       Sex
## Class  Male Female
##   1st    57    140
##   2nd    14     80
##   3rd    75     76
##   Crew  192     20

2.Konversi dataset Titanic menjadi data frame.

Dataset Titanic dikonversi menjadi data frame agar dapat lebih mudah diolah dalam analisis dan visualisasi.

# Konversi ke data frame
titanic_df <- as.data.frame(Titanic)

# Ubah nama kolom
colnames(titanic_df) <- c("Class","Sex","Age","Survived","Freq")

# Tambahkan kolom label survival
titanic_df$Survived_ID <- ifelse(titanic_df$Survived=="Yes","Selamat","Tidak Selamat")

# Tampilkan contoh data
kable(head(titanic_df, 10), caption = "Contoh data Titanic setelah pra-pemrosesan")
Contoh data Titanic setelah pra-pemrosesan
Class Sex Age Survived Freq Survived_ID
1st Male Child No 0 Tidak Selamat
2nd Male Child No 0 Tidak Selamat
3rd Male Child No 35 Tidak Selamat
Crew Male Child No 0 Tidak Selamat
1st Female Child No 0 Tidak Selamat
2nd Female Child No 0 Tidak Selamat
3rd Female Child No 17 Tidak Selamat
Crew Female Child No 0 Tidak Selamat
1st Male Adult No 118 Tidak Selamat
2nd Male Adult No 154 Tidak Selamat

3.Konversi variabel kategorikal menjadi tipe factor.

Semua variabel kategorikal (Class, Sex, Age, dan Survived) dikonversi menjadi tipe faktor. Hal ini penting karena uji Chi-Square membutuhkan variabel kategori dalam bentuk factor.

# Konversi variabel kategorikal menjadi factor
titanic_df$Class <- as.factor(titanic_df$Class)
titanic_df$Sex <- as.factor(titanic_df$Sex)
titanic_df$Age <- as.factor(titanic_df$Age)
titanic_df$Survived_ID <- as.factor(titanic_df$Survived_ID)

# Tampilkan struktur dan level factor
# Struktur dataset: tipe data dan level tiap factor
str(titanic_df[, c("Class","Sex","Age","Survived_ID")])
## 'data.frame':    32 obs. of  4 variables:
##  $ Class      : Factor w/ 4 levels "1st","2nd","3rd",..: 1 2 3 4 1 2 3 4 1 2 ...
##  $ Sex        : Factor w/ 2 levels "Male","Female": 1 1 1 1 2 2 2 2 1 1 ...
##  $ Age        : Factor w/ 2 levels "Child","Adult": 1 1 1 1 1 1 1 1 2 2 ...
##  $ Survived_ID: Factor w/ 2 levels "Selamat","Tidak Selamat": 2 2 2 2 2 2 2 2 2 2 ...
# Lihat level tiap factor
sapply(titanic_df[, c("Class","Sex","Age","Survived_ID")], levels)
## $Class
## [1] "1st"  "2nd"  "3rd"  "Crew"
## 
## $Sex
## [1] "Male"   "Female"
## 
## $Age
## [1] "Child" "Adult"
## 
## $Survived_ID
## [1] "Selamat"       "Tidak Selamat"

4.Pembuatan tabel kontingensi

Tabel kontingensi dibuat untuk melihat hubungan antara masing-masing variabel independen (Class, Sex, Age) terhadap variabel dependen (Survived). Tabel ini menjadi dasar untuk uji Chi-Square.

# Tabel kontingensi
table_class <- xtabs(Freq ~ Class + Survived_ID, data=titanic_df)
table_sex <- xtabs(Freq ~ Sex + Survived_ID, data=titanic_df)
table_age <- xtabs(Freq ~ Age + Survived_ID, data=titanic_df)
table_class_sex <- xtabs(Freq ~ Class + Sex + Survived_ID, data=titanic_df)

# Tampilkan tabel kontingensi
knitr::kable(table_class, caption = "Tabel Kontingensi Class vs Survived")
Tabel Kontingensi Class vs Survived
Selamat Tidak Selamat
1st 203 122
2nd 118 167
3rd 178 528
Crew 212 673
knitr::kable(table_sex, caption = "Tabel Kontingensi Sex vs Survived")
Tabel Kontingensi Sex vs Survived
Selamat Tidak Selamat
Male 367 1364
Female 344 126
knitr::kable(table_age, caption = "Tabel Kontingensi Age vs Survived")
Tabel Kontingensi Age vs Survived
Selamat Tidak Selamat
Child 57 52
Adult 654 1438
knitr::kable(table_class_sex, caption = "Tabel Kontingensi Class × Sex vs Survived")
Tabel Kontingensi Class × Sex vs Survived
Class Sex Survived_ID Freq
1st Male Selamat 62
2nd Male Selamat 25
3rd Male Selamat 88
Crew Male Selamat 192
1st Female Selamat 141
2nd Female Selamat 93
3rd Female Selamat 90
Crew Female Selamat 20
1st Male Tidak Selamat 118
2nd Male Tidak Selamat 154
3rd Male Tidak Selamat 422
Crew Male Tidak Selamat 670
1st Female Tidak Selamat 4
2nd Female Tidak Selamat 13
3rd Female Tidak Selamat 106
Crew Female Tidak Selamat 3

5.Perhitungan total survival

Langkah ini dilakukan untuk melihat distribusi dasar jumlah penumpang yang selamat dan tidak selamat sebelum analisis lebih lanjut.

# Total survival
survival_total <- aggregate(Freq ~ Survived_ID, data=titanic_df, sum)

#Buat vektor bernama
survival_vec <- setNames(survival_total$Freq, survival_total$Survived_ID)

#Tampilkan tabel rapi
knitr::kable(survival_total, caption = "Total Survival Penumpang Titanic")
Total Survival Penumpang Titanic
Survived_ID Freq
Selamat 711
Tidak Selamat 1490

2.4 Hipotesis Penelitian

Hipotesis penelitian dirumuskan untuk menguji ada atau tidaknya hubungan antara karakteristik penumpang Titanic dengan status kelangsungan hidup. Karena seluruh variabel bersifat kategorikal, pengujian dilakukan menggunakan Chi-Square Test of Independence. Adapun hipotesis yang diuji adalah sebagai berikut:

1. Hubungan Class terhadap Survived

2. Hubungan Sex terhadap Survived

3. Hubungan Age terhadap Survived

4. Hubungan Interaksi antara Class × Sex terhadap Survived

2.5 Metode Analisis Statistik

Analisis statistik dilakukan untuk mengetahui hubungan antara variabel independen Class, Sex, dan Age dengan variabel dependen Survived pada penumpang Titanic. Metode yang digunakan meliputi uji Chi-Square, pengukuran kekuatan hubungan (Cramer’s V), dan visualisasi data.

1. Pemeriksaan Asumsi Uji Chi-Square

Sebelum melakukan uji Chi-Square, asumsi berikut harus terpenuhi:

Pemeriksaan asumsi ini akan dilakukan sebelum uji Chi-Square sehingga hasil pengujian dapat dianggap valid.

# Fungsi periksa expected frequency
check_expected <- function(tbl){
chi <- chisq.test(tbl)
expected <- chi$expected
prop_low <- sum(expected < 5) / length(expected) * 100
list(expected = expected, prop_low = prop_low)
}

expected_class <- check_expected(table_class)
expected_sex   <- check_expected(table_sex)
expected_age   <- check_expected(table_age)

expected_class
## $expected
##       Survived_ID
## Class    Selamat Tidak Selamat
##   1st  104.98637      220.0136
##   2nd   92.06497      192.9350
##   3rd  228.06270      477.9373
##   Crew 285.88596      599.1140
## 
## $prop_low
## [1] 0
expected_sex
## $expected
##         Survived_ID
## Sex       Selamat Tidak Selamat
##   Male   559.1736     1171.8264
##   Female 151.8264      318.1736
## 
## $prop_low
## [1] 0
expected_age
## $expected
##        Survived_ID
## Age       Selamat Tidak Selamat
##   Child  35.21081      73.78919
##   Adult 675.78919    1416.21081
## 
## $prop_low
## [1] 0

2. Uji Chi-Square

Uji Chi-Square dilakukan untuk mengetahui apakah terdapat hubungan yang signifikan antara variabel independen (Class, Sex, dan Age) dengan variabel dependen (Survived). Uji ini tepat digunakan karena semua variabel bersifat kategori, sehingga memungkinkan untuk menilai pengaruh setiap kategori terhadap peluang penumpang selamat.

# Uji Chi-Square
chisq_class <- chisq.test(table_class)
chisq_sex <- chisq.test(table_sex)
chisq_age <- chisq.test(table_age)

# Menggabungkan hasil uji Chi-Square
chi_results <- data.frame(
  Variabel = c("Class","Sex","Age"),
  Chi_Square = c(chisq_class$statistic, chisq_sex$statistic, chisq_age$statistic),
  df = c(chisq_class$parameter, chisq_sex$parameter, chisq_age$parameter),
  p_value = c(chisq_class$p.value, chisq_sex$p.value, chisq_age$p.value)
)

# Menampilkan tabel hasil
knitr::kable(chi_results, digits=4, caption="Hasil Uji Chi-Square")
Hasil Uji Chi-Square
Variabel Chi_Square df p_value
Class 190.4011 3 0
Sex 454.4998 1 0
Age 20.0048 1 0

3. Pengukuran Kekuatan Hubungan (Cramer’s V)

Setelah uji Chi-Square menunjukkan hubungan yang signifikan, Cramer’s V digunakan untuk menilai seberapa kuat hubungan antarvariabel.

# Menghitung Cramer's V
cramer_results <- data.frame(
  Variabel = c("Class", "Sex", "Age"),
  Cramers_V = c(
    lsr::cramersV(table_class),
    lsr::cramersV(table_sex),
    lsr::cramersV(table_age)
  )
)

# Menampilkan tabel Cramer's V
knitr::kable(cramer_results, digits=3, caption="Nilai Cramer's V")
Nilai Cramer’s V
Variabel Cramers_V
Class 0.294
Sex 0.454
Age 0.095

4. Visualisasi Data

Visualisasi membantu memahami distribusi data dan pola hubungan antarvariabel. Jenis visualisasi yang digunakan antara lain:

Dengan demikian, setelah langkah-langkah analisis ini diterapkan, Bab 3 akan menyajikan hasil uji statistik dan visualisasi data untuk memahami faktor-faktor yang memengaruhi kelangsungan hidup penumpang Titanic. Interpretasi hasil akan membantu menjelaskan seberapa besar pengaruh masing-masing variabel independen terhadap status survival penumpang.

3 .Hasil dan Pembahasan

Berdasarkan metode analisis yang telah dijelaskan pada Bab 2, hasil uji statistik dan visualisasi data untuk dataset Titanic disajikan berikut ini. Analisis dilakukan untuk melihat pengaruh kelas penumpang (Class), jenis kelamin (Sex), dan kelompok usia (Age) terhadap peluang bertahan hidup (Survived).

3.1 Distribusi Kelangsungan Hidup

Distribusi total penumpang yang selamat dan tidak selamat ditunjukkan pada tabel dan persentase berikut:

# Hitung total survival
survival_vec <- aggregate(Freq ~ Survived_ID, data=titanic_df, sum)
colnames(survival_vec) <- c("Status","Jumlah")

# Hitung persentase
survival_vec$Persentase <- round(survival_vec$Jumlah / sum(survival_vec$Jumlah) * 100,1)

# Tampilkan tabel rapi
knitr::kable(survival_vec, caption="Total Penumpang Titanic: Jumlah dan Persentase")
Total Penumpang Titanic: Jumlah dan Persentase
Status Jumlah Persentase
Selamat 711 32.3
Tidak Selamat 1490 67.7

Interpretasi:

Tabel distribusi menunjukkan perbandingan jumlah penumpang yang selamat dan tidak selamat. Berdasarkan data, sekitar 32% penumpang selamat dan 68% tidak selamat, sehingga jumlah penumpang yang tidak selamat jauh lebih besar dibandingkan yang selamat.

Distribusi ini memberikan gambaran awal mengenai rendahnya tingkat keselamatan pada tragedi Titanic dan menjadi dasar untuk analisis lebih lanjut terhadap faktor-faktor yang memengaruhi peluang survival, seperti kelas tiket (Class), jenis kelamin (Sex), dan kelompok usia (Age), yang akan dibahas pada bagian selanjutnya.

3.2 Pemeriksaan Asumsi Uji Chi-Square

Sebelum melakukan uji Chi-Square, dilakukan pemeriksaan asumsi expected frequency untuk memastikan validitas uji.

# Periksa expected frequencies untuk tabel Class vs Survived

chisq_class <- chisq.test(table_class)
expected_class <- chisq_class$expected

# Periksa proporsi sel < 5

low_count_class <- sum(expected_class < 5)
total_cells_class <- length(expected_class)
prop_low_class <- low_count_class / total_cells_class * 100

# Tampilkan expected frequency dan proporsi sel < 5

expected_class
##       Survived_ID
## Class    Selamat Tidak Selamat
##   1st  104.98637      220.0136
##   2nd   92.06497      192.9350
##   3rd  228.06270      477.9373
##   Crew 285.88596      599.1140
prop_low_class
## [1] 0

Interpretasi:

  • Tabel di atas menampilkan nilai expected frequency untuk setiap sel.

  • Proporsi sel dengan expected < 5 kurang dari 20% = asumsi expected frequency terpenuhi.

  • Dengan demikian, asumsi uji Chi-Square untuk variabel Class vs Survived valid, sehingga uji dapat dilanjutkan.

3.3 Hasil Uji Chi-Square

Setelah memastikan asumsi uji Chi-Square terpenuhi, dilakukan uji untuk menilai hubungan antara variabel independen (Class, Sex, dan Age) dengan status kelangsungan hidup (Survived). Tabel berikut menampilkan nilai Chi-Square, derajat kebebasan, dan p-value untuk masing-masing variabel.

# Menampilkan hasil uji Chi-Square
chi_results
##   Variabel Chi_Square df       p_value
## 1    Class   190.4011  3  4.999928e-41
## 2      Sex   454.4998  1 7.565462e-101
## 3      Age    20.0048  1  7.724799e-06

Interpretasi:

Berdasarkan hasil uji Chi-Square, terlihat bahwa kelas penumpang (Class), jenis kelamin (Sex), dan kelompok usia (Age) semuanya memiliki hubungan yang signifikan dengan status kelangsungan hidup (p < 0.05). Hal ini menunjukkan bahwa ketiga faktor tersebut berperan penting dalam menentukan peluang penumpang untuk selamat dari tragedi Titanic.

Hasil ini menjadi dasar untuk analisis lebih lanjut mengenai kekuatan hubungan antarvariabel yang akan dibahas pada bagian berikutnya.

3.3 Kekuatan Hubungan (Cramer’s V)

Setelah uji Chi-Square menunjukkan adanya hubungan yang signifikan antara variabel independen dengan status kelangsungan hidup, dilakukan pengukuran kekuatan hubungan menggunakan Cramer’s V. Tabel berikut menunjukkan nilai Cramer’s V untuk masing-masing variabel:

cramer_results
##   Variabel  Cramers_V
## 1    Class 0.29412010
## 2      Sex 0.45441938
## 3      Age 0.09533604

Interpretasi:

Berdasarkan nilai Cramer’s V:

  • Class dan Sex menunjukkan kekuatan hubungan sedang dengan status kelangsungan hidup.

  • Age menunjukkan kekuatan hubungan lemah dengan status kelangsungan hidup.

Hal ini mengindikasikan bahwa kelas penumpang dan jenis kelamin memiliki pengaruh lebih besar terhadap peluang survival dibandingkan kelompok usia, meskipun semua faktor tetap terkait dengan status kelangsungan hidup.

3.4 Visualisasi dan Interpretasi

Visualisasi berikut digunakan untuk mendukung temuan statistik yang diperoleh dari uji Chi-Square dan pengukuran kekuatan hubungan (Cramer’s V).

Pie Chart

# Pie chart total survival
pie(
  survival_vec$Jumlah,
  labels = paste0(survival_vec$Status, "\n", survival_vec$Jumlah, " (", survival_vec$Persentase, "%)"),
  col = c("blue","gray"),
  main = "Distribusi Kelangsungan Hidup Penumpang Titanic"
)

Interpretasi:

Pie chart menunjukkan proporsi penumpang yang selamat (sekitar 32%) dan tidak selamat (68%). Hasil ini menguatkan gambaran awal dari distribusi survival, yang menunjukkan tingkat keselamatan penumpang secara umum rendah. Visualisasi ini menjadi dasar untuk menganalisis faktor-faktor yang memengaruhi peluang survival, seperti Class, Sex, dan Age.

Bar_plot

# Bar plot Class
barplot(t(table_class), beside=TRUE, col=c("blue","gray"),
main="Survival per Class", legend=TRUE, args.legend=list(x="topright"))

# Bar plot Sex
barplot(t(table_sex), beside=TRUE, col=c("blue","gray"),
main="Survival per Sex", legend=TRUE, args.legend=list(x="topright"))

# Bar plot Age
barplot(t(table_age), beside=TRUE, col=c("blue","gray"),
        main="Survival per Age", legend=TRUE, args.legend=list(x="topright"))

Interpretasi:

Bar plot memperlihatkan perbedaan distribusi survival di setiap kategori:

  • Class: Penumpang kelas atas memiliki peluang bertahan hidup lebih tinggi dibanding kelas menengah dan bawah.

  • Sex: Wanita cenderung memiliki tingkat survival lebih tinggi dibanding pria.

  • Age: Anak-anak memiliki peluang bertahan hidup lebih tinggi dibanding dewasa.

Temuan ini konsisten dengan hasil uji Chi-Square, yang menunjukkan hubungan signifikan antara Class, Sex, Age, dan survival. Nilai Cramer’s V menegaskan bahwa Class dan Sex memiliki pengaruh lebih kuat dibanding Age.

Mosaic plot

# Mosaic plot Class vs Survived
library(vcd)
mosaic(table_class,
       shade = TRUE,
       legend = TRUE,
       main = "Mosaic Plot: Class vs Survived")

Interpretasi:

Mosaic plot menekankan pengaruh kelas tiket terhadap peluang bertahan hidup. Lebar kolom mewakili jumlah penumpang per kelas, sedangkan tinggi segmen menunjukkan jumlah yang selamat atau tidak selamat. Pewarnaan shading menyoroti perbedaan proporsi yang signifikan: penumpang kelas 1 memiliki tingkat survival tertinggi, sedangkan kelas 3 lebih rendah.

Stacked Bar Plot – Interaksi Class × Sex

Interpretasi:

Stacked bar plot ini menunjukkan interaksi antara kelas dan jenis kelamin terhadap survival. Perempuan kelas 1 memiliki tingkat kelangsungan hidup tertinggi, sedangkan laki-laki kelas 3 paling rendah. Visualisasi ini memperkuat temuan uji Chi-Square dan Cramer’s V, menegaskan bahwa baik Class maupun Sex merupakan faktor determinan utama peluang survival penumpang Titanic.

Kesimpulan visualisasi keseluruhan :

Berdasarkan seluruh visualisasi yang ditampilkan, dapat disimpulkan:

  1. Pie chart memperlihatkan proporsi keseluruhan penumpang yang selamat dan tidak selamat, dengan penumpang yang tidak selamat lebih banyak.

  2. Bar plot menekankan perbedaan distribusi survival berdasarkan kategori Class, Sex, dan Age; penumpang kelas atas, wanita, dan anak-anak memiliki peluang bertahan hidup lebih tinggi.

  3. Mosaic plot menunjukkan pengaruh signifikan kelas tiket terhadap peluang bertahan hidup, dengan penumpang kelas 1 paling tinggi dan kelas 3 paling rendah.

  4. Stacked bar plot (Class × Sex) menyoroti interaksi antara kelas dan jenis kelamin, di mana perempuan kelas 1 memiliki tingkat survival tertinggi, sedangkan laki-laki kelas 3 paling rendah.

Secara keseluruhan, visualisasi ini mendukung temuan uji statistik dan pengukuran kekuatan hubungan, memperjelas bahwa Class dan Sex merupakan determinan utama kelangsungan hidup penumpang Titanic, sedangkan Age berperan lebih kecil namun tetap relevan.

4 .Kesimpulan

Berdasarkan analisis data Titanic, dapat ditarik beberapa kesimpulan sebagai berikut:

4.1 Faktor Penentu Kelangsungan Hidup

  • Kelas Tiket (Class) dan Jenis Kelamin (Sex) merupakan determinan utama peluang bertahan hidup penumpang.

  • Penumpang kelas 1 dan perempuan memiliki tingkat survival tertinggi.

  • Penumpang kelas 3 laki-laki memiliki peluang bertahan hidup terendah.

  • Usia (Age) berpengaruh, namun kekuatannya lebih lemah dibandingkan Class dan Sex, sesuai hasil Cramer’s V.

4.2 Hasil Statistik

  • Semua variabel independen (Class, Sex, Age) memiliki hubungan signifikan dengan status survival (p < 0,05) berdasarkan uji Chi-Square.

  • Nilai Cramer’s V menunjukkan kekuatan hubungan sedang untuk Class dan Sex, serta lemah untuk Age.

4.3 Visualisasi dan Interpretasi

  • Pie chart menampilkan proporsi keseluruhan penumpang yang selamat dan tidak selamat.

  • Bar plot menyoroti distribusi survival per kategori Class, Sex, dan Age.

  • Mosaic plot menegaskan pengaruh kelas terhadap peluang bertahan hidup.

  • Stacked bar plot memperlihatkan interaksi Class × Sex, memperkuat temuan bahwa perempuan kelas 1 memiliki survival tertinggi, sedangkan laki-laki kelas 3 terendah.

4.4 Kesimpulan Umum

Berdasarkan analisis data Titanic, dapat disimpulkan bahwa kelas tiket (Class) dan jenis kelamin (Sex) merupakan faktor yang paling berpengaruh terhadap peluang bertahan hidup penumpang. Sementara kelompok usia (Age) memiliki pengaruh yang lebih lemah. Seluruh analisis ini dilakukan dengan pendekatan Reproducible Research, sehingga seluruh proses—mulai dari pemrosesan data, pengujian statistik, hingga visualisasi dapat direplikasi dengan konsisten, sehingga hasilnya dapat dipercaya dan digunakan sebagai referensi analisis lebih lanjut.

5 .Daftar Pustaka

Ariyanto, F., Yulianto, T., & Isti’adah, J. (2025). Analisis Chi Square untuk mengetahui hubungan antara karakteristik konsumen dengan sikap konsumen. UJMC (Unisda Journal of Mathematics and Computer Science), 11(1), 25–37. https://doi.org/10.52166/ujmc.v11i1.9961

Nugroho, B. W., & Supriyanto, S. (2025). Analisis prediktif berbasis metaheuristik untuk keselamatan penumpang dalam insiden maritim: Studi kasus Titanic. E-Link: Jurnal Teknik Elektro dan Informatika, 20(1), 71–80. https://journal.umg.ac.id/index.php/e-link/article/view/9980

Wikipedia. (2024). RMS Titanic. Wikipedia Bahasa Indonesia. https://id.wikipedia.org/wiki/RMS_Titanic