ANALISIS FAKTOR
DETERMINASI
KELANGSUNGAN HIDUP PENUMPANG
KAPAL TITANIC
Vina Rohamiyanti
3338240007
Tugas
sebagai salah satu penilaian pada mata kuliah
Pengantar Data Sains
Mahasiswa
PROGRAM STUDI STATISTIKA
FAKULTAS TEKNIK
UNIVERSITAS SULTAN AGENG
TIRTAYASA
2025
Abstrak
Tragedi tenggelamnya RMS Titanic pada 15 April 1912 menjadi salah satu peristiwa sejarah yang menarik untuk dianalisis dari sisi kelangsungan hidup penumpang. Dataset Titanic bawaan R memuat informasi tentang kelas tiket, jenis kelamin, kelompok usia, dan status survival penumpang. Laporan ini menganalisis bagaimana faktor faktor tersebut memengaruhi peluang bertahan hidup, dengan pendekatan kuantitatif observasional yang menggabungkan uji Chi Square, Cramer’s V, serta berbagai visualisasi data, seperti pie chart, bar plot, mosaic plot, dan stacked bar plot.
Hasil analisis menunjukkan bahwa kelas tiket dan jenis kelamin memiliki pengaruh paling besar terhadap peluang survival, sementara usia berperan lebih kecil. Visualisasi interaksi antara kelas tiket dan jenis kelamin menyoroti bahwa perempuan kelas 1 memiliki tingkat kelangsungan hidup tertinggi, sedangkan laki-laki kelas 3 paling rendah. Secara keseluruhan, analisis ini tidak hanya menegaskan faktor-faktor yang memengaruhi kelangsungan hidup penumpang Titanic, tetapi juga menunjukkan pentingnya metode Reproducible Research untuk memastikan seluruh proses analisis dapat direplikasi dengan konsisten.
Kata Kunci: Titanic, Kelangsungan Hidup, Analisis Data, Reproducible Research
Dataset Titanic merupakan salah satu dataset bawaan R yang banyak digunakan dalam pembelajaran analisis data. Dataset ini memuat empat variabel utama yang menggambarkan karakteristik penumpang, yaitu kelas penumpang (Class), jenis kelamin (Sex), kelompok usia (Age), serta status kelangsungan hidup (Survived). Struktur data yang ringkas namun informatif menjadikan dataset ini relevan untuk dikaji dalam analisis hubungan antarvariabel kategorikal.
Kapal RMS Titanic adalah kapal penumpang terbesar dan paling mewah pada zamannya, yang tenggelam pada pelayaran perdananya tanggal 15 April 1912 setelah menabrak gunung es di Samudra Atlantik Utara. Tragedi ini mengakibatkan kematian sebanyak 1.514 orang meninggal, sementara hanya sekitar sepertiga penumpang yang selamat. Perbedaan tingkat kelangsungan hidup ini, yang dipengaruhi oleh faktor-faktor seperti kelas penumpang, usia, dan jenis kelamin, menjadi dasar pembentukan dataset Titanic.
Berdasarkan konteks tersebut, laporan ini bertujuan menganalisis hubungan antara variabel- variabel tersebut, khususnya bagaimana kelas penumpang, jenis kelamin, dan kelompok usia memengaruhi peluang bertahan hidup. Laporan ini juga menerapkan konsep Reproducible Research melalui integrasi R dan LaTeX menggunakan Sweave, sehingga seluruh proses analisis mulai dari pemanggilan data, pembuatan tabel, hingga visualisasi dapat direplikasi secara konsisten. Dengan demikian, analisis ini diharapkan memberikan gambaran yang jelas mengenai faktor - faktor penentu kelangsungan hidup penumpang.
2.1 Jenis Penelitian
Penelitian ini merupakan penelitian kuantitatif observasional yang menggunakan data sekunder dari dataset Titanic bawaan R. Analisis difokuskan untuk melihat hubungan antara variabel kategorikal (Class, Sex, Age) terhadap status kelangsungan hidup penumpang (Survived) menggunakan pendekatan statistik deskriptif dan inferensial.
2.2 Variabel Penelitian
Dataset Titanic terdiri dari empat variabel utama yang digunakan dalam analisis, yaitu:
a.Variabel Dependen (Y):
b.Variabel Independen (X):
Class : kelas tiket penumpang (1st, 2nd, 3rd, Crew)
Sex : jenis kelamin penumpang (Male, Female)
Age : kelompok usia penumpang (Adult, Child)
2.3 Pra-Pemrosesan Data
Pra-pemrosesan dilakukan untuk memastikan bahwa dataset Titanic dapat dianalisis dengan menggunakan uji Chi-Square dan visualisasi data. Langkah yang dilakukan meliputi pemanggilan dataset, konversi struktur data, pengubahan tipe variabel menjadi faktor, hingga pembuatan tabel kontingensi.
1.Pemanggilan Dataset Titanic
Dataset Titanic merupakan dataset bawaan R yang tersedia dalam format array 4 dimensi. Dataset ini dipanggil menggunakan fungsi data(“Titanic”).
# Load dataset Titanic
data("Titanic")
# Lihat dataset asli (array 4 dimensi)
Titanic
## , , Age = Child, Survived = No
##
## Sex
## Class Male Female
## 1st 0 0
## 2nd 0 0
## 3rd 35 17
## Crew 0 0
##
## , , Age = Adult, Survived = No
##
## Sex
## Class Male Female
## 1st 118 4
## 2nd 154 13
## 3rd 387 89
## Crew 670 3
##
## , , Age = Child, Survived = Yes
##
## Sex
## Class Male Female
## 1st 5 1
## 2nd 11 13
## 3rd 13 14
## Crew 0 0
##
## , , Age = Adult, Survived = Yes
##
## Sex
## Class Male Female
## 1st 57 140
## 2nd 14 80
## 3rd 75 76
## Crew 192 20
2.Konversi dataset Titanic menjadi data
frame.
Dataset Titanic dikonversi menjadi data frame agar dapat lebih mudah diolah dalam analisis dan visualisasi.
# Konversi ke data frame
titanic_df <- as.data.frame(Titanic)
# Ubah nama kolom
colnames(titanic_df) <- c("Class","Sex","Age","Survived","Freq")
# Tambahkan kolom label survival
titanic_df$Survived_ID <- ifelse(titanic_df$Survived=="Yes","Selamat","Tidak Selamat")
# Tampilkan contoh data
kable(head(titanic_df, 10), caption = "Contoh data Titanic setelah pra-pemrosesan")
| Class | Sex | Age | Survived | Freq | Survived_ID |
|---|---|---|---|---|---|
| 1st | Male | Child | No | 0 | Tidak Selamat |
| 2nd | Male | Child | No | 0 | Tidak Selamat |
| 3rd | Male | Child | No | 35 | Tidak Selamat |
| Crew | Male | Child | No | 0 | Tidak Selamat |
| 1st | Female | Child | No | 0 | Tidak Selamat |
| 2nd | Female | Child | No | 0 | Tidak Selamat |
| 3rd | Female | Child | No | 17 | Tidak Selamat |
| Crew | Female | Child | No | 0 | Tidak Selamat |
| 1st | Male | Adult | No | 118 | Tidak Selamat |
| 2nd | Male | Adult | No | 154 | Tidak Selamat |
3.Konversi variabel kategorikal menjadi tipe factor.
Semua variabel kategorikal (Class, Sex, Age, dan Survived) dikonversi menjadi tipe faktor. Hal ini penting karena uji Chi-Square membutuhkan variabel kategori dalam bentuk factor.
# Konversi variabel kategorikal menjadi factor
titanic_df$Class <- as.factor(titanic_df$Class)
titanic_df$Sex <- as.factor(titanic_df$Sex)
titanic_df$Age <- as.factor(titanic_df$Age)
titanic_df$Survived_ID <- as.factor(titanic_df$Survived_ID)
# Tampilkan struktur dan level factor
# Struktur dataset: tipe data dan level tiap factor
str(titanic_df[, c("Class","Sex","Age","Survived_ID")])
## 'data.frame': 32 obs. of 4 variables:
## $ Class : Factor w/ 4 levels "1st","2nd","3rd",..: 1 2 3 4 1 2 3 4 1 2 ...
## $ Sex : Factor w/ 2 levels "Male","Female": 1 1 1 1 2 2 2 2 1 1 ...
## $ Age : Factor w/ 2 levels "Child","Adult": 1 1 1 1 1 1 1 1 2 2 ...
## $ Survived_ID: Factor w/ 2 levels "Selamat","Tidak Selamat": 2 2 2 2 2 2 2 2 2 2 ...
# Lihat level tiap factor
sapply(titanic_df[, c("Class","Sex","Age","Survived_ID")], levels)
## $Class
## [1] "1st" "2nd" "3rd" "Crew"
##
## $Sex
## [1] "Male" "Female"
##
## $Age
## [1] "Child" "Adult"
##
## $Survived_ID
## [1] "Selamat" "Tidak Selamat"
4.Pembuatan tabel kontingensi
Tabel kontingensi dibuat untuk melihat hubungan antara masing-masing variabel independen (Class, Sex, Age) terhadap variabel dependen (Survived). Tabel ini menjadi dasar untuk uji Chi-Square.
# Tabel kontingensi
table_class <- xtabs(Freq ~ Class + Survived_ID, data=titanic_df)
table_sex <- xtabs(Freq ~ Sex + Survived_ID, data=titanic_df)
table_age <- xtabs(Freq ~ Age + Survived_ID, data=titanic_df)
table_class_sex <- xtabs(Freq ~ Class + Sex + Survived_ID, data=titanic_df)
# Tampilkan tabel kontingensi
knitr::kable(table_class, caption = "Tabel Kontingensi Class vs Survived")
| Selamat | Tidak Selamat | |
|---|---|---|
| 1st | 203 | 122 |
| 2nd | 118 | 167 |
| 3rd | 178 | 528 |
| Crew | 212 | 673 |
knitr::kable(table_sex, caption = "Tabel Kontingensi Sex vs Survived")
| Selamat | Tidak Selamat | |
|---|---|---|
| Male | 367 | 1364 |
| Female | 344 | 126 |
knitr::kable(table_age, caption = "Tabel Kontingensi Age vs Survived")
| Selamat | Tidak Selamat | |
|---|---|---|
| Child | 57 | 52 |
| Adult | 654 | 1438 |
knitr::kable(table_class_sex, caption = "Tabel Kontingensi Class × Sex vs Survived")
| Class | Sex | Survived_ID | Freq |
|---|---|---|---|
| 1st | Male | Selamat | 62 |
| 2nd | Male | Selamat | 25 |
| 3rd | Male | Selamat | 88 |
| Crew | Male | Selamat | 192 |
| 1st | Female | Selamat | 141 |
| 2nd | Female | Selamat | 93 |
| 3rd | Female | Selamat | 90 |
| Crew | Female | Selamat | 20 |
| 1st | Male | Tidak Selamat | 118 |
| 2nd | Male | Tidak Selamat | 154 |
| 3rd | Male | Tidak Selamat | 422 |
| Crew | Male | Tidak Selamat | 670 |
| 1st | Female | Tidak Selamat | 4 |
| 2nd | Female | Tidak Selamat | 13 |
| 3rd | Female | Tidak Selamat | 106 |
| Crew | Female | Tidak Selamat | 3 |
5.Perhitungan total survival
Langkah ini dilakukan untuk melihat distribusi dasar jumlah penumpang yang selamat dan tidak selamat sebelum analisis lebih lanjut.
# Total survival
survival_total <- aggregate(Freq ~ Survived_ID, data=titanic_df, sum)
#Buat vektor bernama
survival_vec <- setNames(survival_total$Freq, survival_total$Survived_ID)
#Tampilkan tabel rapi
knitr::kable(survival_total, caption = "Total Survival Penumpang Titanic")
| Survived_ID | Freq |
|---|---|
| Selamat | 711 |
| Tidak Selamat | 1490 |
2.4 Hipotesis Penelitian
Hipotesis penelitian dirumuskan untuk menguji ada atau tidaknya hubungan antara karakteristik penumpang Titanic dengan status kelangsungan hidup. Karena seluruh variabel bersifat kategorikal, pengujian dilakukan menggunakan Chi-Square Test of Independence. Adapun hipotesis yang diuji adalah sebagai berikut:
1. Hubungan Class terhadap Survived
H0 : Tidak terdapat hubungan antara kelas penumpang (Class) dengan status kelangsungan hidup (Survived).
H1 : Terdapat hubungan antara kelas penumpang (Class) dengan status kelangsungan hidup (Survived).
2. Hubungan Sex terhadap Survived
H0 : Tidak terdapat hubungan antara jenis kelamin penumpang (Sex) dengan status kelangsungan hidup (Survived).
H1 : Terdapat hubungan antara jenis kelamin penumpang (Sex) dengan status kelangsungan hidup (Survived).
3. Hubungan Age terhadap Survived
H0 : Tidak terdapat hubungan antara kelompok usia penumpang (Age) dengan status kelangsungan hidup (Survived).
H1 : Terdapat hubungan antara kelompok usia penumpang (Age) dengan status kelangsungan hidup (Survived).
4. Hubungan Interaksi antara Class × Sex terhadap Survived
H0 : Tidak terdapat hubungan yang signifikan antara interaksi Class × Sex dengan status kelangsungan hidup (Survived).
H1 : Terdapat hubungan yang signifikan antara interaksi Class × Sex dengan status kelangsungan hidup (Survived).
2.5 Metode Analisis Statistik
Analisis statistik dilakukan untuk mengetahui hubungan antara variabel independen Class, Sex, dan Age dengan variabel dependen Survived pada penumpang Titanic. Metode yang digunakan meliputi uji Chi-Square, pengukuran kekuatan hubungan (Cramer’s V), dan visualisasi data.
1. Pemeriksaan Asumsi Uji Chi-Square
Sebelum melakukan uji Chi-Square, asumsi berikut harus terpenuhi:
Skala Data Kategori: Semua variabel harus berupa kategori (nominal/ordinal).
Independensi Observasi: Setiap observasi bersifat independen.
Expected Frequency: Minimal 80% sel pada tabel kontingensi memiliki expected count ≥ 5, dan tidak ada sel dengan expected count < 1.
Pemeriksaan asumsi ini akan dilakukan sebelum uji Chi-Square sehingga hasil pengujian dapat dianggap valid.
# Fungsi periksa expected frequency
check_expected <- function(tbl){
chi <- chisq.test(tbl)
expected <- chi$expected
prop_low <- sum(expected < 5) / length(expected) * 100
list(expected = expected, prop_low = prop_low)
}
expected_class <- check_expected(table_class)
expected_sex <- check_expected(table_sex)
expected_age <- check_expected(table_age)
expected_class
## $expected
## Survived_ID
## Class Selamat Tidak Selamat
## 1st 104.98637 220.0136
## 2nd 92.06497 192.9350
## 3rd 228.06270 477.9373
## Crew 285.88596 599.1140
##
## $prop_low
## [1] 0
expected_sex
## $expected
## Survived_ID
## Sex Selamat Tidak Selamat
## Male 559.1736 1171.8264
## Female 151.8264 318.1736
##
## $prop_low
## [1] 0
expected_age
## $expected
## Survived_ID
## Age Selamat Tidak Selamat
## Child 35.21081 73.78919
## Adult 675.78919 1416.21081
##
## $prop_low
## [1] 0
2. Uji Chi-Square
Uji Chi-Square dilakukan untuk mengetahui apakah terdapat hubungan yang signifikan antara variabel independen (Class, Sex, dan Age) dengan variabel dependen (Survived). Uji ini tepat digunakan karena semua variabel bersifat kategori, sehingga memungkinkan untuk menilai pengaruh setiap kategori terhadap peluang penumpang selamat.
# Uji Chi-Square
chisq_class <- chisq.test(table_class)
chisq_sex <- chisq.test(table_sex)
chisq_age <- chisq.test(table_age)
# Menggabungkan hasil uji Chi-Square
chi_results <- data.frame(
Variabel = c("Class","Sex","Age"),
Chi_Square = c(chisq_class$statistic, chisq_sex$statistic, chisq_age$statistic),
df = c(chisq_class$parameter, chisq_sex$parameter, chisq_age$parameter),
p_value = c(chisq_class$p.value, chisq_sex$p.value, chisq_age$p.value)
)
# Menampilkan tabel hasil
knitr::kable(chi_results, digits=4, caption="Hasil Uji Chi-Square")
| Variabel | Chi_Square | df | p_value |
|---|---|---|---|
| Class | 190.4011 | 3 | 0 |
| Sex | 454.4998 | 1 | 0 |
| Age | 20.0048 | 1 | 0 |
3. Pengukuran Kekuatan Hubungan (Cramer’s V)
Setelah uji Chi-Square menunjukkan hubungan yang signifikan, Cramer’s V digunakan untuk menilai seberapa kuat hubungan antarvariabel.
# Menghitung Cramer's V
cramer_results <- data.frame(
Variabel = c("Class", "Sex", "Age"),
Cramers_V = c(
lsr::cramersV(table_class),
lsr::cramersV(table_sex),
lsr::cramersV(table_age)
)
)
# Menampilkan tabel Cramer's V
knitr::kable(cramer_results, digits=3, caption="Nilai Cramer's V")
| Variabel | Cramers_V |
|---|---|
| Class | 0.294 |
| Sex | 0.454 |
| Age | 0.095 |
4. Visualisasi Data
Visualisasi membantu memahami distribusi data dan pola hubungan antarvariabel. Jenis visualisasi yang digunakan antara lain:
Pie chart: Menunjukkan distribusi total penumpang yang selamat dan tidak selamat.
Bar plot: Menampilkan distribusi survival berdasarkan Class, Sex, dan Age.
Mosaic plot: Memperlihatkan proporsi Class terhadap Survived.
Stacked bar plot: Menunjukkan interaksi antara Class dan Sex terhadap survival.
Dengan demikian, setelah langkah-langkah analisis ini diterapkan, Bab 3 akan menyajikan hasil uji statistik dan visualisasi data untuk memahami faktor-faktor yang memengaruhi kelangsungan hidup penumpang Titanic. Interpretasi hasil akan membantu menjelaskan seberapa besar pengaruh masing-masing variabel independen terhadap status survival penumpang.
Berdasarkan metode analisis yang telah dijelaskan pada Bab 2, hasil uji statistik dan visualisasi data untuk dataset Titanic disajikan berikut ini. Analisis dilakukan untuk melihat pengaruh kelas penumpang (Class), jenis kelamin (Sex), dan kelompok usia (Age) terhadap peluang bertahan hidup (Survived).
3.1 Distribusi Kelangsungan Hidup
Distribusi total penumpang yang selamat dan tidak selamat ditunjukkan pada tabel dan persentase berikut:
# Hitung total survival
survival_vec <- aggregate(Freq ~ Survived_ID, data=titanic_df, sum)
colnames(survival_vec) <- c("Status","Jumlah")
# Hitung persentase
survival_vec$Persentase <- round(survival_vec$Jumlah / sum(survival_vec$Jumlah) * 100,1)
# Tampilkan tabel rapi
knitr::kable(survival_vec, caption="Total Penumpang Titanic: Jumlah dan Persentase")
| Status | Jumlah | Persentase |
|---|---|---|
| Selamat | 711 | 32.3 |
| Tidak Selamat | 1490 | 67.7 |
Interpretasi:
Tabel distribusi menunjukkan perbandingan jumlah penumpang yang selamat dan tidak selamat. Berdasarkan data, sekitar 32% penumpang selamat dan 68% tidak selamat, sehingga jumlah penumpang yang tidak selamat jauh lebih besar dibandingkan yang selamat.
Distribusi ini memberikan gambaran awal mengenai rendahnya tingkat keselamatan pada tragedi Titanic dan menjadi dasar untuk analisis lebih lanjut terhadap faktor-faktor yang memengaruhi peluang survival, seperti kelas tiket (Class), jenis kelamin (Sex), dan kelompok usia (Age), yang akan dibahas pada bagian selanjutnya.
3.2 Pemeriksaan Asumsi Uji Chi-Square
Sebelum melakukan uji Chi-Square, dilakukan pemeriksaan asumsi expected frequency untuk memastikan validitas uji.
# Periksa expected frequencies untuk tabel Class vs Survived
chisq_class <- chisq.test(table_class)
expected_class <- chisq_class$expected
# Periksa proporsi sel < 5
low_count_class <- sum(expected_class < 5)
total_cells_class <- length(expected_class)
prop_low_class <- low_count_class / total_cells_class * 100
# Tampilkan expected frequency dan proporsi sel < 5
expected_class
## Survived_ID
## Class Selamat Tidak Selamat
## 1st 104.98637 220.0136
## 2nd 92.06497 192.9350
## 3rd 228.06270 477.9373
## Crew 285.88596 599.1140
prop_low_class
## [1] 0
Interpretasi:
Tabel di atas menampilkan nilai expected frequency untuk setiap sel.
Proporsi sel dengan expected < 5 kurang dari 20% = asumsi expected frequency terpenuhi.
Dengan demikian, asumsi uji Chi-Square untuk variabel Class vs Survived valid, sehingga uji dapat dilanjutkan.
3.3 Hasil Uji Chi-Square
Setelah memastikan asumsi uji Chi-Square terpenuhi, dilakukan uji untuk menilai hubungan antara variabel independen (Class, Sex, dan Age) dengan status kelangsungan hidup (Survived). Tabel berikut menampilkan nilai Chi-Square, derajat kebebasan, dan p-value untuk masing-masing variabel.
# Menampilkan hasil uji Chi-Square
chi_results
## Variabel Chi_Square df p_value
## 1 Class 190.4011 3 4.999928e-41
## 2 Sex 454.4998 1 7.565462e-101
## 3 Age 20.0048 1 7.724799e-06
Interpretasi:
Berdasarkan hasil uji Chi-Square, terlihat bahwa kelas penumpang (Class), jenis kelamin (Sex), dan kelompok usia (Age) semuanya memiliki hubungan yang signifikan dengan status kelangsungan hidup (p < 0.05). Hal ini menunjukkan bahwa ketiga faktor tersebut berperan penting dalam menentukan peluang penumpang untuk selamat dari tragedi Titanic.
Hasil ini menjadi dasar untuk analisis lebih lanjut mengenai kekuatan hubungan antarvariabel yang akan dibahas pada bagian berikutnya.
3.3 Kekuatan Hubungan (Cramer’s V)
Setelah uji Chi-Square menunjukkan adanya hubungan yang signifikan antara variabel independen dengan status kelangsungan hidup, dilakukan pengukuran kekuatan hubungan menggunakan Cramer’s V. Tabel berikut menunjukkan nilai Cramer’s V untuk masing-masing variabel:
cramer_results
## Variabel Cramers_V
## 1 Class 0.29412010
## 2 Sex 0.45441938
## 3 Age 0.09533604
Interpretasi:
Berdasarkan nilai Cramer’s V:
Class dan Sex menunjukkan kekuatan hubungan sedang dengan status kelangsungan hidup.
Age menunjukkan kekuatan hubungan lemah dengan status kelangsungan hidup.
Hal ini mengindikasikan bahwa kelas penumpang dan jenis kelamin memiliki pengaruh lebih besar terhadap peluang survival dibandingkan kelompok usia, meskipun semua faktor tetap terkait dengan status kelangsungan hidup.
3.4 Visualisasi dan Interpretasi
Visualisasi berikut digunakan untuk mendukung temuan statistik yang diperoleh dari uji Chi-Square dan pengukuran kekuatan hubungan (Cramer’s V).
Pie Chart
# Pie chart total survival
pie(
survival_vec$Jumlah,
labels = paste0(survival_vec$Status, "\n", survival_vec$Jumlah, " (", survival_vec$Persentase, "%)"),
col = c("blue","gray"),
main = "Distribusi Kelangsungan Hidup Penumpang Titanic"
)
Interpretasi:
Pie chart menunjukkan proporsi penumpang yang selamat (sekitar 32%) dan tidak selamat (68%). Hasil ini menguatkan gambaran awal dari distribusi survival, yang menunjukkan tingkat keselamatan penumpang secara umum rendah. Visualisasi ini menjadi dasar untuk menganalisis faktor-faktor yang memengaruhi peluang survival, seperti Class, Sex, dan Age.
Bar_plot
# Bar plot Class
barplot(t(table_class), beside=TRUE, col=c("blue","gray"),
main="Survival per Class", legend=TRUE, args.legend=list(x="topright"))
# Bar plot Sex
barplot(t(table_sex), beside=TRUE, col=c("blue","gray"),
main="Survival per Sex", legend=TRUE, args.legend=list(x="topright"))
# Bar plot Age
barplot(t(table_age), beside=TRUE, col=c("blue","gray"),
main="Survival per Age", legend=TRUE, args.legend=list(x="topright"))
Interpretasi:
Bar plot memperlihatkan perbedaan distribusi survival di setiap kategori:
Class: Penumpang kelas atas memiliki peluang bertahan hidup lebih tinggi dibanding kelas menengah dan bawah.
Sex: Wanita cenderung memiliki tingkat survival lebih tinggi dibanding pria.
Age: Anak-anak memiliki peluang bertahan hidup lebih tinggi dibanding dewasa.
Temuan ini konsisten dengan hasil uji Chi-Square, yang menunjukkan hubungan signifikan antara Class, Sex, Age, dan survival. Nilai Cramer’s V menegaskan bahwa Class dan Sex memiliki pengaruh lebih kuat dibanding Age.
Mosaic plot
# Mosaic plot Class vs Survived
library(vcd)
mosaic(table_class,
shade = TRUE,
legend = TRUE,
main = "Mosaic Plot: Class vs Survived")
Interpretasi:
Mosaic plot menekankan pengaruh kelas tiket terhadap peluang bertahan hidup. Lebar kolom mewakili jumlah penumpang per kelas, sedangkan tinggi segmen menunjukkan jumlah yang selamat atau tidak selamat. Pewarnaan shading menyoroti perbedaan proporsi yang signifikan: penumpang kelas 1 memiliki tingkat survival tertinggi, sedangkan kelas 3 lebih rendah.
Stacked Bar Plot – Interaksi Class × Sex
Interpretasi:
Stacked bar plot ini menunjukkan interaksi antara kelas dan jenis kelamin terhadap survival. Perempuan kelas 1 memiliki tingkat kelangsungan hidup tertinggi, sedangkan laki-laki kelas 3 paling rendah. Visualisasi ini memperkuat temuan uji Chi-Square dan Cramer’s V, menegaskan bahwa baik Class maupun Sex merupakan faktor determinan utama peluang survival penumpang Titanic.
Kesimpulan visualisasi keseluruhan :
Berdasarkan seluruh visualisasi yang ditampilkan, dapat disimpulkan:
Pie chart memperlihatkan proporsi keseluruhan penumpang yang selamat dan tidak selamat, dengan penumpang yang tidak selamat lebih banyak.
Bar plot menekankan perbedaan distribusi survival berdasarkan kategori Class, Sex, dan Age; penumpang kelas atas, wanita, dan anak-anak memiliki peluang bertahan hidup lebih tinggi.
Mosaic plot menunjukkan pengaruh signifikan kelas tiket terhadap peluang bertahan hidup, dengan penumpang kelas 1 paling tinggi dan kelas 3 paling rendah.
Stacked bar plot (Class × Sex) menyoroti interaksi antara kelas dan jenis kelamin, di mana perempuan kelas 1 memiliki tingkat survival tertinggi, sedangkan laki-laki kelas 3 paling rendah.
Secara keseluruhan, visualisasi ini mendukung temuan uji statistik dan pengukuran kekuatan hubungan, memperjelas bahwa Class dan Sex merupakan determinan utama kelangsungan hidup penumpang Titanic, sedangkan Age berperan lebih kecil namun tetap relevan.
Berdasarkan analisis data Titanic, dapat ditarik beberapa kesimpulan sebagai berikut:
4.1 Faktor Penentu Kelangsungan Hidup
Kelas Tiket (Class) dan Jenis Kelamin (Sex) merupakan determinan utama peluang bertahan hidup penumpang.
Penumpang kelas 1 dan perempuan memiliki tingkat survival tertinggi.
Penumpang kelas 3 laki-laki memiliki peluang bertahan hidup terendah.
Usia (Age) berpengaruh, namun kekuatannya lebih lemah dibandingkan Class dan Sex, sesuai hasil Cramer’s V.
4.2 Hasil Statistik
Semua variabel independen (Class, Sex, Age) memiliki hubungan signifikan dengan status survival (p < 0,05) berdasarkan uji Chi-Square.
Nilai Cramer’s V menunjukkan kekuatan hubungan sedang untuk Class dan Sex, serta lemah untuk Age.
4.3 Visualisasi dan Interpretasi
Pie chart menampilkan proporsi keseluruhan penumpang yang selamat dan tidak selamat.
Bar plot menyoroti distribusi survival per kategori Class, Sex, dan Age.
Mosaic plot menegaskan pengaruh kelas terhadap peluang bertahan hidup.
Stacked bar plot memperlihatkan interaksi Class × Sex, memperkuat temuan bahwa perempuan kelas 1 memiliki survival tertinggi, sedangkan laki-laki kelas 3 terendah.
4.4 Kesimpulan Umum
Berdasarkan analisis data Titanic, dapat disimpulkan bahwa kelas tiket (Class) dan jenis kelamin (Sex) merupakan faktor yang paling berpengaruh terhadap peluang bertahan hidup penumpang. Sementara kelompok usia (Age) memiliki pengaruh yang lebih lemah. Seluruh analisis ini dilakukan dengan pendekatan Reproducible Research, sehingga seluruh proses—mulai dari pemrosesan data, pengujian statistik, hingga visualisasi dapat direplikasi dengan konsisten, sehingga hasilnya dapat dipercaya dan digunakan sebagai referensi analisis lebih lanjut.
Ariyanto, F., Yulianto, T., & Isti’adah, J. (2025). Analisis Chi Square untuk mengetahui hubungan antara karakteristik konsumen dengan sikap konsumen. UJMC (Unisda Journal of Mathematics and Computer Science), 11(1), 25–37. https://doi.org/10.52166/ujmc.v11i1.9961
Nugroho, B. W., & Supriyanto, S. (2025). Analisis prediktif berbasis metaheuristik untuk keselamatan penumpang dalam insiden maritim: Studi kasus Titanic. E-Link: Jurnal Teknik Elektro dan Informatika, 20(1), 71–80. https://journal.umg.ac.id/index.php/e-link/article/view/9980
Wikipedia. (2024). RMS Titanic. Wikipedia Bahasa Indonesia. https://id.wikipedia.org/wiki/RMS_Titanic