Analisis Korespondensi (CA) Studi Kasus : Hubungan antara warna rambut (Hair) dan warna mata (Eye) pada individu
Kasus Menganalisis hubungan antara warna rambut (Hair) dan warna mata (Eye) pada individu.
Data
Dataset - Nama: HairEyeColor - Sumber: datasets package (default R) - Variabel asli: Hair (Black, Brown, Red, Blond), Eye (Brown, Blue, Hazel, Green), dan Sex (Male, Female).
Karena CA → 2 variabel kategorik, maka: Saya menggunakan Hair × Eye, dan mengabaikan Sex dengan menjumlahkan frekuensi.
Import Data dan Library
## Warning: package 'FactoMineR' was built under R version 4.4.3
## Warning: package 'factoextra' was built under R version 4.4.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.4.3
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
## , , Sex = Male
##
## Eye
## Hair Brown Blue Hazel Green
## Black 32 11 10 3
## Brown 53 50 25 15
## Red 10 10 7 7
## Blond 3 30 5 8
##
## , , Sex = Female
##
## Eye
## Hair Brown Blue Hazel Green
## Black 36 9 5 2
## Brown 66 34 29 14
## Red 16 7 7 7
## Blond 4 64 5 8
Analisis
Melakukan Uji Chi-Square
##
## Pearson's Chi-squared test
##
## data: tabel_data
## X-squared = 138.29, df = 9, p-value < 2.2e-16
Hasil uji Chi-Square menunjukkan adanya hubungan yang signifikan antara warna rambut dan warna mata (p-value < 0.05).
Melakukan Analisis Korespondensi (CA)
# Analisis Korespondensi (CA)
res.ca <- CA(tabel_data, graph = FALSE)
# Eigenvalue dan inersia
res.ca$eig## eigenvalue percentage of variance cumulative percentage of variance
## dim 1 0.208772652 89.372732 89.37273
## dim 2 0.022226615 9.514911 98.88764
## dim 3 0.002598439 1.112356 100.00000
Hasil eigenvalue dan inersia menunjukkan proporsi varians yang dijelaskan oleh masing-masing dimensi.
Berdasarkan hasil Analisis Korespondensi (CA), Dimensi 1 memiliki eigenvalue 0,2088 dan mampu menjelaskan 89,37% variasi data, sedangkan Dimensi 2 menjelaskan tambahan 9,51%, sehingga dua dimensi pertama secara kumulatif sudah menjelaskan sekitar 98,89% informasi total. Hal ini menunjukkan bahwa hubungan antara dua variabel kategorik yang dianalisis dapat direpresentasikan dengan sangat baik pada bidang dua dimensi, dan interpretasi pola asosiasi antar kategori sudah cukup akurat jika hanya berfokus pada Dimensi 1 dan Dimensi 2, sementara Dimensi 3 memberikan kontribusi yang sangat kecil dan dapat diabaikan.
Koordinat Baris dan Kolom (Kategori)
## Dim 1 Dim 2
## Black 0.505 -0.215
## Brown 0.148 0.033
## Red 0.130 0.320
## Blond -0.835 -0.070
## Dim 1 Dim 2
## Brown 0.492 -0.088
## Blue -0.547 -0.083
## Hazel 0.213 0.167
## Green -0.162 0.339
Hasil koordinat CA menunjukkan bahwa rambut Blond berasosiasi kuat dengan mata Blue, sedangkan rambut Black dan Brown cenderung terkait dengan mata Brown. Sementara itu, rambut Red relatif dekat dengan mata Green dan Hazel, yang menandakan adanya kecenderungan hubungan di antara kategori tersebut. Pola ini menegaskan adanya asosiasi yang jelas antara warna rambut dan warna mata pada dua dimensi utama.
Dilanjut dengan analisis biplot untuk visualisasi hasil CA.
Analisis Biplot CA
Berdasarkan biplot CA, terlihat bahwa rambut
Blond berdekatan dengan mata Blue, menunjukkan asosiasi yang
kuat antara keduanya. Rambut Black dan Brown berada
pada sisi kanan Dimensi 1 dan dekat dengan mata Brown,
sehingga mengindikasikan kecenderungan hubungan di antara kategori
tersebut. Sementara itu, rambut Red relatif dekat
dengan mata Green dan Hazel, yang menunjukkan adanya
asosiasi pada Dimensi 2. Secara keseluruhan, biplot menegaskan pola
hubungan warna rambut dan warna mata yang jelas dan konsisten dengan
hasil uji chi-square.
Kesimpulan
Berdasarkan hasil analisis, uji chi-square menunjukkan adanya hubungan yang signifikan antara warna rambut dan warna mata dengan nilai χ² = 138,29, derajat bebas (df) = 9, dan p-value < 0,001, sehingga kedua variabel tidak bersifat independen. Analisis Korespondensi menghasilkan Dimensi 1 dengan eigenvalue 0,2088 yang menjelaskan 89,37% variasi data, serta Dimensi 2 yang menjelaskan 9,51%, sehingga dua dimensi pertama secara kumulatif menjelaskan sekitar 98,89% informasi total. Pola asosiasi yang terlihat menunjukkan bahwa rambut Blond berasosiasi dengan mata Blue, rambut Black dan Brown dengan mata Brown, serta rambut Red dengan mata Green dan Hazel. Dengan demikian, Analisis Korespondensi tidak hanya mengonfirmasi hasil uji statistik, tetapi juga memberikan gambaran visual yang jelas mengenai hubungan antar kategori warna rambut dan warna mata.