Analisis Korespondensi (CA) Studi Kasus : Hubungan antara warna rambut (Hair) dan warna mata (Eye) pada individu

Kasus Menganalisis hubungan antara warna rambut (Hair) dan warna mata (Eye) pada individu.

Data

Dataset - Nama: HairEyeColor - Sumber: datasets package (default R) - Variabel asli: Hair (Black, Brown, Red, Blond), Eye (Brown, Blue, Hazel, Green), dan Sex (Male, Female).

Karena CA → 2 variabel kategorik, maka: Saya menggunakan Hair × Eye, dan mengabaikan Sex dengan menjumlahkan frekuensi.

Import Data dan Library

library(FactoMineR)
## Warning: package 'FactoMineR' was built under R version 4.4.3
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.4.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.4.3
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
data("HairEyeColor")
print(HairEyeColor)
## , , Sex = Male
## 
##        Eye
## Hair    Brown Blue Hazel Green
##   Black    32   11    10     3
##   Brown    53   50    25    15
##   Red      10   10     7     7
##   Blond     3   30     5     8
## 
## , , Sex = Female
## 
##        Eye
## Hair    Brown Blue Hazel Green
##   Black    36    9     5     2
##   Brown    66   34    29    14
##   Red      16    7     7     7
##   Blond     4   64     5     8

Membuat Tabel Kontingensi

tabel_data <- margin.table(HairEyeColor, margin = c(1, 2))
tabel_data
##        Eye
## Hair    Brown Blue Hazel Green
##   Black    68   20    15     5
##   Brown   119   84    54    29
##   Red      26   17    14    14
##   Blond     7   94    10    16

Analisis

Melakukan Uji Chi-Square

uji_chi <- chisq.test(tabel_data)
uji_chi
## 
##  Pearson's Chi-squared test
## 
## data:  tabel_data
## X-squared = 138.29, df = 9, p-value < 2.2e-16

Hasil uji Chi-Square menunjukkan adanya hubungan yang signifikan antara warna rambut dan warna mata (p-value < 0.05).

Melakukan Analisis Korespondensi (CA)

# Analisis Korespondensi (CA)
res.ca <- CA(tabel_data, graph = FALSE)

# Eigenvalue dan inersia
res.ca$eig
##        eigenvalue percentage of variance cumulative percentage of variance
## dim 1 0.208772652              89.372732                          89.37273
## dim 2 0.022226615               9.514911                          98.88764
## dim 3 0.002598439               1.112356                         100.00000

Hasil eigenvalue dan inersia menunjukkan proporsi varians yang dijelaskan oleh masing-masing dimensi.

Berdasarkan hasil Analisis Korespondensi (CA), Dimensi 1 memiliki eigenvalue 0,2088 dan mampu menjelaskan 89,37% variasi data, sedangkan Dimensi 2 menjelaskan tambahan 9,51%, sehingga dua dimensi pertama secara kumulatif sudah menjelaskan sekitar 98,89% informasi total. Hal ini menunjukkan bahwa hubungan antara dua variabel kategorik yang dianalisis dapat direpresentasikan dengan sangat baik pada bidang dua dimensi, dan interpretasi pola asosiasi antar kategori sudah cukup akurat jika hanya berfokus pada Dimensi 1 dan Dimensi 2, sementara Dimensi 3 memberikan kontribusi yang sangat kecil dan dapat diabaikan.

Koordinat Baris dan Kolom (Kategori)

# Baris (Hair)
round(res.ca$row$coord[,1:2], 3)
##        Dim 1  Dim 2
## Black  0.505 -0.215
## Brown  0.148  0.033
## Red    0.130  0.320
## Blond -0.835 -0.070
# Kolom (Eye)
round(res.ca$col$coord[,1:2], 3)
##        Dim 1  Dim 2
## Brown  0.492 -0.088
## Blue  -0.547 -0.083
## Hazel  0.213  0.167
## Green -0.162  0.339

Hasil koordinat CA menunjukkan bahwa rambut Blond berasosiasi kuat dengan mata Blue, sedangkan rambut Black dan Brown cenderung terkait dengan mata Brown. Sementara itu, rambut Red relatif dekat dengan mata Green dan Hazel, yang menandakan adanya kecenderungan hubungan di antara kategori tersebut. Pola ini menegaskan adanya asosiasi yang jelas antara warna rambut dan warna mata pada dua dimensi utama.

Dilanjut dengan analisis biplot untuk visualisasi hasil CA.

Analisis Biplot CA

fviz_ca_biplot(
  res.ca,
  repel = TRUE,
  col.row = "red",
  col.col = "blue"
)

Berdasarkan biplot CA, terlihat bahwa rambut Blond berdekatan dengan mata Blue, menunjukkan asosiasi yang kuat antara keduanya. Rambut Black dan Brown berada pada sisi kanan Dimensi 1 dan dekat dengan mata Brown, sehingga mengindikasikan kecenderungan hubungan di antara kategori tersebut. Sementara itu, rambut Red relatif dekat dengan mata Green dan Hazel, yang menunjukkan adanya asosiasi pada Dimensi 2. Secara keseluruhan, biplot menegaskan pola hubungan warna rambut dan warna mata yang jelas dan konsisten dengan hasil uji chi-square.

Kesimpulan

Berdasarkan hasil analisis, uji chi-square menunjukkan adanya hubungan yang signifikan antara warna rambut dan warna mata dengan nilai χ² = 138,29, derajat bebas (df) = 9, dan p-value < 0,001, sehingga kedua variabel tidak bersifat independen. Analisis Korespondensi menghasilkan Dimensi 1 dengan eigenvalue 0,2088 yang menjelaskan 89,37% variasi data, serta Dimensi 2 yang menjelaskan 9,51%, sehingga dua dimensi pertama secara kumulatif menjelaskan sekitar 98,89% informasi total. Pola asosiasi yang terlihat menunjukkan bahwa rambut Blond berasosiasi dengan mata Blue, rambut Black dan Brown dengan mata Brown, serta rambut Red dengan mata Green dan Hazel. Dengan demikian, Analisis Korespondensi tidak hanya mengonfirmasi hasil uji statistik, tetapi juga memberikan gambaran visual yang jelas mengenai hubungan antar kategori warna rambut dan warna mata.