Dalam analisis ini, kita menggunakan dataset “USArrests” yang tersedia di R. Dataset ini berisi data kejahatan di Amerika Serikat pada tahun 1973, dengan empat variabel yaitu Murder, Assault, UrbanPop, dan Rape.
data(USArrests)
ini digunakan untuk memuat dataset “USArrests” yang tersedia di R ke dalam lingkungan kerja.
arrests_matrix <- as.matrix(USArrests)
Sintaks ini mengubah dataset “USArrests” menjadi matriks dengan menggunakan fungsi as.matrix(). Kita menyimpan matriks tersebut dalam variabel arrests_matrix.
correlation <- cor(arrests_matrix)
Sintaks ini menghitung korelasi antara variabel dalam matriks arrests_matrix menggunakan fungsi cor(). Korelasi mengukur tingkat hubungan antara pasangan variabel dalam matriks.
print("Matriks Korelasi:")
## [1] "Matriks Korelasi:"
print(correlation)
## Murder Assault UrbanPop Rape
## Murder 1.00000000 0.8018733 0.06957262 0.5635788
## Assault 0.80187331 1.0000000 0.25887170 0.6652412
## UrbanPop 0.06957262 0.2588717 1.00000000 0.4113412
## Rape 0.56357883 0.6652412 0.41134124 1.0000000
Sintaks ini mencetak judul “Matriks Korelasi:” di konsol, kemudian mencetak matriks korelasi correlation. Fungsi print() digunakan untuk mencetak teks atau objek ke konsol.
heatmap(correlation, main = "Heatmap Korelasi USArrests",
xlab = "Variabel", ylab = "Variabel",
col = colorRampPalette(c("darkblue", "white", "darkred"))(100))
Sintaks ini digunakan untuk membuat visualisasi heatmap menggunakan
fungsi heatmap(). Parameter correlation digunakan untuk memberikan
matriks korelasi sebagai input untuk heatmap. Parameter main digunakan
untuk memberikan judul pada plot heatmap. Parameter xlab dan ylab
digunakan untuk memberikan label sumbu x dan y pada plot. Parameter col
digunakan untuk menentukan skema warna pada heatmap.