Dalam analisis ini, kita menggunakan dataset “USArrests” yang tersedia di R. Dataset ini berisi data kejahatan di Amerika Serikat pada tahun 1973, dengan empat variabel yaitu Murder, Assault, UrbanPop, dan Rape.
data(USArrests)
ini digunakan untuk memuat dataset “USArrests” yang tersedia di R ke dalam lingkungan kerja
arrests_matrix <- as.matrix(USArrests)
Sintaks ini mengubah dataset “USArrests” menjadi matriks dengan menggunakan fungsi as.matrix(). Kita menyimpan matriks tersebut dalam variabel arrests_matrix.
correlation <- cor(arrests_matrix)
Sintaks ini menghitung korelasi antara variabel dalam matriks arrests_matrix menggunakan fungsi cor(). Korelasi mengukur tingkat hubungan antara pasangan variabel dalam matriks.
print("Matriks Korelasi:")
## [1] "Matriks Korelasi:"
print(correlation)
## Murder Assault UrbanPop Rape
## Murder 1.00000000 0.8018733 0.06957262 0.5635788
## Assault 0.80187331 1.0000000 0.25887170 0.6652412
## UrbanPop 0.06957262 0.2588717 1.00000000 0.4113412
## Rape 0.56357883 0.6652412 0.41134124 1.0000000
Sintaks ini mencetak judul “Matriks Korelasi:” di konsol, kemudian mencetak matriks korelasi correlation. Fungsi print() digunakan untuk mencetak teks atau objek ke konsol.
heatmap(correlation, main = "Heatmap Korelasi USArrests",
xlab = "Variabel", ylab = "Variabel",
col = colorRampPalette(c("darkblue", "white", "darkred"))(100))
Sintaks ini digunakan untuk membuat visualisasi heatmap menggunakan fungsi heatmap(). Parameter correlation digunakan untuk memberikan matriks korelasi sebagai input untuk heatmap. Parameter main digunakan untuk memberikan judul pada plot heatmap. Parameter xlab dan ylab digunakan untuk memberikan label sumbu x dan y pada plot. Parameter col digunakan untuk menentukan skema warna pada heatmap.