142_Fajar Syihabuddin_AM(Analisis Wholesale Customers)

R Markdown

cor_matrix <- cor(data)

round(cor_matrix, 3)

Interpretasi : Correlation matrix digunakan untuk melihat hubungan antar variabel. Nilai mendekati 1 menunjukkan hubungan positif kuat, sedangkan mendekati 0 menunjukkan hubungan lemah. Berdasarkan hasil, variabel Milk, Grocery, dan Detergents_Paper memiliki korelasi positif cukup tinggi.berdasarkan dri output yang di peroleh Hasil correlation matrix menunjukkan bahwa Grocery dan Detergents_Paper memiliki korelasi positif sangat kuat (0.925), diikuti oleh Milk dan Grocery (0.728).

Hal ini menunjukkan adanya keterkaitan pembelian antar produk tersebut. Sementara itu, variabel Region menunjukkan korelasi yang rendah terhadap variabel lainnya, sehingga tidak terlalu berpengaruh terhadap pola pembelian pelanggan.

cov_matrix <- cov(data)

round(cov_matrix, 2)

Interpretasi : Variance–covariance matrix digunakan untuk mengetahui besarnya variasi data dan arah hubungan antar variabel. Berdasarkan hasil output, variabel Grocery memiliki variansi terbesar sebesar 90,310,103, diikuti oleh Milk (55,446,967) dan Fresh (15,995,493). Hal ini menunjukkan bahwa ketiga variabel tersebut memiliki penyebaran data paling besar.

Nilai kovarians positif terbesar terdapat pada pasangan Milk dan Grocery (51,083,186) serta Grocery dan Detergents_Paper (41,895,189), yang menunjukkan bahwa peningkatan pembelian pada variabel tersebut cenderung terjadi secara bersamaan.

Sebaliknya, beberapa variabel seperti Fresh dan Grocery (−1,424,712) serta Frozen dan Grocery (−1,854,282) memiliki kovarians negatif, yang menunjukkan adanya kecenderungan hubungan berlawanan arah. Namun karena nilai kovarians dipengaruhi oleh skala data, maka hubungan antar variabel lebih mudah dipahami melalui correlation matrix.

eigen_result <- eigen(cov_matrix)

eigen_result$values eigen_result$vectors

Interpretasi : Analisis eigen dilakukan terhadap matriks kovarians untuk mengetahui komponen utama yang menjelaskan variasi data. Berdasarkan hasil eigen value, diperoleh nilai terbesar sebesar 1.649959 × 10⁸, diikuti oleh 1.454521 × 10⁸ dan 2.513998 × 10⁷. Hal ini menunjukkan bahwa sebagian besar variasi data dijelaskan oleh dua komponen utama pertama.

Eigen value yang sangat besar pada komponen pertama dan kedua menandakan bahwa variabel seperti Grocery, Milk, dan Detergents_Paper memberikan kontribusi dominan terhadap penyebaran data secara keseluruhan. Sementara itu, eigen value yang kecil (mendekati nol) menunjukkan adanya komponen dengan kontribusi variasi yang sangat rendah sehingga dapat diabaikan.

Eigen vector menunjukkan bobot masing-masing variabel pada setiap komponen utama. Nilai absolut eigen vector yang besar mengindikasikan variabel yang paling berpengaruh dalam membentuk komponen tersebut. Dari hasil ini dapat disimpulkan bahwa struktur data terutama dipengaruhi oleh pola belanja pada kategori Grocery, Milk, dan Detergents_Paper, sehingga reduksi dimensi menggunakan PCA memungkinkan representasi data yang lebih sederhana tanpa kehilangan informasi yang signifikan.