Analisis korelasi membantu dalam memahami hubungan antara variabel dan faktor yang paling berpengaruh pada kinerja perusahaan. Setelah mengetahui faktor tersebut, perusahaan dapat mencari solusi dan merancang strategi untuk meningkatkan produk, layanan, atau customer experience mereka. Dari analisis korelasi, dapat ditemukan arah dan kekuatan dari hubungan antara satu variabel dengan variabel lainnya. Dengan menggunakan data produk berjenis coffee dari Coffee Chain Datasets, analisis ini bertujuan untuk mengetahui hubungan antara Marketing dengan Profit, hubungan antara Marketing dengan Sales, dan hubungan antara Profit dengan Sales.
Muat library atau R packages yang diperlukan.
library(readxl)
library(dplyr)
library(knitr)
library(psych)
library(DT)
library(prettydoc)
library(corrplot)
Impor data dari file Excel ke dalam R dan mengambil data produk berjenis coffee dengan mencakup tiga variabel, yaitu:
# Mengimpor data
data <- read_excel("D:/3. CM1 - Coffee Chain Datasets.xlsx", sheet = "data")
# Mengambil data produk berjenis coffee dengan mencakup tiga variabel
ccd <- data %>%
filter(`Product Type` == "Coffee") %>%
select('Area Code', 'Product', 'Marketing', 'Profit', 'Sales')
# Menampilkan data yang telah terpilih
datatable(
ccd,
options = list(pageLength = 10),
rownames = FALSE,
colnames = c("Area Code", "Product", "Marketing", "Profit", "Sales"),
class = 'display'
)
Menghitung korelasi dalam R. Karena tidak diketahui data berdistribusi normal atau tidak, maka menggunakan korelasi non-parametrik, yakni uji korelasi Spearman yang memiliki persamaan seperti berikut.
\[ r_s = 1 - \frac{6 \sum D^2}{n(n^2 - 1)} \]
# Korelasi antara Marketing dan Profit
cor.test(ccd$Marketing, ccd$Profit, method = "spearman", exact = FALSE)
##
## Spearman's rank correlation rho
##
## data: ccd$Marketing and ccd$Profit
## S = 131664583, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.3291447
# Korelasi antara Marketing dan Sales
cor.test(ccd$Marketing, ccd$Sales, method = "spearman", exact = FALSE)
##
## Spearman's rank correlation rho
##
## data: ccd$Marketing and ccd$Sales
## S = 38706133, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.8027851
# Korelasi antara Profit dan Sales
cor.test(ccd$Profit, ccd$Sales, method = "spearman", exact = FALSE)
##
## Spearman's rank correlation rho
##
## data: ccd$Profit and ccd$Sales
## S = 45310163, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.7691364
Memvisualisasikan korelasi dengan correlogram.
# Mengelompokkan data hanya dengan tiga variabel numerik
ccdSubset <- ccd[,c('Marketing', 'Profit', 'Sales')]
#Visualisasi dengan correlogram
corrplot(cor(ccdSubset), method = "circle")
Berdasarkan hasil analisis korelasi di atas, dapat disimpulkan sebagai berikut.
(https://rpubs.com/srtyas/1060686)
(https://rpubs.com/SameerMathur/CorrelationAnalysis_mtcars)
(https://bookdown.org/yihui/rmarkdown/html-document.html)
(https://www.sthda.com/english/wiki/correlation-test-between-two-variables-in-r)
(https://jurnal.uisu.ac.id/index.php/mesuisu/article/download/10204/pdf)