Deskripsi Insight

Dataset yang digunakan dalam penelitian ini adalah Coffee Chain Datasets yang berisi informasi penjualan produk kopi pada berbagai wilayah (market). Data tersimpan dalam beberapa tabel yang saling berelasi, di mana variabel Market diperoleh dari tabel location, sedangkan variabel Sales diperoleh dari tabel facttable yang kemudian digabungkan menggunakan operasi INNER JOIN.

Insight yang diambil dalam analisis ini adalah untuk mengetahui apakah terdapat perbedaan tingkat penjualan (Sales) antar market. Pemilihan insight ini didasarkan pada pentingnya memahami performa penjualan di setiap wilayah, sehingga dapat menjadi dasar dalam pengambilan keputusan bisnis dan strategi pemasaran.

Variabel yang digunakan dalam analisis ini terdiri dari:

Market sebagai variabel kategorik yang menunjukkan wilayah penjualan
Sales sebagai variabel numerik yang menunjukkan jumlah penjualan

Analisis difokuskan pada perbandingan nilai Sales antar beberapa kelompok Market, sehingga metode statistik yang digunakan akan menyesuaikan dengan karakteristik data tersebut.n

Import Data dari MY SQL ke R

library(DBI)
## Warning: package 'DBI' was built under R version 4.5.2
library(odbc)
## Warning: package 'odbc' was built under R version 4.5.2
con = dbConnect(odbc(),
                 Driver = "MySQL ODBC 8.0 ANSI Driver",
                 Server = "127.0.0.1",
                 UID = "root",
                 PWD = "nurkhafizh06",
                 Port = 3306,
                 database = "coffee chain datasets")

Mengambil Data dari Tabel Facttable dan Location

data <- dbGetQuery(con, "SELECT l.Market, f.Sales
FROM facttable f
INNER JOIN location l
ON f.`Area Code` = l.`Area Code`;")

head(data)
##    Market Sales
## 1 Central   219
## 2 Central   190
## 3 Central   234
## 4 Central   100
## 5 Central   134
## 6 Central   180

Visualisasi Data

Visualisasi dilakukan menggunakan boxplot untuk melihat distribusi Sales pada masing-masing Market.

boxplot(Sales ~ Market, data = data,
        col = "lightblue",
        main = "Perbandingan Sales antar Market",
        xlab = "Market",
        ylab = "Sales")


Interpretasi
Berdasarkan boxplot, terlihat bahwa median penjualan pada setiap market relatif tidak berbeda jauh. Namun, terdapat variasi data yang cukup besar serta banyaknya outlier pada masing-masing market. Hal ini menunjukkan bahwa distribusi data cenderung tidak normal dan terdapat beberapa nilai penjualan yang sangat tinggi. Secara visual, perbedaan antar market belum terlihat signifikan, sehingga diperlukan uji statistik lebih lanjut untuk memastikan adanya perbedaan rata-rata penjualan.

Analisis Data

Uji Normalitas Data
Uji normalitas digunakan untuk mengetahui apakah data mengikuti distribusi normal atau tidak dengan hipotesis sebagai berikut:
Hipotesis
H0: Data berdistribusi Normal
H1: Data tidak berdistribusi Normal

shapiro.test(data$Sales)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Sales
## W = 0.78969, p-value < 2.2e-16

Keputusan
Karena p-value < 0.05, maka H0 ditolak
Kesimpulan
Berdasarkan uji Shapiro-Wilk diperoleh p-value < 2.2e-16. Karena p-value < 0.05, maka H0 ditolak. Hal ini menunjukkan bahwa data tidak berdistribusi normal.

Karena Data Tidak Berdistribusi Normal

Uji Kruskal-Wallis
Uji Kruskal-Wallis digunakan untuk mengetahui apakah terdapat perbedaan median Sales antar beberapa kelompok Market dengan hipotesis sebagai berikut :
Hipotesis
H0: Tidak terdapat perbedaan median Sales antar Market
H1: Terdapat perbedaan median Sales antar Market

kruskal.test(Sales ~ Market, data = data)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Sales by Market
## Kruskal-Wallis chi-squared = 27.871, df = 3, p-value = 3.865e-06

Keputusan
Karena p-value < 0.05, maka H0 ditolak
Kesimpulan
Berdasarkan uji Kruskal-Wallis diperoleh p-value sebesar 3.865e-06 (< 0.05), sehingga H0 ditolak. Hal ini menunjukkan bahwa terdapat perbedaan median penjualan yang signifikan antar market. Dengan demikian, dapat disimpulkan bahwa faktor market berpengaruh terhadap tingkat penjualan.

Interpretasi Dari Hasil Analisis Data

Berdasarkan uji Shapiro-Wilk diperoleh p-value < 2.2e-16, sehingga H0 ditolak dan dapat disimpulkan bahwa data tidak berdistribusi normal. Oleh karena itu, digunakan uji non-parametrik Kruskal-Wallis. Hasil uji Kruskal-Wallis menunjukkan p-value sebesar 3.865e-06 (< 0.05), sehingga H0 ditolak. Hal ini menunjukkan bahwa terdapat perbedaan median penjualan yang signifikan antar market.