Coffee Chain Dataset merupakan dataset yang berisi informasi penjualan produk kopi pada berbagai market. Analisis dilakukan untuk mengetahui market dengan rata-rata penjualan tertinggi serta produk yang paling banyak dibeli pada market tersebut.
library(DBI)
library(odbc)
library(RSQLite)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
Pertama, mengimpor Coffee Chain dataset dalam MySQL terlebih dahulu. Dan kemudian data tersebut dipanggil dalam R sebagai con1. Kemudian melihat tabel dan variabel masing-masing tabel.
dbListTables(con1)
## [1] "facttable" "location" "product"
fact <- dbReadTable(con1, "facttable")
location <- dbReadTable(con1, "location")
product <- dbReadTable(con1, "product")
Berdasarkan tabel yang tersedia, tabel facttable digunakan sebagai tabel utama karena berisi data transaksi penjualan. Selanjutnya tabel location dan product digunakan sebagai tabel pendukung. Tabel facttable dan location digabung menggunakan variabel “Area Code”, sedangkan tabel facttable dan product digabung menggunakan variabel “ProductId”.
coffee <- fact %>%
left_join(location, by = "Area.Code") %>%
left_join(product, by = "ProductId")
head(coffee)
## Profit Margin Sales COGS Total.Expenses Marketing Inventory Budget.Profit
## 1 94 130 219 89 36 24 777 100
## 2 68 107 190 83 39 27 623 80
## 3 101 139 234 95 38 26 821 110
## 4 30 56 100 44 26 14 623 30
## 5 54 80 134 54 26 15 456 70
## 6 53 108 180 72 55 23 558 80
## Budget.COGS Budget.Margin Budget.Sales Area.Code ProductId
## 1 90 130 220 719 1
## 2 80 110 190 970 2
## 3 100 140 240 970 3
## 4 30 50 80 303 13
## 5 60 90 150 303 5
## 6 80 130 210 720 6
## Date State Market Market.Size Product.Line Product.Type
## 1 2012-01-01 00:00:00 Colorado Central Major Market Beans Coffee
## 2 2012-01-01 00:00:00 Colorado Central Major Market Beans Coffee
## 3 2012-01-01 00:00:00 Colorado Central Major Market Beans Coffee
## 4 2012-01-01 00:00:00 Colorado Central Major Market Leaves Tea
## 5 2012-01-01 00:00:00 Colorado Central Major Market Beans Espresso
## 6 2012-01-01 00:00:00 Colorado Central Major Market Beans Espresso
## Product Type
## 1 Amaretto Regular
## 2 Colombian Regular
## 3 Decaf Irish Cream Decaf
## 4 Green Tea Regular
## 5 Caffe Mocha Regular
## 6 Decaf Espresso Decaf
market_sales <- coffee %>%
group_by(Market) %>%
summarise(
rata_sales = mean(Sales)
)
market_sales %>%
arrange(desc(rata_sales))
## # A tibble: 4 × 2
## Market rata_sales
## <chr> <dbl>
## 1 West 203.
## 2 East 201.
## 3 Central 197.
## 4 South 155.
Dari hasil perhitungan tersebut didapatkan hasil rata-rata tertinggi secara berurutan adalah West Market dengan rata-rata penjualan 203, East Market memiliki rata-rata penjualan 201, Central Market memiliki rata-rata 197, dan South Market memiliki rata-rata penjualan 155.
ggplot(market_sales,
aes(x = reorder(Market, rata_sales),
y = rata_sales,
fill = Market)) +
geom_bar(stat = "identity") +
theme_minimal() +
labs(
title = "Rata-rata Sales pada Setiap Market",
x = "Market",
y = "Rata-rata Sales"
)
Berdasarkan visualisasi bar plot, terlihat bahwa market West dan East memiliki rata-rata penjualan yang lebih tinggi dibandingkan market lainnya. Berdasarkan hasil perhitungan rata-rata sales, market West memiliki rata-rata penjualan tertinggi yaitu sebesar 203, sehingga market West adalah market dengan performa penjualan terbaik.
Kemudian dilakukan identifikasi produk yang paling banyak dibeli oleh konsumen pada market dengan rata-rata penjualan terbaik, yaitu West Market. Yaitu dilakukan dengan melakukan filter data pada dataset coffee berdasarkan variabel Market yang bernilai “West”. Selanjutnya data dikelompokkan berdasarkan variabel Product, kemudian dihitung total sales dari masing-masing produk.
market_tertinggi <- coffee %>%
filter(Market == "West")
produk_terjual <- market_tertinggi %>%
group_by(Product) %>%
summarise(
total_sales = sum(Sales)
) %>%
arrange(desc(total_sales))
produk_terjual
## # A tibble: 12 × 2
## Product total_sales
## <chr> <int>
## 1 Lemon 32273
## 2 Decaf Espresso 30578
## 3 Colombian 30352
## 4 Darjeeling 28773
## 5 Earl Grey 27382
## 6 Chamomile 25631
## 7 Caffe Latte 20456
## 8 Caffe Mocha 18874
## 9 Decaf Irish Cream 18233
## 10 Green Tea 16065
## 11 Mint 14384
## 12 Amaretto 9263
Berdasarkan hasil perhitungan total sales, produk Lemon merupakan produk dengan total penjualan tertinggi pada market West, yaitu sebesar 32.273. Hal ini menunjukkan bahwa produk Lemon merupakan produk yang paling diminati konsumen pada market tersebut.
ggplot(produk_terjual,
aes(
x = reorder(Product, total_sales),
y = total_sales,
fill = Product
)
) +
geom_bar(stat = "identity") +
coord_flip() +
theme_minimal() +
labs(
title = "Produk dengan Total Sales Tertinggi di Market West",
x = "Product",
y = "Total Sales"
)
Visualisasi menunjukkan produk dengan total sales tertinggi pada market West. 3 Produk yang paling banyak terjual secara berurutan adalah Lemon, Decaf Espresso, dan Colombian.
Berdasarkan hasil analisis, market West memiliki rata-rata sales tertinggi dibandingkan market lainnya sehingga dapat dikatakan memiliki performa penjualan terbaik. Selain itu, produk Lemon, Decaf Espresso, dan Colombian merupakan produk dengan total sales tertinggi pada market West sehingga menjadi produk yang paling diminati konsumen.