Pendahuluan

Coffee Chain Dataset merupakan dataset yang berisi informasi penjualan produk kopi pada berbagai market. Analisis dilakukan untuk mengetahui market dengan rata-rata penjualan tertinggi serta produk yang paling banyak dibeli pada market tersebut.

Import Library

library(DBI)
library(odbc)
library(RSQLite)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)

Import dan Join Data

Pertama, mengimpor Coffee Chain dataset dalam MySQL terlebih dahulu. Dan kemudian data tersebut dipanggil dalam R sebagai con1. Kemudian melihat tabel dan variabel masing-masing tabel.

dbListTables(con1)
## [1] "facttable" "location"  "product"
fact <- dbReadTable(con1, "facttable")
location <- dbReadTable(con1, "location")
product <- dbReadTable(con1, "product")

Berdasarkan tabel yang tersedia, tabel facttable digunakan sebagai tabel utama karena berisi data transaksi penjualan. Selanjutnya tabel location dan product digunakan sebagai tabel pendukung. Tabel facttable dan location digabung menggunakan variabel “Area Code”, sedangkan tabel facttable dan product digabung menggunakan variabel “ProductId”.

coffee <- fact %>%
  left_join(location, by = "Area.Code") %>%
  left_join(product, by = "ProductId")

head(coffee)
##   Profit Margin Sales COGS Total.Expenses Marketing Inventory Budget.Profit
## 1     94    130   219   89             36        24       777           100
## 2     68    107   190   83             39        27       623            80
## 3    101    139   234   95             38        26       821           110
## 4     30     56   100   44             26        14       623            30
## 5     54     80   134   54             26        15       456            70
## 6     53    108   180   72             55        23       558            80
##   Budget.COGS Budget.Margin Budget.Sales Area.Code ProductId
## 1          90           130          220       719         1
## 2          80           110          190       970         2
## 3         100           140          240       970         3
## 4          30            50           80       303        13
## 5          60            90          150       303         5
## 6          80           130          210       720         6
##                  Date    State  Market  Market.Size Product.Line Product.Type
## 1 2012-01-01 00:00:00 Colorado Central Major Market        Beans       Coffee
## 2 2012-01-01 00:00:00 Colorado Central Major Market        Beans       Coffee
## 3 2012-01-01 00:00:00 Colorado Central Major Market        Beans       Coffee
## 4 2012-01-01 00:00:00 Colorado Central Major Market       Leaves          Tea
## 5 2012-01-01 00:00:00 Colorado Central Major Market        Beans     Espresso
## 6 2012-01-01 00:00:00 Colorado Central Major Market        Beans     Espresso
##             Product    Type
## 1          Amaretto Regular
## 2         Colombian Regular
## 3 Decaf Irish Cream   Decaf
## 4         Green Tea Regular
## 5       Caffe Mocha Regular
## 6    Decaf Espresso   Decaf

Analisis Rata-rata Sales per Market

market_sales <- coffee %>%
  group_by(Market) %>%
  summarise(
    rata_sales = mean(Sales)
  )
market_sales %>%
  arrange(desc(rata_sales))
## # A tibble: 4 × 2
##   Market  rata_sales
##   <chr>        <dbl>
## 1 West          203.
## 2 East          201.
## 3 Central       197.
## 4 South         155.

Dari hasil perhitungan tersebut didapatkan hasil rata-rata tertinggi secara berurutan adalah West Market dengan rata-rata penjualan 203, East Market memiliki rata-rata penjualan 201, Central Market memiliki rata-rata 197, dan South Market memiliki rata-rata penjualan 155.

Visualisasi Rata-rata Sales

ggplot(market_sales,
       aes(x = reorder(Market, rata_sales),
           y = rata_sales,
           fill = Market)) +
  geom_bar(stat = "identity") +
  theme_minimal() +
  labs(
    title = "Rata-rata Sales pada Setiap Market",
    x = "Market",
    y = "Rata-rata Sales"
  )

Berdasarkan visualisasi bar plot, terlihat bahwa market West dan East memiliki rata-rata penjualan yang lebih tinggi dibandingkan market lainnya. Berdasarkan hasil perhitungan rata-rata sales, market West memiliki rata-rata penjualan tertinggi yaitu sebesar 203, sehingga market West adalah market dengan performa penjualan terbaik.

Analisis Produk Terjual di Market West

Kemudian dilakukan identifikasi produk yang paling banyak dibeli oleh konsumen pada market dengan rata-rata penjualan terbaik, yaitu West Market. Yaitu dilakukan dengan melakukan filter data pada dataset coffee berdasarkan variabel Market yang bernilai “West”. Selanjutnya data dikelompokkan berdasarkan variabel Product, kemudian dihitung total sales dari masing-masing produk.

market_tertinggi <- coffee %>%
  filter(Market == "West")

produk_terjual <- market_tertinggi %>%
  group_by(Product) %>%
  summarise(
    total_sales = sum(Sales)
  ) %>%
  arrange(desc(total_sales))

produk_terjual
## # A tibble: 12 × 2
##    Product           total_sales
##    <chr>                   <int>
##  1 Lemon                   32273
##  2 Decaf Espresso          30578
##  3 Colombian               30352
##  4 Darjeeling              28773
##  5 Earl Grey               27382
##  6 Chamomile               25631
##  7 Caffe Latte             20456
##  8 Caffe Mocha             18874
##  9 Decaf Irish Cream       18233
## 10 Green Tea               16065
## 11 Mint                    14384
## 12 Amaretto                 9263

Berdasarkan hasil perhitungan total sales, produk Lemon merupakan produk dengan total penjualan tertinggi pada market West, yaitu sebesar 32.273. Hal ini menunjukkan bahwa produk Lemon merupakan produk yang paling diminati konsumen pada market tersebut.

Visualisasi Produk Terlaris

ggplot(produk_terjual,
  aes(
    x = reorder(Product, total_sales),
    y = total_sales,
    fill = Product
  )
) +
  geom_bar(stat = "identity") +
  coord_flip() +
  theme_minimal() +
  labs(
    title = "Produk dengan Total Sales Tertinggi di Market West",
    x = "Product",
    y = "Total Sales"
  )

Visualisasi menunjukkan produk dengan total sales tertinggi pada market West. 3 Produk yang paling banyak terjual secara berurutan adalah Lemon, Decaf Espresso, dan Colombian.

Kesimpulan

Berdasarkan hasil analisis, market West memiliki rata-rata sales tertinggi dibandingkan market lainnya sehingga dapat dikatakan memiliki performa penjualan terbaik. Selain itu, produk Lemon, Decaf Espresso, dan Colombian merupakan produk dengan total sales tertinggi pada market West sehingga menjadi produk yang paling diminati konsumen.