1. Deskripsi Data

Data yang digunakan dalam analisis ini adalah Coffee Chain Datasets. Dataset ini berisi data penjualan dan kinerja keuangan pada bisnis coffee chain, yang mencakup informasi terkait wilayah pemasaran, jenis produk, penjualan, biaya, margin, hingga profit. Data ini digunakan untuk melihat bagaimana performa bisnis pada berbagai kategori produk yang dijual.

Berdasarkan file dataset, terdapat 4248 baris data dan 20 variabel pada sheet utama, yaitu sheet data. Selain itu, tersedia juga sheet deskripsi yang berisi penjelasan nama-nama variabel dalam dataset. Secara umum, dataset ini memiliki struktur yang cukup lengkap untuk analisis bisnis karena memuat data target anggaran dan realisasi aktual.

Dalam tugas ini, fokus analisis diarahkan pada variabel Product Type dan Profit. Variabel Product Type menunjukkan jenis produk yang dijual, yaitu Coffee, Tea, Espresso, dan Herbal Tea. Sementara itu, variabel Profit menunjukkan besarnya keuntungan yang diperoleh dari penjualan produk. Dengan menggunakan kedua variabel tersebut, analisis dilakukan untuk mengetahui jenis produk mana yang memberikan kontribusi profit paling besar.

Selain dua variabel utama tersebut, dataset juga memiliki beberapa variabel pendukung seperti Sales, Margin, COGS, Marketing, Inventory, Market, dan State. Variabel-variabel ini dapat digunakan untuk pengembangan analisis lebih lanjut, tetapi dalam tugas ini pembahasan difokuskan pada hubungan antara jenis produk dan profit.

Pemilihan topik ini didasarkan pada pentingnya mengetahui produk yang paling menguntungkan dalam sebuah bisnis. Dengan memahami perbedaan profit antar Product Type, perusahaan dapat memperoleh gambaran mengenai kategori produk yang memiliki performa terbaik dan dapat dijadikan dasar dalam pengambilan keputusan bisnis.

2. Eksplorasi Data

library(readxl)
## Warning: package 'readxl' was built under R version 4.5.2
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.5.2
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
# Impor data
data_coffee <- read_excel("C:/Users/USER/Downloads/1. Tugas SIM 2025B - Coffee Chain Datasets/1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx", sheet = "data")

# Melihat struktur data
str(data_coffee)
## tibble [4,248 × 20] (S3: tbl_df/tbl/data.frame)
##  $ Area Code     : num [1:4248] 719 970 970 303 303 720 970 719 970 719 ...
##  $ Date          : POSIXct[1:4248], format: "2012-01-01" "2012-01-01" ...
##  $ Market        : chr [1:4248] "Central" "Central" "Central" "Central" ...
##  $ Market Size   : chr [1:4248] "Major Market" "Major Market" "Major Market" "Major Market" ...
##  $ Product       : chr [1:4248] "Amaretto" "Colombian" "Decaf Irish Cream" "Green Tea" ...
##  $ Product Line  : chr [1:4248] "Beans" "Beans" "Beans" "Leaves" ...
##  $ Product Type  : chr [1:4248] "Coffee" "Coffee" "Coffee" "Tea" ...
##  $ State         : chr [1:4248] "Colorado" "Colorado" "Colorado" "Colorado" ...
##  $ Type          : chr [1:4248] "Regular" "Regular" "Decaf" "Regular" ...
##  $ Budget COGS   : num [1:4248] 90 80 100 30 60 80 140 50 50 40 ...
##  $ Budget Margin : num [1:4248] 130 110 140 50 90 130 160 80 70 70 ...
##  $ Budget Profit : num [1:4248] 100 80 110 30 70 80 110 20 40 20 ...
##  $ Budget Sales  : num [1:4248] 220 190 240 80 150 210 300 130 120 110 ...
##  $ COGS          : num [1:4248] 89 83 95 44 54 72 170 63 60 58 ...
##  $ Inventory     : num [1:4248] 777 623 821 623 456 ...
##  $ Margin        : num [1:4248] 130 107 139 56 80 108 171 87 80 72 ...
##  $ Marketing     : num [1:4248] 24 27 26 14 15 23 47 57 19 22 ...
##  $ Profit        : num [1:4248] 94 68 101 30 54 53 99 0 33 17 ...
##  $ Sales         : num [1:4248] 219 190 234 100 134 180 341 150 140 130 ...
##  $ Total Expenses: num [1:4248] 36 39 38 26 26 55 72 87 47 55 ...
# Ringkasan data
summary(data_coffee$Profit)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  -638.0    17.0    40.0    61.1    92.0   778.0

3. Analisis Data

# Total profit berdasarkan Product Type
profit_product <- data_coffee %>%
  group_by(`Product Type`) %>%
  summarise(Total_Profit = sum(Profit),
            Rata_rata_Profit = mean(Profit),
            Jumlah_Data = n())

profit_product
## # A tibble: 4 × 4
##   `Product Type` Total_Profit Rata_rata_Profit Jumlah_Data
##   <chr>                 <dbl>            <dbl>       <int>
## 1 Coffee                74683             70.7        1056
## 2 Espresso              68620             58.4        1176
## 3 Herbal Tea            63254             59.9        1056
## 4 Tea                   52986             55.2         960

4. Visualisasi Data

# Bar chart total profit
ggplot(profit_product, aes(x = `Product Type`, y = Total_Profit)) +
  geom_col() +
  labs(
    title = "Total Profit Berdasarkan Product Type",
    x = "Product Type",
    y = "Total Profit"
  ) +
  theme_minimal()

# Boxplot profit
ggplot(data_coffee, aes(x = `Product Type`, y = Profit)) +
  geom_boxplot() +
  labs(
    title = "Distribusi Profit Berdasarkan Product Type",
    x = "Product Type",
    y = "Profit"
  ) +
  theme_minimal()

5. Interpretasi Hasil Visualisasi dan Analisis Data

Berdasarkan grafik Total Profit Berdasarkan Product Type, dapat dilihat bahwa kategori Coffee menghasilkan total profit paling tinggi, yaitu sebesar 74.683. Selanjutnya, kategori Espresso berada di urutan kedua dengan total profit 68.620, disusul oleh Herbal Tea sebesar 63.254. Sementara itu, kategori Tea mencatat total profit paling rendah, yaitu 52.986. Temuan ini menunjukkan bahwa masing-masing jenis produk memberikan kontribusi profit yang berbeda, dan Coffee menjadi kategori dengan sumbangan keuntungan terbesar dalam dataset Coffee Chain.

Temuan tersebut juga didukung oleh hasil tabel analisis. Selain mencatat total profit tertinggi, kategori Coffee juga memiliki rata-rata profit paling besar, yakni 70,7. Hal ini mengindikasikan bahwa Coffee tidak hanya unggul dari sisi akumulasi keuntungan, tetapi juga cenderung menghasilkan profit per data yang lebih tinggi dibandingkan kategori lainnya. Sebaliknya, kategori Tea memiliki total profit terendah sebesar 52.986 dengan rata-rata profit sebesar 55,2, sehingga dapat dinilai sebagai kategori dengan performa profit paling rendah dalam analisis ini.

Jika ditinjau dari jumlah observasi, kategori Espresso memiliki data paling banyak, yaitu 1.176 observasi. Adapun Coffee dan Herbal Tea masing-masing memiliki 1.056 observasi, sedangkan Tea memiliki 960 observasi. Walaupun jumlah data Espresso lebih besar, total profit yang dihasilkan masih lebih rendah dibandingkan Coffee. Kondisi ini menunjukkan bahwa Coffee relatif lebih efektif dalam menghasilkan profit, karena dengan jumlah observasi yang lebih sedikit dibandingkan Espresso, kategori ini tetap mampu memperoleh total dan rata-rata profit yang lebih tinggi.

Berdasarkan boxplot Distribusi Profit Berdasarkan Product Type, terlihat bahwa keempat kategori produk memiliki pola distribusi profit yang secara umum hampir serupa, meskipun masih terdapat perbedaan dalam tingkat penyebaran data dan nilai ekstremnya. Median profit pada kategori Coffee tampak sedikit lebih tinggi dibandingkan kategori lainnya, yang semakin menguatkan hasil analisis bahwa Coffee merupakan kategori produk yang paling menguntungkan. Selain itu, Coffee juga memiliki cukup banyak outlier positif dengan nilai yang sangat tinggi, yang menunjukkan bahwa pada kondisi tertentu produk Coffee mampu menghasilkan profit jauh lebih besar dibandingkan jenis produk lainnya.

Sebaliknya, kategori Tea memperlihatkan beberapa outlier negatif yang cukup ekstrem, bahkan lebih rendah dibandingkan kategori lain. Hal ini mengindikasikan bahwa pada sejumlah observasi, produk Tea mengalami profit yang sangat rendah atau kerugian yang lebih besar dibandingkan produk lainnya. Meskipun seluruh kategori menunjukkan variasi profit, Tea cenderung memiliki risiko performa yang lebih lemah, sedangkan Coffee menunjukkan performa yang lebih stabil dan lebih menguntungkan.

Secara keseluruhan, hasil visualisasi dan analisis data memperlihatkan bahwa Product Type memiliki pengaruh terhadap besarnya profit. Kategori Coffee muncul sebagai jenis produk yang paling menguntungkan, sedangkan Tea menjadi kategori dengan kontribusi profit paling rendah. Hasil ini dapat dimanfaatkan perusahaan sebagai bahan pertimbangan dalam menentukan strategi bisnis, terutama dalam hal pemasaran, pengelolaan persediaan, dan pengembangan produk yang lebih difokuskan pada kategori dengan profit tinggi, khususnya Coffee.