1. Deskripsi Data

Dataset Coffee Chain merupakan kumpulan data penjualan dari sebuah perusahaan kopi yang berisi informasi terkait transaksi bisnis di berbagai wilayah (state). Data ini umumnya mencakup variabel seperti jenis produk (misalnya berbagai varian kopi dan teh), wilayah penjualan, serta metrik kinerja seperti profit, sales, dan quantity.

2. Insight

Analisis ini difokuskan pada profit produk kopi dan non kopi di setiap wilayah negara bagian. Dengan menjumlahkan profit per produk dan membandingkannya dengan wilayah lain. Sebagai metode untuk mengidentifikasi perkembangan bisnis dan membantu dalam membuat keputusan.

3. Packages Yang Digunakan

library(readxl)
## Warning: package 'readxl' was built under R version 4.5.3
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.5.2
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2

4. Import Data

CoffeeChain <- read_excel("Coffee Chain Datasets.xlsx")

5. Memilih Variabel

data_PSP <- CoffeeChain %>%
select(Product, State, Profit)
print(data_PSP)
## # A tibble: 4,248 × 3
##    Product           State    Profit
##    <chr>             <chr>     <dbl>
##  1 Amaretto          Colorado     94
##  2 Colombian         Colorado     68
##  3 Decaf Irish Cream Colorado    101
##  4 Green Tea         Colorado     30
##  5 Caffe Mocha       Colorado     54
##  6 Decaf Espresso    Colorado     53
##  7 Chamomile         Colorado     99
##  8 Lemon             Colorado      0
##  9 Mint              Colorado     33
## 10 Darjeeling        Colorado     17
## # ℹ 4,238 more rows

Variabel yang dipilih adalah Product, State, dan Profit karena variabel ini berkaitan dalam menganalisis kentungan produk-produk dari setiap negara bagian yang disebutkan di data.

6. Visualisasi Data

A. Total Profit Per Produk

profit_product <- data_PSP %>%
  group_by(Product) %>%
  summarise(total_profit = sum(Profit, na.rm = TRUE))

ggplot(profit_product, aes(x = reorder(Product, total_profit), y = total_profit)) +
  geom_bar(stat = "identity", fill = "lightblue") +
  geom_text(aes(label = round(total_profit, 0)), 
            hjust = -0.1, size = 2) +
  coord_flip() +
  labs(title = "Total Profit per Product",
       x = "Product",
       y = "Total Profit") +
  theme_minimal()

Visualisasi ini menunjukkan perbandingan total profit yang dihasilkan oleh setiap produk, terlihat bahwa tidak semua produk memberikan kontribusi yang sama terhadap keuntungan perusahaan. Beberapa produk, seperti yang berada di posisi teratas grafik, memiliki total profit yang jauh lebih tinggi dibandingkan produk lainnya. Grafik ini membantu mengidentifikasi produk mana yang paling berkontribusi terhadap profit perusahaan serta menjadi dasar dalam pengambilan keputusan bisnis untuk optimalisasi penjualan.

B. Perbandingan Profit Produk di Setiap State

data_PSP <- CoffeeChain %>%
  select(Product, State, Profit)

profit_state_product <- data_PSP %>%
  group_by(State, Product) %>%
  summarise(total_profit = sum(Profit, na.rm = TRUE)) %>%
  ungroup()
## `summarise()` has grouped output by 'State'. You can override using the
## `.groups` argument.
top_product_state <- profit_state_product %>%
  group_by(State) %>%
  slice_max(order_by = total_profit, n = 1) %>%
  ungroup()

ggplot(profit_state_product, aes(x = Product, y = total_profit, fill = Product)) +
  geom_bar(stat = "identity") +
  facet_wrap(~State) +
  coord_flip() +
  labs(title = "Perbandingan Profit Produk di Setiap State",
       x = "Product",
       y = "Total Profit") +
  theme_minimal()

Visualisasi tersebut menunjukkan bahwa kontribusi profit tiap produk berbeda di setiap state. Beberapa produk menjadi yang paling menguntungkan di state tertentu, sementara di state lain produk yang berbeda lebih unggul. Hal ini menunjukkan adanya perbedaan preferensi pasar antar wilayah, sehingga strategi penjualan perlu disesuaikan dengan karakteristik masing-masing state.

7. Analisis Data

Analisis Rata-Rata Profit Tiap State

profit_state <- data_PSP %>%
group_by(State) %>%
summarise(avg_profit = mean(Profit, na.rm = TRUE))
print(profit_state)
## # A tibble: 20 × 2
##    State         avg_profit
##    <chr>              <dbl>
##  1 California        110.  
##  2 Colorado           67.2 
##  3 Connecticut        45.4 
##  4 Florida            57.0 
##  5 Illinois          143.  
##  6 Iowa              103.  
##  7 Louisiana          43.8 
##  8 Massachusetts     114.  
##  9 Missouri           16.7 
## 10 Nevada             40.2 
## 11 New Hampshire      16.4 
## 12 New Mexico          4.76
## 13 New York          105.  
## 14 Ohio               49.9 
## 15 Oklahoma           50.9 
## 16 Oregon             47.1 
## 17 Texas              93.8 
## 18 Utah               26.9 
## 19 Washington         47.5 
## 20 Wisconsin          40.3

Hasil analisis menunjukkan bahwa rata-rata profit berbeda di setiap state. Beberapa state seperti Illinois dan Massachusetts memiliki rata-rata profit yang relatif tinggi, menandakan kinerja penjualan yang lebih baik di wilayah tersebut. Sebaliknya, state seperti Missouri dan Nevada memiliki rata-rata profit yang lebih rendah, sehingga kontribusinya terhadap keuntungan perusahaan cenderung kecil. Perbedaan ini menunjukan adanya variasi kondisi pasar, permintaan, atau strategi penjualan di tiap state, sehingga perusahaan dapat memfokuskan pengembangan pada wilayah dengan performa tinggi serta mengevaluasi strategi di wilayah dengan profit rendah.