1. Deskripsi Insight

Dataset Coffee Chain merupakan data penjualan dari sebuah kedai kopi yang mencakup berbagai informasi seperti jenis produk, wilayah penjualan, total penjualan, biaya, dan keuntungan (profit).

Insight yang diambil: 1. Apakah terdapat perbedaan rata-rata profit yang signifikan antar jenis produk Product Type pada Coffee Chain? 2.Bagaimana performa penjualan Sales dan keuntungan Profit Coffee Chain di setiap wilayah?

Variabel yang Saya gunakan 1. Product.Type: Kategori produk (Coffee, Espresso, Herbal Tea, Tea) 2. Profit: Keuntungan bersih dari setiap transaksi 3. State: Wilayah 4. COGS: Biaya pokok penjualan (Cost of Goods Sold)


2. Import dan Persiapan Data

# Install dan load package yang diperlukan
library(DBI)
library(odbc)
library(ggplot2)

# -------------------------------------------------------
# Import dari file SQL (MySQL)

# -------------------------------------------------------
# library(RMySQL)

con1 = dbConnect(odbc(),
                 Driver = "MySQL ODBC 8.0 ANSI Driver",
                 SERVER = "127.0.0.1",
                 UID = "root",
                 PWD = "tata230207",
                 Port = 3306,
                 database = "coffe_chain")

3. Statistik Deskriptif profit setiap jenis produk

# Ringkasan statistik profit per Product Type
dt1 = dbGetQuery(con1, "SELECT p.`Product Type`,
SUM(s.Profit) AS `Total profit`,
ROUND(AVG(s.Profit), 0) AS Mean_Profit,
ROUND(STDDEV(s.Profit), 0) AS SD_Profit,
ROUND(MIN(s.Profit), 0) AS Min_Profit,
ROUND(MAX(s.Profit), 0) AS Max_Profit
FROM product p
JOIN facttable s ON p.ProductId= s.ProductId
GROUP BY p.`Product Type`
ORDER BY Mean_Profit DESC;")

## membuat tabel ringkasan statistik
knitr::kable(dt1,
             caption = "Ringkasan statistik profit setiap product type",
             col.names = c("Product Type", "Total profit", 
                           "Mean Profit", "SD Profit", 
                           "Min Profit", "Max Profit"))
Ringkasan statistik profit setiap product type
Product Type Total profit Mean Profit SD Profit Min Profit Max Profit
Coffee 74683 71 119 -221 778
Herbal Tea 63254 60 85 -420 536
Espresso 68620 58 91 -392 646
Tea 52986 55 109 -638 362

Dari tabel di atas terlihat bahwa Coffee memiliki rata-rata profit tertinggi, diikuti oleh Herbal Tea, Espresso, dan Tea.


4. Visualisasi Data Profit

4.1 Bar chart rata rata Profit per Product Type

ggplot(dt1, aes(x = `Product Type`, y = Mean_Profit, fill = `Product Type`)) +
  geom_bar(stat = "identity") +
  scale_fill_manual(values = c("#4B2E2B","#8C5A3C","#C08552", "#DBCEA5")) +
  labs(title = "Rata rata profit per Product Type",
       x = "Product Type",
       y = "Total Profit") +
  theme_minimal()

4.2 pie Chart presentase total Profit per product type

# Hitung persentase
persen <- round(dt1$`Total profit` / sum(dt1$`Total profit`) * 100, 1)

# Gabungkan label + persen
label_pie <- paste(dt1$`Product Type`, "\n", persen, "%")

# Plot pie chart
pie(dt1$`Total profit`,
    labels = label_pie,
    main = "Proporsi Total Profit per Product Type",
    col = c("#4B2E2B", "#8C5A3C", "#C08552", "#DBCEA5"),
    border = "black",
    lwd = 4)

5. statistik deskriptif COGS setiap wilayah

# Ringkasan statistik COGS per wilayah
df = dbGetQuery(con1,"SELECT p. State,
SUM(s.COGS) AS Total_COGS,
ROUND(AVG(s.COGS), 0) AS Mean_COGS,
ROUND(STDDEV(s.COGS), 0) AS SD_COGS,
ROUND(MIN(s.COGS), 0) AS Min_COGS,
ROUND(MAX(s.COGS), 0) AS Max_COGS
FROM location p
JOIN facttable s ON p.`Area Code`= s.`Area Code`
GROUP BY p.State
ORDER BY Total_COGS ")

## membuat tabel ringkasan statistik
knitr::kable(df,
             caption = "Ringkasan statistik COGS per wilayah",
             col.names = c("State", "Total COGS",  "Mean COGS", "SD COGS", 
                            "Min COGS",  "Max COGS"))
Ringkasan statistik COGS per wilayah
State Total COGS Mean COGS SD COGS Min COGS Max COGS
New Hampshire 5658 34 18 0 64
New Mexico 7594 45 25 15 120
Massachusetts 9066 63 46 16 181
Louisiana 9398 56 16 31 103
Connecticut 10470 62 27 19 130
Oklahoma 11234 67 34 16 141
Missouri 11434 53 23 20 120
Wisconsin 13640 63 22 22 133
Ohio 14632 68 42 16 181
Florida 15496 72 28 22 141
Texas 15674 93 64 34 311
Utah 15766 55 20 20 120
Washington 15814 66 25 22 133
Oregon 17294 66 39 16 181
Colorado 20402 77 34 37 181
Iowa 23518 109 109 0 302
Illinois 29482 136 72 39 295
Nevada 31454 119 100 0 302
New York 35164 183 84 50 364
California 45482 158 81 39 364

6. Visualisasi Data COGS

6.1 Visualisasi rata rata COGS setiap wilayah

ggplot(df, aes(x = State, y = Mean_COGS, fill = State)) +
  geom_bar(stat = "identity") +
  coord_flip() +
  scale_fill_manual(values = colorRampPalette(c("#5D3A00", "#D2B48C"))(nrow(df))) +
  labs(title = "Rata rata COGS setiap wilayah",
       x = "state",
       y = "Rata rata COGS") +
  theme_minimal()

ggplot(df, aes(x = State, y = Total_COGS, fill = State)) +
  geom_bar(stat = "identity")+
  scale_fill_manual(values = colorRampPalette(c("#5D3A00", "#D2B48C"))(nrow(df))) +
  coord_flip() +
  labs(title = "Total COGS setiap wilayah",
       x = "Wilayah",
       y = "Total CGOS") +
  theme_minimal()

7. Analisis Data

Pada analisis ini akan diuji apakah terdapat perbedaan COGS antara California dan Texas sehingga dapat ditulis sebagai berikut H0: Rata-rata COGS tidak lebih dari 100 (≤ 100) H1: Rata-rata COGS lebih dari 100

t.test(df$Mean_COGS, mu = 100, alternative = "greater")
## 
##  One Sample t-test
## 
## data:  df$Mean_COGS
## t = -2.0245, df = 19, p-value = 0.9714
## alternative hypothesis: true mean is greater than 100
## 95 percent confidence interval:
##  67.08996      Inf
## sample estimates:
## mean of x 
##     82.25

6. Interpretasi Hasil

6.1 Statistika Deskriptif

  1. Statistika deskriptif profit setiap jenis produk
    Pada tabel yang telah dibuat, terlihat bahwa Coffee menghasilkan profit tertinggi yaitu sebesar 74.683, disusul Espresso sebesar 68.620, kemudian Herbal Tea sebesar 63.254, dan yang paling rendah adalah Tea sebesar 52.986. Artinya, secara keseluruhan Coffee merupakan penyumbang utama keuntungan. Dari rata rata mena profit coffee juga mempunyai rata rata tertinngi yakni 71 dan tea paling rendah dengan nilai 55. Ini mennunjukkan setiap transaksi Coffe cenderung lebih menguntungkan dibanding produk lain.
  2. Statistika deskriptif COGS setiap wilayah Secara umum, terlihat bahwa California memiliki total COGS tertinggi yaitu sebesar 45.482, diikuti oleh Nevada (31.454) dan Illinois (29.482). Hal ini menunjukkan bahwa aktivitas penjualan atau volume transaksi di wilayah tersebut cukup besar sehingga biaya yang dikeluarkan juga tinggi. Dari sisi rata-rata (Mean COGS), California juga menempati posisi tertinggi (158), disusul Illinois (136) dan Nevada (119). Ini berarti bahwa biaya per transaksi di wilayah tersebut cenderung lebih besar dibanding state lain, bukan hanya karena jumlah transaksi, tetapi juga nilai per transaksi yang tinggi. Jika dilihat dari standar deviasi (SD COGS): California (81) dan Illinois (72) cukup tinggi menunjukkan variasi biaya yang besar (tidak stabil) Beberapa state seperti Louisiana (16) dan Utah (20) lebih rendah dan lebih stabil

6.2 Visualisasi

  1. Bar chart rata rata profit setiap jenis produk Berdasarkan grafik rata-rata profit per product type, terlihat bahwa setiap jenis produk memiliki tingkat keuntungan yang relatif berbeda. Produk Coffee menunjukkan rata-rata profit tertinggi dibandingkan produk lainnya. Sementara itu, Herbal Tea dan Espresso memiliki rata-rata profit yang tidak jauh berbeda dan berada pada posisi menengah. Di sisi lain, produk Tea memiliki rata-rata profit paling rendah di antara seluruh kategori. Secara keseluruhan, perbedaan rata-rata profit antar produk tidak terlalu signifikan, namun Coffee dapat dianggap sebagai produk yang paling menguntungkan. Oleh karena itu, produk dengan profit lebih rendah seperti Tea dapat menjadi bahan evaluasi untuk meningkatkan penjualan.
  2. Diagaram lingkaran presentase total profit setiap jenis produk Berdasarkan diagram lingkaran yang menunjukkan proporsi total profit per product type, terlihat bahwa kontribusi terbesar terhadap total profit berasal dari produk Coffee sebesar 28,8%. Selanjutnya, produk Espresso memberikan kontribusi sebesar 26,4%, diikuti oleh Herbal Tea sebesar 24,4%. Sementara itu, produk Tea memiliki kontribusi paling kecil terhadap total profit, yaitu sebesar 20,4%. Secara keseluruhan, distribusi profit antar produk relatif merata, meskipun Coffee tetap menjadi penyumbang utama. Hal ini menunjukkan bahwa seluruh produk memiliki peran dalam menghasilkan profit, namun terdapat peluang untuk meningkatkan kontribusi dari produk dengan proporsi lebih rendah seperti Tea.
  3. Diagarm batang horizontal rata rata CGOS setiap wilayah Berdasarkan grafik rata-rata Cost of Goods Sold (COGS) per wilayah, terlihat bahwa terdapat variasi yang cukup signifikan antar negara bagian. Wilayah New York menunjukkan rata-rata COGS tertinggi dibandingkan wilayah lainnya, diikuti oleh California dan Nevada yang juga memiliki nilai COGS relatif tinggi. Sebaliknya, beberapa wilayah seperti New Hampshire, New Mexico, dan Utah memiliki rata-rata COGS yang lebih rendah dibandingkan wilayah lainnya. Sementara itu, wilayah lain seperti Illinois, Iowa, dan Texas berada pada tingkat menengah. Secara keseluruhan, perbedaan ini menunjukkan adanya variasi biaya produksi atau operasional di setiap wilayah. Wilayah dengan COGS tinggi perlu diperhatikan lebih lanjut untuk mengidentifikasi faktor penyebab tingginya biaya, sedangkan wilayah dengan COGS rendah dapat menjadi acuan dalam meningkatkan efisiensi di wilayah lain.
  4. Diagarm batang horizontal total CGOS setiap wilayah Berdasarkan diagram batang vertikal yang menunjukkan total Cost of Goods Sold (COGS) setiap wilayah, terlihat bahwa terdapat perbedaan yang cukup signifikan antar wilayah. California memiliki total COGS tertinggi dibandingkan wilayah lainnya, yang menunjukkan bahwa biaya produksi atau operasional di wilayah tersebut paling besar. Selain itu, wilayah seperti New York, Illinois, dan Nevada juga menunjukkan total COGS yang relatif tinggi, meskipun masih berada di bawah California. Di sisi lain, beberapa wilayah seperti New Hampshire, New Mexico, dan Connecticut memiliki total COGS yang lebih rendah dibandingkan wilayah lainnya. Secara keseluruhan, distribusi total COGS antar wilayah tidak merata. Hal ini mengindikasikan adanya perbedaan skala operasional, volume penjualan, atau efisiensi biaya di masing-masing wilayah. Wilayah dengan COGS tinggi perlu dianalisis lebih lanjut untuk mengetahui apakah tingginya biaya tersebut sebanding dengan profit yang dihasilkan.

6.3 Uji hipotesis

  1. One Sample t-test (Uji t satu sampel) Berdasarkan hasil uji one sample t-test terhadap variabel Mean COGS, diperoleh nilai rata-rata sebesar 72,85 dengan nilai t hitung sebesar -3,2754 dan p-value sebesar 0,998. Pengujian ini dilakukan untuk mengetahui apakah rata-rata COGS lebih besar dari 100. Karena nilai p-value lebih besar dari 0,05, maka H0 gagal ditolak. Hal ini menunjukkan bahwa tidak terdapat bukti yang cukup untuk menyatakan bahwa rata-rata COGS lebih besar dari 100. Dengan demikian, dapat disimpulkan bahwa rata-rata biaya pokok penjualan (COGS) cenderung berada di bawah 100. Hasil ini sejalan dengan analisis deskriptif sebelumnya yang menunjukkan bahwa sebagian besar nilai rata-rata COGS di berbagai state relatif tidak terlalu tinggi.