1. Deskripsi Insight
Dataset Coffee Chain merupakan data penjualan dari
sebuah kedai kopi yang mencakup berbagai informasi seperti jenis produk,
wilayah penjualan, total penjualan, biaya, dan keuntungan (profit).
Insight yang diambil: 1. Apakah terdapat perbedaan
rata-rata profit yang signifikan antar jenis produk Product
Type pada Coffee Chain? 2.Bagaimana performa penjualan
Sales dan keuntungan Profit Coffee Chain di setiap
wilayah?
Variabel yang Saya gunakan 1.
Product.Type: Kategori produk (Coffee, Espresso, Herbal
Tea, Tea) 2. Profit: Keuntungan bersih dari setiap
transaksi 3. State: Wilayah 4. COGS: Biaya
pokok penjualan (Cost of Goods Sold)
2. Import dan Persiapan Data
# Install dan load package yang diperlukan
library(DBI)
library(odbc)
library(ggplot2)
# -------------------------------------------------------
# Import dari file SQL (MySQL)
# -------------------------------------------------------
# library(RMySQL)
con1 = dbConnect(odbc(),
Driver = "MySQL ODBC 8.0 ANSI Driver",
SERVER = "127.0.0.1",
UID = "root",
PWD = "tata230207",
Port = 3306,
database = "coffe_chain")
3. Statistik Deskriptif profit setiap jenis produk
# Ringkasan statistik profit per Product Type
dt1 = dbGetQuery(con1, "SELECT p.`Product Type`,
SUM(s.Profit) AS `Total profit`,
ROUND(AVG(s.Profit), 0) AS Mean_Profit,
ROUND(STDDEV(s.Profit), 0) AS SD_Profit,
ROUND(MIN(s.Profit), 0) AS Min_Profit,
ROUND(MAX(s.Profit), 0) AS Max_Profit
FROM product p
JOIN facttable s ON p.ProductId= s.ProductId
GROUP BY p.`Product Type`
ORDER BY Mean_Profit DESC;")
## membuat tabel ringkasan statistik
knitr::kable(dt1,
caption = "Ringkasan statistik profit setiap product type",
col.names = c("Product Type", "Total profit",
"Mean Profit", "SD Profit",
"Min Profit", "Max Profit"))
Ringkasan statistik profit setiap product type
| Coffee |
74683 |
71 |
119 |
-221 |
778 |
| Herbal Tea |
63254 |
60 |
85 |
-420 |
536 |
| Espresso |
68620 |
58 |
91 |
-392 |
646 |
| Tea |
52986 |
55 |
109 |
-638 |
362 |
Dari tabel di atas terlihat bahwa Coffee memiliki
rata-rata profit tertinggi, diikuti oleh Herbal Tea,
Espresso, dan Tea.
4. Visualisasi Data Profit
4.1 Bar chart rata rata Profit per Product Type
ggplot(dt1, aes(x = `Product Type`, y = Mean_Profit, fill = `Product Type`)) +
geom_bar(stat = "identity") +
scale_fill_manual(values = c("#4B2E2B","#8C5A3C","#C08552", "#DBCEA5")) +
labs(title = "Rata rata profit per Product Type",
x = "Product Type",
y = "Total Profit") +
theme_minimal()

4.2 pie Chart presentase total Profit per product type
# Hitung persentase
persen <- round(dt1$`Total profit` / sum(dt1$`Total profit`) * 100, 1)
# Gabungkan label + persen
label_pie <- paste(dt1$`Product Type`, "\n", persen, "%")
# Plot pie chart
pie(dt1$`Total profit`,
labels = label_pie,
main = "Proporsi Total Profit per Product Type",
col = c("#4B2E2B", "#8C5A3C", "#C08552", "#DBCEA5"),
border = "black",
lwd = 4)

5. statistik deskriptif COGS setiap wilayah
# Ringkasan statistik COGS per wilayah
df = dbGetQuery(con1,"SELECT p. State,
SUM(s.COGS) AS Total_COGS,
ROUND(AVG(s.COGS), 0) AS Mean_COGS,
ROUND(STDDEV(s.COGS), 0) AS SD_COGS,
ROUND(MIN(s.COGS), 0) AS Min_COGS,
ROUND(MAX(s.COGS), 0) AS Max_COGS
FROM location p
JOIN facttable s ON p.`Area Code`= s.`Area Code`
GROUP BY p.State
ORDER BY Total_COGS ")
## membuat tabel ringkasan statistik
knitr::kable(df,
caption = "Ringkasan statistik COGS per wilayah",
col.names = c("State", "Total COGS", "Mean COGS", "SD COGS",
"Min COGS", "Max COGS"))
Ringkasan statistik COGS per wilayah
| New Hampshire |
5658 |
34 |
18 |
0 |
64 |
| New Mexico |
7594 |
45 |
25 |
15 |
120 |
| Massachusetts |
9066 |
63 |
46 |
16 |
181 |
| Louisiana |
9398 |
56 |
16 |
31 |
103 |
| Connecticut |
10470 |
62 |
27 |
19 |
130 |
| Oklahoma |
11234 |
67 |
34 |
16 |
141 |
| Missouri |
11434 |
53 |
23 |
20 |
120 |
| Wisconsin |
13640 |
63 |
22 |
22 |
133 |
| Ohio |
14632 |
68 |
42 |
16 |
181 |
| Florida |
15496 |
72 |
28 |
22 |
141 |
| Texas |
15674 |
93 |
64 |
34 |
311 |
| Utah |
15766 |
55 |
20 |
20 |
120 |
| Washington |
15814 |
66 |
25 |
22 |
133 |
| Oregon |
17294 |
66 |
39 |
16 |
181 |
| Colorado |
20402 |
77 |
34 |
37 |
181 |
| Iowa |
23518 |
109 |
109 |
0 |
302 |
| Illinois |
29482 |
136 |
72 |
39 |
295 |
| Nevada |
31454 |
119 |
100 |
0 |
302 |
| New York |
35164 |
183 |
84 |
50 |
364 |
| California |
45482 |
158 |
81 |
39 |
364 |
6. Visualisasi Data COGS
6.1 Visualisasi rata rata COGS setiap wilayah
ggplot(df, aes(x = State, y = Mean_COGS, fill = State)) +
geom_bar(stat = "identity") +
coord_flip() +
scale_fill_manual(values = colorRampPalette(c("#5D3A00", "#D2B48C"))(nrow(df))) +
labs(title = "Rata rata COGS setiap wilayah",
x = "state",
y = "Rata rata COGS") +
theme_minimal()

ggplot(df, aes(x = State, y = Total_COGS, fill = State)) +
geom_bar(stat = "identity")+
scale_fill_manual(values = colorRampPalette(c("#5D3A00", "#D2B48C"))(nrow(df))) +
coord_flip() +
labs(title = "Total COGS setiap wilayah",
x = "Wilayah",
y = "Total CGOS") +
theme_minimal()

7. Analisis Data
Pada analisis ini akan diuji apakah terdapat perbedaan COGS antara
California dan Texas sehingga dapat ditulis sebagai berikut H0:
Rata-rata COGS tidak lebih dari 100 (≤ 100) H1: Rata-rata COGS lebih
dari 100
t.test(df$Mean_COGS, mu = 100, alternative = "greater")
##
## One Sample t-test
##
## data: df$Mean_COGS
## t = -2.0245, df = 19, p-value = 0.9714
## alternative hypothesis: true mean is greater than 100
## 95 percent confidence interval:
## 67.08996 Inf
## sample estimates:
## mean of x
## 82.25
6. Interpretasi Hasil
6.1 Statistika Deskriptif
- Statistika deskriptif profit setiap jenis
produk
Pada tabel yang telah dibuat, terlihat bahwa Coffee
menghasilkan profit tertinggi yaitu sebesar 74.683,
disusul Espresso sebesar 68.620, kemudian
Herbal Tea sebesar 63.254, dan yang paling
rendah adalah Tea sebesar 52.986. Artinya,
secara keseluruhan Coffee merupakan penyumbang utama
keuntungan. Dari rata rata mena profit coffee juga mempunyai rata rata
tertinngi yakni 71 dan tea paling rendah dengan nilai
55. Ini mennunjukkan setiap transaksi Coffe cenderung
lebih menguntungkan dibanding produk lain.
- Statistika deskriptif COGS setiap wilayah Secara
umum, terlihat bahwa California memiliki total COGS
tertinggi yaitu sebesar 45.482, diikuti oleh Nevada
(31.454) dan Illinois (29.482). Hal ini menunjukkan
bahwa aktivitas penjualan atau volume transaksi di wilayah tersebut
cukup besar sehingga biaya yang dikeluarkan juga tinggi. Dari sisi
rata-rata (Mean COGS), California juga menempati posisi
tertinggi (158), disusul Illinois (136) dan
Nevada (119). Ini berarti bahwa biaya per transaksi di
wilayah tersebut cenderung lebih besar dibanding state lain, bukan hanya
karena jumlah transaksi, tetapi juga nilai per transaksi yang tinggi.
Jika dilihat dari standar deviasi (SD COGS): California
(81) dan Illinois (72) cukup tinggi menunjukkan variasi
biaya yang besar (tidak stabil) Beberapa state seperti
Louisiana (16) dan Utah (20) lebih
rendah dan lebih stabil
6.2 Visualisasi
- Bar chart rata rata profit setiap jenis produk
Berdasarkan grafik rata-rata profit per product type, terlihat bahwa
setiap jenis produk memiliki tingkat keuntungan yang relatif berbeda.
Produk Coffee menunjukkan rata-rata profit tertinggi dibandingkan produk
lainnya. Sementara itu, Herbal Tea dan Espresso memiliki rata-rata
profit yang tidak jauh berbeda dan berada pada posisi menengah. Di sisi
lain, produk Tea memiliki rata-rata profit paling rendah di antara
seluruh kategori. Secara keseluruhan, perbedaan rata-rata profit antar
produk tidak terlalu signifikan, namun Coffee dapat dianggap sebagai
produk yang paling menguntungkan. Oleh karena itu, produk dengan profit
lebih rendah seperti Tea dapat menjadi bahan evaluasi untuk meningkatkan
penjualan.
- Diagaram lingkaran presentase total profit setiap jenis
produk Berdasarkan diagram lingkaran yang menunjukkan proporsi
total profit per product type, terlihat bahwa kontribusi terbesar
terhadap total profit berasal dari produk Coffee sebesar 28,8%.
Selanjutnya, produk Espresso memberikan kontribusi sebesar 26,4%,
diikuti oleh Herbal Tea sebesar 24,4%. Sementara itu, produk Tea
memiliki kontribusi paling kecil terhadap total profit, yaitu sebesar
20,4%. Secara keseluruhan, distribusi profit antar produk relatif
merata, meskipun Coffee tetap menjadi penyumbang utama. Hal ini
menunjukkan bahwa seluruh produk memiliki peran dalam menghasilkan
profit, namun terdapat peluang untuk meningkatkan kontribusi dari produk
dengan proporsi lebih rendah seperti Tea.
- Diagarm batang horizontal rata rata CGOS setiap
wilayah Berdasarkan grafik rata-rata Cost of Goods Sold (COGS)
per wilayah, terlihat bahwa terdapat variasi yang cukup signifikan antar
negara bagian. Wilayah New York menunjukkan rata-rata COGS tertinggi
dibandingkan wilayah lainnya, diikuti oleh California dan Nevada yang
juga memiliki nilai COGS relatif tinggi. Sebaliknya, beberapa wilayah
seperti New Hampshire, New Mexico, dan Utah memiliki rata-rata COGS yang
lebih rendah dibandingkan wilayah lainnya. Sementara itu, wilayah lain
seperti Illinois, Iowa, dan Texas berada pada tingkat menengah. Secara
keseluruhan, perbedaan ini menunjukkan adanya variasi biaya produksi
atau operasional di setiap wilayah. Wilayah dengan COGS tinggi perlu
diperhatikan lebih lanjut untuk mengidentifikasi faktor penyebab
tingginya biaya, sedangkan wilayah dengan COGS rendah dapat menjadi
acuan dalam meningkatkan efisiensi di wilayah lain.
- Diagarm batang horizontal total CGOS setiap wilayah
Berdasarkan diagram batang vertikal yang menunjukkan total Cost of Goods
Sold (COGS) setiap wilayah, terlihat bahwa terdapat perbedaan yang cukup
signifikan antar wilayah. California memiliki total COGS tertinggi
dibandingkan wilayah lainnya, yang menunjukkan bahwa biaya produksi atau
operasional di wilayah tersebut paling besar. Selain itu, wilayah
seperti New York, Illinois, dan Nevada juga menunjukkan total COGS yang
relatif tinggi, meskipun masih berada di bawah California. Di sisi lain,
beberapa wilayah seperti New Hampshire, New Mexico, dan Connecticut
memiliki total COGS yang lebih rendah dibandingkan wilayah lainnya.
Secara keseluruhan, distribusi total COGS antar wilayah tidak merata.
Hal ini mengindikasikan adanya perbedaan skala operasional, volume
penjualan, atau efisiensi biaya di masing-masing wilayah. Wilayah dengan
COGS tinggi perlu dianalisis lebih lanjut untuk mengetahui apakah
tingginya biaya tersebut sebanding dengan profit yang dihasilkan.
6.3 Uji hipotesis
- One Sample t-test (Uji t satu sampel) Berdasarkan
hasil uji one sample t-test terhadap variabel Mean COGS, diperoleh nilai
rata-rata sebesar 72,85 dengan nilai t hitung sebesar -3,2754 dan
p-value sebesar 0,998. Pengujian ini dilakukan untuk mengetahui apakah
rata-rata COGS lebih besar dari 100. Karena nilai p-value lebih besar
dari 0,05, maka H0 gagal ditolak. Hal ini menunjukkan bahwa tidak
terdapat bukti yang cukup untuk menyatakan bahwa rata-rata COGS lebih
besar dari 100. Dengan demikian, dapat disimpulkan bahwa rata-rata biaya
pokok penjualan (COGS) cenderung berada di bawah 100. Hasil ini sejalan
dengan analisis deskriptif sebelumnya yang menunjukkan bahwa sebagian
besar nilai rata-rata COGS di berbagai state relatif tidak terlalu
tinggi.