Industri coffee chain menghasilkan data penjualan yang kompleks. Analisis terhadap variabel seperti Sales, Profit, Product Type, Market, dan Marketing dapat memberikan insight penting mengenai performa bisnis. Dalam penelitian ini digunakan subset data untuk menyederhanakan analisis tanpa mengurangi kualitas hasil.
library(readxl)
library(dplyr)
library(ggplot2)
# Import dataset
data <- read_excel("C:/Users/AXIOO/Downloads/1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")
# Subset kolom (sesuai dataset asli)
data_selected <- data %>%
select(Sales, Profit, `Product Type`, Market, Marketing)
# Subset baris (sampling)
set.seed(123)
data_sample <- data_selected %>% sample_n(150)
# Cek data
head(data_sample)
## # A tibble: 6 × 5
## Sales Profit `Product Type` Market Marketing
## <dbl> <dbl> <chr> <chr> <dbl>
## 1 362 147 Espresso West 47
## 2 80 -4 Tea Central 12
## 3 134 41 Coffee South 15
## 4 309 115 Herbal Tea West 40
## 5 49 18 Espresso West 5
## 6 245 89 Coffee East 31
str(data_sample)
## tibble [150 × 5] (S3: tbl_df/tbl/data.frame)
## $ Sales : num [1:150] 362 80 134 309 49 245 43 119 64 56 ...
## $ Profit : num [1:150] 147 -4 41 115 18 89 31 54 -12 -11 ...
## $ Product Type: chr [1:150] "Espresso" "Tea" "Coffee" "Herbal Tea" ...
## $ Market : chr [1:150] "West" "Central" "South" "West" ...
## $ Marketing : num [1:150] 47 12 15 40 5 31 0 17 11 9 ...
summary(data_sample)
## Sales Profit Product Type Market
## Min. : 34.0 Min. :-505.00 Length:150 Length:150
## 1st Qu.: 96.0 1st Qu.: 22.25 Class :character Class :character
## Median :142.5 Median : 43.00 Mode :character Mode :character
## Mean :193.8 Mean : 64.11
## 3rd Qu.:243.5 3rd Qu.: 100.50
## Max. :796.0 Max. : 459.00
## Marketing
## Min. : 0.00
## 1st Qu.: 13.00
## Median : 21.00
## Mean : 30.19
## 3rd Qu.: 37.50
## Max. :156.00
Berdasarkan pengamatan awal terhadap data yang telah dipilih, diperoleh beberapa insight sebagai berikut:
Insight awal ini diperoleh dari pengamatan data dan akan dianalisis lebih lanjut menggunakan visualisasi dan uji statistik.
colSums(is.na(data_sample))
## Sales Profit Product Type Market Marketing
## 0 0 0 0 0
data_sample %>%
summarise(
rata_sales = mean(Sales, na.rm = TRUE),
rata_profit = mean(Profit, na.rm = TRUE),
rata_marketing = mean(Marketing, na.rm = TRUE),
total_profit = sum(Profit, na.rm = TRUE)
)
## # A tibble: 1 × 4
## rata_sales rata_profit rata_marketing total_profit
## <dbl> <dbl> <dbl> <dbl>
## 1 194. 64.1 30.2 9616
ggplot(data_sample, aes(x = Sales, y = Profit)) +
geom_point(color = "blue") +
geom_smooth(method = "lm", color = "red") +
labs(title = "Hubungan Sales dan Profit",
x = "Sales",
y = "Profit")
data_sample %>%
group_by(`Product Type`) %>%
summarise(Total_Profit = sum(Profit, na.rm = TRUE)) %>%
ggplot(aes(x = `Product Type`, y = Total_Profit, fill = `Product Type`)) +
geom_bar(stat = "identity") +
labs(title = "Total Profit per Product Type")
data_sample %>%
group_by(Market) %>%
summarise(Total_Profit = sum(Profit, na.rm = TRUE)) %>%
ggplot(aes(x = Market, y = Total_Profit, fill = Market)) +
geom_bar(stat = "identity") +
labs(title = "Total Profit per Market")
ggplot(data_sample, aes(x = Profit)) +
geom_histogram(bins = 20, fill = "blue") +
labs(title = "Distribusi Profit")
5.1 Scatter Plot Sales dan Profit Scatter plot menunjukkan adanya hubungan positif antara Sales dan Profit. Hal ini terlihat dari pola titik yang cenderung meningkat dari kiri bawah ke kanan atas. Artinya, peningkatan nilai Sales cenderung diikuti oleh peningkatan Profit. Selain itu, sebagian besar titik berada di sekitar garis regresi, yang mengindikasikan bahwa hubungan antara kedua variabel cukup konsisten. Namun, terdapat beberapa titik yang menyimpang (outlier), termasuk nilai profit negatif, yang menunjukkan adanya variasi dalam data.
5.2 Bar Chart Profit per Product Type Grafik menunjukkan adanya perbedaan total profit yang cukup signifikan antar jenis produk. Produk Herbal Tea memiliki kontribusi profit tertinggi dibandingkan produk lainnya, diikuti oleh Espresso. Sementara itu, Coffee dan Tea memiliki nilai profit yang relatif lebih rendah. Hal ini mengindikasikan bahwa kontribusi profit tidak merata antar jenis produk, dengan Herbal Tea menjadi produk yang paling dominan dalam menghasilkan keuntungan.
5.3 Bar Chart Profit per Market Visualisasi menunjukkan adanya perbedaan total profit antar market yang cukup jelas. Market Central dan West memiliki nilai profit yang lebih tinggi dibandingkan East dan South. Sementara itu, South memiliki profit paling rendah. Hal ini mengindikasikan bahwa distribusi profit belum merata antar market dan terdapat market yang lebih dominan dalam menghasilkan keuntungan.
5.4 Histogram Distribusi Profit Histogram menunjukkan bahwa distribusi profit tidak simetris dan cenderung miring ke kanan (positively skewed). Sebagian besar nilai profit terkonsentrasi pada rentang rendah hingga sedang, yaitu sekitar 0 hingga 150. Selain itu, terdapat beberapa nilai ekstrem, baik berupa kerugian (nilai negatif) maupun keuntungan tinggi (nilai positif besar). Hal ini mengindikasikan adanya variasi profit yang cukup besar antar transaksi.
cor.test(data_sample$Sales, data_sample$Profit)
##
## Pearson's product-moment correlation
##
## data: data_sample$Sales and data_sample$Profit
## t = 16.198, df = 148, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.7333039 0.8508290
## sample estimates:
## cor
## 0.7995965
kruskal.test(Profit ~ `Product Type`, data = data_sample)
##
## Kruskal-Wallis rank sum test
##
## data: Profit by Product Type
## Kruskal-Wallis chi-squared = 9.0969, df = 3, p-value = 0.02803
kruskal.test(Profit ~ Market, data = data_sample)
##
## Kruskal-Wallis rank sum test
##
## data: Profit by Market
## Kruskal-Wallis chi-squared = 2.2433, df = 3, p-value = 0.5235
cor.test(data_sample$Marketing, data_sample$Profit)
##
## Pearson's product-moment correlation
##
## data: data_sample$Marketing and data_sample$Profit
## t = 4.1181, df = 148, p-value = 6.328e-05
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.1690598 0.4573924
## sample estimates:
## cor
## 0.3206341
Berdasarkan hasil analisis statistik yang telah dilakukan, diperoleh beberapa temuan sebagai berikut:
6.1 Hubungan antara Sales dan Profit Berdasarkan hasil uji korelasi Pearson, diperoleh nilai koefisien korelasi sebesar r = 0.7996 dengan p-value < 2.2 × 10⁻¹⁶. Nilai tersebut menunjukkan adanya hubungan positif yang kuat antara variabel Sales dan Profit. Karena nilai p-value lebih kecil dari 0.05, maka hubungan tersebut signifikan secara statistik. Dengan demikian, dapat diartikan bahwa peningkatan nilai Sales cenderung diikuti oleh peningkatan nilai Profit. Interval kepercayaan 95% yang berada pada rentang 0.7333 hingga 0.8508 semakin memperkuat bahwa hubungan ini konsisten dan kuat.
6.2 Perbedaan Profit berdasarkan Product Type Hasil uji Kruskal-Wallis menunjukkan nilai chi-squared sebesar 9.0969 dengan p-value = 0.02803. Karena p-value lebih kecil dari 0.05, maka dapat disimpulkan bahwa terdapat perbedaan profit yang signifikan antar Product Type. Hal ini menunjukkan bahwa jenis produk yang berbeda memberikan kontribusi profit yang berbeda, sehingga terdapat produk tertentu yang lebih unggul dalam menghasilkan keuntungan.
6.3 Perbedaan Profit berdasarkan Market Berdasarkan hasil uji Kruskal-Wallis, diperoleh nilai chi-squared sebesar 2.2433 dengan p-value = 0.5235. Karena p-value lebih besar dari 0.05, maka tidak terdapat perbedaan profit yang signifikan antar Market. Meskipun secara visual terdapat variasi nilai profit antar wilayah, perbedaan tersebut tidak cukup kuat secara statistik untuk dinyatakan signifikan. Hal ini menunjukkan bahwa perbedaan wilayah pemasaran belum memberikan pengaruh yang nyata terhadap profit.
6.4 Hubungan antara Marketing dan Profit Hasil uji korelasi Pearson menunjukkan nilai koefisien korelasi sebesar r = 0.3206 dengan p-value = 6.328 × 10⁻⁵. Nilai ini menunjukkan adanya hubungan positif dengan kekuatan lemah hingga sedang antara Marketing dan Profit. Karena p-value lebih kecil dari 0.05, maka hubungan tersebut signifikan secara statistik. Hal ini mengindikasikan bahwa peningkatan aktivitas marketing cenderung diikuti oleh peningkatan profit, meskipun hubungan tersebut tidak sekuat hubungan antara Sales dan Profit.
Berdasarkan hasil analisis data Coffee Chain menggunakan subset data, dapat disimpulkan bahwa:
Secara keseluruhan, variabel yang memiliki hubungan paling kuat dengan Profit adalah Sales, diikuti oleh Product Type dan Marketing, sedangkan Market tidak menunjukkan perbedaan yang signifikan dalam analisis ini.
Berdasarkan hasil analisis yang telah dilakukan, beberapa saran yang dapat diberikan adalah sebagai berikut: