library(readxl)
coffee_chain <- read_excel("D:/SEMESTER 2/SIM/1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")
coffee_chain
## # A tibble: 4,248 × 20
## `Area Code` Date Market `Market Size` Product `Product Line`
## <dbl> <dttm> <chr> <chr> <chr> <chr>
## 1 719 2012-01-01 00:00:00 Central Major Market Amaretto Beans
## 2 970 2012-01-01 00:00:00 Central Major Market Colombi… Beans
## 3 970 2012-01-01 00:00:00 Central Major Market Decaf I… Beans
## 4 303 2012-01-01 00:00:00 Central Major Market Green T… Leaves
## 5 303 2012-01-01 00:00:00 Central Major Market Caffe M… Beans
## 6 720 2012-01-01 00:00:00 Central Major Market Decaf E… Beans
## 7 970 2012-01-01 00:00:00 Central Major Market Chamomi… Leaves
## 8 719 2012-01-01 00:00:00 Central Major Market Lemon Leaves
## 9 970 2012-01-01 00:00:00 Central Major Market Mint Leaves
## 10 719 2012-01-01 00:00:00 Central Major Market Darjeel… Leaves
## # ℹ 4,238 more rows
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## # `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## # `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## # Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
head(coffee_chain)
## # A tibble: 6 × 20
## `Area Code` Date Market `Market Size` Product `Product Line`
## <dbl> <dttm> <chr> <chr> <chr> <chr>
## 1 719 2012-01-01 00:00:00 Central Major Market Amaretto Beans
## 2 970 2012-01-01 00:00:00 Central Major Market Colombian Beans
## 3 970 2012-01-01 00:00:00 Central Major Market Decaf Ir… Beans
## 4 303 2012-01-01 00:00:00 Central Major Market Green Tea Leaves
## 5 303 2012-01-01 00:00:00 Central Major Market Caffe Mo… Beans
## 6 720 2012-01-01 00:00:00 Central Major Market Decaf Es… Beans
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## # `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## # `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## # Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
summary(coffee_chain)
## Area Code Date Market
## Min. :203.0 Min. :2012-01-01 00:00:00 Length:4248
## 1st Qu.:417.0 1st Qu.:2012-06-23 12:00:00 Class :character
## Median :573.0 Median :2012-12-16 12:00:00 Mode :character
## Mean :582.3 Mean :2012-12-15 22:00:00
## 3rd Qu.:772.0 3rd Qu.:2013-06-08 12:00:00
## Max. :985.0 Max. :2013-12-01 00:00:00
## Market Size Product Product Line Product Type
## Length:4248 Length:4248 Length:4248 Length:4248
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## State Type Budget COGS Budget Margin
## Length:4248 Length:4248 Min. : 0.00 Min. :-210.0
## Class :character Class :character 1st Qu.: 30.00 1st Qu.: 50.0
## Mode :character Mode :character Median : 50.00 Median : 70.0
## Mean : 74.83 Mean : 100.8
## 3rd Qu.: 90.00 3rd Qu.: 130.0
## Max. :450.00 Max. : 690.0
## Budget Profit Budget Sales COGS Inventory
## Min. :-320.00 Min. : 0.0 Min. : 0.00 Min. :-3534.0
## 1st Qu.: 20.00 1st Qu.: 80.0 1st Qu.: 43.00 1st Qu.: 432.0
## Median : 40.00 Median : 130.0 Median : 60.00 Median : 619.0
## Mean : 60.91 Mean : 175.6 Mean : 84.43 Mean : 749.4
## 3rd Qu.: 80.00 3rd Qu.: 210.0 3rd Qu.:100.00 3rd Qu.: 910.5
## Max. : 560.00 Max. :1140.0 Max. :364.00 Max. : 8252.0
## Margin Marketing Profit Sales
## Min. :-302.00 Min. : 0.00 Min. :-638.0 Min. : 17
## 1st Qu.: 52.75 1st Qu.: 13.00 1st Qu.: 17.0 1st Qu.:100
## Median : 76.00 Median : 22.00 Median : 40.0 Median :138
## Mean : 104.29 Mean : 31.19 Mean : 61.1 Mean :193
## 3rd Qu.: 132.00 3rd Qu.: 39.00 3rd Qu.: 92.0 3rd Qu.:230
## Max. : 613.00 Max. :156.00 Max. : 778.0 Max. :912
## Total Expenses
## Min. : 10.00
## 1st Qu.: 33.00
## Median : 46.00
## Mean : 54.06
## 3rd Qu.: 65.00
## Max. :190.00
Analisis ini bertujuan untuk mengetahui pengaruh besarnya Sales (total penjualan) terhadap Profit (keuntungan) yang diperoleh perusahaan. Dalam konteks ini, variabel Sales ditempatkan sebagai variabel independen, sedangkan Profit sebagai variabel dependen yang mencerminkan profitabilitas bersih setelah dikurangi seluruh beban operasional. Visualisasi berupa Bar Chart digunakan untuk membandingkan besaran Sales dan Profit di berbagai wilayah pasar, sementara Garis Tren (Trendline) ditambahkan untuk memperjelas arah hubungan serta stabilitas pertumbuhan keduanya dari waktu ke waktu. Hasil analisis menunjukkan adanya korelasi positif yang signifikan; peningkatan batang Sales secara konsisten diikuti oleh kenaikan pada garis tren Profit. Namun, fluktuasi jarak antara puncak batang dan titik garis menunjukkan bahwa efisiensi biaya operasional memegang peranan penting dalam menentukan margin keuntungan. Oleh karena itu, strategi peningkatan volume penjualan yang dibarengi dengan pengendalian biaya yang ketat menjadi faktor krusial dalam memaksimalkan profitabilitas perusahaan.
library(tidyr)
## Warning: package 'tidyr' was built under R version 4.5.3
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.3
# Persiapan data: Agregasi Sales dan Profit per Market
comparison_data <- aggregate(cbind(Sales, Profit) ~ Market, data = coffee_chain, sum)
# Mengubah format data menjadi 'long' agar bisa dibuat grouped bar
comparison_long <- pivot_longer(comparison_data, cols = c(Sales, Profit),
names_to = "Metric", values_to = "Amount")
ggplot(comparison_long, aes(x = Market, y = Amount, fill = Metric)) +
geom_bar(stat = "identity", position = "dodge") +
scale_fill_manual(values = c("Sales" = "darkgreen", "Profit" = "pink")) +
theme_minimal() +
labs(title = "Total Sales vs Total Profit per Market", y = "Total Nilai")
Interpretasi :
Visualisasi ini menunjukkan bahwa wilayah West dan Central memiliki volume penjualan (Sales) yang jauh lebih tinggi dibandingkan dengan wilayah East dan South. Namun, jika diperhatikan secara saksama, proporsi keuntungan (Profit) yang dihasilkan tidak setinggi volume penjualannya. Hal ini mengindikasikan bahwa meskipun pasar di wilayah West sangat besar, biaya operasional dan harga pokok penjualan di sana juga sangat tinggi. Sementara itu, wilayah South menunjukkan angka terendah pada kedua variabel, yang menandakan bahwa wilayah ini masih memiliki skala bisnis yang kecil dan memerlukan strategi penetrasi pasar yang lebih agresif untuk menyamai wilayah lainnya.
Hipotesis: H0: Tidak terdapat perbedaan keuntungan yang signifikan antar wilayah. H1: Terdapat perbedaan keuntungan yang signifikan antar wilayah.
# Uji Kruskal-Wallis
kruskal_test <- kruskal.test(Profit ~ Market, data = coffee_chain)
print(kruskal_test)
##
## Kruskal-Wallis rank sum test
##
## data: Profit by Market
## Kruskal-Wallis chi-squared = 26.504, df = 3, p-value = 7.48e-06
Karena nilai p-value < 0.05, maka kita Tolak H0. Hal ini membuktikan bahwa terdapat perbedaan keuntungan yang sangat signifikan secara statistik di antara keempat wilayah tersebut (Central, East, South, West). Jika melihat grafik batang, wilayah Central dan West secara konsisten mendominasi perolehan profit, sementara South berada di posisi terendah.
library(ggplot2)
# Agregasi data berdasarkan tanggal
time_data <- aggregate(cbind(Sales, Profit) ~ Date, data = coffee_chain, sum)
time_long <- pivot_longer(time_data, cols = c(Sales, Profit),
names_to = "Metric", values_to = "Value")
ggplot(time_long, aes(x = as.Date(Date), y = Value, color = Metric)) +
geom_line(size = 1) +
theme_minimal() +
labs(title = "Tren Sales dan Profit Bulanan", x = "Waktu", y = "Nilai")
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
Interpretasi :
Garis tren menunjukkan adanya hubungan positif yang konsisten. Artinya, setiap kali terjadi peningkatan pada angka penjualan, keuntungan cenderung ikut bergerak naik. Kemiringan (slope) pada garis tren ini membuktikan bahwa volume penjualan merupakan faktor penentu utama bagi profitabilitas perusahaan. Namun, fluktuasi yang terjadi pada garis tersebut juga mengisyaratkan bahwa hubungan ini tidak sepenuhnya linear sempurna. Terdapat momen di mana kenaikan penjualan yang tajam tidak menghasilkan lonjakan keuntungan yang setara, yang menunjukkan adanya faktor efisiensi biaya yang berubah-ubah. Secara keseluruhan, garis tren ini memberikan kepastian bahwa strategi untuk mengejar pertumbuhan Sales tetap berada di jalur yang benar untuk mendatangkan keuntungan lebih besar bagi perusahaan.
# Uji Korelasi Spearman
spearman_test <- cor.test(coffee_chain$Sales, coffee_chain$Profit, method = "spearman")
## Warning in cor.test.default(coffee_chain$Sales, coffee_chain$Profit, method =
## "spearman"): Cannot compute exact p-value with ties
print(spearman_test)
##
## Spearman's rank correlation rho
##
## data: coffee_chain$Sales and coffee_chain$Profit
## S = 2909365515, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.7722827
Karena nilai p-value < 0.05, maka kita Tolak H0. Nilai rho sebesar 0.772 menunjukkan adanya hubungan positif yang kuat dan signifikan. Ini berarti setiap kali terjadi peningkatan pada penjualan (Sales), keuntungan (Profit) cenderung mengikuti tren kenaikan tersebut dengan sangat konsisten.
Berdasarkan hasil analisis dan visualisasi data Coffee Chain, dapat disimpulkan bahwa terdapat hubungan yang kuat dan signifikan antara penjualan (Sales) dan keuntungan (Profit). Peningkatan nilai penjualan secara umum diikuti oleh peningkatan keuntungan, yang menunjukkan bahwa strategi peningkatan volume penjualan merupakan faktor penting dalam meningkatkan profitabilitas perusahaan. Namun demikian, hasil visualisasi juga memperlihatkan bahwa besarnya penjualan tidak selalu sebanding dengan keuntungan yang diperoleh. Hal ini disebabkan oleh adanya perbedaan efisiensi biaya operasional di setiap wilayah. Wilayah dengan penjualan tinggi seperti West dan Central memang menghasilkan profit besar, tetapi tidak selalu memiliki margin keuntungan yang optimal. Sebaliknya, wilayah dengan penjualan lebih rendah menunjukkan potensi untuk dikembangkan. Hasil uji statistik memperkuat temuan ini. Uji Kruskal-Wallis menunjukkan adanya perbedaan keuntungan yang signifikan antar wilayah, sedangkan uji korelasi Spearman membuktikan bahwa hubungan antara Sales dan Profit bersifat positif kuat dan signifikan.