Nama : Faza Aruna Hermawan

NIM : M07250238

Kelas : D

1. MENGIMPOR DATA COFFEE CHAIN

library(readxl)

coffee_chain <- read_excel("D:/SEMESTER 2/SIM/1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")

coffee_chain
## # A tibble: 4,248 × 20
##    `Area Code` Date                Market  `Market Size` Product  `Product Line`
##          <dbl> <dttm>              <chr>   <chr>         <chr>    <chr>         
##  1         719 2012-01-01 00:00:00 Central Major Market  Amaretto Beans         
##  2         970 2012-01-01 00:00:00 Central Major Market  Colombi… Beans         
##  3         970 2012-01-01 00:00:00 Central Major Market  Decaf I… Beans         
##  4         303 2012-01-01 00:00:00 Central Major Market  Green T… Leaves        
##  5         303 2012-01-01 00:00:00 Central Major Market  Caffe M… Beans         
##  6         720 2012-01-01 00:00:00 Central Major Market  Decaf E… Beans         
##  7         970 2012-01-01 00:00:00 Central Major Market  Chamomi… Leaves        
##  8         719 2012-01-01 00:00:00 Central Major Market  Lemon    Leaves        
##  9         970 2012-01-01 00:00:00 Central Major Market  Mint     Leaves        
## 10         719 2012-01-01 00:00:00 Central Major Market  Darjeel… Leaves        
## # ℹ 4,238 more rows
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## #   `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## #   `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## #   Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
head(coffee_chain)
## # A tibble: 6 × 20
##   `Area Code` Date                Market  `Market Size` Product   `Product Line`
##         <dbl> <dttm>              <chr>   <chr>         <chr>     <chr>         
## 1         719 2012-01-01 00:00:00 Central Major Market  Amaretto  Beans         
## 2         970 2012-01-01 00:00:00 Central Major Market  Colombian Beans         
## 3         970 2012-01-01 00:00:00 Central Major Market  Decaf Ir… Beans         
## 4         303 2012-01-01 00:00:00 Central Major Market  Green Tea Leaves        
## 5         303 2012-01-01 00:00:00 Central Major Market  Caffe Mo… Beans         
## 6         720 2012-01-01 00:00:00 Central Major Market  Decaf Es… Beans         
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## #   `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## #   `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## #   Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
summary(coffee_chain)
##    Area Code          Date                        Market         
##  Min.   :203.0   Min.   :2012-01-01 00:00:00   Length:4248       
##  1st Qu.:417.0   1st Qu.:2012-06-23 12:00:00   Class :character  
##  Median :573.0   Median :2012-12-16 12:00:00   Mode  :character  
##  Mean   :582.3   Mean   :2012-12-15 22:00:00                     
##  3rd Qu.:772.0   3rd Qu.:2013-06-08 12:00:00                     
##  Max.   :985.0   Max.   :2013-12-01 00:00:00                     
##  Market Size          Product          Product Line       Product Type      
##  Length:4248        Length:4248        Length:4248        Length:4248       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##     State               Type            Budget COGS     Budget Margin   
##  Length:4248        Length:4248        Min.   :  0.00   Min.   :-210.0  
##  Class :character   Class :character   1st Qu.: 30.00   1st Qu.:  50.0  
##  Mode  :character   Mode  :character   Median : 50.00   Median :  70.0  
##                                        Mean   : 74.83   Mean   : 100.8  
##                                        3rd Qu.: 90.00   3rd Qu.: 130.0  
##                                        Max.   :450.00   Max.   : 690.0  
##  Budget Profit      Budget Sales         COGS          Inventory      
##  Min.   :-320.00   Min.   :   0.0   Min.   :  0.00   Min.   :-3534.0  
##  1st Qu.:  20.00   1st Qu.:  80.0   1st Qu.: 43.00   1st Qu.:  432.0  
##  Median :  40.00   Median : 130.0   Median : 60.00   Median :  619.0  
##  Mean   :  60.91   Mean   : 175.6   Mean   : 84.43   Mean   :  749.4  
##  3rd Qu.:  80.00   3rd Qu.: 210.0   3rd Qu.:100.00   3rd Qu.:  910.5  
##  Max.   : 560.00   Max.   :1140.0   Max.   :364.00   Max.   : 8252.0  
##      Margin          Marketing          Profit           Sales    
##  Min.   :-302.00   Min.   :  0.00   Min.   :-638.0   Min.   : 17  
##  1st Qu.:  52.75   1st Qu.: 13.00   1st Qu.:  17.0   1st Qu.:100  
##  Median :  76.00   Median : 22.00   Median :  40.0   Median :138  
##  Mean   : 104.29   Mean   : 31.19   Mean   :  61.1   Mean   :193  
##  3rd Qu.: 132.00   3rd Qu.: 39.00   3rd Qu.:  92.0   3rd Qu.:230  
##  Max.   : 613.00   Max.   :156.00   Max.   : 778.0   Max.   :912  
##  Total Expenses  
##  Min.   : 10.00  
##  1st Qu.: 33.00  
##  Median : 46.00  
##  Mean   : 54.06  
##  3rd Qu.: 65.00  
##  Max.   :190.00

2. Deskripsi Insight

Analisis ini bertujuan untuk mengetahui pengaruh besarnya Sales (total penjualan) terhadap Profit (keuntungan) yang diperoleh perusahaan. Dalam konteks ini, variabel Sales ditempatkan sebagai variabel independen, sedangkan Profit sebagai variabel dependen yang mencerminkan profitabilitas bersih setelah dikurangi seluruh beban operasional. Visualisasi berupa Bar Chart digunakan untuk membandingkan besaran Sales dan Profit di berbagai wilayah pasar, sementara Garis Tren (Trendline) ditambahkan untuk memperjelas arah hubungan serta stabilitas pertumbuhan keduanya dari waktu ke waktu. Hasil analisis menunjukkan adanya korelasi positif yang signifikan; peningkatan batang Sales secara konsisten diikuti oleh kenaikan pada garis tren Profit. Namun, fluktuasi jarak antara puncak batang dan titik garis menunjukkan bahwa efisiensi biaya operasional memegang peranan penting dalam menentukan margin keuntungan. Oleh karena itu, strategi peningkatan volume penjualan yang dibarengi dengan pengendalian biaya yang ketat menjadi faktor krusial dalam memaksimalkan profitabilitas perusahaan.

3. Visualisasi Insight

A. Visualisasi Bar Chart

library(tidyr)
## Warning: package 'tidyr' was built under R version 4.5.3
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.3
# Persiapan data: Agregasi Sales dan Profit per Market
comparison_data <- aggregate(cbind(Sales, Profit) ~ Market, data = coffee_chain, sum)
# Mengubah format data menjadi 'long' agar bisa dibuat grouped bar
comparison_long <- pivot_longer(comparison_data, cols = c(Sales, Profit), 
                                names_to = "Metric", values_to = "Amount")

ggplot(comparison_long, aes(x = Market, y = Amount, fill = Metric)) +
  geom_bar(stat = "identity", position = "dodge") +
  scale_fill_manual(values = c("Sales" = "darkgreen", "Profit" = "pink")) +
  theme_minimal() +
  labs(title = "Total Sales vs Total Profit per Market", y = "Total Nilai")

Interpretasi :

Visualisasi ini menunjukkan bahwa wilayah West dan Central memiliki volume penjualan (Sales) yang jauh lebih tinggi dibandingkan dengan wilayah East dan South. Namun, jika diperhatikan secara saksama, proporsi keuntungan (Profit) yang dihasilkan tidak setinggi volume penjualannya. Hal ini mengindikasikan bahwa meskipun pasar di wilayah West sangat besar, biaya operasional dan harga pokok penjualan di sana juga sangat tinggi. Sementara itu, wilayah South menunjukkan angka terendah pada kedua variabel, yang menandakan bahwa wilayah ini masih memiliki skala bisnis yang kecil dan memerlukan strategi penetrasi pasar yang lebih agresif untuk menyamai wilayah lainnya.

Analisis Metode Statistika

Hipotesis: H0: Tidak terdapat perbedaan keuntungan yang signifikan antar wilayah. H1: Terdapat perbedaan keuntungan yang signifikan antar wilayah.

# Uji Kruskal-Wallis
kruskal_test <- kruskal.test(Profit ~ Market, data = coffee_chain)
print(kruskal_test)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Profit by Market
## Kruskal-Wallis chi-squared = 26.504, df = 3, p-value = 7.48e-06

Karena nilai p-value < 0.05, maka kita Tolak H0. Hal ini membuktikan bahwa terdapat perbedaan keuntungan yang sangat signifikan secara statistik di antara keempat wilayah tersebut (Central, East, South, West). Jika melihat grafik batang, wilayah Central dan West secara konsisten mendominasi perolehan profit, sementara South berada di posisi terendah.

B. Visualisasi Garis Tren

library(ggplot2)
# Agregasi data berdasarkan tanggal
time_data <- aggregate(cbind(Sales, Profit) ~ Date, data = coffee_chain, sum)
time_long <- pivot_longer(time_data, cols = c(Sales, Profit), 
                          names_to = "Metric", values_to = "Value")

ggplot(time_long, aes(x = as.Date(Date), y = Value, color = Metric)) +
  geom_line(size = 1) +
  theme_minimal() +
  labs(title = "Tren Sales dan Profit Bulanan", x = "Waktu", y = "Nilai")
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Interpretasi :

Garis tren menunjukkan adanya hubungan positif yang konsisten. Artinya, setiap kali terjadi peningkatan pada angka penjualan, keuntungan cenderung ikut bergerak naik. Kemiringan (slope) pada garis tren ini membuktikan bahwa volume penjualan merupakan faktor penentu utama bagi profitabilitas perusahaan. Namun, fluktuasi yang terjadi pada garis tersebut juga mengisyaratkan bahwa hubungan ini tidak sepenuhnya linear sempurna. Terdapat momen di mana kenaikan penjualan yang tajam tidak menghasilkan lonjakan keuntungan yang setara, yang menunjukkan adanya faktor efisiensi biaya yang berubah-ubah. Secara keseluruhan, garis tren ini memberikan kepastian bahwa strategi untuk mengejar pertumbuhan Sales tetap berada di jalur yang benar untuk mendatangkan keuntungan lebih besar bagi perusahaan.

Analisis Metode Statistika

# Uji Korelasi Spearman
spearman_test <- cor.test(coffee_chain$Sales, coffee_chain$Profit, method = "spearman")
## Warning in cor.test.default(coffee_chain$Sales, coffee_chain$Profit, method =
## "spearman"): Cannot compute exact p-value with ties
print(spearman_test)
## 
##  Spearman's rank correlation rho
## 
## data:  coffee_chain$Sales and coffee_chain$Profit
## S = 2909365515, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.7722827

Karena nilai p-value < 0.05, maka kita Tolak H0. Nilai rho sebesar 0.772 menunjukkan adanya hubungan positif yang kuat dan signifikan. Ini berarti setiap kali terjadi peningkatan pada penjualan (Sales), keuntungan (Profit) cenderung mengikuti tren kenaikan tersebut dengan sangat konsisten.

4. Kesimpulan

Berdasarkan hasil analisis dan visualisasi data Coffee Chain, dapat disimpulkan bahwa terdapat hubungan yang kuat dan signifikan antara penjualan (Sales) dan keuntungan (Profit). Peningkatan nilai penjualan secara umum diikuti oleh peningkatan keuntungan, yang menunjukkan bahwa strategi peningkatan volume penjualan merupakan faktor penting dalam meningkatkan profitabilitas perusahaan. Namun demikian, hasil visualisasi juga memperlihatkan bahwa besarnya penjualan tidak selalu sebanding dengan keuntungan yang diperoleh. Hal ini disebabkan oleh adanya perbedaan efisiensi biaya operasional di setiap wilayah. Wilayah dengan penjualan tinggi seperti West dan Central memang menghasilkan profit besar, tetapi tidak selalu memiliki margin keuntungan yang optimal. Sebaliknya, wilayah dengan penjualan lebih rendah menunjukkan potensi untuk dikembangkan. Hasil uji statistik memperkuat temuan ini. Uji Kruskal-Wallis menunjukkan adanya perbedaan keuntungan yang signifikan antar wilayah, sedangkan uji korelasi Spearman membuktikan bahwa hubungan antara Sales dan Profit bersifat positif kuat dan signifikan.