Pendahuluan

Dalam industri retail seperti Coffee Chain, profit merupakan indikator utama dalam menilai keberhasilan suatu bisnis. Perusahaan perlu memahami faktor-faktor yang mempengaruhi profit agar dapat merancang strategi yang efektif dalam meningkatkan kinerja keuangan.

Dataset Coffee Chain menyediakan berbagai informasi terkait penjualan, biaya, serta karakteristik pasar yang dapat digunakan untuk menganalisis faktor-faktor yang berpengaruh terhadap profit.

Tujuan Analisis

Analisis ini bertujuan untuk:

  1. Mengidentifikasi hubungan antara Sales dan Profit
  2. Menganalisis pengaruh COGS dan Marketing terhadap Profit
  3. Mengetahui pengaruh Market Size dan Product Type terhadap Profit
  4. Memberikan rekomendasi strategi berdasarkan hasil analisis

Import Library dan Data

library(readxl)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
data <- read_excel("D:/febry/Documents/Tugas SIM 2025B - Coffee Chain Datasets.xlsx")
names(data) <- make.names(names(data))

Statistik Deskriptif

summary(data[, c("Profit", "Sales", "COGS", "Marketing", "Total.Expenses")])
##      Profit           Sales          COGS          Marketing     
##  Min.   :-638.0   Min.   : 17   Min.   :  0.00   Min.   :  0.00  
##  1st Qu.:  17.0   1st Qu.:100   1st Qu.: 43.00   1st Qu.: 13.00  
##  Median :  40.0   Median :138   Median : 60.00   Median : 22.00  
##  Mean   :  61.1   Mean   :193   Mean   : 84.43   Mean   : 31.19  
##  3rd Qu.:  92.0   3rd Qu.:230   3rd Qu.:100.00   3rd Qu.: 39.00  
##  Max.   : 778.0   Max.   :912   Max.   :364.00   Max.   :156.00  
##  Total.Expenses  
##  Min.   : 10.00  
##  1st Qu.: 33.00  
##  Median : 46.00  
##  Mean   : 54.06  
##  3rd Qu.: 65.00  
##  Max.   :190.00

Visualisasi Data

Hubungan Sales dan Profit

ggplot(data, aes(x = Sales, y = Profit)) +
  geom_point(alpha = 0.6, color = "deeppink") +
  geom_smooth(method = "lm", se = FALSE, color = "hotpink") +
  labs(title = "Hubungan antara Sales dan Profit",
       x = "Sales",
       y = "Profit") +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

Distribusi Profit Berdasarkan Market Size

ggplot(data, aes(x = Market.Size, y = Profit)) +
  geom_boxplot(fill = "lightpink") +
  labs(title = "Distribusi Profit Berdasarkan Market Size",
       x = "Market Size",
       y = "Profit") +
  theme_minimal()

Rata-rata Profit per Product Type

data %>%
  group_by(Product.Type) %>%
  summarise(AvgProfit = mean(Profit)) %>%
  ggplot(aes(x = reorder(Product.Type, AvgProfit), y = AvgProfit)) +
  geom_col(fill = "pink") +
  coord_flip() +
  labs(title = "Rata-rata Profit per Product Type",
       x = "Product Type",
       y = "Average Profit") +
  theme_minimal()

Analisis Regresi Linear Berganda

Model regresi digunakan untuk mengetahui pengaruh variabel Sales, COGS, Marketing, Market Size, dan Product Type terhadap Profit.

model <- lm(Profit ~ Sales + COGS + Marketing + Market.Size + Product.Type,
            data = data)
summary(model)
## 
## Call:
## lm(formula = Profit ~ Sales + COGS + Marketing + Market.Size + 
##     Product.Type, data = data)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -122.126  -11.552   -0.028    9.946  102.049 
## 
## Coefficients:
##                          Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             -23.16315    0.94017 -24.637  < 2e-16 ***
## Sales                     1.19365    0.00452 264.093  < 2e-16 ***
## COGS                     -1.20358    0.01243 -96.842  < 2e-16 ***
## Marketing                -1.45421    0.02030 -71.633  < 2e-16 ***
## Market.SizeSmall Market  -3.07450    0.67370  -4.564 5.17e-06 ***
## Product.TypeEspresso      3.64762    0.86564   4.214 2.56e-05 ***
## Product.TypeHerbal Tea    3.39911    0.88926   3.822 0.000134 ***
## Product.TypeTea           3.80318    0.91391   4.161 3.22e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.37 on 4240 degrees of freedom
## Multiple R-squared:  0.9599, Adjusted R-squared:  0.9599 
## F-statistic: 1.452e+04 on 7 and 4240 DF,  p-value: < 2.2e-16
# Model Regresi

\[ \hat{Profit} = -23.163 + 1.194(Sales) - 1.204(COGS) - 1.454(Marketing) - 3.075(Small\ Market) + 3.648(Espresso) + 3.399(Herbal\ Tea) + 3.803(Tea) \]

Interpretasi dan Hasil Analisis

Berdasarkan hasil analisis regresi:

Kesimpulan dan Rekomendasi

Berdasarkan hasil analisis, dapat disimpulkan bahwa Profit pada Coffee Chain sangat dipengaruhi oleh variabel Sales, COGS, Marketing, Market Size, dan Product Type.

Variabel Sales menjadi faktor utama yang meningkatkan profit, sementara COGS dan Marketing menjadi faktor yang menekan profit. Selain itu, ukuran pasar dan jenis produk juga memberikan kontribusi yang signifikan terhadap variasi profit.

Dengan nilai R-squared yang sangat tinggi (95.99%), model ini mampu menjelaskan sebagian besar variasi profit sehingga dapat digunakan sebagai dasar pengambilan keputusan bisnis.

Rekomendasi yang dapat diberikan adalah: