1. Pendahuluan

Dataset Coffee Chain digunakan untuk menganalisis faktor-faktor yang memengaruhi profit dan penjualan. Dalam analisis ini, fokus utama adalah pada hubungan antara marketing, market, sales, dan profit.

Tujuan analisis:

  1. Mengetahui hubungan antara marketing dan profit
  2. Membandingkan performa penjualan antar market
  3. Mengidentifikasi faktor yang memengaruhi profit

2. Load Data

library(readxl)
## Warning: package 'readxl' was built under R version 4.5.2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.5.2
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
data <- read_excel("C:/Users/ACER/Downloads/1. Tugas SIM 2025B - Coffee Chain Datasets (1)/1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")
head(data)
## # A tibble: 6 × 20
##   `Area Code` Date                Market  `Market Size` Product   `Product Line`
##         <dbl> <dttm>              <chr>   <chr>         <chr>     <chr>         
## 1         719 2012-01-01 00:00:00 Central Major Market  Amaretto  Beans         
## 2         970 2012-01-01 00:00:00 Central Major Market  Colombian Beans         
## 3         970 2012-01-01 00:00:00 Central Major Market  Decaf Ir… Beans         
## 4         303 2012-01-01 00:00:00 Central Major Market  Green Tea Leaves        
## 5         303 2012-01-01 00:00:00 Central Major Market  Caffe Mo… Beans         
## 6         720 2012-01-01 00:00:00 Central Major Market  Decaf Es… Beans         
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## #   `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## #   `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## #   Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>

3. Deskripsi Data

Dataset ini terdiri dari beberapa variabel penting, yaitu:

Analisis difokuskan pada bagaimana marketing dan market memengaruhi profit dan sales.

4. Visualisasi 1: Hubungan Marketing dan Profit

Grafik berikut menunjukkan hubungan antara biaya marketing dan profit.

ggplot(data, aes(x = Marketing, y = Profit, color = Market)) +
  geom_point(size = 2, alpha = 0.7) +
  geom_smooth(method = "lm", formula = y ~ x, se = FALSE, linewidth = 1) +
  scale_color_brewer(palette = "Dark2") +
  labs(
    title = "Hubungan Marketing terhadap Profit",
    x = "Biaya Marketing",
    y = "Profit",
    color = "Market",
    caption = "Sumber: Coffee Chain Dataset"
  )

Analisis:

cor(data$Marketing, data$Profit, use = "complete.obs")
## [1] 0.225465

Interpretasi:

Dari grafik terlihat adanya hubungan antara marketing dan profit. Nilai korelasi menunjukkan bahwa semakin besar biaya marketing, profit cenderung meningkat (sesuaikan dengan output hasil korelasi).

5. Visualisasi 2: Perbandingan Sales antar Market

data_market <- data %>%
  group_by(Market) %>%
  summarise(Total_Sales = sum(Sales, na.rm = TRUE))

ggplot(data_market, aes(x = reorder(Market, Total_Sales), 
                        y = Total_Sales, fill = Market)) +
  geom_bar(stat = "identity", width = 0.7) +
  scale_fill_brewer(palette = "Dark2") +
  labs(
    title = "Total Sales per Market",
    x = "Market",
    y = "Total Sales",
    caption = "Sumber: Coffee Chain Dataset"
  ) +
  theme(legend.position = "none")

Analisis:

data_market
## # A tibble: 4 × 2
##   Market  Total_Sales
##   <chr>         <dbl>
## 1 Central      265045
## 2 East         178576
## 3 South        103926
## 4 West         272264

Interpretasi:

Region dengan total sales tertinggi adalah West Hal ini menunjukkan bahwa wilayah tersebut memiliki permintaan yang lebih tinggi dibanding wilayah lainnya.

6. Visualisasi 3: Profit berdasarkan Product

data_product <- data %>%
  group_by(Product) %>%
  summarise(Total_Profit = sum(Profit, na.rm = TRUE))

ggplot(data_product, aes(x = reorder(Product, Total_Profit), 
                         y = Total_Profit, fill = Product)) +
  geom_bar(stat = "identity", width = 0.7) +
  scale_fill_manual(values = scales::hue_pal()(13)) +
  labs(
    title = "Profit berdasarkan Produk",
    x = "Produk",
    y = "Total Profit",
    caption = "Sumber: Coffee Chain Dataset"
  ) +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1),
    legend.position = "none"
  )

Analisis:

data_product
## # A tibble: 13 × 2
##    Product           Total_Profit
##    <chr>                    <dbl>
##  1 Amaretto                  4890
##  2 Caffe Latte              11375
##  3 Caffe Mocha              17678
##  4 Chamomile                27231
##  5 Colombian                55804
##  6 Darjeeling               29053
##  7 Decaf Espresso           29502
##  8 Decaf Irish Cream        13989
##  9 Earl Grey                24164
## 10 Green Tea                 -231
## 11 Lemon                    29869
## 12 Mint                      6154
## 13 Regular Espresso         10065

Interpretasi:

Produk dengan profit tertinggi adalah Colombian Sedangkan produk dengan profit terendah adalah Green Tea Hal ini dapat disebabkan oleh perbedaan permintaan atau strategi pricing.

7. Analisis Tambahan: Pengaruh Simultan (Regresi Linear)

model <- lm(Profit ~ Marketing + Sales, data = data)
summary(model)
## 
## Call:
## lm(formula = Profit ~ Marketing + Sales, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -334.62  -13.59   -0.19   15.64  276.60 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -25.172413   0.931639  -27.02   <2e-16 ***
## Marketing    -2.592300   0.029526  -87.80   <2e-16 ***
## Sales         0.865916   0.005279  164.02   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 36.59 on 4245 degrees of freedom
## Multiple R-squared:  0.8706, Adjusted R-squared:  0.8706 
## F-statistic: 1.428e+04 on 2 and 4245 DF,  p-value: < 2.2e-16

Interpretasi:

Hasil regresi menunjukkan bahwa: -Marketing memiliki pengaruh terhadap profit -Sales memiliki pengaruh positif terhadap profit Hal ini menunjukkan bahwa profit dipengaruhi oleh aktivitas pemasaran dan tingkat penjualan.

8. Kesimpulan

Berdasarkan analisis yang dilakukan:

  1. Marketing memiliki hubungan dengan profit
  2. Market tertentu memiliki performa penjualan lebih tinggi
  3. Produk tertentu memberikan kontribusi profit terbesar
  4. Sales merupakan faktor penting dalam meningkatkan profit

Analisis ini menunjukkan bahwa strategi bisnis perlu mempertimbangkan keseimbangan antara biaya marketing dan peningkatan penjualan untuk memaksimalkan profit.