A. Pendahuluan

Industri coffee chain sangat bergantung pada strategi marketing untuk meningkatkan penjualan dan profit. Namun, belum tentu peningkatan biaya marketing selalu menghasilkan profit yang optimal.

Tujuan Analisis:

- Mengetahui perbedaan rata-rata profit berdasarkan tingkat pengeluaran marketing.

- Menganalisis hubungan marketing, sales, dan profit.

- Menganalisis apakah tingkat pengeluaran marketing berpengaruh terhadap perbedaan rata-rata profit.

1. Load Library

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
library(readxl)
## Warning: package 'readxl' was built under R version 4.5.3
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

2. Impor data dari excel

Coffe_Chain <- read_excel("1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")
View(Coffe_Chain)
getwd
## function () 
## .Internal(getwd())
## <bytecode: 0x000001fae9e3e8c8>
## <environment: namespace:base>

3. Pemilihan Data

df <- Coffe_Chain%>%
  select(Marketing, Sales, Profit) %>%
  na.omit()
df
## # A tibble: 4,248 × 3
##    Marketing Sales Profit
##        <dbl> <dbl>  <dbl>
##  1        24   219     94
##  2        27   190     68
##  3        26   234    101
##  4        14   100     30
##  5        15   134     54
##  6        23   180     53
##  7        47   341     99
##  8        57   150      0
##  9        19   140     33
## 10        22   130     17
## # ℹ 4,238 more rows

Insight yang Dapat Diambil dari Data yang Dipilih

Pada analisis ini digunakan tiga variabel utama, yaitu Marketing, Sales, dan Profit. Variabel Marketing diposisikan sebagai variabel independen yang dianalisis keterkaitannya dengan Profit sebagai variabel dependen, sedangkan Sales digunakan sebagai variabel pendukung dalam memahami pola data.

Dari pemilihan variabel tersebut, beberapa insight yang dapat diperoleh antara lain:

1. Mengetahui karakteristik data melalui analisis statistika deskriptif pada variabel Marketing, Sales, dan Profit.

2. Mengelompokkan variabel Marketing ke dalam tiga kategori, yaitu Low, Medium, dan High, untuk mempermudah analisis perbandingan.

3. Menganalisis perbedaan rata-rata Profit pada setiap kategori Marketing.

4. Mengamati pola hubungan antara Marketing dan Profit melalui sebaran data.

5. Menyajikan perbandingan rata-rata Profit antar kategori Marketing dalam bentuk visualisasi.

Melalui analisis ini diharapkan dapat diperoleh gambaran mengenai bagaimana tingkat pengeluaran marketing berkaitan dengan profit yang dihasilkan.

B. Analisis Data

1. Statistika Deskriptif

summary(df)
##    Marketing          Sales         Profit      
##  Min.   :  0.00   Min.   : 17   Min.   :-638.0  
##  1st Qu.: 13.00   1st Qu.:100   1st Qu.:  17.0  
##  Median : 22.00   Median :138   Median :  40.0  
##  Mean   : 31.19   Mean   :193   Mean   :  61.1  
##  3rd Qu.: 39.00   3rd Qu.:230   3rd Qu.:  92.0  
##  Max.   :156.00   Max.   :912   Max.   : 778.0

2. Dataframe Baru Untuk Kategori Marketing

df$Marketing_Category <- cut(df$Marketing,
                            breaks = quantile(df$Marketing, probs = c(0, 0.33, 0.66, 1), na.rm = TRUE),
                            labels = c("Low", "Medium", "High"),
                            include.lowest = TRUE)

3. Ringkasan statistik untuk Setiap Kategori Marketing

summary_df <- df %>%
  group_by(Marketing_Category) %>%
  summarise(
    avg_profit = mean(Profit, na.rm = TRUE),
    avg_sales = mean(Sales, na.rm = TRUE),
    n = n()
  )
summary_df$Marketing_Category <- factor(summary_df$Marketing_Category,
                                       levels = c("Low", "Medium", "High"))
summary_df 
## # A tibble: 3 × 4
##   Marketing_Category avg_profit avg_sales     n
##   <fct>                   <dbl>     <dbl> <int>
## 1 Low                      26.3      85.1  1462
## 2 Medium                   67.7     177.   1368
## 3 High                     90.6     319.   1418

4. Visualisasi Data

a. Rata-rata Profit per Kategori Marketing

ggplot(summary_df, aes(x = Marketing_Category, y = avg_profit,
                       fill = Marketing_Category)) +
  geom_col() +
  scale_fill_manual(values = c(
    "Low" = "#6EC3E6",     
    "Medium" = "#4C9ED4",  
    "High" = "#0A3463"
  )) +
  labs(title = "Rata-rata Profit per Kategori Marketing",
       x = "Kategori Marketing",
       y = "Rata-rata Profit")

Interpretasi Hasil Visualisasi

Dari visualisasi tersbut dapat dilihat bahwa kategori marketing “Medium” memiliki rata-rata profit tertinggi dibandingkan dengan kategori “Low” dan “High”. Hal ini menunjukkan bahwa peningkatan biaya marketing tidak selalu diikuti dengan peningkatan profit yang sebanding.

b. Sebaran Marketing vs Profit

ggplot(df, aes(x = Marketing, y = Profit)) +
  geom_point(alpha = 0.6, color = "#055169") +
  labs(title = "Sebaran Marketing vs Profit")

Interpretasi Hasil Visualisasi

Dari visualisasi tersebut, terlihat bahwa profit cenderung meningkat seiring dengan peningkatan marketing, namun terdapat variasi yang cukup besar pada beberapa titik data. Hal ini menunjukkan bahwa selain marketing, terdapat faktor lain yang juga memengaruhi profit.

5. Analisis Data Statistik

anova_model <- aov(Profit ~ Marketing_Category, data = df)
summary(anova_model)
##                      Df   Sum Sq Mean Sq F value Pr(>F)    
## Marketing_Category    2  3064747 1532374   159.2 <2e-16 ***
## Residuals          4245 40868889    9628                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretasi Hasil Analisis Data Statistik

Berdasarkan visualisasi, terlihat bahwa rata-rata profit berbeda antar kategori marketing, dimana kategori Medium memiliki rata-rata profit tertinggi dibandingkan kategori lainnya. Hasil uji ANOVA menunjukkan bahwa nilai p-value < 0.05, sehingga dapat disimpulkan bahwa terdapat perbedaan rata-rata profit yang signifikan antar kategori marketing. Hal ini menunjukkan bahwa tingkat pengeluaran marketing berpengaruh terhadap profit yang diperoleh.

C. Kesimpulan

Berdasarkan hasil analisis yang telah dilakukan, dapat disimpulkan bahwa:

1. Variabel Marketing, Sales, dan Profit memiliki karakteristik data yang berbeda dan saling berkaitan dalam analisis performa coffee chain.

2. Pengelompokan Marketing menjadi kategori Low, Medium, dan High membantu dalam memahami perbedaan rata-rata profit antar kelompok.

3. Hasil visualisasi menunjukkan adanya perbedaan rata-rata profit pada setiap kategori marketing.

4. Hasil uji ANOVA menunjukkan bahwa terdapat perbedaan rata-rata profit yang signifikan antar kategori marketing.