A. Pendahuluan
Industri coffee chain sangat bergantung pada strategi marketing
untuk meningkatkan penjualan dan profit. Namun, belum tentu peningkatan
biaya marketing selalu menghasilkan profit yang optimal.
Tujuan Analisis:
- Mengetahui perbedaan rata-rata profit berdasarkan tingkat
pengeluaran marketing.
- Menganalisis hubungan marketing, sales, dan profit.
- Menganalisis apakah tingkat pengeluaran marketing berpengaruh
terhadap perbedaan rata-rata profit.
1. Load Library
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
library(readxl)
## Warning: package 'readxl' was built under R version 4.5.3
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
2. Impor data dari excel
Coffe_Chain <- read_excel("1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")
View(Coffe_Chain)
getwd
## function ()
## .Internal(getwd())
## <bytecode: 0x000001fae9e3e8c8>
## <environment: namespace:base>
3. Pemilihan Data
df <- Coffe_Chain%>%
select(Marketing, Sales, Profit) %>%
na.omit()
df
## # A tibble: 4,248 × 3
## Marketing Sales Profit
## <dbl> <dbl> <dbl>
## 1 24 219 94
## 2 27 190 68
## 3 26 234 101
## 4 14 100 30
## 5 15 134 54
## 6 23 180 53
## 7 47 341 99
## 8 57 150 0
## 9 19 140 33
## 10 22 130 17
## # ℹ 4,238 more rows
Insight yang Dapat Diambil dari Data yang Dipilih
Pada analisis ini digunakan tiga variabel utama, yaitu Marketing,
Sales, dan Profit. Variabel Marketing diposisikan sebagai variabel
independen yang dianalisis keterkaitannya dengan Profit sebagai variabel
dependen, sedangkan Sales digunakan sebagai variabel pendukung dalam
memahami pola data.
Dari pemilihan variabel tersebut, beberapa insight yang dapat
diperoleh antara lain:
1. Mengetahui karakteristik data melalui analisis statistika
deskriptif pada variabel Marketing, Sales, dan Profit.
2. Mengelompokkan variabel Marketing ke dalam tiga kategori, yaitu
Low, Medium, dan High, untuk mempermudah analisis perbandingan.
3. Menganalisis perbedaan rata-rata Profit pada setiap kategori
Marketing.
4. Mengamati pola hubungan antara Marketing dan Profit melalui
sebaran data.
5. Menyajikan perbandingan rata-rata Profit antar kategori Marketing
dalam bentuk visualisasi.
Melalui analisis ini diharapkan dapat diperoleh gambaran mengenai
bagaimana tingkat pengeluaran marketing berkaitan dengan profit yang
dihasilkan.
B. Analisis Data
1. Statistika Deskriptif
summary(df)
## Marketing Sales Profit
## Min. : 0.00 Min. : 17 Min. :-638.0
## 1st Qu.: 13.00 1st Qu.:100 1st Qu.: 17.0
## Median : 22.00 Median :138 Median : 40.0
## Mean : 31.19 Mean :193 Mean : 61.1
## 3rd Qu.: 39.00 3rd Qu.:230 3rd Qu.: 92.0
## Max. :156.00 Max. :912 Max. : 778.0
2. Dataframe Baru Untuk Kategori Marketing
df$Marketing_Category <- cut(df$Marketing,
breaks = quantile(df$Marketing, probs = c(0, 0.33, 0.66, 1), na.rm = TRUE),
labels = c("Low", "Medium", "High"),
include.lowest = TRUE)
3. Ringkasan statistik untuk Setiap Kategori Marketing
summary_df <- df %>%
group_by(Marketing_Category) %>%
summarise(
avg_profit = mean(Profit, na.rm = TRUE),
avg_sales = mean(Sales, na.rm = TRUE),
n = n()
)
summary_df$Marketing_Category <- factor(summary_df$Marketing_Category,
levels = c("Low", "Medium", "High"))
summary_df
## # A tibble: 3 × 4
## Marketing_Category avg_profit avg_sales n
## <fct> <dbl> <dbl> <int>
## 1 Low 26.3 85.1 1462
## 2 Medium 67.7 177. 1368
## 3 High 90.6 319. 1418
4. Visualisasi Data
a. Rata-rata Profit per Kategori Marketing
ggplot(summary_df, aes(x = Marketing_Category, y = avg_profit,
fill = Marketing_Category)) +
geom_col() +
scale_fill_manual(values = c(
"Low" = "#6EC3E6",
"Medium" = "#4C9ED4",
"High" = "#0A3463"
)) +
labs(title = "Rata-rata Profit per Kategori Marketing",
x = "Kategori Marketing",
y = "Rata-rata Profit")

Interpretasi Hasil Visualisasi
Dari visualisasi tersbut dapat dilihat bahwa kategori marketing
“Medium” memiliki rata-rata profit tertinggi dibandingkan dengan
kategori “Low” dan “High”. Hal ini menunjukkan bahwa peningkatan biaya
marketing tidak selalu diikuti dengan peningkatan profit yang
sebanding.
b. Sebaran Marketing vs Profit
ggplot(df, aes(x = Marketing, y = Profit)) +
geom_point(alpha = 0.6, color = "#055169") +
labs(title = "Sebaran Marketing vs Profit")

Interpretasi Hasil Visualisasi
5. Analisis Data Statistik
anova_model <- aov(Profit ~ Marketing_Category, data = df)
summary(anova_model)
## Df Sum Sq Mean Sq F value Pr(>F)
## Marketing_Category 2 3064747 1532374 159.2 <2e-16 ***
## Residuals 4245 40868889 9628
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Interpretasi Hasil Analisis Data Statistik
Berdasarkan visualisasi, terlihat bahwa rata-rata profit berbeda
antar kategori marketing, dimana kategori Medium memiliki rata-rata
profit tertinggi dibandingkan kategori lainnya. Hasil uji ANOVA
menunjukkan bahwa nilai p-value < 0.05, sehingga dapat disimpulkan
bahwa terdapat perbedaan rata-rata profit yang signifikan antar kategori
marketing. Hal ini menunjukkan bahwa tingkat pengeluaran marketing
berpengaruh terhadap profit yang diperoleh.
C. Kesimpulan
Berdasarkan hasil analisis yang telah dilakukan, dapat disimpulkan
bahwa:
1. Variabel Marketing, Sales, dan Profit memiliki karakteristik data
yang berbeda dan saling berkaitan dalam analisis performa coffee
chain.
2. Pengelompokan Marketing menjadi kategori Low, Medium, dan High
membantu dalam memahami perbedaan rata-rata profit antar kelompok.