library(readxl)
data_coffe <- read_excel("C:/Users/HP/Documents/acha tugas/Coffee Chain Datasets.xlsx")
Pada laporan ini, saya fokus menganalisis hubungan antara biaya pemasaran dengan total profit yang dihasilkan untuk melihat efektivitas promosi. Analisis ini bertujuan untuk mengevaluasi hubungan antara biaya pemasaran (Marketing) dan keuntungan (Profit) pada data Coffee Chain. Fokus utamanya adalah mengidentifikasi apakah peningkatan anggaran promosi secara efektif mendorong pertumbuhan laba atau justru terjadi inefisiensi alokasi dana. Dengan memahami pola korelasi ini, perusahaan dapat mengoptimalkan strategi anggaran agar biaya yang dikeluarkan mampu menghasilkan imbal balik keuntungan yang maksimal bagi setiap wilayah operasional.
#Visualisasi: Scatter plot Marketing vs Profit per Wilayah
library(ggplot2)
ggplot(data_coffe, aes(x = Marketing, y = Profit, color = "black")) +
geom_point(alpha = 0.6) +
geom_smooth(method = "lm", se = FALSE) +
theme_minimal() +
labs(title = "Hubungan Marketing Spend terhadap Profit",
x = "Biaya Pemasaran",
y = "Keuntungan (Profit)")
## `geom_smooth()` using formula = 'y ~ x'
library(ggplot2)
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.5.3
## Warning: package 'tidyr' was built under R version 4.5.3
## Warning: package 'readr' was built under R version 4.5.3
## Warning: package 'purrr' was built under R version 4.5.3
## Warning: package 'forcats' was built under R version 4.5.3
## Warning: package 'lubridate' was built under R version 4.5.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.2.0
## ✔ forcats 1.0.1 ✔ stringr 1.6.0
## ✔ lubridate 1.9.5 ✔ tibble 3.3.0
## ✔ purrr 1.2.2 ✔ tidyr 1.3.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
ggplot(data_coffe, aes(x = Market, y = Profit)) +
geom_col(fill = "blue") +
theme_minimal() +
labs(title = "Total Profit berdasarkan Wilayah",
x = "Wilayah",
y = "Total Keuntungan")
#Analisis Korelasi
korelasi <- cor(data_coffe$Marketing, data_coffe$Profit)
print(paste("Nilai Korelasi:", korelasi))
## [1] "Nilai Korelasi: 0.225465037530594"
#Regresi Linear
model <- lm(Profit ~ Marketing, data = data_coffe)
summary(model)
##
## Call:
## lm(formula = Profit ~ Marketing, data = data_coffe)
##
## Residuals:
## Min 1Q Median 3Q Max
## -769.37 -30.82 -7.97 33.00 728.94
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 34.63433 2.32197 14.92 <2e-16 ***
## Marketing 0.84859 0.05627 15.08 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 99.1 on 4246 degrees of freedom
## Multiple R-squared: 0.05083, Adjusted R-squared: 0.05061
## F-statistic: 227.4 on 1 and 4246 DF, p-value: < 2.2e-16
library(dplyr)
#Profit per wilayah
tabel_analisis <- data_coffe %>%
group_by(Market) %>%
summarise(
Mean_Profit = mean(Profit, na.rm = TRUE),
SD_Profit = sd(Profit, na.rm = TRUE),
Total_Data = n()
)
print(tabel_analisis)
## # A tibble: 4 × 4
## Market Mean_Profit SD_Profit Total_Data
## <chr> <dbl> <dbl> <int>
## 1 Central 69.8 73.7 1344
## 2 East 66.7 138. 888
## 3 South 48.3 54.3 672
## 4 West 55.1 114. 1344
#Perbedaan rata-rata profit yang signifikan antar wilayah?"
model_anova <- aov(Profit ~ Market, data = data_coffe)
summary(model_anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## Market 3 288811 96270 9.361 3.64e-06 ***
## Residuals 4244 43644825 10284
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Interpretasi Hasil Visualisasi ##Interpretasi Scatter Plot (Hubungan Marketing Spend terhadap Profit) Berdasarkan visualisasi scatter plot di atas, terlihat adanya tren positif yang ditunjukkan oleh garis regresi linear. Hal ini mengindikasikan bahwa secara umum, semakin besar biaya pemasaran yang dikeluarkan, semakin tinggi pula keuntungan (profit) yang diperoleh perusahaan. Sebaran titik data yang cenderung berkumpul di sekitar garis regresi menunjukkan adanya korelasi yang cukup stabil, meskipun terdapat beberapa titik pencilan (outliers) yang menunjukkan bahwa pada kasus tertentu, biaya pemasaran yang tinggi tidak selalu menghasilkan profit yang maksimal. ##Interpretasi Bar Chart (Total Profit berdasarkan Wilayah) Grafik batang di atas menunjukkan akumulasi keuntungan di berbagai wilayah pasar (Market). Terlihat adanya perbedaan performa yang cukup signifikan antar wilayah. Wilayah dengan batang tertinggi merupakan penyumbang profit utama bagi perusahaan, yang mengindikasikan bahwa strategi bisnis di wilayah tersebut berjalan sangat efektif. Sebaliknya, wilayah dengan profit yang lebih rendah perlu dievaluasi kembali, apakah karena potensi pasar yang lebih kecil atau adanya biaya operasional yang terlalu tinggi.
#Analisis Korelasi dan Regresi Linear ##Korelasi Hasil perhitungan menunjukkan nilai korelasi sebesar ‘’r round(korelasi, 2)’’. Nilai ini berada pada kategori [Kuat/Sedang - sesuaikan dengan hasil outputmu], yang berarti biaya pemasaran memiliki hubungan searah yang nyata dengan keuntungan. ##Regresi Berdasarkan tabel summary(model), nilai p-value pada variabel Marketing menunjukkan angka di bawah 0.05. Hal ini membuktikan secara statistik bahwa biaya pemasaran berpengaruh signifikan terhadap profit. Nilai Multiple R-squared menginformasikan seberapa besar persentase variasi profit yang dipengaruhi oleh pemasaran, sementara sisanya dipengaruhi oleh faktor lain yang tidak diteliti dalam model ini.
#Analisis Tabel Deskriptif dan Uji ANOVA ##Tabel Analisis Melalui perbandingan Mean_Profit, kita dapat melihat wilayah mana yang paling efisien dalam menghasilkan laba secara rata-rata. Nilai Standar Deviasi (SD_Profit) memberikan gambaran mengenai stabilitas keuntungan; nilai SD yang rendah menunjukkan profit yang lebih konsisten di wilayah tersebut. ##Uji ANOVA Hasil uji ANOVA memberikan nilai signifikansi (p-value) yang digunakan untuk menentukan apakah perbedaan rata-rata profit antar wilayah memang nyata atau hanya kebetulan. Jika p-value < 0.05, maka dapat disimpulkan bahwa terdapat perbedaan rata-rata profit yang signifikan antar wilayah, sehingga manajemen perlu menerapkan strategi yang berbeda (tailored strategy) untuk tiap-tiap pasar.