Dataset Coffee Chain digunakan untuk menganalisis faktor-faktor yang memengaruhi profit dan penjualan. Dalam analisis ini, fokus utama adalah pada hubungan antara marketing, market, sales, dan profit.
Tujuan analisis:
library(readxl)
## Warning: package 'readxl' was built under R version 4.5.2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.5.2
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
data <- read_excel("C:/Users/ACER/Downloads/1. Tugas SIM 2025B - Coffee Chain Datasets (1)/1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")
head(data)
## # A tibble: 6 × 20
## `Area Code` Date Market `Market Size` Product `Product Line`
## <dbl> <dttm> <chr> <chr> <chr> <chr>
## 1 719 2012-01-01 00:00:00 Central Major Market Amaretto Beans
## 2 970 2012-01-01 00:00:00 Central Major Market Colombian Beans
## 3 970 2012-01-01 00:00:00 Central Major Market Decaf Ir… Beans
## 4 303 2012-01-01 00:00:00 Central Major Market Green Tea Leaves
## 5 303 2012-01-01 00:00:00 Central Major Market Caffe Mo… Beans
## 6 720 2012-01-01 00:00:00 Central Major Market Decaf Es… Beans
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## # `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## # `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## # Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
Dataset ini terdiri dari beberapa variabel penting, yaitu:
Analisis difokuskan pada bagaimana marketing dan market memengaruhi profit dan sales.
Grafik berikut menunjukkan hubungan antara biaya marketing dan profit.
ggplot(data, aes(x = Marketing, y = Profit, color = Market)) +
geom_point(size = 2, alpha = 0.7) +
geom_smooth(method = "lm", formula = y ~ x, se = FALSE, linewidth = 1) +
scale_color_brewer(palette = "Dark2") +
labs(
title = "Hubungan Marketing terhadap Profit",
x = "Biaya Marketing",
y = "Profit",
color = "Market",
caption = "Sumber: Coffee Chain Dataset"
)
cor(data$Marketing, data$Profit, use = "complete.obs")
## [1] 0.225465
Dari grafik terlihat adanya hubungan antara marketing dan profit. Nilai korelasi menunjukkan bahwa semakin besar biaya marketing, profit cenderung meningkat (sesuaikan dengan output hasil korelasi).
data_market <- data %>%
group_by(Market) %>%
summarise(Total_Sales = sum(Sales, na.rm = TRUE))
ggplot(data_market, aes(x = reorder(Market, Total_Sales),
y = Total_Sales, fill = Market)) +
geom_bar(stat = "identity", width = 0.7) +
scale_fill_brewer(palette = "Dark2") +
labs(
title = "Total Sales per Market",
x = "Market",
y = "Total Sales",
caption = "Sumber: Coffee Chain Dataset"
) +
theme(legend.position = "none")
data_market
## # A tibble: 4 × 2
## Market Total_Sales
## <chr> <dbl>
## 1 Central 265045
## 2 East 178576
## 3 South 103926
## 4 West 272264
Region dengan total sales tertinggi adalah West Hal ini menunjukkan bahwa wilayah tersebut memiliki permintaan yang lebih tinggi dibanding wilayah lainnya.
data_product <- data %>%
group_by(Product) %>%
summarise(Total_Profit = sum(Profit, na.rm = TRUE))
ggplot(data_product, aes(x = reorder(Product, Total_Profit),
y = Total_Profit, fill = Product)) +
geom_bar(stat = "identity", width = 0.7) +
scale_fill_manual(values = scales::hue_pal()(13)) +
labs(
title = "Profit berdasarkan Produk",
x = "Produk",
y = "Total Profit",
caption = "Sumber: Coffee Chain Dataset"
) +
theme(
axis.text.x = element_text(angle = 45, hjust = 1),
legend.position = "none"
)
data_product
## # A tibble: 13 × 2
## Product Total_Profit
## <chr> <dbl>
## 1 Amaretto 4890
## 2 Caffe Latte 11375
## 3 Caffe Mocha 17678
## 4 Chamomile 27231
## 5 Colombian 55804
## 6 Darjeeling 29053
## 7 Decaf Espresso 29502
## 8 Decaf Irish Cream 13989
## 9 Earl Grey 24164
## 10 Green Tea -231
## 11 Lemon 29869
## 12 Mint 6154
## 13 Regular Espresso 10065
Produk dengan profit tertinggi adalah Colombian Sedangkan produk dengan profit terendah adalah Green Tea Hal ini dapat disebabkan oleh perbedaan permintaan atau strategi pricing.
model <- lm(Profit ~ Marketing + Sales, data = data)
summary(model)
##
## Call:
## lm(formula = Profit ~ Marketing + Sales, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -334.62 -13.59 -0.19 15.64 276.60
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -25.172413 0.931639 -27.02 <2e-16 ***
## Marketing -2.592300 0.029526 -87.80 <2e-16 ***
## Sales 0.865916 0.005279 164.02 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 36.59 on 4245 degrees of freedom
## Multiple R-squared: 0.8706, Adjusted R-squared: 0.8706
## F-statistic: 1.428e+04 on 2 and 4245 DF, p-value: < 2.2e-16
Hasil regresi menunjukkan bahwa: -Marketing memiliki pengaruh terhadap profit -Sales memiliki pengaruh positif terhadap profit Hal ini menunjukkan bahwa profit dipengaruhi oleh aktivitas pemasaran dan tingkat penjualan.
Berdasarkan analisis yang dilakukan:
Analisis ini menunjukkan bahwa strategi bisnis perlu mempertimbangkan keseimbangan antara biaya marketing dan peningkatan penjualan untuk memaksimalkan profit.