Laporan ini disusun untuk memenuhi tugas mata kuliah Sistem Informasi Manajemen tahun 2026. Fokus utama dari laporan ini adalah melakukan koneksi data menggunakan R-Markdown dan menarik insight manajerial dari Coffee Chain Dataset. Melalui analisis ini, diharapkan kita dapat memahami pola hubungan antar variabel bisnis untuk mendukung pengambilan keputusan yang lebih efektif.
Dataset yang digunakan adalah Coffee Chain Dataset. Insight yang ditarik dari data ini berfokus pada hubungan antara volume penjualan (Sales) dengan keuntungan bersih (Profit), dan bagaimana hubungan tersebut dipengaruhi oleh ukuran pasar (Market Size), yaitu antara Major Market dan Small Market.
Data yang dianalisis difokuskan pada variabel Sales, Profit, dan Market Size. Tujuan dari insight ini adalah untuk memberikan rekomendasi kepada manajemen terkait efisiensi profitabilitas: apakah pasar yang lebih besar (Major Market) selalu menghasilkan tingkat konversi profit yang lebih baik dari setiap penjualannya dibandingkan pasar kecil (Small Market).
#Memanggil library yang dibutuhkan
library(readxl)
## Warning: package 'readxl' was built under R version 4.5.2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.5.2
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
#IMPORT FILE EXCEL
coffee_data<-read_excel("Coffee_Chain.xlsx")
#Mengambil beberapa variabel dari data coffe_chain
data_analisis <- coffee_data %>% select(`Market Size`, Sales, Profit)
#Menampilkan 5 baris pertama dari beberapa variabel data yang dipilih
head(data_analisis)
## # A tibble: 6 × 3
## `Market Size` Sales Profit
## <chr> <dbl> <dbl>
## 1 Major Market 219 94
## 2 Major Market 190 68
## 3 Major Market 234 101
## 4 Major Market 100 30
## 5 Major Market 134 54
## 6 Major Market 180 53
Untuk melihat sebaran dan pola hubungan antara Sales dan Profit berdasarkan Market Size, digunakan visualisasi Scatter Plot dengan penambahan garis regresi (tren).
#Membuat Scatter Plot Sales vs Profit berdasarkan Market Size
scatterplot1=ggplot(data_analisis, aes(x = Sales, y = Profit, color = `Market Size`)) +
geom_point(alpha = 0.5, size = 2) +
geom_smooth(method = "lm", se = FALSE, size = 1) +
labs(title = "Hubungan Antara Penjualan (Sales) dan Keuntungan (Profit)",
subtitle = "Pengelompokkan Berdasarkan Ukuran Pasar (Market Size)",
x = "Total Penjualan (Sales)",
y = "Keuntungan (Profit)",
color = "Market Size") +
theme_minimal() +
scale_color_manual(values = c("Major Market" = "darkgreen", "Small Market" = "orange"))
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
print(scatterplot1)
## `geom_smooth()` using formula = 'y ~ x'
Dari grafik scatter plot di atas, terlihat jelas bahwa secara umum terdapat tren positif dimana semakin tinggi nilai Sales, semakin tinggi Profit yang dihasilkan. Garis tren menunjukkan bahwa baik di Major Market maupun Small Market, penjualannya memberikan dampak positif terhadap keuntungan. Namun, titik-titik data (observasi) pada Major Market cenderung mencapai nilai Sales dan Profit yang lebih tinggi secara nominal dibandingkan Small Market.
Metode statistika yang digunakan adalah Regresi Linear Sederhana. Analisis ini akan mengukur seberapa besar pengaruh variabel Sales sebagai prediktor terhadap Profit secara keseluruhan.
#Membuat model regresi linear sederhana
model_regresi <- lm(Profit ~ Sales, data = data_analisis)
#Menampilkan ringkasan hasil analisis regresi
summary(model_regresi)
##
## Call:
## lm(formula = Profit ~ Sales, data = data_analisis)
##
## Residuals:
## Min 1Q Median 3Q Max
## -606.28 -9.15 11.77 28.31 466.85
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -42.456004 1.527850 -27.79 <2e-16 ***
## Sales 0.536582 0.006233 86.08 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 61.39 on 4246 degrees of freedom
## Multiple R-squared: 0.6357, Adjusted R-squared: 0.6357
## F-statistic: 7410 on 1 and 4246 DF, p-value: < 2.2e-16
Berdasarkan output summary regresi linear di atas, diperoleh beberapa kesimpulan statistika sebagai berikut: