Laporan ini disusun untuk memenuhi tugas mata kuliah Sistem Informasi Manajemen tahun 2026. Fokus utama dari laporan ini adalah melakukan koneksi data menggunakan R-Markdown dan menarik insight manajerial dari Coffee Chain Dataset. Melalui analisis ini, diharapkan kita dapat memahami pola hubungan antar variabel bisnis untuk mendukung pengambilan keputusan yang lebih efektif.

Insight Data

Dataset yang digunakan adalah Coffee Chain Dataset. Insight yang ditarik dari data ini berfokus pada hubungan antara volume penjualan (Sales) dengan keuntungan bersih (Profit), dan bagaimana hubungan tersebut dipengaruhi oleh ukuran pasar (Market Size), yaitu antara Major Market dan Small Market.

Pemilihan Data

Data yang dianalisis difokuskan pada variabel Sales, Profit, dan Market Size. Tujuan dari insight ini adalah untuk memberikan rekomendasi kepada manajemen terkait efisiensi profitabilitas: apakah pasar yang lebih besar (Major Market) selalu menghasilkan tingkat konversi profit yang lebih baik dari setiap penjualannya dibandingkan pasar kecil (Small Market).

#Memanggil library yang dibutuhkan
library(readxl)
## Warning: package 'readxl' was built under R version 4.5.2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.5.2
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
#IMPORT FILE EXCEL
coffee_data<-read_excel("Coffee_Chain.xlsx")
#Mengambil beberapa variabel dari data coffe_chain
data_analisis <- coffee_data %>% select(`Market Size`, Sales, Profit)
#Menampilkan 5 baris pertama dari beberapa variabel data yang dipilih
head(data_analisis)
## # A tibble: 6 × 3
##   `Market Size` Sales Profit
##   <chr>         <dbl>  <dbl>
## 1 Major Market    219     94
## 2 Major Market    190     68
## 3 Major Market    234    101
## 4 Major Market    100     30
## 5 Major Market    134     54
## 6 Major Market    180     53

Visualisasi Data

Untuk melihat sebaran dan pola hubungan antara Sales dan Profit berdasarkan Market Size, digunakan visualisasi Scatter Plot dengan penambahan garis regresi (tren).

#Membuat Scatter Plot Sales vs Profit berdasarkan Market Size
scatterplot1=ggplot(data_analisis, aes(x = Sales, y = Profit, color = `Market Size`)) +
  geom_point(alpha = 0.5, size = 2) +
  geom_smooth(method = "lm", se = FALSE, size = 1) +
  labs(title = "Hubungan Antara Penjualan (Sales) dan Keuntungan (Profit)",
       subtitle = "Pengelompokkan Berdasarkan Ukuran Pasar (Market Size)",
       x = "Total Penjualan (Sales)",
       y = "Keuntungan (Profit)",
       color = "Market Size") +
  theme_minimal() +
  scale_color_manual(values = c("Major Market" = "darkgreen", "Small Market" = "orange"))
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
print(scatterplot1)
## `geom_smooth()` using formula = 'y ~ x'

Dari grafik scatter plot di atas, terlihat jelas bahwa secara umum terdapat tren positif dimana semakin tinggi nilai Sales, semakin tinggi Profit yang dihasilkan. Garis tren menunjukkan bahwa baik di Major Market maupun Small Market, penjualannya memberikan dampak positif terhadap keuntungan. Namun, titik-titik data (observasi) pada Major Market cenderung mencapai nilai Sales dan Profit yang lebih tinggi secara nominal dibandingkan Small Market.

Analisis Data(Metode Statistika)

Metode statistika yang digunakan adalah Regresi Linear Sederhana. Analisis ini akan mengukur seberapa besar pengaruh variabel Sales sebagai prediktor terhadap Profit secara keseluruhan.

#Membuat model regresi linear sederhana
model_regresi <- lm(Profit ~ Sales, data = data_analisis)

#Menampilkan ringkasan hasil analisis regresi
summary(model_regresi)
## 
## Call:
## lm(formula = Profit ~ Sales, data = data_analisis)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -606.28   -9.15   11.77   28.31  466.85 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -42.456004   1.527850  -27.79   <2e-16 ***
## Sales         0.536582   0.006233   86.08   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 61.39 on 4246 degrees of freedom
## Multiple R-squared:  0.6357, Adjusted R-squared:  0.6357 
## F-statistic:  7410 on 1 and 4246 DF,  p-value: < 2.2e-16

Berdasarkan output summary regresi linear di atas, diperoleh beberapa kesimpulan statistika sebagai berikut: