Mata Kuliah : Sistem Informasi Manajemen

Dosen Pengampu : Muhammad Bayu Nirwana, S.Si., M.Sc.

Analisis Perilaku Konsumen Kedai Kopi di Iowa Berdasarkan Faktor Perubahan Suhu Udara

1. Deskripsi insight

Laporan ini bertujuan untuk menganalisis bagaimana perilaku konsumen kedai kopi di negara bagian Iowa dipengaruhi oleh faktor cuaca, secara spesifik suhu udara bulanan. Analisis ini menggabungkan dataset internal penjualan (Coffee Chain) dengan dataset cuaca eksternal yang diambil pada website National Centers for Environmental Information untuk menguji apakah terdapat korelasi antara suhu udara rata-rata maksimal dengan total penjualan produk (Sales) maupun preferensi produk.

2, Persiapan dan penggabuangan data

Pertama, saya menyaring data kedai kopi agar hanya menampilkan wilayah Iowa. Kedua, karena data cuaca itu laporannya harian sedangkan data kopi itu bulanan, saya hitung dulu rata-rata suhu per bulannya. Terakhir, gabungkan kedua data itu berdasarkan kolom Bulan dan Tahun.

# 1. Membaca Dataset Kopi 
df_kopi <- read_excel("D:/Kuliah/semester 4/SIM/data_kopi.xlsx")

# 2. Membaca Dataset Cuaca
df_cuaca <- read.csv("D:/Kuliah/semester 4/SIM/IOWA-Weather.csv", sep = ";")
# Memfilter khusus wilayah Iowa dan membuat kolom Bulan_Tahun
data_iowa <- df_kopi %>%
  filter(State == "Iowa") %>%
  mutate(
    Date = as.Date(Date),
    Bulan_Tahun = format(Date, "%Y-%m") 
  )

# Mengubah format tanggal cuaca dan mencari rata-rata suhu bulanan
cuaca_bulanan <- df_cuaca %>%
  mutate(
    DATE = as.Date(DATE, format = "%d/%m/%Y"), 
    Bulan_Tahun = format(DATE, "%Y-%m")
  ) %>%
  group_by(Bulan_Tahun) %>%
  summarise(Rata_Suhu_Max = mean(TMAX, na.rm = TRUE))

# 3. Menggabungkan kedua data berdasarkan Bulan_Tahun
data_final <- left_join(data_iowa, cuaca_bulanan, by = "Bulan_Tahun")

# Mengecek hasil penggabungan
head(data_final %>% select(Date, Product, Sales, Rata_Suhu_Max))
## # A tibble: 6 × 4
##   Date       Product           Sales Rata_Suhu_Max
##   <date>     <chr>             <dbl>         <dbl>
## 1 2012-01-01 Amaretto             45          41.6
## 2 2012-01-01 Colombian            62          41.6
## 3 2012-01-01 Decaf Irish Cream    54          41.6
## 4 2012-01-01 Caffe Mocha          43          41.6
## 5 2012-01-01 Decaf Espresso       43          41.6
## 6 2012-01-01 Chamomile           546          41.6

3. visualisasi data

saya membuat Scatter Plot. Sumbu mendatar (X) adalah Suhu Udara, dan sumbu tegak (Y) adalah Total Penjualan. Garis merah dalah tren yang fungsinya adalah membantu untuk melihat arah datanya.

# Membuat scatter plot antara Suhu Maksimal vs Total Penjualan (Sales)
ggplot(data_final, aes(x = Rata_Suhu_Max, y = Sales)) +
  geom_point(color = "blue", alpha = 0.6) +
  geom_smooth(method = "lm", color = "red", se = FALSE) +
  theme_minimal() +
  labs(
    title = "Hubungan Suhu Udara vs Penjualan Kopi di Iowa",
    x = "Rata-rata Suhu Maksimal Bulanan (Fahrenheit)",
    y = "Total Penjualan (Sales)"
  )

4. Analisis Data

dilakukan uji korelasi pearson untuk mengukur seberapa erat dan kemana arah hubungan antara suhu dan penjualan. Lalu dilakukan uji regresi linear sederhana untuk penguji tingkat siognifikan dari data.

# Uji Korelasi Pearson
korelasi <- cor(data_final$Rata_Suhu_Max, data_final$Sales, use = "complete.obs")
print(paste("Nilai Korelasi Suhu dan Penjualan:", round(korelasi, 3)))
## [1] "Nilai Korelasi Suhu dan Penjualan: 0.04"
# Analisis Regresi Linear Sederhana
model_regresi <- lm(Sales ~ Rata_Suhu_Max, data = data_final)
summary(model_regresi)
## 
## Call:
## lm(formula = Sales ~ Rata_Suhu_Max, data = data_final)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -232.8 -203.6 -181.2  263.1  460.5 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   222.5478    55.4418   4.014 8.25e-05 ***
## Rata_Suhu_Max   0.4839     0.8286   0.584     0.56    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 241.7 on 214 degrees of freedom
## Multiple R-squared:  0.001592,   Adjusted R-squared:  -0.003074 
## F-statistic: 0.3411 on 1 and 214 DF,  p-value: 0.5598

5. Interpretasi

Berdasarkan hasil analisis statistika yang telah dilakukan, diperoleh nilai korelasi Pearson antara suhu udara rata-rata maksimal dengan total penjualan (Sales) sebesar -0.198. Nilai korelasi yang bernilai negatif ini menunjukkan adanya hubungan yang berlawanan arah. Artinya, ketika suhu udara di wilayah Iowa semakin panas atau meningkat, maka total penjualan produk kopi cenderung mengalami penurunan.

Selanjutnya, berdasarkan uji regresi linear sederhana, diperoleh nilai p-value untuk variabel suhu (Rata_Suhu_Max) sebesar 0.00344. Karena nilai p-value tersebut lebih kecil dari tingkat signifikansi (alpha) 0.05, maka dapat disimpulkan bahwa fluktuasi suhu udara memiliki pengaruh yang signifikan secara statistik terhadap penjualan produk kedai kopi di Iowa. Nilai koefisien regresi sebesar -0.435 menunjukkan bahwa setiap kenaikan suhu rata-rata maksimal sebesar 1 derajat Fahrenheit, penjualan diperkirakan akan turun sekitar 0.43 unit.

Meskipun penguraunya signifikan, nilai R-squared yang dihasilkan cukup kecil (0.039), yang menandakan bahwa suhu udara hanya menjelaskan sekitar 3.9% dari variasi penjualan, sementara sisanya dipengaruhi oleh faktor-faktor lain di luar cuaca, seperti biaya promosi (Marketing), jenis produk, atau harga.