Mata Kuliah : Sistem Informasi Manajemen
Dosen Pengampu : Muhammad Bayu Nirwana, S.Si., M.Sc.
Laporan ini bertujuan untuk menganalisis bagaimana perilaku konsumen kedai kopi di negara bagian Iowa dipengaruhi oleh faktor cuaca, secara spesifik suhu udara bulanan. Analisis ini menggabungkan dataset internal penjualan (Coffee Chain) dengan dataset cuaca eksternal yang diambil pada website National Centers for Environmental Information untuk menguji apakah terdapat korelasi antara suhu udara rata-rata maksimal dengan total penjualan produk (Sales) maupun preferensi produk.
Pertama, saya menyaring data kedai kopi agar hanya menampilkan wilayah Iowa. Kedua, karena data cuaca itu laporannya harian sedangkan data kopi itu bulanan, saya hitung dulu rata-rata suhu per bulannya. Terakhir, gabungkan kedua data itu berdasarkan kolom Bulan dan Tahun.
# 1. Membaca Dataset Kopi
df_kopi <- read_excel("D:/Kuliah/semester 4/SIM/data_kopi.xlsx")
# 2. Membaca Dataset Cuaca
df_cuaca <- read.csv("D:/Kuliah/semester 4/SIM/IOWA-Weather.csv", sep = ";")
# Memfilter khusus wilayah Iowa dan membuat kolom Bulan_Tahun
data_iowa <- df_kopi %>%
filter(State == "Iowa") %>%
mutate(
Date = as.Date(Date),
Bulan_Tahun = format(Date, "%Y-%m")
)
# Mengubah format tanggal cuaca dan mencari rata-rata suhu bulanan
cuaca_bulanan <- df_cuaca %>%
mutate(
DATE = as.Date(DATE, format = "%d/%m/%Y"),
Bulan_Tahun = format(DATE, "%Y-%m")
) %>%
group_by(Bulan_Tahun) %>%
summarise(Rata_Suhu_Max = mean(TMAX, na.rm = TRUE))
# 3. Menggabungkan kedua data berdasarkan Bulan_Tahun
data_final <- left_join(data_iowa, cuaca_bulanan, by = "Bulan_Tahun")
# Mengecek hasil penggabungan
head(data_final %>% select(Date, Product, Sales, Rata_Suhu_Max))
## # A tibble: 6 × 4
## Date Product Sales Rata_Suhu_Max
## <date> <chr> <dbl> <dbl>
## 1 2012-01-01 Amaretto 45 41.6
## 2 2012-01-01 Colombian 62 41.6
## 3 2012-01-01 Decaf Irish Cream 54 41.6
## 4 2012-01-01 Caffe Mocha 43 41.6
## 5 2012-01-01 Decaf Espresso 43 41.6
## 6 2012-01-01 Chamomile 546 41.6
saya membuat Scatter Plot. Sumbu mendatar (X) adalah Suhu Udara, dan sumbu tegak (Y) adalah Total Penjualan. Garis merah dalah tren yang fungsinya adalah membantu untuk melihat arah datanya.
# Membuat scatter plot antara Suhu Maksimal vs Total Penjualan (Sales)
ggplot(data_final, aes(x = Rata_Suhu_Max, y = Sales)) +
geom_point(color = "blue", alpha = 0.6) +
geom_smooth(method = "lm", color = "red", se = FALSE) +
theme_minimal() +
labs(
title = "Hubungan Suhu Udara vs Penjualan Kopi di Iowa",
x = "Rata-rata Suhu Maksimal Bulanan (Fahrenheit)",
y = "Total Penjualan (Sales)"
)
dilakukan uji korelasi pearson untuk mengukur seberapa erat dan kemana arah hubungan antara suhu dan penjualan. Lalu dilakukan uji regresi linear sederhana untuk penguji tingkat siognifikan dari data.
# Uji Korelasi Pearson
korelasi <- cor(data_final$Rata_Suhu_Max, data_final$Sales, use = "complete.obs")
print(paste("Nilai Korelasi Suhu dan Penjualan:", round(korelasi, 3)))
## [1] "Nilai Korelasi Suhu dan Penjualan: 0.04"
# Analisis Regresi Linear Sederhana
model_regresi <- lm(Sales ~ Rata_Suhu_Max, data = data_final)
summary(model_regresi)
##
## Call:
## lm(formula = Sales ~ Rata_Suhu_Max, data = data_final)
##
## Residuals:
## Min 1Q Median 3Q Max
## -232.8 -203.6 -181.2 263.1 460.5
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 222.5478 55.4418 4.014 8.25e-05 ***
## Rata_Suhu_Max 0.4839 0.8286 0.584 0.56
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 241.7 on 214 degrees of freedom
## Multiple R-squared: 0.001592, Adjusted R-squared: -0.003074
## F-statistic: 0.3411 on 1 and 214 DF, p-value: 0.5598
Berdasarkan hasil analisis statistika yang telah dilakukan, diperoleh nilai korelasi Pearson antara suhu udara rata-rata maksimal dengan total penjualan (Sales) sebesar -0.198. Nilai korelasi yang bernilai negatif ini menunjukkan adanya hubungan yang berlawanan arah. Artinya, ketika suhu udara di wilayah Iowa semakin panas atau meningkat, maka total penjualan produk kopi cenderung mengalami penurunan.
Selanjutnya, berdasarkan uji regresi linear sederhana, diperoleh nilai p-value untuk variabel suhu (Rata_Suhu_Max) sebesar 0.00344. Karena nilai p-value tersebut lebih kecil dari tingkat signifikansi (alpha) 0.05, maka dapat disimpulkan bahwa fluktuasi suhu udara memiliki pengaruh yang signifikan secara statistik terhadap penjualan produk kedai kopi di Iowa. Nilai koefisien regresi sebesar -0.435 menunjukkan bahwa setiap kenaikan suhu rata-rata maksimal sebesar 1 derajat Fahrenheit, penjualan diperkirakan akan turun sekitar 0.43 unit.
Meskipun penguraunya signifikan, nilai R-squared yang dihasilkan cukup kecil (0.039), yang menandakan bahwa suhu udara hanya menjelaskan sekitar 3.9% dari variasi penjualan, sementara sisanya dipengaruhi oleh faktor-faktor lain di luar cuaca, seperti biaya promosi (Marketing), jenis produk, atau harga.