library(dplyr)
## Warning: package 'dplyr' was built under R version 4.5.2
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
getwd()
## [1] "D:/Kuliah/SIM"
library(readxl)
## Warning: package 'readxl' was built under R version 4.5.3
data_coffee <- read_xlsx("1. Tugas SIM 2025B - Coffee Chain Datasets.xlsx")
View(data_coffee)
## Apabila mengambil seluruh wilayah
tabel_profit <- data_coffee %>%
group_by(Product) %>%
summarise(total_profit = sum(Profit, na.rm = TRUE))
ggplot(tabel_profit, aes(x = Product, y = total_profit)) +
geom_bar(stat = "identity", fill = "pink", alpha = 0.8) +
theme_minimal() +
labs(title = "Total Profit tiap Produk",
x = "Produk",
y = "Total Profit (USD)") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Insight yang diambil dalam analisis ini adalah perbandingan kinerja produk berdasarkan total profit yang dihasilkan. Analisis difokuskan pada identifikasi produk dengan kontribusi keuntungan tertinggi dan terendah dalam dataset Coffee Chain.
Berdasarkan pengolahan data, dilakukan agregasi total profit untuk setiap produk guna mengetahui produk mana yang paling menguntungkan bagi perusahaan. Selain itu, analisis ini juga bertujuan untuk melihat perbedaan kontribusi profit antar produk sebagai dasar dalam pengambilan keputusan bisnis.
Hasil awal menunjukkan bahwa terdapat perbedaan yang cukup signifikan antar produk, di mana produk Colombian memiliki total profit tertinggi, sedangkan Green Tea memiliki total profit terendah. Oleh karena itu, analisis lebih lanjut dilakukan menggunakan visualisasi dan metode statistik untuk memperkuat temuan tersebut. ### Banyaknya Peminat
tabel_terjual <- data_coffee %>%
group_by(Product) %>%
summarise(total_sales = sum(Sales, na.rm = TRUE))
ggplot(tabel_terjual, aes(x = Product, y = total_sales)) +
geom_bar(stat = "identity", fill = "lightblue", alpha = 0.8) +
theme_minimal() +
labs(title = "Total Penjualan tiap Produk",
x = "Produk",
y = "Total Penjualan") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Insight yang diambil dalam analisis ini adalah evaluasi total penjualan (sales) berdasarkan produk pada dataset Coffee Chain. Analisis ini bertujuan untuk mengidentifikasi produk dengan tingkat penjualan tertinggi dan terendah sebagai indikator preferensi konsumen terhadap produk yang ditawarkan.
Untuk memperoleh insight tersebut, dilakukan agregasi data dengan menjumlahkan nilai penjualan pada masing-masing produk. Hasil analisis menunjukkan bahwa produk Colombian memiliki total penjualan tertinggi, sedangkan produk Regular Espresso memiliki total penjualan terendah.
Perbedaan ini mengindikasikan bahwa tingkat permintaan konsumen terhadap produk tidak merata. Oleh karena itu, hasil ini dapat digunakan sebagai dasar bagi perusahaan dalam menentukan strategi pemasaran dan pengembangan produk, khususnya dalam meningkatkan performa produk dengan penjualan rendah.
uji_saphiro <- shapiro.test(data_coffee$Profit)
cat("Keputusan:",
ifelse(uji_saphiro$p.value < 0.05,
"TOLAK H0",
"GAGAL TOLAK H0"))
## Keputusan: TOLAK H0
Karena H0 ditolak maka data berdistribusi normal. Selanjutnya dipilih data dari kota Ohio khusunya market central dengan market size Major market dalam kurun waktu 2 hari untuk dilakukan uji korelasi pearson guna mengetahui hubungan total penjualan dan keuntungan di kota tersebut.
library(dplyr)
data_ohio <- data_coffee %>%
filter(State == "Ohio",
`Market Size` == "Major Market",
Market == "Central",
Date >= as.POSIXct("2012-01-01"),
Date <= as.POSIXct("2012-04-01"))
View(data_ohio)
kor.pearson <- cor.test(data_ohio$Sales, data_ohio$Profit, method = "pearson")
print(kor.pearson)
##
## Pearson's product-moment correlation
##
## data: data_ohio$Sales and data_ohio$Profit
## t = 8.2054, df = 25, p-value = 1.476e-08
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.7016158 0.9316346
## sample estimates:
## cor
## 0.8539471
cat("Keputusan:",
ifelse(kor.pearson$p.value < 0.05,
"TOLAK H0",
"GAGAL TOLAK H0"))
## Keputusan: TOLAK H0
Berdasarkan hasil uji korelasi pearson, diperoleh nilai p-value sebesar 2.2e-16, sehingga H0 ditolak. Hal ini menunjukkan bahwa terdapat korelasi antara keuntungan produk dan banyaknya produk yang terjual. Hasil ini mengindikasikan bahwa banyaknya produk yang terjual terdapat hubungan dengan keuntungan produk Nilai koefisien yang positif menunjukkan bahwa hubungan bersifat searah, namun dengan kekuatan hubungan yang cukup kuat. Dengan demikian, semakin banyak produk terjual maka semakin tinggi pula keuntungan yang didapatkan.
ggplot(data_ohio, aes(x = Sales, y = Profit)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE) +
theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'
Semakin tinggi jumlah penjualan, maka cenderung semakin tinggi pula keuntungan yang diperoleh. Hal ini menunjukkan bahwa peningkatan penjualan memberikan dampak positif terhadap profit perusahaan.
Selain itu, terlihat bahwa sebagian besar data membentuk pola yang cukup konsisten, meskipun terdapat beberapa titik yang menyimpang (outlier), yang menunjukkan adanya kondisi tertentu di mana penjualan tidak selalu sebanding dengan keuntungan.