Tugas Sistem Informasi Manajemen (SIM) Kelas E
Erlina Dwi Cahyani (M0723031)
Pada tugas ini, dataset yang digunakan adalah Coffee Chain Datasets. Saya mengambil 4 insight yang menurut saya menarik dan penting untuk diperhatikan oleh perusahaan.
Deskripsi data: Coffee Chain Datasets merupakan data yang berisi informasi terkait aktivitas penjualan dan kinerja bisnis pada suatu perusahaan. Dataset ini mencakup berbagai variabel seperti sales, profit, total expenses, dan lain-lain yang menunjukkan performa perusahaan. Selain itu, dataset ini juga berisi variabel kategorikal seperti market, product line, product type, dan lain sebagainya yang menggambarkan segmentasi pasar dan produk.
# Load library
library(readxl)
## Warning: package 'readxl' was built under R version 4.5.3
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.3
# Import data
data <- read_excel("D:/Downloads/Coffe Chain Datasets.xlsx")
Analisis ini dilakukan untuk melihat bagaimana kinerja penjualan (sales) dan keuntungan (profit) pada masing-masing market. Dengan membandingkan total sales dan profit antar market, kita dapat mengidentifikasi wilayah mana yang memiliki kontribusi terbesar terhadap pendapatan dan keuntungan perusahaan. Analisis ini juga dapat memberikan gambaran apakah market dengan nilai sales yang tinggi selalu menghasilkan profit yang tinggi. Variabel yang digunakan: Market, Sales, Profit
# Agregasikan total Sales dan Profit per Market
summary_market <- data %>%
group_by(Market) %>%
summarise(
Total_Sales = sum(Sales, na.rm = TRUE),
Total_Profit = sum(Profit, na.rm = TRUE)
)
# Menampilkan hasil
summary_market
## # A tibble: 4 × 3
## Market Total_Sales Total_Profit
## <chr> <dbl> <dbl>
## 1 Central 265045 93852
## 2 East 178576 59217
## 3 South 103926 32478
## 4 West 272264 73996
# Visualisasi Sales per Market
ggplot(summary_market, aes(x = Market, y = Total_Sales)) +
geom_bar(stat = "identity", fill = "pink", alpha = 0.8) +
theme_minimal() +
labs(title = "Total Sales per Market",
x = "Market",
y = "Total Sales") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
# Visualisasi Profit per Market
ggplot(summary_market, aes(x = Market, y = Total_Profit)) +
geom_bar(stat = "identity", fill = "yellow", alpha = 0.8) +
theme_minimal() +
labs(title = "Total Profit per Market",
x = "Market",
y = "Total Profit") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Berdasarkan hasil analisis dan visualisasi, terlihat bahwa West merupakan market dengan total sales tertinggi, yaitu sebesar 272.264, kemudian diikuti oleh Central sebesar 265.045, East sebesar 178.576, dan South sebagai yang terendah yaitu 103.926. Hasil ini menunjukkan bahwa West dan Central memiliki kontribusi terbesar terhadap penjualan perusahaan dibandingkan market lainnya.
Namun, jika kita melihat dari sisi profit, Central justru menjadi market dengan keuntungan tertinggi dibandingkan West, yaitu sebesar 93.852. Sementara itu, West yang memiliki total sales tertinggi menghasilkan profit sebesar 73.996, lebih rendah dibandingkan Central. Adapun East dan South masing-masing menghasilkan profit sebesar 59.217 dan 32.478, hal ini sejalan dengan tingkat penjualannya yang lebih rendah.Perbedaan nilai sales dan profit dari masing-masing market menunjukkan bahwa tingginya penjualan tidak selalu berbanding lurus dengan keuntungan yang didapatkan. Informasi ini bisa digunakan oleh perusahaan untuk melakukan strategi optimalisasi biaya dan meningkatkan efisiensi demi tercapainya keuntungan yang maksimal.
Analisis ini dilakukan untuk melihat hubungan antara penjualan (sales) dan keuntungan (profit) yang diperoleh perusahaan. Secara teoritis, ketika penjualan meningkat, maka keuntungan juga akan meningkat. Namun, dalam praktik dunia nyata sering kali hal tersebut tidak selalu terjadi karena pengaruh dari berbagai faktor. Variabel yang digunakan: Sales, Profit
# Korelasi
correlation <- cor(data$Sales, data$Profit, use = "complete.obs")
correlation
## [1] 0.7973309
# Regresi Linear
model <- lm(Profit ~ Sales, data = data)
summary(model)
##
## Call:
## lm(formula = Profit ~ Sales, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -606.28 -9.15 11.77 28.31 466.85
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -42.456004 1.527850 -27.79 <2e-16 ***
## Sales 0.536582 0.006233 86.08 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 61.39 on 4246 degrees of freedom
## Multiple R-squared: 0.6357, Adjusted R-squared: 0.6357
## F-statistic: 7410 on 1 and 4246 DF, p-value: < 2.2e-16
# Scatter plot & garis regresi
ggplot(data, aes(x = Sales, y = Profit)) +
geom_point(color = "blue", alpha = 0.6) +
geom_smooth(method = "lm", se = FALSE, color = "red") +
theme_minimal() +
labs(title = "Hubungan Sales dan Profit dengan Garis Regresi",
x = "Sales",
y = "Profit")
## `geom_smooth()` using formula = 'y ~ x'
Berdasarkan hasil analisis korelasi, diperoleh nilai koefisien korelasi antara sales dan profit sebesar 0.7973309, yang mengindikasikan adanya hubungan positif yang kuat antara kedua variabel tersebut. Di samping itu, berdasarkan hasil analisis regresi diperoleh persamaan regresi sebagai berikut: Profit = -42.456004 + (0.536582 x Sales)
Koefisien regresi pada variabel sales bernilai positif sebesar 0.536582 yang menunjukkan bahwa setiap peningkatan sales sebesar satu satuan akan meningkatkan profit sebesar 0.536582 satuan, dengan asumsi faktor lain konstan. Hasil ini menunjukkan adanya hubungan searah antara sales dan profit, yang mana peningkatan penjualan akan diikuti oleh peningkatan keuntungan pula. Nilai p-value pada variabel sales yang lebih kecil dari alpha 0.05 menunjukkan bahwa pengaruh variabel sales terhadap profit berpengaruh signifikan secara statistik. Selain itu, nilai koefisien determinasi (R-squared) sebesar 0.6357 menunjukkan bahwa sebesar 63,57% variasi dalam profit dijelaskan oleh variabel sales, sedangkan sisanya sebesar 36,43% dipengaruhi oleh faktor lain di luar model.
Berdasarkan visualisasi scatter plot, terlihat bahwa sebagian besar titik data mengikuti pola linear yang meningkat, meskipun terdapat beberapa penyimpangan (pada nilai sales yang rendah) di mana terdapat profit yang bernilai negatif. Hal ini mengindikasikan bahwa pada tingkat penjualan tertentu, perusahaan masih bisa mengalami kerugian. Dengan demikian, dapat disimpulkan bahwa sales memiliki pengaruh signifikan terhadap peningkatan profit perusahaan. Namun, hubungan tersebut tidak sempurna sehingga perusahaan tetap perlu memperhatikan faktor lain agar peningkatan sales dapat secara optimal menghasilkan profit.
Analisis ini bertujuan untuk mengetahui bagaimana pengaruh total expenses (total biaya) terhadap keuntungan (profit) yang diperoleh perusahaan. Secara umum, biasanya biaya yang lebih tinggi sering dianggap dapat menurunkan keuntungan. Pada kenyataannya, dalam bisnis, peningkatan baiya tidak selalu berdampak negatif, karena biaya tersebut bisa saja menjadi investasi untuk meningkatkan penjualan. Variabel yang digunakan: Total Expenses, Profit
# Korelasi
correlation_expenses <- cor(data$`Total Expenses`, data$Profit, use = "complete.obs")
correlation_expenses
## [1] 0.1999761
# Regresi linear
model_exp <- lm(Profit ~ `Total Expenses`, data = data)
summary(model_exp)
##
## Call:
## lm(formula = Profit ~ `Total Expenses`, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -757.52 -37.61 -9.44 34.14 721.97
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 27.10926 2.97820 9.103 <2e-16 ***
## `Total Expenses` 0.62868 0.04727 13.299 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 99.67 on 4246 degrees of freedom
## Multiple R-squared: 0.03999, Adjusted R-squared: 0.03976
## F-statistic: 176.9 on 1 and 4246 DF, p-value: < 2.2e-16
# Scatter plot & garis regresi
ggplot(data, aes(x = 'Total Expenses', y = Profit)) +
geom_point(color = "darkgreen", alpha = 0.6) +
geom_smooth(method = "lm", se = FALSE, color = "red") +
theme_minimal() +
labs(title = "Hubungan Total Expenses dan Profit",
x = "Total Expenses",
y = "Profit")
## `geom_smooth()` using formula = 'y ~ x'
Berdasarkan hasil analisis korelasi, diperoleh nilai koefisien korelasi antara total expenses dan profit senilai 0.1999761, yang mengindikasikan adanya hubungan positif tetapi lemah antara kedua variabel. Pada hasil analisis regresi diperoleh persamaan regresi sebagai berikut: Profit = 27.10926 + (0.62868 x Total Expenses)
Koefisien regresi pada variabel total expenses bernilai positif sebesar 0.62868, yang berarti setiap peningkatan total expenses sebesar satu satuan akan meningkatkan profit sebesar 0.62868 dengan asumsi faktor lain konstan. Selain itu, nilai p-value yang lebih kecil dari alpha 0.05 menunjukkan bahwa pengaruh total expenses terhadap profit signifikan secara statistik. Namun, nilai koefisien determinasi (R-squared) sebesar 0.03999 menunjukkan bahwa hanya sekitar 3,99% atau 4% variasi dalam profit yang dapat dijelaskan oleh total expenses. Hal ini berarti sebagian besar variasi profit (sekitar 96%) dipengaruhi oleh faktor lain di luar model.
Sementara itu, berdasarkan visualisasi scatter plot, terlihat bahwa titik data tidak tersebar secara horizontal, tetapi cenderung membentuk pola vertikal pada nilai total expenses tertentu. Hal ini dapat dikatakan bahwa variabel total expenses memiliki variasi yang terbatas sehingga kurang mampu menjelaskan variasi dalam profit. Kondisi tersebut menyebabkan hubungan antara total expenses dan profit tampak tidak jelas secara visual dan menghasilkan nilai korelasi yang rendah (0.1999761). Dapat dikatakan bahwa rendahnya kekuatan hubungan antara variabel total expenses dan profit tidak hanya disebabkan oleh lemahnya keterkaitan antar variabel, tetapi juga oleh karakteristik data yang kurang bervariasi.
Analisis ini dilakukan untuk mengidentifikasi kinerja masing-masing product line dalam menghasilkan profit. Setiap product line memiliki karakteristik yang berbeda-beda. Oleh karena itu, kita perlu mengetahui produk mana yang memberikan kontribusi terbesar terhadap keuntungan perusahaan. Informasi ini dapat dapat digunakan sebagai dasar dalam pengambilan keputusan terkait pengembangan produk. Variabel yang digunakan: Profit, Product Line
#Product type dan Profit
summary_product_type <- data %>%
group_by(`Product Type`) %>%
summarise(
Total_Profit = sum(Profit, na.rm = TRUE)
) %>%
mutate(
persen = round(Total_Profit / sum(Total_Profit) * 100, 1)
)
# Menampilkan hasil
summary_product_type
## # A tibble: 4 × 3
## `Product Type` Total_Profit persen
## <chr> <dbl> <dbl>
## 1 Coffee 74683 28.8
## 2 Espresso 68620 26.4
## 3 Herbal Tea 63254 24.4
## 4 Tea 52986 20.4
# Visualisasi pie chart
pie <- ggplot(summary_product_type, aes(x = "", y = Total_Profit, fill = `Product Type`)) +
geom_bar(stat = "identity", width = 1) +
coord_polar("y", start = 0) +
geom_text(aes(label = paste0(persen, "%")),
position = position_stack(vjust = 0.5)) +
scale_fill_manual(values = c("#55DDE0", "#33658A",
"#F6AE2D", "#F26419")) +
labs(title = "Total Profit per Product Type", fill = "Product Type") +
theme_void() +
theme(axis.line = element_blank(),
axis.text = element_blank(),
axis.ticks = element_blank(),
plot.title = element_text(hjust = 0.5, color = "#666666"))
pie
Berdasarkan hasil agregasi data, terlihat bahwa masing-masing product type memberikan kontribusi berbeda-beda terhadap total profit perusahaan. Product type Coffee memberikan kontribusi terbesar terhadap profit yaitu sebesar 28,8%, diikuti oleh Espresso sebesar 26,4%, Herbal Tea sebesar 24,4%, dan Tea sebesar 20,4%.
Hasil tersebut menunjukkan bahwa produk berbasis kopi, khususnya Coffee dan Espresso, mendominasi kontribusi keuntungan perusahaan. Hal ini menunjukkan bahwa permintaan terhadap produk kopi cenderung lebih tinggi dibandingkan dengan produk lainnya. Meskipun demikian, produk seperti Tea dan Herbal Tea tetap memberikan kontribusi yang signifikan meskipun proporsinya relatif lebih kecil terhadap total profit. Perbedaan kontribusi ini mungkin saja dipengaruhi oleh berbagai faktor, seperti preferensi konsumen, harga, atau biaya produksi pada masing-masing product type. Dengan itu, perusahaan dapat mempertimbangkan untuk mempertahankan atau bahkan meningkatkan fokus pada produk dengan kontribusi besar seperti Coffee dan Espresso, serta melakukan evaluasi pada produk dengan kontribusi yang lebih kecil guna meningkatkan keuntungan (profit).
Secara keseluruhan, hasil analisis pada Coffee Chain dataset menunjukkan bahwa kinerja perusahaan dipengaruhi oleh berbagai faktor. Selain itu, hasil analisis ini juga menegaskan bahwa keberhasilan perushaan dalam meningkatkan profit tidak hanya bergantung pada total penjualan, tetapi juga oleh kemampuan mengelola dan memahami karakteristik tiap market serta mengoptimalkan kinerja produk yang paling menguntungkan. Oleh karena itu, dengan menggunakan insight yang diperoleh, perusahaan diharapkan mampu mempertimbangkan strategi yang tepat pada masing-masing aspek yang menunjang proses produksi, seperti memaksimalkan potensi market, meningkatkan efisiensi biaya, serta mengoptimalkan penjualan produk dengan kontribusi keuntungan terbesar untuk meningkatkan kinerja bisnis dan memperoleh keuntungan yang optimal.