#Import Data
library(openxlsx)
## Warning: package 'openxlsx' was built under R version 4.5.2
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.5.2
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.5.2
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
dataset <- read.xlsx("Dataset.xlsx", sheet = 1)
#Insight 1 Insight yang diambil adalah hubungan antara Sales dan Profit untuk mengetahui apakah peningkatan penjualan berpengaruh terhadap keuntungan.
#Visualisasi 1
ggplot(dataset, aes(x = Sales, y = Profit)) +
geom_point(color = "blue") +
geom_smooth(method = "lm", se = FALSE, color = "red") +
theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'
#Analisis Data 1
model <- lm(Profit ~ Sales, data = dataset)
summary(model)
##
## Call:
## lm(formula = Profit ~ Sales, data = dataset)
##
## Residuals:
## Min 1Q Median 3Q Max
## -606.28 -9.15 11.77 28.31 466.85
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -42.456004 1.527850 -27.79 <2e-16 ***
## Sales 0.536582 0.006233 86.08 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 61.39 on 4246 degrees of freedom
## Multiple R-squared: 0.6357, Adjusted R-squared: 0.6357
## F-statistic: 7410 on 1 and 4246 DF, p-value: < 2.2e-16
#Interpretasi 1 (Visualisasi) Berdasarkan scatter plot antara Sales dan Profit, Terdapat hubungan positif, di mana semakin tinggi nilai Sales, maka Profit cenderung meningkat. Garis regresi juga meningkat, sehingga memperkuat adanya hubungan searah antara kedua variabel. Namun, terdapat penyebaran data yang cukup lebar, terutama pada nilai Sales rendah, yang menunjukkan bahwa pada beberapa kondisi profit bisa bernilai negatif meskipun terdapat penjualan. Hal ini menunjukkan bahwa terdapat faktor lain selain Sales yang mempengaruhi Profit.
(Analisis Data) Berdasarkan output regresi linear, Nilai p-value < 2e-16, yang berarti jauh lebih kecil dari 0,05, sehingga dapat disimpulkan bahwa Sales berpengaruh signifikan terhadap Profit. Koefisien regresi sebesar 0.5366 menunjukkan bahwa setiap kenaikan 1 unit Sales akan meningkatkan Profit sebesar 0.5366 unit. Nilai intercept sebesar -42.456 menunjukkan bahwa ketika Sales = 0, maka Profit diperkirakan bernilai negatif (rugi). Nilai R-squared sebesar 0.6357 menunjukkan bahwa sekitar 63.57% variasi Profit dapat dijelaskan oleh Sales, sedangkan sisanya dipengaruhi oleh faktor lain. Nilai F-statistic yang signifikan (p-value < 2.2e-16) menunjukkan bahwa model regresi yang digunakan sudah layak.
(Keseluruhan) Berdasarkan hasil visualisasi dan analisis regresi, dapat disimpulkan bahwa terdapat hubungan positif antara Sales dan Profit. Peningkatan penjualan berkontribusi terhadap peningkatan keuntungan perusahaan. Tetapi, variasi data yang masih cukup besar menunjukkan bahwa Sales bukan satu-satunya faktor yang mempengaruhi Profit.
#Insight 2 Insight yang diambil adalah perbedaan profit antar produk untuk mengetahui produk mana yang paling menguntungkan.
#Visualisasi 2
profit_produk <- dataset %>%
group_by(Product) %>%
summarise(Total_Profit = sum(Profit, na.rm = TRUE))
ggplot(profit_produk, aes(x = reorder(Product, Total_Profit), y = Total_Profit)) +
geom_bar(stat = "identity", fill = "darkgreen") +
coord_flip() +
theme_minimal()
#Analisis Data 2
anova_model <- aov(Profit ~ Product, data = dataset)
summary(anova_model)
## Df Sum Sq Mean Sq F value Pr(>F)
## Product 12 4267412 355618 37.97 <2e-16 ***
## Residuals 4235 39666224 9366
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Interpretasi 2 (Visualisasi) Berdasarkan visualisasi (bar chart) profit per produk, Produk Colombian memiliki total profit tertinggi dengan selisih yang cukup jauh dibandingkan produk lainnya. Produk seperti Lemon, Decaf Espresso, dan Darjeeling di posisi berikutnya dengan nilai profit yang mirip satu sama lain. Perbedaan tinggi batang antar produk menunjukkan bahwa kontribusi profit tidak merata di antara seluruh produk. Hal ini menunjukkan bahwa hanya beberapa produk tertentu yang menjadi penyumbang utama keuntungan perusahaan.
(Analisis) Brdasarkan hasil uji ANOVA, Nilai p-value < 2e-16, yang berarti jauh lebih kecil dari 0,05. Hal ini menunjukkan bahwa terdpat perbedaan rata-rata profit antar produk. Nilai F-value sebesar 37.97 menunjukkan bahwa variasi antar kelompok (produk) jauh lebih besar dibandingkan variasi dalam kelompok. Dengan demikian, faktor jenis produk berpengaruh terhadap profit.
(Keseluruhan) Berdasarkan hasil visualisasi dan analisis ANOVA, dapat disimpulkan bhwa terdapat perbedaan dalam profit yang dihasilkan oleh masing-masing produk. Produk Colombian menjadi kontributor utama terhadap profit perusahaan, sedangkan produk lain seperti Lemon, Decaf Espresso, dan Darjeeling memiliki kontribusi yang lebih rendah dan mirip. Oleh karena itu, perusahaan sebaiknya fokus pada produk denagn profit tinggi serta melakukan evaluasi terhadap produk dengan profit yang lebih rendah.