if(!require(ggplot2)){
install.packages("ggplot2")
library(ggplot2)
} else {
library(ggplot2)
}
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.4.3
library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
data <- read_excel("coffe_chain.xlsx")
head(data)
## # A tibble: 6 × 20
## `Area Code` Date Market `Market Size` Product `Product Line`
## <dbl> <dttm> <chr> <chr> <chr> <chr>
## 1 719 2012-01-01 00:00:00 Central Major Market Amaretto Beans
## 2 970 2012-01-01 00:00:00 Central Major Market Colombian Beans
## 3 970 2012-01-01 00:00:00 Central Major Market Decaf Ir… Beans
## 4 303 2012-01-01 00:00:00 Central Major Market Green Tea Leaves
## 5 303 2012-01-01 00:00:00 Central Major Market Caffe Mo… Beans
## 6 720 2012-01-01 00:00:00 Central Major Market Decaf Es… Beans
## # ℹ 14 more variables: `Product Type` <chr>, State <chr>, Type <chr>,
## # `Budget COGS` <dbl>, `Budget Margin` <dbl>, `Budget Profit` <dbl>,
## # `Budget Sales` <dbl>, COGS <dbl>, Inventory <dbl>, Margin <dbl>,
## # Marketing <dbl>, Profit <dbl>, Sales <dbl>, `Total Expenses` <dbl>
names(data)
## [1] "Area Code" "Date" "Market" "Market Size"
## [5] "Product" "Product Line" "Product Type" "State"
## [9] "Type" "Budget COGS" "Budget Margin" "Budget Profit"
## [13] "Budget Sales" "COGS" "Inventory" "Margin"
## [17] "Marketing" "Profit" "Sales" "Total Expenses"
str(data)
## tibble [4,248 × 20] (S3: tbl_df/tbl/data.frame)
## $ Area Code : num [1:4248] 719 970 970 303 303 720 970 719 970 719 ...
## $ Date : POSIXct[1:4248], format: "2012-01-01" "2012-01-01" ...
## $ Market : chr [1:4248] "Central" "Central" "Central" "Central" ...
## $ Market Size : chr [1:4248] "Major Market" "Major Market" "Major Market" "Major Market" ...
## $ Product : chr [1:4248] "Amaretto" "Colombian" "Decaf Irish Cream" "Green Tea" ...
## $ Product Line : chr [1:4248] "Beans" "Beans" "Beans" "Leaves" ...
## $ Product Type : chr [1:4248] "Coffee" "Coffee" "Coffee" "Tea" ...
## $ State : chr [1:4248] "Colorado" "Colorado" "Colorado" "Colorado" ...
## $ Type : chr [1:4248] "Regular" "Regular" "Decaf" "Regular" ...
## $ Budget COGS : num [1:4248] 90 80 100 30 60 80 140 50 50 40 ...
## $ Budget Margin : num [1:4248] 130 110 140 50 90 130 160 80 70 70 ...
## $ Budget Profit : num [1:4248] 100 80 110 30 70 80 110 20 40 20 ...
## $ Budget Sales : num [1:4248] 220 190 240 80 150 210 300 130 120 110 ...
## $ COGS : num [1:4248] 89 83 95 44 54 72 170 63 60 58 ...
## $ Inventory : num [1:4248] 777 623 821 623 456 ...
## $ Margin : num [1:4248] 130 107 139 56 80 108 171 87 80 72 ...
## $ Marketing : num [1:4248] 24 27 26 14 15 23 47 57 19 22 ...
## $ Profit : num [1:4248] 94 68 101 30 54 53 99 0 33 17 ...
## $ Sales : num [1:4248] 219 190 234 100 134 180 341 150 140 130 ...
## $ Total Expenses: num [1:4248] 36 39 38 26 26 55 72 87 47 55 ...
INSIGHT 1. 1. Apakah terdapat hubungan antara Sales dan Profit dalam dataset Coffe Chain?
Deskripsi Insight Dalam dunia bisnis, Sales menjadi indikator utama dalam performa perusahaan. Namun demikian, tinggi nya angka penjualan tidak selalu menjamin tingginya profit yang diperoleh. Hal ini dikarenakan karna adanya faktor lain seperti biaya produksi, biaya pemasaran, serta efisiensi operasional yang turut mempengaruhi profit. Oleh karena itu, analisis ini bertujuan untuk mengkaji hubungan antara Sales dan Profit guna mengetahui apakah peningkatan penjualan benar-benar berkontribusi terhadap peningkatan keuntungan. Hasil dari analisis ini diharapkan dapat menjadi gambaran mengenai strategi penjualan yang ditetapkan.
Visualisasi
ggplot(data, aes(x = Sales, y = Profit)) +
geom_point(color = "brown", alpha = 0.6) +
geom_smooth(method = "Im", color = "darkred", se = FALSE) +
labs(title = "Hubungan Sales dan Profit",
x = "Sales",
y = "Profit") +
theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'
## Warning: Failed to fit group -1.
## Caused by error in `compute_group()`:
## ! object 'weight' not found
Interprestasi Visualisasi Berdasarkan grafik scatter plot yang dihasilkan, dapat terlihat bahwa adanya pola hubungan yang cenderung meningkat antara Sales dan Profit. Titik-titik antara data cenderung membentuk pola naik, yang mengindikasikan bahwa semakin tinggi penjualan maka keuntungan juga cenderung meningkat.
Analisis Data
cor(data$Sales, data$Profit)
## [1] 0.7973309
cor.test(data$Sales, data$Profit)
##
## Pearson's product-moment correlation
##
## data: data$Sales and data$Profit
## t = 86.084, df = 4246, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.7861073 0.8080289
## sample estimates:
## cor
## 0.7973309
H0: Tidak terdapat hubungan antara Sales dan Profit (p = 0) h1: Terdapat hubungan antara Sales dan Profit (p =! 0)
Interprestasi Analisis Berdasarkan hasil uji korelasi, diperoleh nilai p-value < 0.05, sehingga H0 ditolak. Hal ini meenunjukkan bahwa terdapat hubungan yang signifikan antara Sales dan Profit. Nilai hasil pengujian ini menunjukkan bahwa hubungan tersebut bersifat kuat dan positif, sehingga peningkatan penjualan cenderung diikuti oleh peningkatan keuntungan.
Kesimpulan Dapat disimpulkan bahwa terdapat hubungan yang kuat dan signifikan antara Sales dan Profit. Hal ini menunjukkan bahwa strategi peningkatan penjualan berperan penting dalam meningkatkan perusahaan.
INSIGHT 2 1. Bagaimana distribusi data Sales?
Deskripsi Insight Distribusi data penjualan dianalisis untuk mengetahui pola penyebaran data serta mengidentifikasi adanya skewness atau nilai ekstrem
Visualisasi
ggplot(data, aes(x = Sales)) +
geom_histogram(aes(y = after_stat(density)),
fill = "brown",
color = "orange",
bins = 30) +
geom_density(color = "red") +
theme_minimal()
str(data)
## tibble [4,248 × 20] (S3: tbl_df/tbl/data.frame)
## $ Area Code : num [1:4248] 719 970 970 303 303 720 970 719 970 719 ...
## $ Date : POSIXct[1:4248], format: "2012-01-01" "2012-01-01" ...
## $ Market : chr [1:4248] "Central" "Central" "Central" "Central" ...
## $ Market Size : chr [1:4248] "Major Market" "Major Market" "Major Market" "Major Market" ...
## $ Product : chr [1:4248] "Amaretto" "Colombian" "Decaf Irish Cream" "Green Tea" ...
## $ Product Line : chr [1:4248] "Beans" "Beans" "Beans" "Leaves" ...
## $ Product Type : chr [1:4248] "Coffee" "Coffee" "Coffee" "Tea" ...
## $ State : chr [1:4248] "Colorado" "Colorado" "Colorado" "Colorado" ...
## $ Type : chr [1:4248] "Regular" "Regular" "Decaf" "Regular" ...
## $ Budget COGS : num [1:4248] 90 80 100 30 60 80 140 50 50 40 ...
## $ Budget Margin : num [1:4248] 130 110 140 50 90 130 160 80 70 70 ...
## $ Budget Profit : num [1:4248] 100 80 110 30 70 80 110 20 40 20 ...
## $ Budget Sales : num [1:4248] 220 190 240 80 150 210 300 130 120 110 ...
## $ COGS : num [1:4248] 89 83 95 44 54 72 170 63 60 58 ...
## $ Inventory : num [1:4248] 777 623 821 623 456 ...
## $ Margin : num [1:4248] 130 107 139 56 80 108 171 87 80 72 ...
## $ Marketing : num [1:4248] 24 27 26 14 15 23 47 57 19 22 ...
## $ Profit : num [1:4248] 94 68 101 30 54 53 99 0 33 17 ...
## $ Sales : num [1:4248] 219 190 234 100 134 180 341 150 140 130 ...
## $ Total Expenses: num [1:4248] 36 39 38 26 26 55 72 87 47 55 ...
Interprestasi Visualisasi Histogram menunjukkan suatu distribusi yang tidak simetris dan cenderung miring ke kanan, yang mengindiksikan adanya nilai penjualan yang tinggi.
Analisis data
mean(data$Sales)
## [1] 192.9875
median(data$Sales)
## [1] 138
sd(data$Sales)
## [1] 151.1331
H0: Data Sales berdistribusi normal H1: Data Sales tidak berdistribusi normal
Interprestasi Analisis Nilai mean yang lebih besar daripada median menunjukkan bahwa data berdistribusi bahwa data miring ke kanan (positively skewed). Hal ini mengindikasikan bahwa H0 ditolak dan data tidak berdistribusi normal. Hasil standar deviasi yang tinggi menunjukkan adanya variasi besar dalam data penjualan.
Kesimpulan: Distribusi Sales tidak normal dan cenderung adanya dominasi oleh beberapa nilai penjualan yang tinggi. Hal ini menunjukkan adanya ketimpangan dalam kontribusi penjualan.
INSIGHT 3. 1. Bagaimana variasi keuntungan (Profit)?
Deskripsi Insight Analisis ini bertujuan untuk melihat bagaimana pola penyebaran data profit serta mengidentifikasi adanya kerugian dan nilai ekstrem.
Visualisasi
ggplot(data, aes(y = Profit)) +
geom_boxplot(fill = "brown") +
theme_minimal()
4. Interprestasi Visualisasi Boxplot menunjukkan adanya variasi yang
besar dalam data profit, serta indikasi adanya outlier.
summary(data$Provit)
## Warning: Unknown or uninitialised column: `Provit`.
## Length Class Mode
## 0 NULL NULL
H0: Tidak terdapat variasi yang signifikan pada data Profit H1: Terdapat variasi signifikan pada data Profit
Interprestasi Analisis Rentang nilai yang sangat lebar antara minimum dan maksimum menunjukkan bahwa terdapat variasi yang tinggi dalam data Profit. Hal ini mengindikasikan bahwa H0 ditolak. Selain itu, adanya nilai negatif menunjukkan adanya kerugian, sedangkan nilai maksimum menunjukkan potensi keuntungan besar.
Kesimpulan Data Profit memiliki variasi yang tinggi dengan adanya risiko kerugian serta peluang keuntungan yang besar. Hal ini menunjukkan bahwa stabilitas keuntungan perusahaan masih perlu diperhatikan.
KESIMPULAN UMUM Berdasarkan seluruh analisis yang dilakukan, dapat disimpulkan bahwa terdapat hubungan yang kuat antara Sales dan Profit, distribusi Sales yang tidak merata, serta variasi Profit yang tinggi. Hal ini menunjukkan bahwa kinerja bisnis tidak hanya ditentukan oleh penjualan tapi juga oleh kemampuan perusahaan dalam mengelola biaya dan mengoptimalkan keuntungan.