A. Pendahuluan

Data ini berisi informasi terkait kinerja penjualan dan keuangan perusahan terhadap penjualan minuman di beberapa wilayah dengan ukuran pasar yang berbeda

Tujuan dari analisis ini ingin diketahui faktor - faktor apa saja yang mempengaruhikeuntungan perusahaan. Analisis ini menggunakan anailis regresi untuk mengidentifikasi variabel mana yang paling berpengaruh terhadap ‘profit’ serta seberapa besar pengaruhnya

B.Insigt

Analisis ini ingin mengetahui hubungan anatra sales, COGS, marketing dan product type terhadap keuntungan perusahaan(profit) dan seberapa kuat pengaruhnya.

df <- data %>%
  select(Profit, Sales, COGS, Marketing, `Product Type`) %>%
  na.omit()
summary(df)
##      Profit           Sales          COGS          Marketing     
##  Min.   :-638.0   Min.   : 17   Min.   :  0.00   Min.   :  0.00  
##  1st Qu.:  17.0   1st Qu.:100   1st Qu.: 43.00   1st Qu.: 13.00  
##  Median :  40.0   Median :138   Median : 60.00   Median : 22.00  
##  Mean   :  61.1   Mean   :193   Mean   : 84.43   Mean   : 31.19  
##  3rd Qu.:  92.0   3rd Qu.:230   3rd Qu.:100.00   3rd Qu.: 39.00  
##  Max.   : 778.0   Max.   :912   Max.   :364.00   Max.   :156.00  
##  Product Type      
##  Length:4248       
##  Class :character  
##  Mode  :character  
##                    
##                    
## 
colnames(data)
##  [1] "Area Code"      "Date"           "Market"         "Market Size"   
##  [5] "Product"        "Product Line"   "Product Type"   "State"         
##  [9] "Type"           "Budget COGS"    "Budget Margin"  "Budget Profit" 
## [13] "Budget Sales"   "COGS"           "Inventory"      "Margin"        
## [17] "Marketing"      "Profit"         "Sales"          "Total Expenses"
# Cek missing value
colSums(is.na(data))
##      Area Code           Date         Market    Market Size        Product 
##              0              0              0              0              0 
##   Product Line   Product Type          State           Type    Budget COGS 
##              0              0              0              0              0 
##  Budget Margin  Budget Profit   Budget Sales           COGS      Inventory 
##              0              0              0              0              0 
##         Margin      Marketing         Profit          Sales Total Expenses 
##              0              0              0              0              0
# Cek & hapus duplikasi
sum(duplicated(data))
## [1] 0

C. Visualisasi Data

Ingin mengetahui hubungan variabel independen dengan variabel dependen. Berdasarkan scatter plot ini diketahui terdapat hubungan postif antara sales terhadap profit. Namun terdapat beberapa penyebaran data yang berarti ada faktor lain yang mempengaruhi profit

ggplot(df, aes(x = Sales, y = Profit)) +
geom_point(color = "blue") +
geom_smooth(method = "lm", se = FALSE, color = "red") +
labs(title = "Hubungan Sales terhadap Profit")
## `geom_smooth()` using formula = 'y ~ x'

D. Analisis Data

Berdasarkan hasil analisis regresi model menunjukkan signifikan dengan p-value< 0.001 dengan R-squared = 0.9597 yang berarti model mampu menjelaskan sekitar 95.97% variasi profit. Variabel sales dan product type berpengaruh positif signifikan terhadap profit, sedangkan variabel cogs dan marketing berpengaruh negatif signifikan. Hal ini menunjukan peningkan biaya marketing produksi atau bahan baku dan pemasaran dapat menurunkan profit

model <- lm(Profit ~ Sales + COGS + Marketing + `Product Type`, data = df)

summary(model)
## 
## Call:
## lm(formula = Profit ~ Sales + COGS + Marketing + `Product Type`, 
##     data = df)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -123.469  -12.021   -0.187    9.702  103.092 
## 
## Coefficients:
##                            Estimate Std. Error t value Pr(>|t|)    
## (Intercept)              -25.669110   0.764927 -33.558  < 2e-16 ***
## Sales                      1.195666   0.004509 265.193  < 2e-16 ***
## COGS                      -1.198988   0.012416 -96.565  < 2e-16 ***
## Marketing                 -1.460194   0.020306 -71.910  < 2e-16 ***
## `Product Type`Espresso     3.641829   0.867661   4.197 2.76e-05 ***
## `Product Type`Herbal Tea   3.552489   0.890695   3.988 6.76e-05 ***
## `Product Type`Tea          3.971188   0.915296   4.339 1.47e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 20.42 on 4241 degrees of freedom
## Multiple R-squared:  0.9597, Adjusted R-squared:  0.9597 
## F-statistic: 1.685e+04 on 6 and 4241 DF,  p-value: < 2.2e-16

E. Kesimpulan

Berdasarkan hasil analisis data Coffee Chain menggunakan metode regresi linear, dapat disimpulkan bahwa model yang dibangun mampu menjelaskan variasi profit dengan sangat baik, yang ditunjukkan oleh nilai koefisien determinasi (R²) yang tinggi. Hal ini menunjukkan bahwa variabel yang digunakan dalam model sudah cukup representatif dalam menjelaskan faktor-faktor yang memengaruhi profit. Secara keseluruhan, profit perusahaan dipengaruhi oleh kombinasi antara pendapatan, biaya, dan jenis produk. Oleh karena itu, perusahaan perlu meningkatkan penjualan, mengendalikan biaya secara efisien, serta fokus pada produk yang lebih menguntungkan untuk memaksimalkan keuntungan