Nama : Lutfi Rahmayanti
NIM : M0725044

Pendahuluan

Dalam era persaingan bisnis yang semakin ketat, perusahaan perlu memahami faktor-faktor yang memengaruhi profitabilitas. Salah satu aspek penting adalah strategi pemasaran serta efisiensi biaya operasional. Oleh karena itu, analisis ini bertujuan untuk mengkaji hubungan antara marketing dan profit pada Coffee Chain, serta mengidentifikasi faktor lain yang berpotensi memengaruhi profit.

Analisis dilakukan dengan pendekatan data menggunakan kombinasi SQL dan R, di mana data diekstraksi melalui query SQL dan dianalisis menggunakan metode statistik di R.

Import dan Persiapan Data

Data diperoleh melalui koneksi database SQL di RStudio. Selanjutnya dilakukan proses ekstraksi data menggunakan query SQL dengan teknik JOIN untuk menggabungkan tabel yang berkitan dengan data choffee chain. Data hasil query kemudian dianalisis menggunakan metode statistik di R. Tahap awal analisis dilakukan dengan mengeksplorasi struktur dan ringkasan data untuk memahami karakteristik variabel yang akan dianalisis.

library(DBI)
library(odbc)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
con2 = dbConnect(odbc(),
                 Driver = "MySQL ODBC 8.0 ANSI Driver",
                 Server = "127.0.0.1",
                 UID = "root",
                 PWD = "Luutfirahma15_2",
                 Port = "3306",
                 Database = "classicmodels")

#menampilkan keseluruhan tabel
data_coffee_chain = dbGetQuery(con2, "SELECT 
    l.`Area Code`,
    f. `Date`,
    l.Market,
    l.`Market Size`,
    p.Product,
    p.`Product Line`,
    p.`Product Type`,
    l.State,
    p.`Type`,
    f.`Budget COGS`,
    f.`Budget Margin`,
    f.`Budget Profit`,
    f.`Budget Sales`,
      f.COGS,
    f.Inventory,
    f.Margin,
    f.Marketing,
    f.Profit,
    f.Sales,
    f.`Total Expenses`
FROM factTable f
JOIN Product p ON f.ProductId = p.ProductId
JOIN Location l ON f.`Area Code` = l.`Area Code`
order by f.`Date`")
View(data_coffee_chain)
summary(data_coffee_chain)
##    Area Code         Date              Market          Market Size       
##  Min.   :203.0   Length:4248        Length:4248        Length:4248       
##  1st Qu.:417.0   Class :character   Class :character   Class :character  
##  Median :573.0   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :582.3                                                           
##  3rd Qu.:772.0                                                           
##  Max.   :985.0                                                           
##    Product          Product Line       Product Type          State          
##  Length:4248        Length:4248        Length:4248        Length:4248       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##      Type            Budget COGS     Budget Margin    Budget Profit    
##  Length:4248        Min.   :  0.00   Min.   :-210.0   Min.   :-320.00  
##  Class :character   1st Qu.: 30.00   1st Qu.:  50.0   1st Qu.:  20.00  
##  Mode  :character   Median : 50.00   Median :  70.0   Median :  40.00  
##                     Mean   : 74.83   Mean   : 100.8   Mean   :  60.91  
##                     3rd Qu.: 90.00   3rd Qu.: 130.0   3rd Qu.:  80.00  
##                     Max.   :450.00   Max.   : 690.0   Max.   : 560.00  
##   Budget Sales         COGS          Inventory           Margin       
##  Min.   :   0.0   Min.   :  0.00   Min.   :-3534.0   Min.   :-302.00  
##  1st Qu.:  80.0   1st Qu.: 43.00   1st Qu.:  432.0   1st Qu.:  52.75  
##  Median : 130.0   Median : 60.00   Median :  619.0   Median :  76.00  
##  Mean   : 175.6   Mean   : 84.43   Mean   :  749.4   Mean   : 104.29  
##  3rd Qu.: 210.0   3rd Qu.:100.00   3rd Qu.:  910.5   3rd Qu.: 132.00  
##  Max.   :1140.0   Max.   :364.00   Max.   : 8252.0   Max.   : 613.00  
##    Marketing          Profit           Sales     Total Expenses  
##  Min.   :  0.00   Min.   :-638.0   Min.   : 17   Min.   : 10.00  
##  1st Qu.: 13.00   1st Qu.:  17.0   1st Qu.:100   1st Qu.: 33.00  
##  Median : 22.00   Median :  40.0   Median :138   Median : 46.00  
##  Mean   : 31.19   Mean   :  61.1   Mean   :193   Mean   : 54.06  
##  3rd Qu.: 39.00   3rd Qu.:  92.0   3rd Qu.:230   3rd Qu.: 65.00  
##  Max.   :156.00   Max.   : 778.0   Max.   :912   Max.   :190.00
head(data_coffee_chain)
##   Area Code                Date  Market  Market Size           Product
## 1       719 2012-01-01 00:00:00 Central Major Market          Amaretto
## 2       970 2012-01-01 00:00:00 Central Major Market         Colombian
## 3       970 2012-01-01 00:00:00 Central Major Market Decaf Irish Cream
## 4       303 2012-01-01 00:00:00 Central Major Market         Green Tea
## 5       303 2012-01-01 00:00:00 Central Major Market       Caffe Mocha
## 6       720 2012-01-01 00:00:00 Central Major Market    Decaf Espresso
##   Product Line Product Type    State    Type Budget COGS Budget Margin
## 1        Beans       Coffee Colorado Regular          90           130
## 2        Beans       Coffee Colorado Regular          80           110
## 3        Beans       Coffee Colorado   Decaf         100           140
## 4       Leaves          Tea Colorado Regular          30            50
## 5        Beans     Espresso Colorado Regular          60            90
## 6        Beans     Espresso Colorado   Decaf          80           130
##   Budget Profit Budget Sales COGS Inventory Margin Marketing Profit Sales
## 1           100          220   89       777    130        24     94   219
## 2            80          190   83       623    107        27     68   190
## 3           110          240   95       821    139        26    101   234
## 4            30           80   44       623     56        14     30   100
## 5            70          150   54       456     80        15     54   134
## 6            80          210   72       558    108        23     53   180
##   Total Expenses
## 1             36
## 2             39
## 3             38
## 4             26
## 5             26
## 6             55
str(data_coffee_chain)
## 'data.frame':    4248 obs. of  20 variables:
##  $ Area Code     : int  719 970 970 303 303 720 970 719 970 719 ...
##  $ Date          : chr  "2012-01-01 00:00:00" "2012-01-01 00:00:00" "2012-01-01 00:00:00" "2012-01-01 00:00:00" ...
##  $ Market        : chr  "Central" "Central" "Central" "Central" ...
##  $ Market Size   : chr  "Major Market" "Major Market" "Major Market" "Major Market" ...
##  $ Product       : chr  "Amaretto" "Colombian" "Decaf Irish Cream" "Green Tea" ...
##  $ Product Line  : chr  "Beans" "Beans" "Beans" "Leaves" ...
##  $ Product Type  : chr  "Coffee" "Coffee" "Coffee" "Tea" ...
##  $ State         : chr  "Colorado" "Colorado" "Colorado" "Colorado" ...
##  $ Type          : chr  "Regular" "Regular" "Decaf" "Regular" ...
##  $ Budget COGS   : int  90 80 100 30 60 80 140 50 50 40 ...
##  $ Budget Margin : int  130 110 140 50 90 130 160 80 70 70 ...
##  $ Budget Profit : int  100 80 110 30 70 80 110 20 40 20 ...
##  $ Budget Sales  : int  220 190 240 80 150 210 300 130 120 110 ...
##  $ COGS          : int  89 83 95 44 54 72 170 63 60 58 ...
##  $ Inventory     : int  777 623 821 623 456 558 1091 435 336 338 ...
##  $ Margin        : int  130 107 139 56 80 108 171 87 80 72 ...
##  $ Marketing     : int  24 27 26 14 15 23 47 57 19 22 ...
##  $ Profit        : int  94 68 101 30 54 53 99 0 33 17 ...
##  $ Sales         : int  219 190 234 100 134 180 341 150 140 130 ...
##  $ Total Expenses: int  36 39 38 26 26 55 72 87 47 55 ...

Selanjutnya, akan digunakan data Profit, Marketing, Biaya Produksi (COGS), Sales, Product Type, dan Market Size untuk analisis statistik, maka data akan diambil dengan membuat data frame.

Data ini diambil untuk mengetahui seberapa besar peran marketing terhadap profit pada data Coffee Chain.

#mengambil data yang akan dianalisis
dcc <- data.frame(Profit = data_coffee_chain$Profit,
         Marketing = data_coffee_chain$Marketing,
         COGS = data_coffee_chain$COGS,
         Sales = data_coffee_chain$Sales,
         `Product Type` = data_coffee_chain$`Product Type`,
         `Market Size` = data_coffee_chain$`Market Size`)
View(dcc)

Visualisasi Data

Visualisasi berikut digunakan untuk melihat pola hubungan antara biaya marketing dan profit. Selain itu, ditambahkan garis regresi untuk menunjukkan tren hubungan antar variabel.

library(ggplot2)
# Hitung korelasi
cor_val <- cor(dcc$Marketing, dcc$Profit, method = "spearman", use = "complete.obs")

ggplot(dcc, aes(x = Marketing, y = Profit)) +
  geom_point(aes(color = Profit, size = Sales), alpha = 0.7) +
  geom_smooth(method = "lm", se = TRUE, color = "red") +
  
  annotate(
    "text",
    x = max(dcc$Marketing)*0.6,
    y = max(dcc$Profit)*0.9,
    label = paste0("Korelasi: ", round(cor_val, 3)),
    size = 5,
    fontface = "bold"
  ) +
  
  scale_color_gradient(low = "#56B1F7", high = "#132B43") +
  
  labs(
    title = "Pengaruh Marketing terhadap Profit",
    subtitle = "Ukuran titik menunjukkan Sales",
    x = "Marketing",
    y = "Profit"
  ) +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

Berdasarkan visualisasi di atas terlihat adanya kecenderungan pola hubungan yang bersifat positif, di mana peningkatan nilai marketing diikuti dengan peningkatan profit. Hal ini ditunjukkan oleh arah sebaran titik yang cenderung naik serta garis regresi yang memiliki kemiringan positif.

Selain itu, variasi ukuran dan warna titik yang merepresentasikan nilai sales dan profit menunjukkan bahwa terdapat perbedaan intensitas kinerja pada masing-masing observasi. Beberapa titik dengan ukuran yang lebih besar mengindikasikan adanya volume penjualan yang tinggi, yang turut berkontribusi terhadap peningkatan profit.

Namun demikian, sebaran titik yang cukup menyebar dan tidak terlalu rapat di sekitar garis regresi menunjukkan bahwa hubungan antara marketing dan profit tidak terlalu kuat, sehingga terdapat variabilitas yang cukup besar dalam data.

Meskipun visualisasi menunjukkan adanya kecenderungan hubungan positif antara marketing dan profit, sebaran data yang cukup luas mengindikasikan adanya kemungkinan data yang menyimpang dari pola umum. Oleh karena itu, perlu dilakukan analisis lebih lanjut untuk mengidentifikasi keberadaan outlier dalam data.

Berikut adalah visualisasi data outlier yang terdeteksi:

model <- lm(Profit ~ Marketing, data = dcc)

dcc$residual <- resid(model)
dcc$z_resid <- scale(dcc$residual)

outliers <- dcc %>%
  filter(abs(z_resid) > 2)
## Warning: Using one column matrices in `filter()` or `filter_out()` was deprecated in
## dplyr 1.1.0.
## ℹ Please use one dimensional logical vectors instead.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
ggplot(dcc, aes(x = Marketing, y = Profit)) +
  geom_point(color = "grey70") +
  geom_point(data = outliers, color = "red", size = 3) +
  geom_text(data = outliers, aes(label = Product.Type), vjust = -1, size = 3) +
  geom_smooth(method = "lm", color = "blue") +
  labs(
    title = "Deteksi Outlier",
    subtitle = "Titik merah adalah data menyimpang"
  ) +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

Berdasarkan visualisasi deteksi outlier, terlihat bahwa terdapat beberapa titik data yang berada jauh dari pola umum atau garis regresi. Titik-titik tersebut ditandai dengan warna merah dan menunjukkan observasi yang memiliki nilai residual tinggi, sehingga dikategorikan sebagai outlier.

Keberadaan outlier ini mengindikasikan bahwa tidak semua data mengikuti hubungan linear antara marketing dan profit. Beberapa kondisi menunjukkan bahwa meskipun nilai marketing tinggi, profit yang dihasilkan tidak selalu sebanding, atau sebaliknya. Hal ini dapat disebabkan oleh berbagai faktor seperti perbedaan jenis produk, kondisi pasar, atau efisiensi operasional yang tidak tercermin dalam variabel yang dianalisis.

Oleh karena itu, keberadaan outlier perlu diperhatikan karena dapat memengaruhi hasil analisis statistik, khususnya dalam model regresi, serta menunjukkan bahwa terdapat faktor lain yang memengaruhi profit di luar variabel marketing

Untuk memberikan informasi yang lebih rinci, data outlier juga ditampilkan dalam bentuk tabel berikut:

# Menampilkan data outlier
outliers %>%
  select(Product.Type, Market.Size, Marketing, Profit, residual, z_resid) %>%
  arrange(desc(abs(z_resid)))
##     Product.Type  Market.Size Marketing Profit  residual   z_resid
## 1            Tea Small Market       114   -638 -769.3738 -7.764419
## 2            Tea Small Market       111   -605 -733.8280 -7.405696
## 3         Coffee Major Market        17    778  728.9396  7.356363
## 4         Coffee Major Market        17    777  727.9396  7.346271
## 5         Coffee Major Market        17    755  705.9396  7.124250
## 6            Tea Small Market       107   -558 -683.4337 -6.897123
## 7            Tea Small Market        93   -552 -665.5534 -6.716677
## 8            Tea Small Market        98   -542 -659.7963 -6.658578
## 9            Tea Small Market        96   -539 -655.0991 -6.611174
## 10           Tea Small Market       100   -524 -643.4935 -6.494052
## 11           Tea Small Market       102   -522 -643.1907 -6.490996
## 12        Coffee Major Market        19    690  639.2424  6.451150
## 13           Tea Small Market       102   -509 -630.1907 -6.359802
## 14           Tea Small Market        91   -508 -619.8562 -6.255507
## 15           Tea Small Market        93   -505 -618.5534 -6.242359
## 16           Tea Small Market        93   -505 -618.5534 -6.242359
## 17           Tea Small Market       114   -430 -561.3738 -5.665311
## 18      Espresso Major Market       156   -392 -559.0147 -5.641502
## 19      Espresso Major Market        66    646  555.3586  5.604606
## 20        Coffee Major Market        21    599  546.5452  5.515663
## 21           Tea Small Market       111   -408 -536.8280 -5.417598
## 22    Herbal Tea Major Market        96   -420 -536.0991 -5.410242
## 23        Coffee Major Market        22    589  535.6966  5.406180
## 24           Tea Small Market       107   -404 -529.4337 -5.342975
## 25      Espresso Major Market       147   -367 -526.3773 -5.312131
## 26        Coffee Major Market        22    579  525.6966  5.305261
## 27        Coffee Major Market        23    572  517.8481  5.226054
## 28        Coffee Major Market        17    564  514.9396  5.196703
## 29        Coffee Major Market        17    563  513.9396  5.186611
## 30           Tea Small Market       100   -380 -499.4935 -5.040823
## 31           Tea Small Market       102   -378 -499.1907 -5.037767
## 32        Coffee Major Market        17    547  497.9396  5.025141
## 33           Tea Small Market       102   -369 -490.1907 -4.946940
## 34        Coffee Major Market        23    543  488.8481  4.933390
## 35           Tea Small Market        98   -365 -482.7963 -4.872317
## 36      Espresso Major Market        59    565  480.2987  4.847112
## 37           Tea Small Market        96   -363 -479.0991 -4.835006
## 38      Espresso Major Market       131   -326 -471.7999 -4.761342
## 39      Espresso Major Market       122   -332 -470.1625 -4.744818
## 40           Tea Small Market        93   -354 -467.5534 -4.718487
## 41        Coffee Major Market        23    516  461.8481  4.660910
## 42           Tea Small Market        91   -342 -453.8562 -4.580257
## 43           Tea Small Market        93   -340 -453.5534 -4.577201
## 44           Tea Small Market        93   -340 -453.5534 -4.577201
## 45    Herbal Tea Major Market        77   -353 -452.9759 -4.571373
## 46      Espresso Major Market       156   -284 -451.0147 -4.551581
## 47        Coffee Major Market        24    505  449.9995  4.541335
## 48      Espresso Major Market       113   -309 -439.5252 -4.435631
## 49      Espresso Major Market       113   -304 -434.5252 -4.385171
## 50      Espresso Major Market       113   -300 -430.5252 -4.344804
## 51      Espresso Major Market       110   -301 -428.9794 -4.329204
## 52      Espresso Major Market       109   -300 -427.1308 -4.310548
## 53        Coffee Major Market        24    481  425.9995  4.299131
## 54      Espresso Major Market       147   -266 -425.3773 -4.292852
## 55    Herbal Tea Major Market        96   -304 -420.0991 -4.239585
## 56      Espresso Major Market       110   -292 -419.9794 -4.238377
## 57    Herbal Tea Major Market       102    536  414.8093  4.186201
## 58        Coffee Major Market        19    465  414.2424  4.180480
## 59      Espresso Major Market       109   -269 -396.1308 -3.997700
## 60      Espresso Major Market        95   -268 -383.2506 -3.867714
## 61      Espresso Major Market       131   -236 -381.7999 -3.853074
## 62        Coffee Major Market        21    434  381.5452  3.850504
## 63    Herbal Tea Major Market        74   -280 -377.4301 -3.808975
## 64      Espresso Major Market        70    463  368.9642  3.723539
## 65        Coffee Major Market       127    511  368.5945  3.719807
## 66        Coffee Major Market       127    511  368.5945  3.719807
## 67        Coffee Major Market       127    508  365.5945  3.689532
## 68        Coffee Major Market       127    508  365.5945  3.689532
## 69      Espresso Major Market       122   -224 -362.1625 -3.654897
## 70        Coffee Major Market       124    493  353.1403  3.563845
## 71        Coffee Major Market       124    493  353.1403  3.563845
## 72    Herbal Tea Major Market        74   -252 -349.4301 -3.526403
## 73      Espresso Major Market        66    435  344.3586  3.475222
## 74        Coffee Major Market        22    397  343.6966  3.468541
## 75      Espresso Major Market        72    439  343.2671  3.464206
## 76      Espresso Major Market       113   -208 -338.5252 -3.416352
## 77    Herbal Tea Major Market        77   -238 -337.9759 -3.410808
## 78        Coffee Major Market       110    465  337.0206  3.401167
## 79        Coffee Major Market        22    390  336.6966  3.397898
## 80      Espresso Major Market       113   -205 -335.5252 -3.386076
## 81        Coffee Major Market       110    463  335.0206  3.380983
## 82      Espresso Major Market       113   -202 -332.5252 -3.355801
## 83      Espresso Major Market       110   -203 -330.9794 -3.340201
## 84    Herbal Tea Major Market       111    459  330.1720  3.332052
## 85      Espresso Major Market       109   -202 -329.1308 -3.321545
## 86    Herbal Tea Major Market        80   -226 -328.5217 -3.315398
## 87    Herbal Tea Major Market        69   -232 -325.1872 -3.281746
## 88      Espresso Major Market       110   -197 -324.9794 -3.279650
## 89      Espresso Major Market       109   -195 -322.1308 -3.250902
## 90        Coffee Major Market        78   -217 -317.8245 -3.207443
## 91        Coffee Major Market        73   -221 -317.5815 -3.204991
## 92        Coffee Major Market        23    367  312.8481  3.157221
## 93        Coffee Major Market        23    366  311.8481  3.147130
## 94      Espresso Major Market        63    392  303.9044  3.066963
## 95        Coffee Major Market        63   -209 -297.0956 -2.998250
## 96      Espresso Major Market        59    381  296.2987  2.990208
## 97    Herbal Tea Major Market        75   -197 -295.2787 -2.979914
## 98        Coffee Major Market        23    348  293.8481  2.965476
## 99        Coffee Major Market        94    408  293.5980  2.962953
## 100       Coffee Major Market        94    408  293.5980  2.962953
## 101       Coffee Major Market        99    410  291.3551  2.940317
## 102       Coffee Major Market        99    410  291.3551  2.940317
## 103     Espresso Major Market        95   -172 -287.2506 -2.898895
## 104       Coffee Major Market        66   -196 -286.6414 -2.892747
## 105   Herbal Tea Major Market        74   -189 -286.4301 -2.890615
## 106       Coffee Major Market        97    402  285.0523  2.876710
## 107       Coffee Major Market        97    402  285.0523  2.876710
## 108       Coffee Major Market        24    340  284.9995  2.876177
## 109       Coffee Major Market        64   -196 -284.9442 -2.875619
## 110       Coffee Major Market       105    407  283.2635  2.858658
## 111       Coffee Major Market       105    407  283.2635  2.858658
## 112       Coffee Major Market        64   -189 -277.9442 -2.804976
## 113   Herbal Tea Major Market        72   -181 -276.7329 -2.792752
## 114       Coffee Major Market        57   -188 -271.0041 -2.734937
## 115       Coffee Major Market        94    384  269.5980  2.720748
## 116       Coffee Major Market        94    384  269.5980  2.720748
## 117       Coffee Major Market        24    324  268.9995  2.714707
## 118   Herbal Tea Major Market        66   -178 -268.6414 -2.711094
## 119       Coffee Major Market        49   -192 -268.2153 -2.706794
## 120   Herbal Tea Major Market        66   -177 -267.6414 -2.701002
## 121   Herbal Tea Major Market        74   -170 -267.4301 -2.698870
## 122   Herbal Tea Major Market       102    388  266.8093  2.692604
## 123   Herbal Tea Major Market        80   -164 -266.5217 -2.689702
## 124       Coffee Major Market        49   -190 -266.2153 -2.686610
## 125   Herbal Tea Major Market        64   -176 -264.9442 -2.673782
## 126     Espresso Major Market        66    349  258.3586  2.607321
## 127       Coffee Major Market        78   -157 -257.8245 -2.601931
## 128       Coffee Major Market        53   -178 -257.6097 -2.599763
## 129       Coffee Major Market        50   -180 -257.0639 -2.594255
## 130       Coffee Major Market        47   -182 -256.5181 -2.588747
## 131       Coffee Major Market        91    367  255.1438  2.574878
## 132       Coffee Major Market        91    367  255.1438  2.574878
## 133       Coffee Major Market        90    364  252.9924  2.553166
## 134       Coffee Major Market        90    364  252.9924  2.553166
## 135       Coffee Major Market        50   -174 -251.0639 -2.533704
## 136       Coffee Major Market        48   -174 -249.3667 -2.516576
## 137   Herbal Tea Major Market        98    367  249.2037  2.514931
## 138   Herbal Tea Major Market        69   -156 -249.1872 -2.514764
## 139       Coffee Major Market        73   -149 -245.5815 -2.478377
## 140     Espresso Major Market        97    362  245.0523  2.473035
## 141   Herbal Tea Small Market        97    362  245.0523  2.473035
## 142     Espresso Major Market        97    362  245.0523  2.473035
## 143          Tea Small Market        97    362  245.0523  2.473035
## 144   Herbal Tea Major Market        64   -156 -244.9442 -2.471945
## 145   Herbal Tea Major Market       102    363  241.8093  2.440308
## 146       Coffee Major Market        87    350  241.5382  2.437571
## 147   Herbal Tea Major Market        75   -143 -241.2787 -2.434953
## 148     Espresso Major Market        96    357  240.9009  2.431140
## 149     Espresso Major Market        96    357  240.9009  2.431140
## 150       Coffee Major Market        87    349  240.5382  2.427480
## 151   Herbal Tea Small Market        96    356  239.9009  2.421048
## 152          Tea Small Market        96    356  239.9009  2.421048
## 153     Espresso Major Market        69    332  238.8128  2.410068
## 154       Coffee Major Market        66   -142 -232.6414 -2.347786
## 155       Coffee Major Market        64   -142 -230.9442 -2.330659
## 156       Coffee Major Market        63   -141 -229.0956 -2.312003
## 157       Coffee Major Market        96    345  228.9009  2.310037
## 158       Coffee Major Market        45   -156 -228.8210 -2.309231
## 159   Herbal Tea Major Market       100    348  228.5065  2.306057
## 160     Espresso Major Market        84    334  228.0840  2.301793
## 161   Herbal Tea Major Market        96    344  227.9009  2.299945
## 162       Coffee Major Market       127    370  227.5945  2.296854
## 163       Coffee Major Market       127    370  227.5945  2.296854
## 164   Herbal Tea Major Market        72   -131 -226.7329 -2.288159
## 165     Espresso Major Market        84    332  226.0840  2.281609
## 166   Herbal Tea Small Market        84    332  226.0840  2.281609
## 167          Tea Small Market        84    332  226.0840  2.281609
## 168       Coffee Major Market        64   -137 -225.9442 -2.280199
## 169       Coffee Major Market       127    368  225.5945  2.276670
## 170       Coffee Major Market       127    368  225.5945  2.276670
## 171          Tea Small Market        83    328  222.9325  2.249806
## 172     Espresso Major Market        89    333  222.8410  2.248882
## 173   Herbal Tea Small Market        89    333  222.8410  2.248882
## 174          Tea Small Market        89    333  222.8410  2.248882
## 175     Espresso Major Market        72    318  222.2671  2.243090
## 176     Espresso Major Market        83    326  220.9325  2.229622
## 177   Herbal Tea Small Market        83    326  220.9325  2.229622
## 178     Espresso Major Market        83    326  220.9325  2.229622
## 179     Espresso Major Market        83    326  220.9325  2.229622
## 180   Herbal Tea Small Market        83    326  220.9325  2.229622
## 181     Espresso Major Market        83    326  220.9325  2.229622
## 182     Espresso Major Market        89    331  220.8410  2.228698
## 183          Tea Small Market        83    325  219.9325  2.219530
## 184     Espresso Major Market        70    312  217.9642  2.199666
## 185     Espresso Major Market        81    321  217.6297  2.196291
## 186   Herbal Tea Small Market        81    321  217.6297  2.196291
## 187     Espresso Major Market        81    321  217.6297  2.196291
## 188       Coffee Major Market       124    357  217.1403  2.191351
## 189       Coffee Major Market       124    357  217.1403  2.191351
## 190     Espresso Major Market        77    316  216.0241  2.180087
## 191     Espresso Major Market        77    316  216.0241  2.180087
## 192          Tea Small Market        77    316  216.0241  2.180087
## 193          Tea Small Market        81    319  215.6297  2.176107
## 194       Coffee Major Market        49   -139 -215.2153 -2.171925
## 195   Herbal Tea Small Market        77    315  215.0241  2.169995
## 196       Coffee Major Market        49   -138 -214.2153 -2.161833
## 197   Herbal Tea Small Market        80    315  212.4783  2.144303
## 198          Tea Small Market        80    315  212.4783  2.144303
## 199   Herbal Tea Small Market        86    319  211.3868  2.133287
## 200          Tea Small Market        86    319  211.3868  2.133287
## 201   Herbal Tea Major Market        66   -120 -210.6414 -2.125765
## 202     Espresso Major Market        80    313  210.4783  2.124120
## 203     Espresso Major Market        80    313  210.4783  2.124120
## 204       Coffee Major Market        57   -127 -210.0041 -2.119333
## 205   Herbal Tea Major Market        66   -119 -209.6414 -2.115673
## 206     Espresso Major Market        86    317  209.3868  2.113104
## 207     Espresso Major Market        86    317  209.3868  2.113104
## 208   Herbal Tea Major Market        64   -113 -201.9442 -2.037994
## 209     Espresso Major Market        77    300  200.0241  2.018617
## 210          Tea Small Market        77    300  200.0241  2.018617
## 211          Tea Small Market       114    331  199.6262  2.014601
## 212       Coffee Major Market        53   -120 -199.6097 -2.014435
## 213       Coffee Major Market        40   -131 -199.5780 -2.014115
cat("Jumlah outlier:", nrow(outliers), "\n")
## Jumlah outlier: 213
if(nrow(outliers) > 0){
  cat("Terdapat beberapa data yang menyimpang dari pola umum, yang dapat disebabkan oleh kondisi tertentu seperti strategi marketing yang tidak efektif atau faktor eksternal lainnya.\n")
} else {
  cat("Tidak ditemukan outlier yang signifikan dalam data.\n")
}
## Terdapat beberapa data yang menyimpang dari pola umum, yang dapat disebabkan oleh kondisi tertentu seperti strategi marketing yang tidak efektif atau faktor eksternal lainnya.

Data outlier tersebut menunjukkan adanya beberapa observasi yang memiliki karakteristik berbeda dari pola umum, yang dapat memengaruhi hasil analisis.

Berdasarkan visualisasi di atas, dapat diamati bahwa terdapat kecenderungan hubungan antara marketing dan profit yang akan diuji lebih lanjut menggunakan analisis statistik.

Analisis Data

Analisis Korelasi

Analisis korelasi dilakukan untuk mengukur kekuatan dan arah hubungan antara marketing dan profit. Pada analisis ini akan digunakan:

H0 : Tidak terdapat hubungan yang signifikan antara Marketing dan Profit. H1 : Terdapat hubungan yang signifikan antara Marketing dan Profit.

cor_test <- cor.test(dcc$Marketing, dcc$Profit, method = "spearman")
## Warning in cor.test.default(dcc$Marketing, dcc$Profit, method = "spearman"):
## Cannot compute exact p-value with ties
cor_test
## 
##  Spearman's rank correlation rho
## 
## data:  dcc$Marketing and dcc$Profit
## S = 8228563128, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.3559468
cat("=== KESIMPULAN ===\n\n")
## === KESIMPULAN ===
cat("Keputusan:",
ifelse(cor_test$p.value < 0.05,
"TOLAK H0 - Terdapat hubungan yang signifikan.

",
"GAGAL TOLAK H0 - Tidak Terdapat hubungan yang signifikan.

"))
## Keputusan: TOLAK H0 - Terdapat hubungan yang signifikan.
cat(paste0("Berdasarkan hasil uji korelasi Spearman antara marketing dan profit, diperoleh nilai koefisien korelasi (ρ) sebesar ",
  round(cor_test$estimate, 3),
  " dengan p-value sebesar ", cor_test$p.value,
  ". Hubungan ini ",
  ifelse(cor_test$p.value < 0.05, "signifikan", "tidak signifikan"),
  " dan bersifat ",
  ifelse(cor_test$estimate > 0, "positif.\n\n", "negatif.\n\n")
))
## Berdasarkan hasil uji korelasi Spearman antara marketing dan profit, diperoleh nilai koefisien korelasi (ρ) sebesar 0.356 dengan p-value sebesar 4.24481092935694e-127. Hubungan ini signifikan dan bersifat positif.

Hasil analisis menunjukkan bahwa marketing memiliki hubungan positif dan signifikan terhadap profit. Artinya, peningkatan biaya marketing cenderung diikuti dengan peningkatan profit. Namun, kekuatan hubungan yang tidak terlalu besar mengindikasikan bahwa terdapat faktor lain selain marketing yang juga memengaruhi profit.

Analisis Regresi Linear

Karena hasil analisis korelasi spearman menunjukkan bahwa kekuatan hubungan antara marketing dan profit tidak terlalu besar, maka akan digunakan analisis regresi linear untuk mengetahui seberapa besar pengaruh variabel marketing terhadap profit. Pada analisis ini akan digunakan:

H0 : Marketing tidak berpengaruh signifikan terhadap Profit (Koefisien = 0). H1 : Marketing berpengaruh signifikan terhadap Profit (Koefisien ≠ 0)

model <- lm(Profit ~ Marketing, data = dcc)
summary(model)
## 
## Call:
## lm(formula = Profit ~ Marketing, data = dcc)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -769.37  -30.82   -7.97   33.00  728.94 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 34.63433    2.32197   14.92   <2e-16 ***
## Marketing    0.84859    0.05627   15.08   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 99.1 on 4246 degrees of freedom
## Multiple R-squared:  0.05083,    Adjusted R-squared:  0.05061 
## F-statistic: 227.4 on 1 and 4246 DF,  p-value: < 2.2e-16
coef_val <- coef(model)[2]
p_value <- summary(model)$coefficients["Marketing", "Pr(>|t|)"]
r_squared <- round(summary(model)$r.squared * 100, 2)

cat("=== KESIMPULAN ===\n\n")
## === KESIMPULAN ===
cat(paste0(
  "Berdasarkan hasil uji regresi linear antara marketing dan profit, diperoleh p-value sebesar ",
  p_value,
  " dan koefisien variabel marketing sebesar ",
  round(coef_val, 3),
  ".

"
))
## Berdasarkan hasil uji regresi linear antara marketing dan profit, diperoleh p-value sebesar 4.26501790072002e-50 dan koefisien variabel marketing sebesar 0.849.
cat(paste0(
  "Maka dari itu, ",
  ifelse(p_value < 0.05, "H0 DITOLAK, sehingga hal ini menunjukkan bahwa variabel marketing berpengaruh signifikan terhadap profit. ", "GAGAL TOLAK H0, sehingga hal ini menunjukkan bahwa variabel marketing tidak berpengaruh signifikan terhadap profit. ")
))
## Maka dari itu, H0 DITOLAK, sehingga hal ini menunjukkan bahwa variabel marketing berpengaruh signifikan terhadap profit.
cat(paste0(
  "Nilai koefisien yang ",
  ifelse(coef_val > 0, "positif", "negatif"),
  " menunjukkan bahwa setiap kenaikan marketing sebesar 1 unit akan ",
  ifelse(coef_val > 0, "meningkatkan", "menurunkan"),
  " profit sebesar ",
  round(abs(coef_val), 3),
  ".\n\n"
))
## Nilai koefisien yang positif menunjukkan bahwa setiap kenaikan marketing sebesar 1 unit akan meningkatkan profit sebesar 0.849.
cat(paste0(
  "Namun, jika ditinjau dari sisi akurasi prediksi, nilai R-squared sebesar ",
  round(r_squared, 5),
  " menunjukkan bahwa variabel marketing mampu menjelaskan sekitar ",
  r_squared,
  "% variasi profit, sedangkan sisanya dipengaruhi oleh faktor lain di luar model."
))
## Namun, jika ditinjau dari sisi akurasi prediksi, nilai R-squared sebesar 5.08 menunjukkan bahwa variabel marketing mampu menjelaskan sekitar 5.08% variasi profit, sedangkan sisanya dipengaruhi oleh faktor lain di luar model.

Hasil analisis menunjukkan bahwa variabel Marketing hanya mampu menjelaskan variasi Profit sebesar 5,08%. Meskipun hubungan tersebut nyata secara statistik, rendahnya nilai ini mengisyaratkan bahwa sebagian besar variasi profit (sekitar 94,9%) dipengaruhi oleh faktor-faktor lain di luar biaya marketing yang tidak dimasukkan ke dalam model. Dengan demikian, meskipun strategi marketing terbukti efektif meningkatkan profit, model ini masih memiliki tingkat ketidakpastian yang tinggi jika digunakan sebagai satu-satunya alat prediksi tunggal.

Analisis COGS terhadap Profit

Selain marketing, faktor biaya produksi (COGS) juga dianalisis untuk mengetahui pengaruhnya terhadap profit. Pada analisis ini akan digunakan:

H0 : Tidak terdapat hubungan yang signifikan antara Biaya Produksi (COGS) dan Profit. H1 : Terdapat hubungan yang signifikan antara Biaya Produksi (COGS) dan Profit.

kor_COGS <- cor.test(dcc$COGS, dcc$Profit, method = "spearman")
## Warning in cor.test.default(dcc$COGS, dcc$Profit, method = "spearman"): Cannot
## compute exact p-value with ties
kor_COGS
## 
##  Spearman's rank correlation rho
## 
## data:  dcc$COGS and dcc$Profit
## S = 4992928669, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.6092013
cat("=== KESIMPULAN ===\n\n")
## === KESIMPULAN ===
cat("Keputusan:",
ifelse(kor_COGS$p.value < 0.05,
"TOLAK H0 - Terdapat hubungan yang signifikan.

",
"GAGAL TOLAK H0 - Tidak Terdapat hubungan yang signifikan.

"))
## Keputusan: TOLAK H0 - Terdapat hubungan yang signifikan.
cat(paste0("Berdasarkan hasil uji korelasi Spearman antara marketing dan profit, diperoleh nilai koefisien korelasi (ρ) sebesar ",
  round(kor_COGS$estimate, 3),
  " dengan p-value sebesar ", 
  kor_COGS$p.value,
  ". Hubungan ini ",
  ifelse(kor_COGS$p.value < 0.05, "signifikan", "tidak signifikan"),
  " dan bersifat ",
  ifelse(kor_COGS$estimate > 0, "positif.\n\n", "negatif.\n\n")
))
## Berdasarkan hasil uji korelasi Spearman antara marketing dan profit, diperoleh nilai koefisien korelasi (ρ) sebesar 0.609 dengan p-value sebesar 0. Hubungan ini signifikan dan bersifat positif.

Hasil analisis menunjukkan bahwa biaya produksi (COGS) memiliki hubungan positif dan signifikan terhadap profit. Artinya, selain variabel marketing, peningkatan variabel biaya produksi (COGS) juga memengaruhi peningkatan profit. Ini menguatkan bukti bahwa peningkatan profit tidak hanya dapat dipengaruhi oleh marketing. Dari analisis sebelumnya, biaya produksi (COGS) ini merupakan salah satu faktor lain yang memengaruhi peningkatan profit.

Ringkasan Data

Untuk melengkapi pemahaman terhadap karakteristik data, dilakukan analisis deskriptif guna melihat gambaran umum nilai profit, marketing, dan biaya produksi.

dcc %>%
  summarise(
    Total_Profit = sum(Profit),
    Rata_rata_Profit = mean(Profit),
    Total_Marketing = sum(Marketing),
    Rata_rata_Marketing = mean(Marketing),
    Total_Biaya_Produksi = sum(COGS),
    Rata_rata_Biaya_Produksi = mean(COGS)
  )
##   Total_Profit Rata_rata_Profit Total_Marketing Rata_rata_Marketing
## 1       259543         61.09769          132474            31.18503
##   Total_Biaya_Produksi Rata_rata_Biaya_Produksi
## 1               358672                 84.43315

Berdasarkan hasil ringkasan data, terlihat bahwa perusahaan memiliki tingkat pengeluaran marketing dan profit yang cukup konsisten. Hal ini menunjukkan bahwa aktivitas marketing merupakan bagian penting dalam operasional perusahaan.

Strategi marketing berperan penting dalam meningkatkan profit, namun perlu diimbangi dengan efisiensi biaya agar peningkatan profit dapat lebih optimal.

Kesimpulan

Berdasarkan hasil analisis yang telah dilakukan, diperoleh bahwa variabel marketing memiliki hubungan yang positif dan signifikan terhadap profit, dengan koefisien korelasi Spearman sebesar 0,356 yang menunjukkan kekuatan hubungan pada kategori sedang. Hal ini mengindikasikan bahwa peningkatan biaya marketing cenderung diikuti dengan peningkatan profit. Temuan ini diperkuat oleh analisis regresi linear yang menunjukkan bahwa marketing berpengaruh signifikan terhadap profit. Namun, nilai koefisien determinasi (R-squared) yang relatif rendah, yaitu sekitar 5,08%, menunjukkan bahwa variabel marketing hanya mampu menjelaskan sebagian kecil variasi profit, sehingga sebagian besar variasi dipengaruhi oleh faktor lain di luar model.

Analisis tambahan menunjukkan bahwa biaya produksi (COGS) juga memiliki hubungan positif dan signifikan terhadap profit, yang mengindikasikan bahwa peningkatan aktivitas operasional turut berkontribusi terhadap peningkatan profit. Selain itu, keberadaan outlier dalam data menunjukkan bahwa tidak semua observasi mengikuti pola yang sama, sehingga terdapat variasi kondisi yang tidak sepenuhnya dapat dijelaskan oleh variabel yang dianalisis. Secara keseluruhan, marketing merupakan faktor yang berperan dalam meningkatkan profit, namun bukan faktor dominan. Oleh karena itu, perusahaan perlu mengombinasikan strategi marketing dengan efisiensi biaya serta pengelolaan operasional lainnya untuk mencapai profitabilitas yang optimal.