Analisis Pengeluaran Anggaran Iklan terhadap Pendapatan Penjualan

Nama: Aisyah Azka Nurfadhila
NRP : 5006201066

1. Statistika Deskriptif

data = read.csv("C:/Folder ITS/Semester 7/Business Intellegence/Advertising Budget and Sales.csv")

#Ganti nama variabel
names(data)[1] <- "ID" 
names(data)[2] <- "Iklan TV ($)" 
names(data)[3] <- "Iklan Radio ($)" 
names(data)[4] <- "Iklan Koran ($)" 
names(data)[5] <- "Pendapatan Penjualan ($)" 

summary(data)
##        ID          Iklan TV ($)    Iklan Radio ($)  Iklan Koran ($) 
##  Min.   :  1.00   Min.   :  0.70   Min.   : 0.000   Min.   :  0.30  
##  1st Qu.: 50.75   1st Qu.: 74.38   1st Qu.: 9.975   1st Qu.: 12.75  
##  Median :100.50   Median :149.75   Median :22.900   Median : 25.75  
##  Mean   :100.50   Mean   :147.04   Mean   :23.264   Mean   : 30.55  
##  3rd Qu.:150.25   3rd Qu.:218.82   3rd Qu.:36.525   3rd Qu.: 45.10  
##  Max.   :200.00   Max.   :296.40   Max.   :49.600   Max.   :114.00  
##  Pendapatan Penjualan ($)
##  Min.   : 1.60           
##  1st Qu.:10.38           
##  Median :12.90           
##  Mean   :14.02           
##  3rd Qu.:17.40           
##  Max.   :27.00
a=sd(data$`Iklan TV ($)`)
b=sd(data$`Iklan Radio ($)`)
c=sd(data$`Iklan Koran ($)`)
d=sd(data$`Pendapatan Penjualan ($)`)
print(c(a,b,c,d))
## [1] 85.854236 14.846809 21.778621  5.217457

Berdasarkan ouput diatas, dapat diketahui bahwa untuk variabel Iklan TV memiliki nilai mean 147.04 dan nilai standar deviasi 85.854236. Untuk variabel Iklan Radio memiliki nilai mean 23.264 dan nilai standar deviasi 14.846809. Untuk variabel Iklan Koran memiliki nilai mean 30.55 dan nilai standar deviasi 21.778621. Untuk variabel Pendapatan Penjualan memiliki nilai mean 14.02 dan nilai standar deviasi 5.217457.Dapat dilihat bahwa keempat variabel memiliki nilai mean yang lebih besar dari nilai standar deviasinya, sehingga penyimpangan data yang terjadi rendah dan dapat disimpulkan bahwa penyebaran nilainya merata.

2. Visualisasi

par(mfrow=c(2,2))
hist(data$`Iklan TV ($)`)
hist(data$`Iklan Radio ($)`)
hist(data$`Iklan Koran ($)`)
hist(data$`Pendapatan Penjualan ($)`)

Berdasarkan histogram diatas, dapat dilihat pada variabel Iklan TV dengan rentang harga 200-250 US Dollar memiliki frekuensi paling banyak, tetapi secara keseluruhan frekuensi cenderung stabil. Untuk variabel Iklan Radio, rentang harga 0-5 US Dollar memiliki frekuensi paling banyak, tetapi secara keseluruhan frekuensi cenderung menurun. Untuk variabel Iklan Koran, semakin tinggi rentang harga maka frekuensi cenderung menurun. Dan untuk variabel Pendapatan Penjualan, rentang harga 10-15 Us Dollar memiliki frekuensi paling banyak.

library(cowplot)
## Warning: package 'cowplot' was built under R version 4.1.3
library(ggplot2)
plot1 <- ggplot(data=data)+
  geom_point(mapping=aes(x=`Iklan TV ($)`, y=`Pendapatan Penjualan ($)`))
plot2 <- ggplot(data=data)+
  geom_point(mapping=aes(x=`Iklan Radio ($)`, y=`Pendapatan Penjualan ($)`))
plot3 <- ggplot(data=data)+
  geom_point(mapping=aes(x=`Iklan Koran ($)`, y=`Pendapatan Penjualan ($)`))
plot_grid(plot1, plot2, plot3)

Berdasarkan scatterplot diatas, dapat dilihat bahwa variabel Iklan TV dengan Pendapatan Penjualan memiliki hubungan positif yaitu semakin besar biaya iklan TV yang dikeluarkan, maka semakin tinggi Pendapatan Penjualan yang dihasilkan. Variabel Iklan Radio dengan Pendapatan Penjualan juga memiliki hubungan yang cenderung positif. Hal tersebut berarti biaya iklan Radio yang dikeluarkan berpengaruh terhadap besarnya pendapatan penjualan. Variabel Iklan Koran dengan Pendapatan Penjualan memiliki hubungan yang lemah atau bisa dikatakan tidak ada hubungan, sehingga dapat dikatakan bahwa biaya iklan koran yang dikeluarkan tidak begitu berpengaruh terhadap besarnya Pendapatan Penjualan.

3. Analisis Korelasi

cor(data$`Iklan TV ($)`, y=data$`Pendapatan Penjualan ($)`)
## [1] 0.7822244
cor(data$`Iklan Radio ($)`, y=data$`Pendapatan Penjualan ($)`)
## [1] 0.5762226
cor(data$`Iklan Koran ($)`, y=data$`Pendapatan Penjualan ($)`)
## [1] 0.228299

Berdasarkan output diatas, variabel Iklan Tv dengan Pendapatan Penjualan memiliki nilai korelasi positif 0.7822244 yang berarti bahwa semakin besar biaya iklan TV yang dikeluarkan, semakin tinggi pendapatan penjualan yang dihasilkan. Variabel Iklan Radio dengan Pendapatan Penjualan memiliki nilai korelasi positif 0.5762226 (moderat) yang berarti bahwa besar biaya iklan Radio yang dikeluarkan berpengaruh terhadap pendapatan penjualan namun tidak signifikan. Variabel Iklan Koran dengan Pendapatan Penjualan memiliki nilai korelasi positif 0.228299 yang berarti bahwa biaya iklan Koran yang dikeluarkan tidak begitu berpengaruh terhadap pendapatan penjualan yang dihasilkan.

4. Model Regresi Linier (Sederhana dan Berganda)

#Regresi Linier Sederhana
e=lm(data$`Pendapatan Penjualan ($)` ~ data$`Iklan TV ($)`)
summary(e)
## 
## Call:
## lm(formula = data$`Pendapatan Penjualan ($)` ~ data$`Iklan TV ($)`)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.3860 -1.9545 -0.1913  2.0671  7.2124 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         7.032594   0.457843   15.36   <2e-16 ***
## data$`Iklan TV ($)` 0.047537   0.002691   17.67   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.259 on 198 degrees of freedom
## Multiple R-squared:  0.6119, Adjusted R-squared:  0.6099 
## F-statistic: 312.1 on 1 and 198 DF,  p-value: < 2.2e-16

Berdasarkan output diatas, dapat dilihat bahwa variabel Iklan TV memiliki nilai p-value < 2.2e-16 kurang dari alpha (0.05), sehingga dapat disimpulkan bahwa variabel Iklan TV berpengaruh secara signifikan terhadap variabel Pendapatan Penjualan.

Model Regresi Linier Sederhana: Y = 7.032594 + 0.047537X1

Interpretasi Model: Setiap kenaikan Iklan TV sebesar 1, akan menyebabkan kenaikan Pendapatan Penjualan sebesar 0.047537.

#Regresi Linier Berganda
f=lm(data$`Pendapatan Penjualan ($)` ~ data$`Iklan TV ($)`+data$`Iklan Radio ($)`+
       data$`Iklan Koran ($)`)
summary(f)
## 
## Call:
## lm(formula = data$`Pendapatan Penjualan ($)` ~ data$`Iklan TV ($)` + 
##     data$`Iklan Radio ($)` + data$`Iklan Koran ($)`)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.8277 -0.8908  0.2418  1.1893  2.8292 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)    
## (Intercept)             2.938889   0.311908   9.422   <2e-16 ***
## data$`Iklan TV ($)`     0.045765   0.001395  32.809   <2e-16 ***
## data$`Iklan Radio ($)`  0.188530   0.008611  21.893   <2e-16 ***
## data$`Iklan Koran ($)` -0.001037   0.005871  -0.177     0.86    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.686 on 196 degrees of freedom
## Multiple R-squared:  0.8972, Adjusted R-squared:  0.8956 
## F-statistic: 570.3 on 3 and 196 DF,  p-value: < 2.2e-16

Berdasarkan output diatas, dapat dilihat bahwa pada variabel Iklan TV dan Iklan Radio memiliki nilai p-value < 2.2e-16 kurang dari alpha (0.05), sehingga dapat disimpulkan bahwa variabel tersebut berpengaruh secara signifikan terhadap variabel Pendapatan Penjualan. Sedangkan variabel Iklan Koran memiliki nilai p-value 0.86 lebih besar dari alpha (0.05), sehingga dapat disimpulkan bahwa variabel tersebut tidak berpengaruh secara signifikan terhadap variabel Pendapatan Penjualan.

Model Regresi Linier Sederhana: Y = 2.938889 + 0.045765X1 + 0.188530X2 - 0.001037X3

Interpretasi Model: Setiap kenaikan Iklan TV sebesar 1, akan menyebabkan kenaikan Pendapatan Penjualan sebesar 0.045765. Setiap kenaikan Iklan Radio sebesar 1, akan menyebabkan kenaikan Pendapatan Penjualan sebesar 0.188530. Setiap kenaikan Iklan Koran sebesar 1, akan menyebabkan penurunan Pendapatan Penjualan sebesar 0.001037.

#Uji Asumsi Klasik
#Cek Multikolinieritas
library(car)
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.1.3
vif(f)
##    data$`Iklan TV ($)` data$`Iklan Radio ($)` data$`Iklan Koran ($)` 
##               1.004611               1.144952               1.145187

Berdasarkan output diatas, dapat dilihat bahwa semua variabel memiliki nilai VIF < 10, sehingga dapat dinyatakan bahwa model tidak terdapat gejala multikolinieritas.

#Uji Normalitas
ks.test(f$residuals,"pnorm")
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  f$residuals
## D = 0.16256, p-value = 5.136e-05
## alternative hypothesis: two-sided

Berdasarkan output diatas, dapat dilihat bahwa nilai p-value 5.136e-05 < alpha (0.05), sehingga dapat dinyatakan bahwa data tidak berdistribusi normal. Namun, beberapa pakar statistik menyatakan bahwa jika data lebih dari 30 (n>30), maka dapat diasumsikan berdistribusi normal. Hal ini turut diperkuat dengan penjelasan (Bowerman dkk., 2017) yang menjelaskan jika ukuran sampel cukup besar, maka populasi dari semua kemungkinan sampel akan terdistribusi normal, tidak memedulikan nilai probabilitasnya (p-value). Dikarenakan data yang saya gunakan berjumlah 200 data, maka dapat disimpulkan bahwa data berdistribusi normal.