Email : vanessasupit0910@gmail.com
RPubs : https://rpubs.com/vanessasupit/
Department : Business Statistics
Address : ARA Center, Matana University Tower
Jl. CBD Barat Kav, RT.1, Curug Sangereng, Kelapa Dua, Tangerang, Banten 15810.
The impact of how a dollar spent on an organization’s marketing efforts on its sales is something that all organizations should consider. A fiscally prudent organization should be using its relatively scarce resources wisely. Thus, all organizations need to ask themselves, “Is the money I’m spending worth the return on sales?” Furthermore, organizations can delve deeper by asking, “For every dollar spent on marketing, how much are we getting in return on sales?” One can answer these questions using a simple linear regression model. As always, we will use a fabricated example to examine a store’s marketing efforts and their impact on sales. This will also be a more comprehensive primer on the simple linear regression model, the model that the majority of econometrics students are first exposed to.
## youtube facebook newspaper sales
## 1 276.12 45.36 83.04 26.52
## 2 53.40 47.16 54.12 12.48
## 3 20.64 55.08 83.16 11.16
## 4 181.80 49.56 70.20 22.20
## 5 216.96 12.96 70.08 15.48
## 6 10.44 58.68 90.00 8.64
## 7 69.00 39.36 28.20 14.16
## 8 144.24 23.52 13.92 15.84
## 9 10.32 2.52 1.20 5.76
## 10 239.76 3.12 25.44 12.72
Tes Hipotesis * Ho : tidak ada hubungan antara advertising budget dan sales * Ha : ada hubungan antara advertising budget dan sales
\[ \begin{align} H_0:\beta_(yt)=\beta_(fb)=\beta_(np)=0 \end{align} \] \[ \begin{align} H_a:\beta_(yt)≠\beta_(fb)≠\beta_(np) \end{align} \] nilai signfikan
alpha = 5% atau 0.05
\[ \begin{align} \alpha= 0.05 \end{align} \]
##
## Call:
## lm(formula = sales ~ youtube + facebook + newspaper, data = marketing)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.5932 -1.0690 0.2902 1.4272 3.3951
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.526667 0.374290 9.422 <2e-16 ***
## youtube 0.045765 0.001395 32.809 <2e-16 ***
## facebook 0.188530 0.008611 21.893 <2e-16 ***
## newspaper -0.001037 0.005871 -0.177 0.86
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.023 on 196 degrees of freedom
## Multiple R-squared: 0.8972, Adjusted R-squared: 0.8956
## F-statistic: 570.3 on 3 and 196 DF, p-value: < 2.2e-16
dari hasil kita dapat melihat bahwa p-value dari F-statistics adalah <2.2e-16. ini berarti setidaknya salah satu variabel prediktor (youtube, Facebook atau newspaper) secara signifikan berhubungan dengan variabel hasil. disini berarti kita menolak Ho. dimana berarti terdapat hubungan antara advertising budget dan sales. Ada hubungan antara advertising budget youtube dan facebook dan sales karena nilai p kurang dari 0,05. Satu-satunya variabel yang tidak dapat kita katakan memiliki dampak pada sales adalah biaya newspaper karena nilai p-nya adalah 0,86.
Seperti yang sudah kita ketahui dari hasil sebelumnya, bahwa tidak ada hubungan antara sales dengan surat kabar atau bisa dikatakan hubungan tersebut lemah. Untuk mengetahui kekuatan hubungan tersebut, kita dapat memeriksa korelasi masing-masing media dengan penjualan menggunakan fungsi cor ().
## youtube facebook newspaper
## 0.7822244 0.5762226 0.2282990
Sekarang kita akan menginterpretasikan hasil di atas menggunakan korelasi rank Spearman di bawah ini:
* \(| r | = 1\) hubungan yang sempurna.
* \(| r | \ ge 0,8\) hubungan yang sangat kuat.
* \(0,6 \ le | r | <0,8\) hubungan yang kuat.
* \(0,4 \ le | r | <0,6\) hubungan sedang.
* \(0,2 \ le | r | <0,4\) hubungan lemah.
* \(0 <| r | <0,2\) hubungan yang sangat lemah.
* \(| r | = 0\) tidak ada hubungan.
dari kriteria diatas kita bisa melihat kalau youtube mempunyai relationship yang kuat, facebook mempunyai relationship yang sedang, dan newspaper mempunyai relationship yang lemah
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.526667243 0.374289884 9.4222884 1.267295e-17
## youtube 0.045764645 0.001394897 32.8086244 1.509960e-81
## facebook 0.188530017 0.008611234 21.8934961 1.505339e-54
## newspaper -0.001037493 0.005871010 -0.1767146 8.599151e-01
kita lihat dari kolom estimasinya, perubahahan advertising budget di youtube dan facebook secara signifikan berhubugan dengan perubahan sales sedangkan perubahan pada advertising budget di newspaper tidak. contohnya, ketika menghabiskan 100 dolar tambahan untuk avdertising di facebook akan menyebabkan peningkatan pejualan rata-rata sekitar (0.1885* 100) = 18.85 atau 19 unit penjualan. koefisien youtube menunjukkan bahwa untuk setiap kenaikan 100 dolar dalam anggaran, kita bisa mendapatkan pingkatan rata-rata (0.0457* 100) 45.7 atau 46 unit penjualan. newspaper tampaknya dampak positif, tetapi juga berdampak negatif pada angka penjualan.
dari jawaban kita yang sebelumnya kita mendapat bahwa hubungan antara sales dan advertising budget kuat. Nilai Adjusted \(R^2\) adalah ~ 0,89, artinya 89% dari varians sales dapat dijelaskan oleh varians dalam avdertising budget.
b0 <- coef(ad.lm)[[1]]
b1 <- coef(ad.lm)[[2]]
b2 <- coef(ad.lm)[[3]]
marketing$prediction <- (b0+b1*marketing$youtube+b2*marketing$facebook)
marketing$error <- abs (marketing$sales-marketing$prediction)
marketing$'%error'<- round(marketing$error/marketing$sales*100,2)
total_error <- sum(marketing$'%error')
MAPE <- total_error/nrow(marketing)
paste ("Prediciton accuracy for future sales is ", 100-MAPE, "%")## [1] "Prediciton accuracy for future sales is 86.1247 %"
**PREDICTION PLOT"
library(ggplot2)
library(caTools)
set.seed(101)
data = sample.split(marketing$youtube, SplitRatio=0.75)
train = subset(marketing, data=TRUE)
test = subset (marketing, data=FALSE)
#Predicting
pred <- predict(ad.lm, test)
data_dim <- dim(marketing)
numx <- data_dim[1]*(1-0.75)
x_axis <- seq(numx)
df <- data.frame(x_axis, pred, test$sales)
#Plotting
g <- ggplot(df, aes(x=x_axis))
g <- g + geom_line(aes(y=pred, colour="Predicted"))
g <- g + geom_point(aes(x=x_axis, y=pred, colour="Predicted"))
g <- g + geom_line(aes(y=test$sales, colour="Actual"))
g <- g + geom_point(aes(x=x_axis, y=test$sales, colour="Actual"))
g <- g + scale_colour_manual("", values = c(Predicted="red", Actual="black"))
gkenapa disini saya tidak menambahkan variabel newspapaer, karena dari hasil estimasi yang kita dapat pada pengerjaan sebelumnya, dapat kita lihat bahwa newspaper memiliki estimasi negatif, dimana dia tidak memberi dampak positif bahkan memberikan negatif jika membayar iklan di newspaper, oleh karena itu saya memutuskan untuk tidak menggunakan iklan dalam newspaper untuk kedepannya agar penjualan memiliki untung yang lebih besar tanpa melakukan iklan di newspaper atau tidak saya masukkan kedalam
tujuan melakukan uji Multikoliieritas adalah untuk menguji apakah model regsi ditemukan adanya korelasi (hubungan kuat) antar variabel bebas atau variabe independent. model regresi yang baik seharusnya tidak terjadi korealsi diantara variabel bebas atau tidak terjadi gejala multikolinieritas.
\[ \begin{align} VIF(\hat{\beta_j})=1/(1-R^2) \end{align} \] dimana R^2 dari nilai regresi variabel prediktor. vif> 5 atau 10 menunjukkan terdapat kolinieritas.
## Loading required package: car
## Loading required package: carData
## youtube facebook newspaper
## 1.004611 1.144952 1.145187
nilai VIF adalah 1.005, 1.145, dan 1.145 untuk TV, radio, dan surat kabar, yang menunjukkan tidak adanya bukti kolineritas.
Kami juga dapat memeriksa korelasi antara setiap variabel menggunakan fungsi cor ().
## youtube facebook newspaper sales
## youtube 1.00000000 0.05480866 0.05664787 0.7822244
## facebook 0.05480866 1.00000000 0.35410375 0.5762226
## newspaper 0.05664787 0.35410375 1.00000000 0.2282990
## sales 0.78222442 0.57622257 0.22829903 1.0000000
tidak terlihat ada korelasi yang lebih dari 0.8, yang berarti tidak ada synergy diantara media.