Email             :
Instagram     : https://www.instagram.com/putriangelinaw
RPubs            : https://rpubs.com/putriangelinaw/



1 Pengenalan

Dampak dari bagaimana satu dolar dihabiskan untuk upaya pemasaran organisasi pada penjualannya adalah sesuatu yang harus dipertimbangkan oleh semua organisasi. Organisasi yang bijaksana secara fiskal harus menggunakan sumber dayanya yang relatif langka dengan bijaksana. Jadi, semua organisasi perlu bertanya pada diri sendiri, “Apakah uang yang saya belanjakan sebanding dengan laba atas penjualan?” Selain itu, organisasi dapat mempelajari lebih dalam dengan bertanya, “Untuk setiap dolar yang dihabiskan untuk pemasaran, berapa banyak yang kita peroleh sebagai imbalan atas penjualan?” Pertanyaan ini dapat dijawab dengan menggunakan model regresi linier sederhana. Seperti biasa, kami akan menggunakan contoh palsu untuk memeriksa upaya pemasaran toko dan dampaknya terhadap penjualan. Ini juga akan menjadi primer yang lebih komprehensif tentang model regresi linier sederhana, model yang pertama kali dipaparkan oleh sebagian besar siswa ekonometrik.

1.2 Import Data

Berikut data yang akan digunakan;

Ternyata terdapat tiga variabel independen (youtube,facebook,dan newspaper) dan satu variabel dependen (sales), maka dapat dikatakan bahwa data ini multiple linear regression. Mari kita buat linier modelnya terlebih dahulu:

1.3 Linear Model

## 
## Call:
## lm(formula = sales ~ ., data = marketing)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -10.5932  -1.0690   0.2902   1.4272   3.3951 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3.526667   0.374290   9.422   <2e-16 ***
## youtube      0.045765   0.001395  32.809   <2e-16 ***
## facebook     0.188530   0.008611  21.893   <2e-16 ***
## newspaper   -0.001037   0.005871  -0.177     0.86    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.023 on 196 degrees of freedom
## Multiple R-squared:  0.8972, Adjusted R-squared:  0.8956 
## F-statistic: 570.3 on 3 and 196 DF,  p-value: < 2.2e-16

1.4 Plot

Berikut plot tiap variabel independen terhadap sales.


2 Objektif

2.1 Hubungan Antara Budget dengan Sales

  1. Apakah terdapat hubungan antara budget dan sales? untuk mengetahuinya kita perlu membuat hipotesis bahwa;

\[ \begin{align} \tag{1} H_0&:\beta_{youtube}=\beta_{facebook}=\beta_{newspaper}=0\\ H_a&:\beta_{youtube}\neq\beta_{facebook}\neq\beta_{newspaper}\neq0 \end{align} \] Jika P-value \(\leq\alpha\) maka tolak \(H_0\); sebaliknya terima \(H_0\). Untuk menghitung P_value dapat langsung dilihat pada summary sebelumnya atau dapat menggunakan cara berikut;

## [1] 1.809337e-84

Dari hasil diatas menyatakan bahwa P-value = 1.809337e-84 \(\leq\alpha=0.05\) sehingga tolak \(H_0\). Maka dapat disimpulkan bahwa slope nya tidak nol dan terdapat hubungan antara youtube, facebook, dan newspaper dengan sales.

2.2 Seberapa Kuat Hubungannya

  1. Seberapa kuat hubungan antara budget dengan sales? Untuk mengetahuinya dapat dilihat dari nilai R-squared. \[ \begin{align} \tag{2} R^2&=\frac{SSR}{SST}=1-\frac{SSE}{SST} \end{align} \] \(R^2\) memiliki nilai antara 0 dan 1, semakin dekat nilai \(R^2\) dengan 1 menandakan semakin kuat hubungan linier regresinya.
## [1] 0.1202004
## [1] 0.8972106
## [1] 0.8972106

RSE memperkirakan standar deviasi dari regresi populasi. Nilai RSE untuk data marketing adalah \(2.023\) dan rata-ratanya adalah 14.022, menunjukkan bahwa presentase kesalahan sekitar \(12\%\). Dari hasil diatas menyatakan bahwa nilai \(R^2\) sangat mendekati 1 yaitu sekitar 0.896 atau sekitar \(90\%\), sehingga menandakan bahwa hubungan linier dari ketiga variabel independen dengan variabel dependen cukup kuat.

2.3 Media Yang Berkontribusi Dengan Penjualan

  1. Media mana yang cukup berkontribusi dengan sales? Untuk mengetahuinya dapat dilihat pada P-value dari tiap variabel independen
##                 Estimate  Std. Error    t value     Pr(>|t|)
## (Intercept)  3.526667243 0.374289884  9.4222884 1.267295e-17
## youtube      0.045764645 0.001394897 32.8086244 1.509960e-81
## facebook     0.188530017 0.008611234 21.8934961 1.505339e-54
## newspaper   -0.001037493 0.005871010 -0.1767146 8.599151e-01

Hasil diatas menyatakan bahwa P-value youtube dan facebook sangat rendah sedangkan newpaper tidak begitu rendah dibanding lainnya. Maka dapat disimpulkan bahwa media youtube dan facebook sangat berkontribusi terhadap penjualan atau sales.

2.4 Estimasi Efek Media Terhadap Penjualan

  1. Seberapa akurat kita bisa mengestimasi efek tiap media terhadap sales?
##                   2.5 %     97.5 %
## (Intercept)  2.78851474 4.26481975
## youtube      0.04301371 0.04851558
## facebook     0.17154745 0.20551259
## newspaper   -0.01261595 0.01054097

Dilihat dari hasil diatas menyatakan bahwa youtube dan facebook memiliki interval kepercayaan jauh dari angka nol, sedangkan newspaper angka nol masih terdapat pada interval kepercayaannya. Sehingga dapat disimpulkan bahwa 95% kita percaya bahwa youtube dan facebook sangat berpengaruh terhadap sales. Sedangkan newspaper tidak begitu berpengaruh terhadap sales.

2.5 Prediksi untuk Penjualan di Masa Depan

  1. Seberapa akurat kita bisa memprediksi penjualan masa depan?
##        fit      lwr      upr
## 1 15.72514 15.42906 16.02121
##        fit      lwr      upr
## 1 15.72514 11.72529 19.72499

Jika kita misalkan budget youtube sebesar \(\$170,000\), facebook sebesar \(\$27,000\) dan newspaper sebesar \(\$30,000\) maka prediksi penjualannya sebanyak \(\pm15.73\) unit. Interval Prediksi pasti lebih lebar daripada interval kepercayaan. Semakin dekat data kita dengan garis fit maka menyatakan semakin akurat dengan tingkat kepercayaannya \(95\%\).

2.6 Sinergi Diantara Tiap Media

  1. Apakah ada interaksi/sinergi antara media-media tersebut?

Pertama-tama mari kita coba menambahkan variabel hubungan antar variabel seperti dibawah ini;

## 
## Call:
## lm(formula = sales ~ .^2, data = marketing)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -7.1087 -0.4745  0.2248  0.7172  1.8320 
## 
## Coefficients:
##                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         7.752e+00  3.811e-01  20.342   <2e-16 ***
## youtube             2.033e-02  1.609e-03  12.633   <2e-16 ***
## facebook            2.293e-02  1.141e-02   2.009   0.0460 *  
## newspaper           1.703e-02  1.007e-02   1.691   0.0924 .  
## youtube:facebook    9.494e-04  4.764e-05  19.930   <2e-16 ***
## youtube:newspaper  -6.643e-05  2.983e-05  -2.227   0.0271 *  
## facebook:newspaper -9.133e-05  1.969e-04  -0.464   0.6433    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.126 on 193 degrees of freedom
## Multiple R-squared:  0.9686, Adjusted R-squared:  0.9677 
## F-statistic: 993.3 on 6 and 193 DF,  p-value: < 2.2e-16

Dari hasil diatas menyatakan bahwa dengan membuat interaksi dalam model menghasilkan peningkatan pada \(R^2\), dari sekitar \(90\%\) menjadi hampir \(97\%\). Tetapi, jika dilihat dari variabel newspaper dan variabel lainnya yang berkaitan dengan newspaper p-value nya itu tidak signifikan. Oleh karena itu, pada saat yang sama selanjutnya saya coba hilangkan variabel tersebut dan menggunakan model lain.

2.6.1 Quadratic Model

Selanjutnya saya mencoba menggunakan model kuadratik seperti dibawah ini;

## 
## Call:
## lm(formula = sales ~ youtube + facebook + I(youtube^2) + I(facebook^2), 
##     data = marketing)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.8784 -1.0211  0.0451  1.1737  4.0473 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    1.842e+00  4.912e-01   3.750 0.000233 ***
## youtube        7.852e-02  4.978e-03  15.774  < 2e-16 ***
## facebook       1.588e-01  2.830e-02   5.613 6.78e-08 ***
## I(youtube^2)  -9.486e-05  1.395e-05  -6.799 1.26e-10 ***
## I(facebook^2)  5.946e-04  4.757e-04   1.250 0.212862    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.818 on 195 degrees of freedom
## Multiple R-squared:  0.9174, Adjusted R-squared:  0.9157 
## F-statistic: 541.2 on 4 and 195 DF,  p-value: < 2.2e-16

Jika dilihat pada P-value tiap variabel, terlihat bahwa I(facebook^2)tidak signifikan dengan p-value sebesar \(0.212862\) dan \(\alpha=0.1\). \(R^2\) sebesar \(91\%\). Jadi selanjutnya saya hilangkan lagi variabel tersebut dan coba menggunakan model selanjutnya.

2.6.2 Polynomial Model

Selanjutnya saya mencoba menggunakan model polinomial;

## 
## Call:
## lm(formula = sales ~ facebook + poly(youtube, 5), data = marketing)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.6284 -0.9101  0.0934  0.9161  4.7570 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        11.367719   0.222098  51.183  < 2e-16 ***
## facebook            0.195555   0.006736  29.033  < 2e-16 ***
## poly(youtube, 5)1  66.393498   1.674115  39.659  < 2e-16 ***
## poly(youtube, 5)2 -12.464038   1.680353  -7.418 3.69e-12 ***
## poly(youtube, 5)3   8.840159   1.677299   5.270 3.62e-07 ***
## poly(youtube, 5)4  -4.352890   1.672407  -2.603  0.00997 ** 
## poly(youtube, 5)5   3.722361   1.674929   2.222  0.02742 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.672 on 193 degrees of freedom
## Multiple R-squared:  0.9309, Adjusted R-squared:  0.9287 
## F-statistic: 433.1 on 6 and 193 DF,  p-value: < 2.2e-16

Dilihat dari hasil diatas menyatakan bahwa pada saat youtube^4 dan youtube^5 sudah tidak signifikan, maka selanjutnya hanya sampai youtube^3. \(R^2\) sebesar \(93\%\)

Yang Terakhir kita coba gabungkan semua variabel supaya mendapatkan interaksi yang kuat;

## 
## Call:
## lm(formula = sales ~ facebook + youtube * facebook + poly(youtube, 
##     3), data = marketing)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.0621 -0.2527  0.0267  0.2945  1.4012 
## 
## Coefficients: (1 not defined because of singularities)
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        7.737e+00  1.598e-01  48.421  < 2e-16 ***
## facebook           4.206e-02  4.801e-03   8.761 9.63e-16 ***
## youtube            2.008e-02  8.050e-04  24.952  < 2e-16 ***
## poly(youtube, 3)1         NA         NA      NA       NA    
## poly(youtube, 3)2 -1.205e+01  6.064e-01 -19.865  < 2e-16 ***
## poly(youtube, 3)3  6.281e+00  6.091e-01  10.312  < 2e-16 ***
## facebook:youtube   8.698e-04  2.343e-05  37.129  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.6031 on 194 degrees of freedom
## Multiple R-squared:  0.991,  Adjusted R-squared:  0.9907 
## F-statistic:  4250 on 5 and 194 DF,  p-value: < 2.2e-16

Maka terlihat bahwa interaksi dari semua variabel sudah signifikan, yang mana menunjukkan bahwa terdapat efek interaksi antara youtube dan facebook dengan \(R^2\) sebesar \(99\%\).

2.6.3 Perbandingan R-squared Tiap Model

Berikut perbandingan R-squared dari tiap model;