Pendahuluan

Analisis regresi merupakan salah satu metode statistik yang digunakan untuk mempelajari hubungan antara suatu variabel dependen dengan satu atau lebih variabel independen. Metode ini banyak digunakan dalam berbagai bidang penelitian kuantitatif, seperti ekonomi, bisnis, kesehatan, maupun ilmu lingkungan, karena mampu menjelaskan hubungan antar variabel serta membantu dalam proses prediksi. Melalui analisis regresi, peneliti dapat mengetahui sejauh mana perubahan pada variabel independen dapat mempengaruhi perubahan pada variabel dependen.

Salah satu bentuk analisis regresi yang sering digunakan adalah regresi linear berganda, yaitu metode yang digunakan untuk menganalisis pengaruh beberapa variabel independen secara simultan terhadap satu variabel dependen. Dengan menggunakan regresi linear berganda, peneliti dapat mengetahui tidak hanya hubungan antara variabel, tetapi juga besarnya kontribusi masing-masing variabel independen dalam menjelaskan variasi variabel dependen.

Pada analisis ini digunakan dataset Advertising yang berisi informasi mengenai pengeluaran iklan pada berbagai media serta tingkat penjualan produk. Dataset ini banyak digunakan sebagai contoh dalam analisis pemasaran karena menggambarkan hubungan antara aktivitas promosi dan hasil penjualan. Data tersebut terdiri dari beberapa variabel, yaitu pengeluaran iklan pada media televisi (TV), radio (Radio), dan surat kabar (Newspaper), serta variabel Sales yang menunjukkan tingkat penjualan produk.

Setiap media iklan memiliki karakteristik yang berbeda dalam menjangkau konsumen. Iklan melalui televisi biasanya memiliki jangkauan yang luas dan bersifat visual sehingga dapat menarik perhatian konsumen secara lebih efektif. Iklan melalui radio cenderung memiliki biaya yang lebih rendah dan mampu menjangkau pendengar secara rutin. Sementara itu, iklan melalui surat kabar dapat memberikan informasi yang lebih detail kepada pembaca. Oleh karena itu, penting untuk mengetahui media iklan mana yang memberikan pengaruh paling besar terhadap peningkatan penjualan.

Melalui analisis regresi linear berganda, hubungan antara pengeluaran iklan pada masing-masing media dengan tingkat penjualan dapat dianalisis secara kuantitatif. Dengan menggunakan model regresi, dapat mengukur seberapa besar perubahan penjualan yang terjadi akibat perubahan pengeluaran iklan pada masing-masing media.

Data dan Model Regresi

data <- read.csv("~/Downloads/advertising.csv")
head(data)
##      TV Radio Newspaper Sales
## 1 230.1  37.8      69.2  22.1
## 2  44.5  39.3      45.1  10.4
## 3  17.2  45.9      69.3  12.0
## 4 151.5  41.3      58.5  16.5
## 5 180.8  10.8      58.4  17.9
## 6   8.7  48.9      75.0   7.2
summary(data)
##        TV             Radio          Newspaper          Sales      
##  Min.   :  0.70   Min.   : 0.000   Min.   :  0.30   Min.   : 1.60  
##  1st Qu.: 74.38   1st Qu.: 9.975   1st Qu.: 12.75   1st Qu.:11.00  
##  Median :149.75   Median :22.900   Median : 25.75   Median :16.00  
##  Mean   :147.04   Mean   :23.264   Mean   : 30.55   Mean   :15.13  
##  3rd Qu.:218.82   3rd Qu.:36.525   3rd Qu.: 45.10   3rd Qu.:19.05  
##  Max.   :296.40   Max.   :49.600   Max.   :114.00   Max.   :27.00

Analisis Regresi Linear Berganda

Regresi linear berganda digunakan untuk mengetahui hubungan antara satu variabel dependen dengan beberapa variabel independen. Dalam penelitian ini, model regresi yang digunakan adalah sebagai berikut: \[ Sales = \beta_0 + \beta_1 TV + \beta_2 Radio + \beta_3 Newspaper + \varepsilon \]

Dimana:

Model regresi dapat dibuat menggunakan fungsi lm() di dalam R.

model <- lm(Sales ~ TV + Radio + Newspaper, data = data)
summary(model)
## 
## Call:
## lm(formula = Sales ~ TV + Radio + Newspaper, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -7.3034 -0.8244 -0.0008  0.8976  3.7473 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 4.6251241  0.3075012  15.041   <2e-16 ***
## TV          0.0544458  0.0013752  39.592   <2e-16 ***
## Radio       0.1070012  0.0084896  12.604   <2e-16 ***
## Newspaper   0.0003357  0.0057881   0.058    0.954    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.662 on 196 degrees of freedom
## Multiple R-squared:  0.9026, Adjusted R-squared:  0.9011 
## F-statistic: 605.4 on 3 and 196 DF,  p-value: < 2.2e-16

Fungsi lm() digunakan untuk membentuk model regresi linear, sedangkan summary() digunakan untuk menampilkan hasil analisis regresi secara lengkap.

Uji Asumsi Klasik

1. Uji Normalitas Residual

Uji normalitas dilakukan untuk mengetahui apakah residual dari model regresi berdistribusi normal.

Hipotesis :

H0 : residual berdistribusi normal

H1 : residual tidak berdistribusi normal

Taraf Signifikansi :

\[ \alpha = 5%\]

Statistik Uji

Statistik uji yang digunakan adalah Shapiro-Wilk Test.

shapiro.test(residuals(model))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(model)
## W = 0.97581, p-value = 0.001576

Kriteria Keputusan

Jika p-value > 0.05, maka H0 gagal ditolak, artinya residual berdistribusi normal.

Jika p-value ≤ 0.05, maka H0 ditolak, artinya residual tidak berdistribusi normal.

Kesimpulan

Kesimpulan uji normalitas ditentukan berdasarkan nilai p-value dari uji Shapiro-Wilk. Berdasarkan hasil pengujian diperoleh nilai p-value sebesar 0.001576, yang lebih kecil dari taraf signifikansi 0.05. Oleh karena itu H0 ditolak, sehingga dapat disimpulkan bahwa residual model regresi tidak berdistribusi normal.

2. Uji Multikolinearitas

Uji multikolinearitas dilakukan untuk mengetahui apakah terdapat korelasi yang tinggi antar variabel independen dalam model regresi.

Hipotesis :

H0 : tidak terjadi multikolinearitas antar variabel independen

H1 : terjadi multikolinearitas antar variabel independen

Taraf Signifikansi :

\[\alpha=0.05\]

Statistik Uji

Statistik uji yang digunakan adalah Variance Inflation Factor (VIF).

library(car)
## Loading required package: carData
vif(model)
##        TV     Radio Newspaper 
##  1.004611  1.144952  1.145187

Kriteria Keputusan

Jika VIF < 10, maka tidak terjadi multikolinearitas.

Jika VIF ≥ 10, maka terjadi multikolinearitas.

Kesimpulan :

Kesimpulan uji multikolinearitas ditentukan berdasarkan nilai Variance Inflation Factor (VIF) dari masing-masing variabel independen. Berdasarkan hasil pengujian diperoleh nilai VIF untuk variabel TV sebesar 1.0046, Radio sebesar 1.1449, dan Newspaper sebesar 1.1452. Karena seluruh nilai VIF lebih kecil dari 10, maka dapat disimpulkan bahwa model regresi tidak mengalami multikolinearitas antar variabel independen.

3. Uji Autokorelasi

Uji autokorelasi dilakukan untuk mengetahui apakah residual pada suatu pengamatan berkorelasi dengan residual pada pengamatan lain.

Hipotesis :

H0 : tidak terjadi autokorelasi

H1 : terjadi autokorelasi

Taraf Signifikansi :

\[\alpha=0.05\]

Statistik Uji :

Statistik uji yang digunakan adalah Durbin-Watson Test.

library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.2506, p-value = 0.9625
## alternative hypothesis: true autocorrelation is greater than 0

Kriteria Keputusan :

Jika p-value > 0.05, maka H0 gagal ditolak, artinya tidak terjadi autokorelasi.

Jika p-value ≤ 0.05, maka H0 ditolak, artinya terjadi autokorelasi.

Kesimpulan :

Kesimpulan uji autokorelasi ditentukan berdasarkan nilai p-value dari uji Durbin–Watson. Berdasarkan hasil pengujian diperoleh nilai p-value sebesar 0.9625, yang lebih besar dari taraf signifikansi 0.05. Oleh karena itu H0 gagal ditolak, sehingga dapat disimpulkan bahwa model regresi tidak mengalami autokorelasi.

4. Uji Heteroskedastisitas

Uji heteroskedastisitas dilakukan untuk mengetahui apakah terdapat ketidaksamaan varians residual dari satu pengamatan ke pengamatan lainnya.

Hipotesis :

H0 : tidak terjadi heteroskedastisitas

H1 : terjadi heteroskedastisitas

Taraf Signifikansi :

\[\alpha=0.05\]

Statistik Uji :

Statistik uji yang digunakan adalah Breusch-Pagan Test.

bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 3.9785, df = 3, p-value = 0.2638

Kriteria Keputusan :

Jika p-value > 0.05, maka H0 gagal ditolak, artinya tidak terjadi heteroskedastisitas.

Jika p-value ≤ 0.05, maka H0 ditolak, artinya terjadi heteroskedastisitas.

Kesimpulan :

Kesimpulan uji heteroskedastisitas ditentukan berdasarkan nilai p-value dari hasil uji Breusch-Pagan. Berdasarkan hasil pengujian diperoleh nilai p-value sebesar 0.2638, yang lebih besar dari taraf signifikansi 0.05. Oleh karena itu, H0 gagal ditolak, sehingga dapat disimpulkan bahwa model regresi tidak mengalami heteroskedastisitas atau varians residual bersifat konstan.

Uji Signifikansi Model

1. Uji F

Uji F digunakan untuk mengetahui apakah variabel independen secara bersama-sama berpengaruh signifikan terhadap variabel dependen.

Hipotesis :

\[H0 : \beta_1 = \beta_2 = \beta_3 = 0\], artinya variabel independen secara simultan tidak berpengaruh terhadap Sales. \[H1 : minimal ada satu \beta_i ≠ 0,\] artinya variabel independen secara simultan berpengaruh terhadap Sales.

Taraf Signifikansi :

\[\alpha=0.05\]

Statistik Uji :

summary(model)
## 
## Call:
## lm(formula = Sales ~ TV + Radio + Newspaper, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -7.3034 -0.8244 -0.0008  0.8976  3.7473 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 4.6251241  0.3075012  15.041   <2e-16 ***
## TV          0.0544458  0.0013752  39.592   <2e-16 ***
## Radio       0.1070012  0.0084896  12.604   <2e-16 ***
## Newspaper   0.0003357  0.0057881   0.058    0.954    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.662 on 196 degrees of freedom
## Multiple R-squared:  0.9026, Adjusted R-squared:  0.9011 
## F-statistic: 605.4 on 3 and 196 DF,  p-value: < 2.2e-16

Kriteria Keputusan :

Jika p-value F-statistic < 0.05, maka H0 ditolak.

Jika p-value F-statistic ≥ 0.05, maka H0 gagal ditolak.

Kesimpulan :

Berdasarkan hasil uji F diperoleh nilai p-value < 0.05, sehingga H0 ditolak. Hal ini menunjukkan bahwa variabel TV, Radio, dan Newspaper secara simultan berpengaruh signifikan terhadap Sales. Dengan demikian, model regresi yang digunakan layak digunakan untuk menjelaskan hubungan antara pengeluaran iklan dan tingkat penjualan.

2. Uji t

Uji t digunakan untuk mengetahui pengaruh masing-masing variabel independen secara parsial terhadap variabel dependen.

Hipotesis :

H0 : \[\beta_i = 0\], artinya variabel independen ke-i tidak berpengaruh signifikan terhadap Sales. H1 : \[\beta_i ≠ 0\], artinya variabel independen ke-i berpengaruh signifikan terhadap Sales..

Taraf Signifikansi :

\[\alpha=0.05\]

Statistik Uji :

summary(model)
## 
## Call:
## lm(formula = Sales ~ TV + Radio + Newspaper, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -7.3034 -0.8244 -0.0008  0.8976  3.7473 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 4.6251241  0.3075012  15.041   <2e-16 ***
## TV          0.0544458  0.0013752  39.592   <2e-16 ***
## Radio       0.1070012  0.0084896  12.604   <2e-16 ***
## Newspaper   0.0003357  0.0057881   0.058    0.954    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.662 on 196 degrees of freedom
## Multiple R-squared:  0.9026, Adjusted R-squared:  0.9011 
## F-statistic: 605.4 on 3 and 196 DF,  p-value: < 2.2e-16

Kriteria Keputusan :

Jika p-value < 0.05, maka H0 ditolak

Jika p-value ≥ 0.05, maka H0 gagal ditolak

Kesimpulan :

Berdasarkan hasil uji t pada model regresi, diperoleh bahwa variabel TV dan Radio memiliki p-value kurang dari 0.05, sehingga kedua variabel tersebut berpengaruh signifikan terhadap Sales. Sementara itu, variabel Newspaper memiliki p-value sebesar 0.954 yang lebih besar dari 0.05, sehingga variabel Newspaper tidak berpengaruh signifikan terhadap Sales.

Kesimpulan

Berdasarkan hasil analisis regresi linear berganda yang telah dilakukan terhadap dataset Advertising, dapat disimpulkan bahwa terdapat hubungan antara pengeluaran iklan pada media TV, Radio, dan Newspaper terhadap tingkat penjualan (Sales). Model regresi yang dibentuk digunakan untuk menganalisis pengaruh ketiga variabel independen tersebut terhadap variabel dependen.

Hasil pengujian secara simultan melalui uji F menunjukkan bahwa variabel TV, Radio, dan Newspaper secara bersama-sama berpengaruh signifikan terhadap Sales, sehingga model regresi yang digunakan layak untuk menjelaskan hubungan antara pengeluaran iklan dan tingkat penjualan.

Selanjutnya, berdasarkan uji t secara parsial, diketahui bahwa variabel TV dan Radio memiliki pengaruh signifikan terhadap Sales, sedangkan variabel Newspaper tidak berpengaruh signifikan terhadap Sales.

Berdasarkan hasil uji asumsi klasik, diketahui bahwa model regresi tidak mengalami multikolinearitas, autokorelasi, maupun heteroskedastisitas. Namun, hasil uji normalitas menunjukkan bahwa residual tidak sepenuhnya berdistribusi normal.

Secara keseluruhan, analisis ini menunjukkan bahwa pengeluaran iklan pada media tertentu memiliki pengaruh terhadap peningkatan penjualan, sehingga strategi promosi melalui media iklan dapat menjadi faktor penting dalam meningkatkan penjualan produk.