Import Data

Dataset yang digunakan pada analisis ini adalah Advertising Dataset yang berisi data pengeluaran iklan pada beberapa media serta jumlah penjualan yang dihasilkan.

Variabel yang digunakan dalam dataset ini yaitu:

  • TV : biaya iklan pada media televisi
  • Radio : biaya iklan pada media radio
  • Newspaper : biaya iklan pada media koran
  • Sales : jumlah penjualan produk
Advertising <- read.csv("Advertising.csv")
head(Advertising)
##   X    TV radio newspaper sales
## 1 1 230.1  37.8      69.2  22.1
## 2 2  44.5  39.3      45.1  10.4
## 3 3  17.2  45.9      69.3   9.3
## 4 4 151.5  41.3      58.5  18.5
## 5 5 180.8  10.8      58.4  12.9
## 6 6   8.7  48.9      75.0   7.2

Deskripsi Data

Statistik deskriptif digunakan untuk memberikan gambaran umum mengenai data yang digunakan dalam penelitian.

summary(Advertising)
##        X                TV             radio          newspaper     
##  Min.   :  1.00   Min.   :  0.70   Min.   : 0.000   Min.   :  0.30  
##  1st Qu.: 50.75   1st Qu.: 74.38   1st Qu.: 9.975   1st Qu.: 12.75  
##  Median :100.50   Median :149.75   Median :22.900   Median : 25.75  
##  Mean   :100.50   Mean   :147.04   Mean   :23.264   Mean   : 30.55  
##  3rd Qu.:150.25   3rd Qu.:218.82   3rd Qu.:36.525   3rd Qu.: 45.10  
##  Max.   :200.00   Max.   :296.40   Max.   :49.600   Max.   :114.00  
##      sales      
##  Min.   : 1.60  
##  1st Qu.:10.38  
##  Median :12.90  
##  Mean   :14.02  
##  3rd Qu.:17.40  
##  Max.   :27.00

Rata-rata pengeluaran iklan TV adalah 147.04

Rata-rata pengeluaran iklan Radio adalah 23.26

Rata-rata pengeluaran iklan Newspaper adalah 30.55

Rata-rata penjualan (Sales) adalah 14.02

Berdasarkan statistik deskriptif tersebut dapat diketahui gambaran umum mengenai distribusi data dari masing-masing variabel yang digunakan dalam analisis.

Model Regresi Linear Berganda

Model regresi linear berganda digunakan untuk mengetahui pengaruh beberapa variabel independen terhadap satu variabel dependen.

Bentuk umum model regresi linear berganda adalah sebagai berikut:

\[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + \beta_3X_3 + \epsilon \]

Keterangan:

  • Y : Sales (penjualan)
  • X1 : TV
  • X2 : Radio
  • X3 : Newspaper
  • β0 : intercept
  • β1, β2, β3 : koefisien regresi
  • ε : error

Estimasi Parameter Model

Estimasi parameter dilakukan menggunakan metode Ordinary Least Squares (OLS).

model <- lm(sales ~ TV + radio + newspaper, data = Advertising)
summary(model)
## 
## Call:
## lm(formula = sales ~ TV + radio + newspaper, data = Advertising)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.8277 -0.8908  0.2418  1.1893  2.8292 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  2.938889   0.311908   9.422   <2e-16 ***
## TV           0.045765   0.001395  32.809   <2e-16 ***
## radio        0.188530   0.008611  21.893   <2e-16 ***
## newspaper   -0.001037   0.005871  -0.177     0.86    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.686 on 196 degrees of freedom
## Multiple R-squared:  0.8972, Adjusted R-squared:  0.8956 
## F-statistic: 570.3 on 3 and 196 DF,  p-value: < 2.2e-16

Model regresi yang diperoleh adalah:

\[ Sales = 2.9389 + 0.0458TV + 0.1885Radio + -0.001Newspaper \]

Interpretasi model:

  • Jika pengeluaran iklan TV meningkat satu satuan dengan variabel lain tetap, maka nilai Sales akan berubah sebesar koefisien TV.
  • Jika pengeluaran iklan Radio meningkat satu satuan dengan variabel lain tetap, maka nilai Sales akan berubah sebesar koefisien Radio.
  • Jika pengeluaran iklan Newspaper meningkat satu satuan dengan variabel lain tetap, maka nilai Sales akan berubah sebesar koefisien Newspaper.

Pengujian Asumsi Klasik

Uji Normalitas Residual

Uji normalitas dilakukan untuk mengetahui apakah residual dari model regresi berdistribusi normal.

error <- model$residuals
ks.test(error,"pnorm",mean(error),sqrt(var(error)))
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  error
## D = 0.13197, p-value = 0.001887
## alternative hypothesis: two-sided

Hipotesis yang digunakan:

  • H0 : residual berdistribusi normal
  • H1 : residual tidak berdistribusi normal

Jika nilai p-value > 0.05 maka residual dapat dianggap berdistribusi normal.

Uji Autokorelasi

Uji autokorelasi digunakan untuk mengetahui apakah terdapat korelasi antar residual.

library(lmtest)
dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.0836, p-value = 0.7236
## alternative hypothesis: true autocorrelation is greater than 0

Hipotesis:

  • H0 : tidak terdapat autokorelasi
  • H1 : terdapat autokorelasi

Jika p-value > 0.05 maka tidak terdapat autokorelasi.

Uji Multikolinearitas

Uji multikolinearitas dilakukan untuk mengetahui apakah terdapat korelasi tinggi antar variabel independen.

library(car)
## Loading required package: carData
vif(model)
##        TV     radio newspaper 
##  1.004611  1.144952  1.145187

Kriteria:

  • Jika VIF < 10, maka tidak terjadi multikolinearitas.

Uji Heteroskedastisitas

Uji heteroskedastisitas digunakan untuk mengetahui apakah varians residual konstan.

bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 5.1329, df = 3, p-value = 0.1623

Hipotesis:

  • H0 : tidak terjadi heteroskedastisitas
  • H1 : terjadi heteroskedastisitas

Jika p-value > 0.05 maka tidak terjadi heteroskedastisitas.

Visualisasi Model Regresi

Visualisasi dilakukan untuk melihat hubungan antara variabel independen dan variabel dependen.

Scatterplot TV vs Sales

Scatterplot TV vs Sales

Grafik scatterplot menunjukkan hubungan antara pengeluaran iklan TV dengan penjualan produk.

Kesimpulan

Berdasarkan hasil analisis regresi linear berganda yang telah dilakukan, dapat diketahui bahwa variabel pengeluaran iklan pada media TV, Radio, dan Newspaper memiliki pengaruh terhadap variabel penjualan (Sales). Model regresi yang diperoleh dapat digunakan untuk menjelaskan hubungan antara pengeluaran iklan dengan tingkat penjualan produk.

Selain itu, berdasarkan pengujian asumsi klasik yang telah dilakukan, model regresi yang diperoleh dapat dikatakan memenuhi asumsi dasar regresi sehingga model tersebut dapat digunakan untuk analisis lebih lanjut.