Input Data

data <- read.csv("advertising.csv")

summary(data)
##        TV             Radio          Newspaper          Sales      
##  Min.   :  0.70   Min.   : 0.000   Min.   :  0.30   Min.   : 1.60  
##  1st Qu.: 74.38   1st Qu.: 9.975   1st Qu.: 12.75   1st Qu.:11.00  
##  Median :149.75   Median :22.900   Median : 25.75   Median :16.00  
##  Mean   :147.04   Mean   :23.264   Mean   : 30.55   Mean   :15.13  
##  3rd Qu.:218.82   3rd Qu.:36.525   3rd Qu.: 45.10   3rd Qu.:19.05  
##  Max.   :296.40   Max.   :49.600   Max.   :114.00   Max.   :27.00

Model Regresi

Bentuk Umum Persamaan Regresi Linier Berganda: \[ y = \beta_0 + \beta_1 x_1 +\beta_2 x_2 +\beta_3 x_3 + \epsilon \] # Estimasi Parameter

model = lm(Sales ~ TV + Radio + Newspaper, data = data)
summary(model)
## 
## Call:
## lm(formula = Sales ~ TV + Radio + Newspaper, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -7.3034 -0.8244 -0.0008  0.8976  3.7473 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 4.6251241  0.3075012  15.041   <2e-16 ***
## TV          0.0544458  0.0013752  39.592   <2e-16 ***
## Radio       0.1070012  0.0084896  12.604   <2e-16 ***
## Newspaper   0.0003357  0.0057881   0.058    0.954    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.662 on 196 degrees of freedom
## Multiple R-squared:  0.9026, Adjusted R-squared:  0.9011 
## F-statistic: 605.4 on 3 and 196 DF,  p-value: < 2.2e-16

Interpretasi Estimasi Parameter:

Berdasarkan hasil estimasi parameter dari model regresi linear berganda diperoleh persamaan regresi (Sales = 4.6251 + 0.0544(TV) + 0.1070(Radio) + 0.0003(Newspaper)). Nilai intercept sebesar 4.6251 menunjukkan bahwa ketika pengeluaran iklan pada TV, Radio, dan Newspaper bernilai nol, maka nilai Sales diperkirakan sebesar 4.6251. Koefisien variabel TV sebesar 0.0544 menunjukkan bahwa setiap peningkatan pengeluaran iklan TV sebesar 1 unit akan meningkatkan Sales sebesar 0.0544 unit dengan asumsi variabel lain konstan. Koefisien variabel Radio sebesar 0.1070 menunjukkan bahwa setiap peningkatan pengeluaran iklan Radio sebesar 1 unit akan meningkatkan Sales sebesar 0.1070 unit dengan asumsi variabel lain tetap. Sementara itu, koefisien variabel Newspaper sebesar 0.0003 menunjukkan bahwa setiap peningkatan pengeluaran iklan Newspaper sebesar 1 unit akan meningkatkan Sales sebesar 0.0003 unit dengan asumsi variabel lain konstan. Selain itu, berdasarkan hasil uji F diperoleh nilai F-statistic sebesar 605.4 dengan p-value < 0.05, sehingga dapat disimpulkan bahwa variabel TV, Radio, dan Newspaper secara bersama-sama berpengaruh signifikan terhadap Sales.

Model Akhir: \[ Sales = 4.6251 + 0.0544 TV + 0.107 Radio + 3\times 10^{-4} Newspaper \] # Pengujian Hipotesis ### Uji Normalitas Residual

error = model$residuals
ks.test(error,"pnorm",mean(error),sqrt(var(error)))
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  error
## D = 0.082313, p-value = 0.133
## alternative hypothesis: two-sided

Interpretasi Uji Normalitas Residual: Berdasarkan hasil uji normalitas menggunakan metode Kolmogorov–Smirnov diperoleh nilai p-value sebesar 0.133. Karena nilai p-value lebih besar dari tingkat signifikansi 0.05, maka H₀ tidak ditolak sehingga dapat disimpulkan bahwa residual pada model regresi berdistribusi normal. Dengan demikian, asumsi normalitas pada model regresi telah terpenuhi.

Uji Autokorelasi

library(lmtest)
## Warning: package 'lmtest' was built under R version 4.3.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.3.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.2506, p-value = 0.9625
## alternative hypothesis: true autocorrelation is greater than 0

Interpretasi Uji Autokorelasi:

Berdasarkan hasil uji autokorelasi menggunakan metode Durbin–Watson diperoleh nilai statistik Durbin–Watson sebesar 2.2506 dengan p-value sebesar 0.9625. Karena nilai p-value lebih besar dari tingkat signifikansi 0.05, maka H₀ tidak ditolak, sehingga dapat disimpulkan bahwa tidak terdapat autokorelasi pada residual model regresi. Dengan demikian, asumsi tidak adanya autokorelasi dalam model regresi telah terpenuhi.

Plot Model Regresi

plot(data$TV, data$Sales,
     main="Scatterplot Iklan TV vs Penjualan",
     xlab="Pengeluaran Iklan TV",
     ylab="Sales",
     pch=19,
     col="steelblue")

abline(lm(Sales ~ TV, data=data), col="red")

Interpretasi Scatterplot: Berdasarkan scatterplot antara pengeluaran iklan TV dan Sales, terlihat bahwa titik-titik data membentuk pola yang cenderung meningkat. Hal ini menunjukkan adanya hubungan positif antara pengeluaran iklan TV dan penjualan. Artinya, semakin besar pengeluaran untuk iklan TV, maka penjualan cenderung meningkat. dilihat dari output, garis regresi pada grafik menunjukkan hubungan yang cenderung linear antar kedua variabel tersebut.

Struktur data

str(data)
## 'data.frame':    200 obs. of  4 variables:
##  $ TV       : num  230.1 44.5 17.2 151.5 180.8 ...
##  $ Radio    : num  37.8 39.3 45.9 41.3 10.8 48.9 32.8 19.6 2.1 2.6 ...
##  $ Newspaper: num  69.2 45.1 69.3 58.5 58.4 75 23.5 11.6 1 21.2 ...
##  $ Sales    : num  22.1 10.4 12 16.5 17.9 7.2 11.8 13.2 4.8 15.6 ...
summary(data)
##        TV             Radio          Newspaper          Sales      
##  Min.   :  0.70   Min.   : 0.000   Min.   :  0.30   Min.   : 1.60  
##  1st Qu.: 74.38   1st Qu.: 9.975   1st Qu.: 12.75   1st Qu.:11.00  
##  Median :149.75   Median :22.900   Median : 25.75   Median :16.00  
##  Mean   :147.04   Mean   :23.264   Mean   : 30.55   Mean   :15.13  
##  3rd Qu.:218.82   3rd Qu.:36.525   3rd Qu.: 45.10   3rd Qu.:19.05  
##  Max.   :296.40   Max.   :49.600   Max.   :114.00   Max.   :27.00

Deskripsi dan ringksan data:

Data yang digunakan dalam analisis ini merupakan data Advertising yang berisi informasi mengenai pengeluaran iklan pada tiga media, yaitu TV, Radio, dan Newspaper, serta penjualan (Sales) yang dihasilkan. Dataset ini terdiri dari 200 observasi dengan 4 variabel, yaitu TV, Radio, Newspaper, dan Sales. Variabel TV, Radio, dan Newspaper menunjukkan jumlah pengeluaran untuk iklan pada masing-masing media, sedangkan variabel Sales menunjukkan jumlah penjualan yang diperoleh.

Berdasarkan output, diketahui bahwa pengeluaran iklan pada media TV memiliki nilai minimum sebesar 0.70 dan maksimum sebesar 296.40, dengan rata-rata sekitar 147.04. Untuk media Radio, pengeluaran iklan berkisar antara 0.00 hingga 49.60 dengan rata-rata sebesar 23.264. Sementara itu, pengeluaran iklan pada Newspaper memiliki nilai minimum 0.30 dan maksimum 114.00, dengan rata-rata sekitar 30.55. Pada variabel Sales, nilai penjualan terendah adalah 1.60 dan tertinggi 27.00, dengan rata-rata sebesar 15.13. Sumber data: https://www.kaggle.com/datasets/ashydv/advertising-dataset

Visualisasi

plot(data$TV, data$Sales)

plot(data$Radio, data$Sales)

plot(data$Newspaper, data$Sales)

Interpretasi: Berdasarkan scatter plot antara variabel TV, Radio, dan Newspaper terhadap Sales, terlihat bahwa iklan pada media TV memiliki kecenderungan hubungan positif yang paling jelas dengan penjualan, karena titik-titik data menunjukkan pola yang meningkat. Pada variabel Radio, hubungan dengan penjualan juga terlihat positif namun penyebaran titiknya lebih luas sehingga hubungannya tidak sekuat TV. Sementara itu, pada variabel Newspaper, titik-titik data tersebar cukup acak dan tidak membentuk pola yang jelas, sehingga hubungan antara iklan di koran dengan penjualan terlihat lebih lemah dibandingkan dua media lainnya.

pairs(data)

Interpretasi: Dilihat dari grafik, TV memiliki hubungan positif yang paling jelas dengan Sales, ditunjukkan oleh pola titik yang meningkat. Variabel Radio juga menunjukkan kecenderungan hubungan positif dengan Sales, namun pola titiknya lebih menyebar sehingga hubungannya tidak sekuat TV. Sementara itu, Newspaper tidak menunjukkan pola hubungan yang jelas dengan Sales karena titik-titiknya tersebar cenderung acak. Selain itu, hubungan antar variabel iklan (TV, Radio, dan Newspaper) terlihat tidak terlalu kuat karena tidak membentuk pola tertentu.

Cek Asumsi Regresi

par(mfrow=c(2,2))
plot(model)

Interpretasi: Berdasarkan grafik diagnostik regresi, residual pada Residuals vs Fitted terlihat menyebar di sekitar garis nol tanpa pola yang jelas. Pada Q-Q Plot, sebagian besar titik mengikuti garis diagonal sehingga menunjukkan bahwa residual mendekati distribusi normal. Grafik Scale-Location memperlihatkan penyebaran residual yang relatif merata, dan pada Residuals vs Leverage tidak terlihat adanya titik yang memiliki pengaruh sangat besar terhadap model. Sehingga,hasil grafik menunjukkan bahwa asumsi-asumsi pada model regresi sudah cukup terpenuhi.