## TV Radio Newspaper Sales
## Min. : 0.70 Min. : 0.000 Min. : 0.30 Min. : 1.60
## 1st Qu.: 74.38 1st Qu.: 9.975 1st Qu.: 12.75 1st Qu.:11.00
## Median :149.75 Median :22.900 Median : 25.75 Median :16.00
## Mean :147.04 Mean :23.264 Mean : 30.55 Mean :15.13
## 3rd Qu.:218.82 3rd Qu.:36.525 3rd Qu.: 45.10 3rd Qu.:19.05
## Max. :296.40 Max. :49.600 Max. :114.00 Max. :27.00
Bentuk Umum Persamaan Regresi Linier Berganda: \[ y = \beta_0 + \beta_1 x_1 +\beta_2 x_2 +\beta_3 x_3 + \epsilon \] # Estimasi Parameter
##
## Call:
## lm(formula = Sales ~ TV + Radio + Newspaper, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -7.3034 -0.8244 -0.0008 0.8976 3.7473
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.6251241 0.3075012 15.041 <2e-16 ***
## TV 0.0544458 0.0013752 39.592 <2e-16 ***
## Radio 0.1070012 0.0084896 12.604 <2e-16 ***
## Newspaper 0.0003357 0.0057881 0.058 0.954
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.662 on 196 degrees of freedom
## Multiple R-squared: 0.9026, Adjusted R-squared: 0.9011
## F-statistic: 605.4 on 3 and 196 DF, p-value: < 2.2e-16
Interpretasi Estimasi Parameter:
Berdasarkan hasil estimasi parameter dari model regresi linear berganda diperoleh persamaan regresi (Sales = 4.6251 + 0.0544(TV) + 0.1070(Radio) + 0.0003(Newspaper)). Nilai intercept sebesar 4.6251 menunjukkan bahwa ketika pengeluaran iklan pada TV, Radio, dan Newspaper bernilai nol, maka nilai Sales diperkirakan sebesar 4.6251. Koefisien variabel TV sebesar 0.0544 menunjukkan bahwa setiap peningkatan pengeluaran iklan TV sebesar 1 unit akan meningkatkan Sales sebesar 0.0544 unit dengan asumsi variabel lain konstan. Koefisien variabel Radio sebesar 0.1070 menunjukkan bahwa setiap peningkatan pengeluaran iklan Radio sebesar 1 unit akan meningkatkan Sales sebesar 0.1070 unit dengan asumsi variabel lain tetap. Sementara itu, koefisien variabel Newspaper sebesar 0.0003 menunjukkan bahwa setiap peningkatan pengeluaran iklan Newspaper sebesar 1 unit akan meningkatkan Sales sebesar 0.0003 unit dengan asumsi variabel lain konstan. Selain itu, berdasarkan hasil uji F diperoleh nilai F-statistic sebesar 605.4 dengan p-value < 0.05, sehingga dapat disimpulkan bahwa variabel TV, Radio, dan Newspaper secara bersama-sama berpengaruh signifikan terhadap Sales.
Model Akhir: \[ Sales = 4.6251 + 0.0544 TV + 0.107 Radio + 3\times 10^{-4} Newspaper \] # Pengujian Hipotesis ### Uji Normalitas Residual
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: error
## D = 0.082313, p-value = 0.133
## alternative hypothesis: two-sided
Interpretasi Uji Normalitas Residual: Berdasarkan hasil uji normalitas menggunakan metode Kolmogorov–Smirnov diperoleh nilai p-value sebesar 0.133. Karena nilai p-value lebih besar dari tingkat signifikansi 0.05, maka H₀ tidak ditolak sehingga dapat disimpulkan bahwa residual pada model regresi berdistribusi normal. Dengan demikian, asumsi normalitas pada model regresi telah terpenuhi.
## Warning: package 'lmtest' was built under R version 4.3.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.3.3
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## Durbin-Watson test
##
## data: model
## DW = 2.2506, p-value = 0.9625
## alternative hypothesis: true autocorrelation is greater than 0
Interpretasi Uji Autokorelasi:
Berdasarkan hasil uji autokorelasi menggunakan metode Durbin–Watson diperoleh nilai statistik Durbin–Watson sebesar 2.2506 dengan p-value sebesar 0.9625. Karena nilai p-value lebih besar dari tingkat signifikansi 0.05, maka H₀ tidak ditolak, sehingga dapat disimpulkan bahwa tidak terdapat autokorelasi pada residual model regresi. Dengan demikian, asumsi tidak adanya autokorelasi dalam model regresi telah terpenuhi.
plot(data$TV, data$Sales,
main="Scatterplot Iklan TV vs Penjualan",
xlab="Pengeluaran Iklan TV",
ylab="Sales",
pch=19,
col="steelblue")
abline(lm(Sales ~ TV, data=data), col="red")Interpretasi Scatterplot: Berdasarkan scatterplot antara pengeluaran iklan TV dan Sales, terlihat bahwa titik-titik data membentuk pola yang cenderung meningkat. Hal ini menunjukkan adanya hubungan positif antara pengeluaran iklan TV dan penjualan. Artinya, semakin besar pengeluaran untuk iklan TV, maka penjualan cenderung meningkat. dilihat dari output, garis regresi pada grafik menunjukkan hubungan yang cenderung linear antar kedua variabel tersebut.
## 'data.frame': 200 obs. of 4 variables:
## $ TV : num 230.1 44.5 17.2 151.5 180.8 ...
## $ Radio : num 37.8 39.3 45.9 41.3 10.8 48.9 32.8 19.6 2.1 2.6 ...
## $ Newspaper: num 69.2 45.1 69.3 58.5 58.4 75 23.5 11.6 1 21.2 ...
## $ Sales : num 22.1 10.4 12 16.5 17.9 7.2 11.8 13.2 4.8 15.6 ...
## TV Radio Newspaper Sales
## Min. : 0.70 Min. : 0.000 Min. : 0.30 Min. : 1.60
## 1st Qu.: 74.38 1st Qu.: 9.975 1st Qu.: 12.75 1st Qu.:11.00
## Median :149.75 Median :22.900 Median : 25.75 Median :16.00
## Mean :147.04 Mean :23.264 Mean : 30.55 Mean :15.13
## 3rd Qu.:218.82 3rd Qu.:36.525 3rd Qu.: 45.10 3rd Qu.:19.05
## Max. :296.40 Max. :49.600 Max. :114.00 Max. :27.00
Deskripsi dan ringksan data:
Data yang digunakan dalam analisis ini merupakan data Advertising yang berisi informasi mengenai pengeluaran iklan pada tiga media, yaitu TV, Radio, dan Newspaper, serta penjualan (Sales) yang dihasilkan. Dataset ini terdiri dari 200 observasi dengan 4 variabel, yaitu TV, Radio, Newspaper, dan Sales. Variabel TV, Radio, dan Newspaper menunjukkan jumlah pengeluaran untuk iklan pada masing-masing media, sedangkan variabel Sales menunjukkan jumlah penjualan yang diperoleh.
Berdasarkan output, diketahui bahwa pengeluaran iklan pada media TV memiliki nilai minimum sebesar 0.70 dan maksimum sebesar 296.40, dengan rata-rata sekitar 147.04. Untuk media Radio, pengeluaran iklan berkisar antara 0.00 hingga 49.60 dengan rata-rata sebesar 23.264. Sementara itu, pengeluaran iklan pada Newspaper memiliki nilai minimum 0.30 dan maksimum 114.00, dengan rata-rata sekitar 30.55. Pada variabel Sales, nilai penjualan terendah adalah 1.60 dan tertinggi 27.00, dengan rata-rata sebesar 15.13. Sumber data: https://www.kaggle.com/datasets/ashydv/advertising-dataset
Interpretasi: Berdasarkan scatter plot antara variabel TV, Radio, dan
Newspaper terhadap Sales, terlihat bahwa iklan pada media TV memiliki
kecenderungan hubungan positif yang paling jelas dengan penjualan,
karena titik-titik data menunjukkan pola yang meningkat. Pada variabel
Radio, hubungan dengan penjualan juga terlihat positif namun penyebaran
titiknya lebih luas sehingga hubungannya tidak sekuat TV. Sementara itu,
pada variabel Newspaper, titik-titik data tersebar cukup acak dan tidak
membentuk pola yang jelas, sehingga hubungan antara iklan di koran
dengan penjualan terlihat lebih lemah dibandingkan dua media
lainnya.
Interpretasi: Dilihat dari grafik, TV memiliki hubungan positif yang paling jelas dengan Sales, ditunjukkan oleh pola titik yang meningkat. Variabel Radio juga menunjukkan kecenderungan hubungan positif dengan Sales, namun pola titiknya lebih menyebar sehingga hubungannya tidak sekuat TV. Sementara itu, Newspaper tidak menunjukkan pola hubungan yang jelas dengan Sales karena titik-titiknya tersebar cenderung acak. Selain itu, hubungan antar variabel iklan (TV, Radio, dan Newspaper) terlihat tidak terlalu kuat karena tidak membentuk pola tertentu.
Interpretasi: Berdasarkan grafik diagnostik regresi, residual pada
Residuals vs Fitted terlihat menyebar di sekitar garis nol tanpa pola
yang jelas. Pada Q-Q Plot, sebagian besar titik mengikuti garis diagonal
sehingga menunjukkan bahwa residual mendekati distribusi normal. Grafik
Scale-Location memperlihatkan penyebaran residual yang relatif merata,
dan pada Residuals vs Leverage tidak terlihat adanya titik yang memiliki
pengaruh sangat besar terhadap model. Sehingga,hasil grafik menunjukkan
bahwa asumsi-asumsi pada model regresi sudah cukup terpenuhi.