STA1512-Analisis Regresi Berganda
Model Regresi Linier Berganda
Dugaan persamaan garis regresi linier berganda:
\(\hat{y}=b_{0}+b_{i}x_{i};j=1,2,3,..k\)
\(\hat{y}=b_{0}+b_{1}x_{1}+b_{2}x_{2}+b_{3}x_{3}+...+b_{k}x_{k}\)
dengan
\(\hat{y}\) : Nilai dugaan y (peubah respon)
\(x_{i}\) : peubah penjelas
\(b_{0}\) : dugaan bagi intersep (\(\beta_{0}\))
\(b_{i}\) : dugaan bagi \(\beta_{i}\)
Interpretasi koefisien regresi:
Besarnya koefisien \(b_{0}\) menunjukkan nilai dugaan rataan y ketika x bernilai nol.
Besarnya koefisien \(b_{i}\) menunjukkan besarnya perubahan y jika x berubah satu satuan (Tanda positif pada \(b_{i}\) menunjukkan suatu kenaikan, sedangkan tanda negatif menunjukkan suatu penurunan)
Pengujian Parameter Regresi
Uji t (Uji Parsial)
Hipotesis:
\(H_{0}:\beta_{i}=0\)
\(H_{1}:\beta_{i} \neq 0\)
dengan \(i=0,1,2,...,k\)
Statistik Uji:
dengan
Daerah Penolakan H0:
H0 ditolak jika \(|t|>t_{\alpha/2 ; df}\)
df uji t: n-jumlah parameter pada persamaan regresi
Uji F (Uji Simultan)
Hipotesis:
\(H_{0}:\beta_{1}=\beta_{2}=...\beta_{k}=0\)
\(H_{1}:\) Paling tidak terdapat satu \(\beta_{i} \neq 0; i=1,2,...,k\)
Statistik Uji:
dengan SS(Residual)=SSE
Daerah Penolakan H0:
H0 ditolak jika \(F>F_{df1;df2;\alpha}\)
df1: jumlah peubah bebas dalam model
df2: n-jumlah parameter pada persamaan regresi
Tabel F dapat dilihat pada link berikut : http://statisticslectures.com/tables/ftable/
Koefisien Determinasi (\(R^{2}\))
Koefisien determinasi menunjukkan sejauh mana kontribusi Peubah bebas (penjelas) dalam model regresi mampu menjelaskan variasi dari peubah terikat (respon) nya.
Nilai \(R^{2}\) berada pada rentang:
\(0\leq R^{2} \leq 1\)
Pemeriksaaan Multikolinearitas
Multikolinieritas merupakan kondisi saat peubah penjelas saling memiliki pola hubungan linier.
Pemeriksaan Multikolineartitas dapat dilakukan dengan melihat nilai variance inflation factor (VIF).
Jika nilai VIF < 10 maka dapat disimpulkan tidak terjadi multikolinearitas.
Jika nilai VIF > 10 maka dapat disimpulkan terjadi multikolinearitas.
Uji Asumsi
1. Uji Normalitas
Hipotesis:
H0: Sisaan berdistribusi normal
H1: Sisaan tidak berdistribusi normal
Uji normalitas dapat dilakukan dengan Shapiro-Wilk normality test. Secara eksploratif normalitas sisaan dapat dilihat menggunakan Normal QQ Plot.
2. Uji Homogenitas
Hipotesis:
H0: Ragam sisaan homogen
H1: Ragam sisaan tidak homogen
Uji homogenitas dapat dilakukan dengan menggunakan Breusch-Pagan test. Secara eksploratif kehomogenan ragam sisaan dapat dilihat melalui Plot Residual vs Fitted.
3. Uji Non-Autokorelasi
Hipotesis:
H0: Tidak terdapat autokorelasi pada sisaan model
H1: Terdapat autokorelasi pada sisaan model
Uji non-autokorelasi dapat dilakukan dengan menggunakan Durbin Watson test.
Contoh
Sebuah Eksperimen dilakukan untuk menyelidiki penurunan berat (pounds) suatu senyawa untuk jumlah waktu (dalam jam) yang berbeda ketika senyawa tersebut terpapar ke udara. Informasi tambahan juga tersedia pada kelembaban lingkungan selama pemaparan. Data selengkapnya disajikan pada Tabel berikut :
Tentukan persamaan regresi dari data tersebut,interpretasikan.
Lakukan pengujian hipotesis secara simultan dan parsial menggunakan taraf nyata 5%, apakah x1 dan x2 memberikan pengaruh signifikan terhadap y?
Lakukan pemeriksaan multikolinearitas dan pengujian asumsi model regresi.
Persamaan Regresi
library(readxl)
library(lmtest)
library(car)
library(tidyverse)
<- read_excel("D:/MATERI KULIAH S2 IPB/ASPRAK 3/contoh1_reg.xlsx")
datareghead(datareg)
## # A tibble: 6 x 3
## penurunan_bb_y waktu_terpapar_x1 kelembaban_x2
## <dbl> <dbl> <dbl>
## 1 4.3 4 0.2
## 2 5.5 5 0.2
## 3 6.8 6 0.2
## 4 8 7 0.2
## 5 4 4 0.3
## 6 5.2 5 0.3
<- lm(formula = penurunan_bb_y ~ waktu_terpapar_x1+kelembaban_x2, data=datareg)
modelasummary(modela)
##
## Call:
## lm(formula = penurunan_bb_y ~ waktu_terpapar_x1 + kelembaban_x2,
## data = datareg)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.73333 -0.17083 -0.04167 0.33750 0.46667
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.66667 0.69423 0.960 0.361994
## waktu_terpapar_x1 1.31667 0.09981 13.191 3.43e-07 ***
## kelembaban_x2 -8.00000 1.36677 -5.853 0.000243 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.3866 on 9 degrees of freedom
## Multiple R-squared: 0.9586, Adjusted R-squared: 0.9494
## F-statistic: 104.1 on 2 and 9 DF, p-value: 5.993e-07
Persamaan regresi dapat dituliskan sebagai berikut:
\(\hat{y}=0.66667+1.31667x_{1}-8x_{2}\)
Interpretasi:
Setiap kenaikan satu jam waktu terpapar (x1) maka akan meningkatkan penurunan berat (pounds) sebesar 1.31667.
Setiap terjadi kenaikan kelembaban lingkungan (x2) maka akan menurunkan penurunan berat (pounds) sebesar 8.
Uji Simultan
I.Hipotesis
\(H_{0}:\beta_{1}=\beta_{2}=0\) (Kedua peubah penjelas secara simultan tidak berpengaruh terhadap Penurunan Berat senyawa)
\(H_{1}:\) Paling tidak terdapat satu \(\beta_{i} \neq 0; i=1,2\) (paling tidak ada satu peubah penjelas yang berpengaruh pada penurunan Berat senyawa)
II.Taraf Nyata (α = 0,05)
III.Statistik Uji
F=104.1
IV.Daerah Kritis:
H0 ditolak jika F>F(2;9;0.05)= 4.25
V.Kesimpulan
Karena F=104.1>F(2;9;0.05)=4.25, maka H0 ditolak yang berarti paling tidak ada satu peubah penjelas yang berpengaruh pada penurunan Berat senyawa.
Uji Parsial
I.Hipotesis
\(H_{0}:\beta_{i}=0;i=1,2\) (Peubah penjelas ke-i tidak memiliki pengaruh yang signifikan terhadap penurunan berat senyawa)
\(H_{1}:\beta_{i} \neq 0; i=1,2\) (Peubah penjelas ke-i memiliki pengaruh yang signifikan terhadap penurunan berat senyawa)
II.Taraf Nyata (α = 0,05)
III.Statistik Uji
t1=13.191
t2=-5.853
IV.Daerah Kritis:
H0 ditolak jika \(|t|>t_{0.025 ;9}=2.2622\)
V.Kesimpulan
Karena t1=13.191 > t{0.025;9}=2.2622, maka H0 ditolak yang berarti waktu terpapar (x1) memiliki pengaruh yang signifikan terhadap penurunan berat senyawa (y).
Karena |t2|=5.853 > t{0.025;9}=2.2622, maka H0 ditolak yang berarti kelembaban lingkungan (x2) memiliki pengaruh yang signifikan terhadap penurunan berat senyawa (y).
Pemeriksaan Multikolinearitas
vif(modela)
## waktu_terpapar_x1 kelembaban_x2
## 1 1
Karena nilai VIF x1 dan x2 kurang dari 10,maka dapat disimpulkan bahwa tidak terdapat multikolinearitas.
Uji Asumsi
Uji Normalitas
#secara eksploratif
qqPlot(residuals(modela),distribution="norm",main="Normal QQ Plot")
## [1] 9 5
Interpretasi QQ Plot: qqplot menunjukkan sisaan berada di sepanjang garis lurus, sehingga mengindikasikan bahwa sisaan menyebar normal.
I.Hipotesis:
H0: Sisaan berdistribusi normal
H1: Sisaan tidak berdistribusi normal
II.Tingkat signifikansi: 5%
III.Statistik Uji:
#Shapiro Wilk Test
shapiro.test(residuals(modela))
##
## Shapiro-Wilk normality test
##
## data: residuals(modela)
## W = 0.92548, p-value = 0.3347
IV.Daerah Kritis
H0 ditolak jika p-value<\(\alpha=0.05\)
V.Kesimpulan
Karena p-value=0.3347>0.05, maka H0 tidak ditolak dan dapat disimpulkan bahwa sisaan berdistribusi normal.
Uji Homogenitas
Plot Residual vs Fitted
<- data.frame(residual = residuals(modela), fitted = datareg$penurunan_bb_y)
homogen %>%
homogen ggplot(aes(fitted, residual)) +
geom_point() +
geom_smooth(method = "h") +
geom_hline(aes(yintercept = 0)) +
theme_minimal()+
labs(
title="Residual Vs Fitted",
caption = "")
## Warning: Computation failed in `stat_smooth()`:
## object 'h' of mode 'function' was not found
Interpretasi Plot: Plot Residual vs Fitted di atas menunjukan bahwa data tersebar dan tidak membuat satu pola tertentu sehingga dapat disimpulkan bahwa ragam sisaan homogen (memenuhi asumsi homogenitas).
I.Hipotesis:
H0: Ragam sisaan homogen
H1: Ragam sisaan tidak homogen
II.Tingkat signifikansi: 5%
III.Statistik Uji:
bptest(modela, data=datareg)
##
## studentized Breusch-Pagan test
##
## data: modela
## BP = 4.1601, df = 2, p-value = 0.1249
IV.Daerah Kritis
H0 ditolak jika p-value<\(\alpha=0.05\)
V.Kesimpulan
Karena p-value=0.1249>0.05, maka H0 tidak ditolak dan dapat disimpulkan bahwa ragam sisaan homogen.
Uji Non-autokorelasi
I.Hipotesis:
H0: Tidak terdapat autokorelasi pada sisaan model
H1: Terdapat autokorelasi pada sisaan model
II.Tingkat signifikansi: 5%
III.Statistik Uji:
dwtest(modela)
##
## Durbin-Watson test
##
## data: modela
## DW = 1.6561, p-value = 0.157
## alternative hypothesis: true autocorrelation is greater than 0
IV.Daerah Kritis
H0 ditolak jika p-value<\(\alpha=0.05\)
V.Kesimpulan
Karena p-value=0.157>0.05, maka H0 tidak ditolak dan dapat disimpulkan bahwa tidak terdapat autokorelasi pada sisaan model.
Excercise
Soal 1
Suatu perusahaan perkebunan buah naga di kota A melakukan uji coba pemberian pupuk organic yang diharapkan dapat meningkatkan produksi buah naga. Uji coba dilakukan pada 8 petak lahan yang kondisi lahannya relatif sama.
Apabila ingin dilakukan analisis regresi untuk mengetahui pengaruh pupuk organik terhadap produksi buah naga,tentukan peubah penjelas dan responnya.
Tentukan persamaan regresi dari data tersebut,interpretasikan.
Lakukan pengujian hipotesis pada taraf nyata 5%, apakah pupuk organic memberikan pengaruh terhadap produksi buah naga?
Dugalah produksi buah naga jika diberikan pupuk organik 1kg dan 3.5kg.
Lakukan pengujian asumsi model regresi.
Soal 2
A medical study was conducted to study the relationship between the systolic blood pressure and the explanatory variables, weight (kgm) and age (days) for infants. The data for 25 infants are shown here.
Tentukan persamaan regresi dari data tersebut,interpretasikan.
Lakukan pengujian hipotesis secara simultan dan parsial menggunakan taraf nyata 5%, apakah x1 (age) dan x2 (weight) memberikan pengaruh signifikan terhadap y (systolic BP)?
Lakukan pemeriksaan multikolinearitas dan pengujian asumsi model regresi.