STA1512-Analisis Regresi Berganda

Model Regresi Linier Berganda

Dugaan persamaan garis regresi linier berganda:

\(\hat{y}=b_{0}+b_{i}x_{i};j=1,2,3,..k\)

\(\hat{y}=b_{0}+b_{1}x_{1}+b_{2}x_{2}+b_{3}x_{3}+...+b_{k}x_{k}\)

dengan

\(\hat{y}\) : Nilai dugaan y (peubah respon)

\(x_{i}\) : peubah penjelas

\(b_{0}\) : dugaan bagi intersep (\(\beta_{0}\))

\(b_{i}\) : dugaan bagi \(\beta_{i}\)

Interpretasi koefisien regresi:

Besarnya koefisien \(b_{0}\) menunjukkan nilai dugaan rataan y ketika x bernilai nol.

Besarnya koefisien \(b_{i}\) menunjukkan besarnya perubahan y jika x berubah satu satuan (Tanda positif pada \(b_{i}\) menunjukkan suatu kenaikan, sedangkan tanda negatif menunjukkan suatu penurunan)

Pengujian Parameter Regresi

Uji t (Uji Parsial)

Hipotesis:

\(H_{0}:\beta_{i}=0\)

\(H_{1}:\beta_{i} \neq 0\)

dengan \(i=0,1,2,...,k\)

Statistik Uji:

dengan

Daerah Penolakan H0:

H0 ditolak jika \(|t|>t_{\alpha/2 ; df}\)

df uji t: n-jumlah parameter pada persamaan regresi

Uji F (Uji Simultan)

Hipotesis:

\(H_{0}:\beta_{1}=\beta_{2}=...\beta_{k}=0\)

\(H_{1}:\) Paling tidak terdapat satu \(\beta_{i} \neq 0; i=1,2,...,k\)

Statistik Uji:

dengan SS(Residual)=SSE

Daerah Penolakan H0:

H0 ditolak jika \(F>F_{df1;df2;\alpha}\)

df1: jumlah peubah bebas dalam model

df2: n-jumlah parameter pada persamaan regresi

Tabel F dapat dilihat pada link berikut : http://statisticslectures.com/tables/ftable/

Koefisien Determinasi (\(R^{2}\))

Koefisien determinasi menunjukkan sejauh mana kontribusi Peubah bebas (penjelas) dalam model regresi mampu menjelaskan variasi dari peubah terikat (respon) nya.

Nilai \(R^{2}\) berada pada rentang:

\(0\leq R^{2} \leq 1\)

Pemeriksaaan Multikolinearitas

Multikolinieritas merupakan kondisi saat peubah penjelas saling memiliki pola hubungan linier.

Pemeriksaan Multikolineartitas dapat dilakukan dengan melihat nilai variance inflation factor (VIF).

  • Jika nilai VIF < 10 maka dapat disimpulkan tidak terjadi multikolinearitas.

  • Jika nilai VIF > 10 maka dapat disimpulkan terjadi multikolinearitas.

Uji Asumsi

1. Uji Normalitas

Hipotesis:

H0: Sisaan berdistribusi normal

H1: Sisaan tidak berdistribusi normal

Uji normalitas dapat dilakukan dengan Shapiro-Wilk normality test. Secara eksploratif normalitas sisaan dapat dilihat menggunakan Normal QQ Plot.

2. Uji Homogenitas

Hipotesis:

H0: Ragam sisaan homogen

H1: Ragam sisaan tidak homogen

Uji homogenitas dapat dilakukan dengan menggunakan Breusch-Pagan test. Secara eksploratif kehomogenan ragam sisaan dapat dilihat melalui Plot Residual vs Fitted.

3. Uji Non-Autokorelasi

Hipotesis:

H0: Tidak terdapat autokorelasi pada sisaan model

H1: Terdapat autokorelasi pada sisaan model

Uji non-autokorelasi dapat dilakukan dengan menggunakan Durbin Watson test.

Contoh

Sebuah Eksperimen dilakukan untuk menyelidiki penurunan berat (pounds) suatu senyawa untuk jumlah waktu (dalam jam) yang berbeda ketika senyawa tersebut terpapar ke udara. Informasi tambahan juga tersedia pada kelembaban lingkungan selama pemaparan. Data selengkapnya disajikan pada Tabel berikut :

  1. Tentukan persamaan regresi dari data tersebut,interpretasikan.

  2. Lakukan pengujian hipotesis secara simultan dan parsial menggunakan taraf nyata 5%, apakah x1 dan x2 memberikan pengaruh signifikan terhadap y?

  3. Lakukan pemeriksaan multikolinearitas dan pengujian asumsi model regresi.

Persamaan Regresi

library(readxl)
library(lmtest)
library(car)
library(tidyverse)
datareg<- read_excel("D:/MATERI KULIAH S2 IPB/ASPRAK 3/contoh1_reg.xlsx")
head(datareg)
## # A tibble: 6 x 3
##   penurunan_bb_y waktu_terpapar_x1 kelembaban_x2
##            <dbl>             <dbl>         <dbl>
## 1            4.3                 4           0.2
## 2            5.5                 5           0.2
## 3            6.8                 6           0.2
## 4            8                   7           0.2
## 5            4                   4           0.3
## 6            5.2                 5           0.3
modela<- lm(formula = penurunan_bb_y ~ waktu_terpapar_x1+kelembaban_x2, data=datareg)
summary(modela)
## 
## Call:
## lm(formula = penurunan_bb_y ~ waktu_terpapar_x1 + kelembaban_x2, 
##     data = datareg)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.73333 -0.17083 -0.04167  0.33750  0.46667 
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        0.66667    0.69423   0.960 0.361994    
## waktu_terpapar_x1  1.31667    0.09981  13.191 3.43e-07 ***
## kelembaban_x2     -8.00000    1.36677  -5.853 0.000243 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.3866 on 9 degrees of freedom
## Multiple R-squared:  0.9586, Adjusted R-squared:  0.9494 
## F-statistic: 104.1 on 2 and 9 DF,  p-value: 5.993e-07

Persamaan regresi dapat dituliskan sebagai berikut:

\(\hat{y}=0.66667+1.31667x_{1}-8x_{2}\)

Interpretasi:

  • Setiap kenaikan satu jam waktu terpapar (x1) maka akan meningkatkan penurunan berat (pounds) sebesar 1.31667.

  • Setiap terjadi kenaikan kelembaban lingkungan (x2) maka akan menurunkan penurunan berat (pounds) sebesar 8.

Uji Simultan

I.Hipotesis

\(H_{0}:\beta_{1}=\beta_{2}=0\) (Kedua peubah penjelas secara simultan tidak berpengaruh terhadap Penurunan Berat senyawa)

\(H_{1}:\) Paling tidak terdapat satu \(\beta_{i} \neq 0; i=1,2\) (paling tidak ada satu peubah penjelas yang berpengaruh pada penurunan Berat senyawa)

II.Taraf Nyata (α = 0,05)

III.Statistik Uji

F=104.1

IV.Daerah Kritis:

H0 ditolak jika F>F(2;9;0.05)= 4.25

V.Kesimpulan

Karena F=104.1>F(2;9;0.05)=4.25, maka H0 ditolak yang berarti paling tidak ada satu peubah penjelas yang berpengaruh pada penurunan Berat senyawa.

Uji Parsial

I.Hipotesis

\(H_{0}:\beta_{i}=0;i=1,2\) (Peubah penjelas ke-i tidak memiliki pengaruh yang signifikan terhadap penurunan berat senyawa)

\(H_{1}:\beta_{i} \neq 0; i=1,2\) (Peubah penjelas ke-i memiliki pengaruh yang signifikan terhadap penurunan berat senyawa)

II.Taraf Nyata (α = 0,05)

III.Statistik Uji

t1=13.191

t2=-5.853

IV.Daerah Kritis:

H0 ditolak jika \(|t|>t_{0.025 ;9}=2.2622\)

V.Kesimpulan

  • Karena t1=13.191 > t{0.025;9}=2.2622, maka H0 ditolak yang berarti waktu terpapar (x1) memiliki pengaruh yang signifikan terhadap penurunan berat senyawa (y).

  • Karena |t2|=5.853 > t{0.025;9}=2.2622, maka H0 ditolak yang berarti kelembaban lingkungan (x2) memiliki pengaruh yang signifikan terhadap penurunan berat senyawa (y).

Pemeriksaan Multikolinearitas

vif(modela)
## waktu_terpapar_x1     kelembaban_x2 
##                 1                 1

Karena nilai VIF x1 dan x2 kurang dari 10,maka dapat disimpulkan bahwa tidak terdapat multikolinearitas.

Uji Asumsi

Uji Normalitas

#secara eksploratif
qqPlot(residuals(modela),distribution="norm",main="Normal QQ Plot")

## [1] 9 5

Interpretasi QQ Plot: qqplot menunjukkan sisaan berada di sepanjang garis lurus, sehingga mengindikasikan bahwa sisaan menyebar normal.

I.Hipotesis:

H0: Sisaan berdistribusi normal

H1: Sisaan tidak berdistribusi normal

II.Tingkat signifikansi: 5%

III.Statistik Uji:

#Shapiro Wilk Test
shapiro.test(residuals(modela))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(modela)
## W = 0.92548, p-value = 0.3347

IV.Daerah Kritis

H0 ditolak jika p-value<\(\alpha=0.05\)

V.Kesimpulan

Karena p-value=0.3347>0.05, maka H0 tidak ditolak dan dapat disimpulkan bahwa sisaan berdistribusi normal.

Uji Homogenitas

Plot Residual vs Fitted

homogen <- data.frame(residual = residuals(modela), fitted = datareg$penurunan_bb_y)
homogen %>% 
  ggplot(aes(fitted, residual)) + 
  geom_point() + 
  geom_smooth(method = "h") + 
  geom_hline(aes(yintercept = 0)) + 
     theme_minimal()+
    labs(
    title="Residual Vs Fitted", 
    caption = "")
## Warning: Computation failed in `stat_smooth()`:
## object 'h' of mode 'function' was not found

Interpretasi Plot: Plot Residual vs Fitted di atas menunjukan bahwa data tersebar dan tidak membuat satu pola tertentu sehingga dapat disimpulkan bahwa ragam sisaan homogen (memenuhi asumsi homogenitas).

I.Hipotesis:

H0: Ragam sisaan homogen

H1: Ragam sisaan tidak homogen

II.Tingkat signifikansi: 5%

III.Statistik Uji:

bptest(modela, data=datareg)
## 
##  studentized Breusch-Pagan test
## 
## data:  modela
## BP = 4.1601, df = 2, p-value = 0.1249

IV.Daerah Kritis

H0 ditolak jika p-value<\(\alpha=0.05\)

V.Kesimpulan

Karena p-value=0.1249>0.05, maka H0 tidak ditolak dan dapat disimpulkan bahwa ragam sisaan homogen.

Uji Non-autokorelasi

I.Hipotesis:

H0: Tidak terdapat autokorelasi pada sisaan model

H1: Terdapat autokorelasi pada sisaan model

II.Tingkat signifikansi: 5%

III.Statistik Uji:

dwtest(modela)
## 
##  Durbin-Watson test
## 
## data:  modela
## DW = 1.6561, p-value = 0.157
## alternative hypothesis: true autocorrelation is greater than 0

IV.Daerah Kritis

H0 ditolak jika p-value<\(\alpha=0.05\)

V.Kesimpulan

Karena p-value=0.157>0.05, maka H0 tidak ditolak dan dapat disimpulkan bahwa tidak terdapat autokorelasi pada sisaan model.

Excercise

Soal 1

Suatu perusahaan perkebunan buah naga di kota A melakukan uji coba pemberian pupuk organic yang diharapkan dapat meningkatkan produksi buah naga. Uji coba dilakukan pada 8 petak lahan yang kondisi lahannya relatif sama.

  1. Apabila ingin dilakukan analisis regresi untuk mengetahui pengaruh pupuk organik terhadap produksi buah naga,tentukan peubah penjelas dan responnya.

  2. Tentukan persamaan regresi dari data tersebut,interpretasikan.

  3. Lakukan pengujian hipotesis pada taraf nyata 5%, apakah pupuk organic memberikan pengaruh terhadap produksi buah naga?

  4. Dugalah produksi buah naga jika diberikan pupuk organik 1kg dan 3.5kg.

  5. Lakukan pengujian asumsi model regresi.

Soal 2

A medical study was conducted to study the relationship between the systolic blood pressure and the explanatory variables, weight (kgm) and age (days) for infants. The data for 25 infants are shown here.

  1. Tentukan persamaan regresi dari data tersebut,interpretasikan.

  2. Lakukan pengujian hipotesis secara simultan dan parsial menggunakan taraf nyata 5%, apakah x1 (age) dan x2 (weight) memberikan pengaruh signifikan terhadap y (systolic BP)?

  3. Lakukan pemeriksaan multikolinearitas dan pengujian asumsi model regresi.