Input Data

library(readxl)
data <- read_excel("C:/Users/TU'THI INAYAH W/Documents/STATISTIKA/SEMESTER 6/data_komlan.xlsx")

Deskripsi Data

summary(data)
##      No.            Kota/Kabupaten          IPM            Miskin      
##  Length:35          Length:35          Min.   :69.47   Min.   :  6.93  
##  Class :character   Class :character   1st Qu.:72.61   1st Qu.: 66.47  
##  Mode  :character   Mode  :character   Median :74.98   Median : 86.97  
##                                        Mean   :75.64   Mean   : 96.19  
##                                        3rd Qu.:77.85   3rd Qu.:127.17  
##                                        Max.   :86.23   Max.   :257.29

Rata-rata IPM adalah 75.6422857

Rata-rata Jumlah Penduduk Miskin adalah 96.1917143 (ribu) orang

Model Regresi

Bentuk umum persamaan regresi linier: \[ y = \beta_0 +\beta_1 X_1 + \beta_2 X_2 + \epsilon \]

Estimasi Parameter

model = lm(IPM ~ Miskin, data = data)
summary(model)
## 
## Call:
## lm(formula = IPM ~ Miskin, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.5477 -2.6565 -0.4496  1.6230  9.1401 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 80.12591    1.23030  65.127  < 2e-16 ***
## Miskin      -0.04661    0.01121  -4.157 0.000215 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.502 on 33 degrees of freedom
## Multiple R-squared:  0.3437, Adjusted R-squared:  0.3238 
## F-statistic: 17.28 on 1 and 33 DF,  p-value: 0.0002149

Model Akhir Regresi

Model Akhir persamaan regresi linier: \[ IPM = 80.1259 -0.0466 Jumlah Penduduk Miskin \] Artinya, setiap kenaikan 1 satuan Jumlah Penduduk Miskin akan menurunkan nilai IPM sebesar 0,0466 poin, dengan asumsi faktor lain konstan. Jadi, semakin banyak penduduk miskin, maka kualitas pembangunan manusia cenderung menurun.

Pengujian Hipotesis

Uji Normalitas Residual

error = model$residuals
ks.test(error, "pnorm", mean(error), sqrt(var(error)))
## 
##  Exact one-sample Kolmogorov-Smirnov test
## 
## data:  error
## D = 0.11976, p-value = 0.6533
## alternative hypothesis: two-sided

Hipotesisnya adalah: H0: Data residual berdistribusi normal H1: Data residual tidak berdistribusi normal

Karena nilai p-value = 0,6533 > 0,05, maka gagal menolak H₀ pada taraf signifikansi 5%. Artinya, Residual pada model regresi berdistribusi normal, sehingga asumsi normalitas dalam regresi linear terpenuhi.

Uji Autokorelasi

library(lmtest)
dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 1.0763, p-value = 0.001377
## alternative hypothesis: true autocorrelation is greater than 0

Hipotesis yang diuji adalah: H₀: Tidak terdapat autokorelasi (ρ = 0) H₁: Terdapat autokorelasi positif (ρ > 0)

Karena p-value = 0,001377 < 0,05, maka H₀ ditolak pada taraf signifikansi 5%. Kesimpulannya, terdapat autokorelasi positif yang signifikan pada residual model regresi. Artinya, error pada satu pengamatan berkorelasi dengan error pada pengamatan sebelumnya.

Penanganan Autokorelasi dengan log

model_log <- lm(log(IPM) ~ log(Miskin), data = data)
summary(model_log)
## 
## Call:
## lm(formula = log(IPM) ~ log(Miskin), data = data)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.062395 -0.034381 -0.004258  0.021493  0.125651 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  4.523882   0.039863 113.486  < 2e-16 ***
## log(Miskin) -0.045838   0.009021  -5.081 1.45e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.04172 on 33 degrees of freedom
## Multiple R-squared:  0.4389, Adjusted R-squared:  0.4219 
## F-statistic: 25.82 on 1 and 33 DF,  p-value: 1.453e-05

Uji Normalitas Residual

error_log = model_log$residuals
ks.test(error_log, "pnorm", mean(error_log), sqrt(var(error_log)))
## 
##  Exact one-sample Kolmogorov-Smirnov test
## 
## data:  error_log
## D = 0.11776, p-value = 0.6732
## alternative hypothesis: two-sided

Uji Autokorelasi

dwtest(model_log)
## 
##  Durbin-Watson test
## 
## data:  model_log
## DW = 1.5178, p-value = 0.06203
## alternative hypothesis: true autocorrelation is greater than 0

Setelah dilakukan transformasi log pada kedua variabel, nilai pvalue pada uji normalitas residula tetap di atas 0.05, sehingga residual data tetap berdistribusi normal. Sedangkan statistik Durbin–Watson meningkat dari 1,0763 menjadi 1,5178 dengan p-value 0,06203 (>0,05). Hal ini menunjukkan bahwa pada taraf signifikansi 5%, tidak terdapat autokorelasi positif yang signifikan pada residual model. Dengan demikian, asumsi non-autokorelasi dapat dianggap terpenuhi setelah transformasi log.

Sehingga Model akhirnya berubah menjadi berikut Model Akhir persamaan regresi linier: \[ log(IPM) = 4.5239 -0.0458 log(Jumlah Penduduk Miskin) \]

Setiap kenaikan 1% Jumlah Penduduk Miskin akan menurunkan IPM sebesar 0,0458%, dengan asumsi variabel lain konstan.

Plot Model regresi

scatterplot Jumlah Penduduk Miskin vs IPM

scatterplot Jumlah Penduduk Miskin vs IPM

Plot Model regresi dalam log

scatterplot Jumlah Penduduk Miskin vs IPM (dalam log)

scatterplot Jumlah Penduduk Miskin vs IPM (dalam log)