Input Data UHH dan IPM tiap Provinsi di Indonesia pada Tahun 2023

Sumber data:

https://www.bps.go.id/id/statistics-table/2/MjIwNSMy/-metode-baru--indeks-pembangunan-manusia--umur-harapan-hidup-hasil-long-form-sp2020-.html

https://www.bps.go.id/id/statistics-table/2/MjIwNiMy/-metode-baru--umur-harapan-hidup-saat-lahir--uhh--hasil-long-form-sp2020.html

library(readxl)
databps <- read_excel("C:/Users/ASUS/Documents/UNY/SEM 2/ANALISIS REGRESI/Artikel/IPMUHH.xlsx")
data.frame(databps)
##                Provinsi   UHH   IPM
## 1                  ACEH 73.06 74.70
## 2        SUMATERA UTARA 73.67 75.13
## 3        SUMATERA BARAT 74.14 75.64
## 4                  RIAU 74.18 74.95
## 5                 JAMBI 73.84 73.73
## 6      SUMATERA SELATAN 74.04 73.18
## 7              BENGKULU 73.11 74.30
## 8               LAMPUNG 74.17 72.48
## 9  KEP. BANGKA BELITUNG 73.90 74.09
## 10       KEPULAUAN RIAU 74.90 79.08
## 11          DKI JAKARTA 75.81 83.55
## 12           JAWA BARAT 74.91 74.24
## 13          JAWA TENGAH 74.69 73.39
## 14       D I YOGYAKARTA 75.18 81.09
## 15           JAWA TIMUR 74.87 74.65
## 16               BANTEN 74.77 75.77
## 17                 BALI 74.88 78.01
## 18  NUSA TENGGARA BARAT 72.02 72.37
## 19  NUSA TENGGARA TIMUR 71.57 68.40
## 20     KALIMANTAN BARAT 73.71 70.47
## 21    KALIMANTAN TENGAH 73.54 73.73
## 22   KALIMANTAN SELATAN 73.97 74.66
## 23     KALIMANTAN TIMUR 74.72 78.20
## 24     KALIMANTAN UTARA 73.54 72.88
## 25       SULAWESI UTARA 73.85 75.04
## 26      SULAWESI TENGAH 70.66 71.66
## 27     SULAWESI SELATAN 73.63 74.60
## 28    SULAWESI TENGGARA 71.79 72.94
## 29            GORONTALO 70.50 71.25
## 30       SULAWESI BARAT 70.76 69.80
## 31               MALUKU 70.45 72.75
## 32         MALUKU UTARA 70.76 70.98
## 33          PAPUA BARAT 68.51 67.47
## 34                PAPUA 68.17 63.01

Eksplorasi Data

summary(databps)
##    Provinsi              UHH             IPM       
##  Length:34          Min.   :68.17   Min.   :63.01  
##  Class :character   1st Qu.:71.85   1st Qu.:72.40  
##  Mode  :character   Median :73.78   Median :73.91  
##                     Mean   :73.13   Mean   :73.77  
##                     3rd Qu.:74.56   3rd Qu.:75.02  
##                     Max.   :75.81   Max.   :83.55

Model Regresi

modelbps <- lm(IPM~UHH, data=databps)
summary(modelbps)
## 
## Call:
## lm(formula = IPM ~ UHH, data = databps)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.2412 -1.4657  0.0606  1.2725  5.4580 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -43.9562    14.4193  -3.048  0.00459 ** 
## UHH           1.6099     0.1971   8.167  2.5e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.176 on 32 degrees of freedom
## Multiple R-squared:  0.6758, Adjusted R-squared:  0.6657 
## F-statistic:  66.7 on 1 and 32 DF,  p-value: 2.501e-09

Plot Regresi

plot(databps$UHH,databps$IPM, main="Scatterplot",xlab="UHH",ylab="IPM",pch=16)
abline(modelbps, col="blue")

Interpretasi secara visualisasi:

semua titik-titik pada scatterplot di atas terletak disekitar garis regresi dan garis tersebut miring ke kanan, maka nilai koefisien korelasinya mendekati 1. Sehingga, terdapat hubungan linear positif yang kuat antara peubah bebas dan peubah respon.

Mencari Koefisien Determinasi (r^2)

JKG <- sum((databps$IPM-modelbps$fitted.values)^2)
JKG
## [1] 151.4954
JKR <- sum(((modelbps$fitted.values-mean(databps$IPM))^2))
JKR
## [1] 315.7935
JKT <- sum((databps$IPM-mean(databps$IPM))^2)
JKT
## [1] 467.2889
# Koefisien determinasi
r2 <- (JKT-JKG)/JKT
r2
## [1] 0.6757992

Mencari Koefisien Korelasi (r)

# Mencari koefisien korelasi menggunakan koefisien determinasi
sqrt(r2)
## [1] 0.8220701
# Mencari koefisien korelasi menggunakan fungsi cor.test
cor.test(databps$UHH, databps$IPM)
## 
##  Pearson's product-moment correlation
## 
## data:  databps$UHH and databps$IPM
## t = 8.1673, df = 32, p-value = 2.501e-09
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.6702239 0.9078556
## sample estimates:
##       cor 
## 0.8220701

Interpretasi:

0.8220701 merupakan nilai koefisien korelasi yang mendekati 1, sehingga terdapat hubungan linear yang kuat antara peubah bebas dan peubah respon.

Persamaan Regresi menggunakan fungsi lm pada program R

modelbps <- lm(IPM~UHH, data=databps)
summary(modelbps)
## 
## Call:
## lm(formula = IPM ~ UHH, data = databps)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.2412 -1.4657  0.0606  1.2725  5.4580 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -43.9562    14.4193  -3.048  0.00459 ** 
## UHH           1.6099     0.1971   8.167  2.5e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.176 on 32 degrees of freedom
## Multiple R-squared:  0.6758, Adjusted R-squared:  0.6657 
## F-statistic:  66.7 on 1 and 32 DF,  p-value: 2.501e-09
# Berdasarkan Persamaan Regresi menggunakan fungsi lm pada R diperoleh
b1 <- 1.6099
b0 <- -43.9562

Persamaan Regresi Dugaan:

yhat = (-43.9562) + (1.6099)x

Interpretasi:

Analisis Variansi (Anova)

anova(modelbps)
## Analysis of Variance Table
## 
## Response: IPM
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## UHH        1 315.79 315.793  66.704 2.501e-09 ***
## Residuals 32 151.50   4.734                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretasi:

Berdasarkan hasil di atas diperoleh nilai SSR(Sum square residuals) = JKG (jumlah kuadrat galat) = 151.50

Uji Signifikansi korelasi Populasi

Hipotesis:

H0: Tidak ada hubungan linear yang signifikan antara UHH dan IPM (ρ = 0)

H1: Ada hubungan linear yang signifikan antara UHH dan IPM (ρ ≠ 0)

Taraf Signifikansi:

𝛼 = 0.05

Statistik Uji:

Uji t

Kriteria Keputusan:

H0 ditolak jika |t-value| > t(𝛼/2,𝑛−2)

Perhitungan:

t-value = 8.1673

cor.test(databps$UHH, databps$IPM)
## 
##  Pearson's product-moment correlation
## 
## data:  databps$UHH and databps$IPM
## t = 8.1673, df = 32, p-value = 2.501e-09
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.6702239 0.9078556
## sample estimates:
##       cor 
## 0.8220701

t tabel = 2.036933

# Mencari t tabel
qt(0.975,length(databps$UHH)-2)
## [1] 2.036933

Kesimpulan:

karena |t-value| = 8.1673 > 2.036933 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa ada hubungan linear yang signifikan antara UHH dan IPM di Indonesia pada tahun 2023.

Pengujian hipotesis bagi regresi linear

Hipotesis:

H0: Tidak ada hubungan linear yang signifikan antara UHH dan IPM (𝛽1 = 0)

H1: Ada hubungan linear yang signifikan antara UHH dan IPM (𝛽1 ≠ 0)

Taraf Signifikansi:

𝛼 = 0.05

Statistik Uji:

Uji F

Kriteria Keputusan:

H0 ditolak jika 𝐹-value > 𝐹𝛼(1,𝑛−2) atau H0 ditolak jika p-value < 𝛼

Perhitungan:

F-value = 66.704

p-value = 2.501e-09

# Mencari F-value dan p-value menggunakan fungsi anova
anova(modelbps)
## Analysis of Variance Table
## 
## Response: IPM
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## UHH        1 315.79 315.793  66.704 2.501e-09 ***
## Residuals 32 151.50   4.734                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

F tabel = 4.149097

# Mencari F tabel
qf(0.95,df1=1, df2=32)
## [1] 4.149097

Kesimpulan:

karena F-value = 66.704 > 4.149097 atau p-value = 2.501e-09 < 0.05 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa ada hubungan linear yang signifikan antara UHH dan IPM di Indonesia pada tahun 2023.

Inferensi dalam Regresi Linier Sederhana

Uji hipotesis β1

Hipotesis:

H0: Tidak terdapat pengaruh antara UHH (X) dan IPM (Y) (𝛽1 = 0)

H1: Terdapat pengaruh antara UHH (X) dan IPM (Y) (𝛽1 ≠ 0)

Taraf Signifikansi:

𝛼 = 0.05

Statistik Uji:

Uji t

Kriteria Keputusan:

H0 ditolak jika |t-value| > t(𝛼/2,𝑛−2)

Perhitungan:

t-value = 8.167158

# Mencari KTG untuk menghitung t-value
KTG <- JKG/(length(databps$UHH)-2)
KTG
## [1] 4.734232
# t-value β1
sb1sqr <- KTG/sum((databps$UHH-mean(databps$UHH))^2)
sb1 <- sqrt(sb1sqr)
tb1 <- b1/sb1
tb1
## [1] 8.167158

t tabel = 2.036933

# Mencari t tabel
qt(0.975,length(databps$UHH)-2)
## [1] 2.036933

Kesimpulan:

karena t-value = 8.167158 > 2.036933 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa terdapat pengaruh antara UHH (X) dan IPM (Y).

Uji hipotesis β0 (coba ditanyakan!)

Hipotesis:

H0: Tidak terdapat perbedaan yang signifikan antara UHH (X) dan IPM (Y) (𝛽0 = 0)

H1: Terdapat perbedaan yang signifikan antara UHH (X) dan IPM (Y) (𝛽0 ≠ 0)

Taraf Signifikansi:

𝛼 = 0.05

Statistik Uji:

Uji t

Kriteria Keputusan:

H0 ditolak jika |t-value| > t(𝛼/2,𝑛−2)

Perhitungan:

t-value = -3.048438 |t-value| = 3.048438

# Mencari KTG untuk menghitung t-value
KTG <- JKG/(length(databps$UHH)-2)
KTG
## [1] 4.734232
# t-value β0
sb0sqr <- KTG*(1/length(databps$UHH)+((mean(databps$UHH)^2)/sum((databps$UHH-mean(databps$UHH))^2)))
sb0 <- sqrt(sb0sqr)
tb0 <- b0/sb0
tb0
## [1] -3.048438

t tabel = 2.036933

# Mencari t tabel
qt(0.975,length(databps$UHH)-2)
## [1] 2.036933

Kesimpulan:

karena |t-value| = 3.048438 > 2.036933 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa terdapat perbedaan yang signifikan antara UHH (X) dan IPM (Y)

Interval Kepercayaan untuk β1 dan β0

confint(modelbps, level = 0.95)
##                  2.5 %    97.5 %
## (Intercept) -73.327245 -14.58512
## UHH           1.208404   2.01144

Selang Kepercayaan β0:

-73.327245 < β0 < -14.58512

Selang Kepercayaan β1:

1.208404 < β1 < 2.01144

Selang Kepercayaan E{Yh}

belum…

Uji Ketidakpasan

library(alr3)
## Loading required package: car
## Warning: package 'car' was built under R version 4.3.2
## Loading required package: carData
pureErrorAnova(modelbps)
## Analysis of Variance Table
## 
## Response: IPM
##              Df  Sum Sq Mean Sq  F value  Pr(>F)   
## UHH           1 315.793 315.793 597.2736 0.00167 **
## Residuals    32 151.495   4.734                    
##  Lack of fit 30 150.438   5.015   9.4843 0.09974 . 
##  Pure Error   2   1.057   0.529                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretasi:

Berdasarkan data di atas diperoleh nilai JKKM = 150.438 dan JKGM = 1.057

Hipotesis:

H0: Tidak ada ketidakpasan model regresi linear sederhana dengan data

H1: Ada ketidakpasan model regresi linear sederhana dengan data

Taraf Signifikansi:

𝛼 = 0.05

Statistik Uji:

Uji F

Kriteria Keputusan:

H0 ditolak jika 𝐹-value > 𝐹𝛼(k-2,𝑛−k)

Perhitungan:

F-value = 9.4843

F tabel = 19.46241

# Mencari f tabel
qf(0.95, df1=30, df2=2)
## [1] 19.46241

Kesimpulan:

karena F-value = 9.4843 < 19.46241 maka H0 diterima. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa ada tidak ada ketidakpasan model regresi linear sederhana dengan data. Dengan demikian, model regresi linear sederhana cocok digunakan pada data tersebut.

Asumsi 1: Rata-rata galat diasumsikan bernilai nol

plot(databps$UHH,modelbps$residuals,
xlab="UHH (x)",ylab="Residuals",
main="Plot Uji Asumsi Rata-rata Galat bernilai nol")
abline(h=0,col="blue",lty=2)

Analisis dengan Visualisasi:

Pada plot Uji Asumsi 1 di atas dapat diamati bahwa sebagian titik-titik menyebar secara acak di sekitar galat sama dengan nol. Dengan demikian, memungkinkan asumsi rata-rata galat bernilai 0 terpenuhi.

Asumsi 2 : Galat Saling Bebas (Independen)

c<-(1:34)
databps<-cbind(databps,c)
head(databps)
##           Provinsi   UHH   IPM c
## 1             ACEH 73.06 74.70 1
## 2   SUMATERA UTARA 73.67 75.13 2
## 3   SUMATERA BARAT 74.14 75.64 3
## 4             RIAU 74.18 74.95 4
## 5            JAMBI 73.84 73.73 5
## 6 SUMATERA SELATAN 74.04 73.18 6
plot(databps$c,modelbps$residuals,
xlab="Amatan",ylab="Residuals",
main="Plot Uji Asumsi Galat Saling Bebas")
abline(h=0,col="blue",lty=2)

Analisis dengan visualisasi:

pada plot amatan vs residual di atas dapat diamati bahwa titik-titiknya menyebar secara acak dan tidak membentuk pola tertentu, maka galat saling bebas (independen). Dengan demikian, asumsi Galat Saling Bebas (Independen) terpenuhi.

Analisis dengan pengujian hipotesis

Hipotesis:

H0: Galat saling bebas

H1: Galat tidak saling bebas

Kriteria keputusan:

H0 ditolak jika p-value < 0.05

Perhitungan:

library(lmtest)
## Warning: package 'lmtest' was built under R version 4.3.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.3.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
dwtest(modelbps) # p-value < 0.05 H0 ditolak atau terjadi autokorelasi (Galat tidak saling bebas)
## 
##  Durbin-Watson test
## 
## data:  modelbps
## DW = 1.8956, p-value = 0.3233
## alternative hypothesis: true autocorrelation is greater than 0
library(car)
dwt(modelbps)
##  lag Autocorrelation D-W Statistic p-value
##    1      0.02309286      1.895645   0.682
##  Alternative hypothesis: rho != 0

Kesimpulan asumsi 2:

pada kedua perhitungan diatas diperoleh p-value = 0.3233 > 0.05 dan p-value = 0.682 > 0.05 maka H0 diterima. Sehingga pada taraf signifikansi 0.05 dapat disimpulkan bahwa galat saling bebas atau tidak terjadi autokorelasi. Dengan demikian, asumsi independen terpenuhi.

Asumsi 3 = Galat berdistribusi normal (Normalitas)

qqnorm(modelbps$residuals,ylab = "Raw Residuals")
qqline(modelbps$residuals)

Analisis secara Visualisasi:

Pada Normal Q-Q plot di atas terlihat bahwa mayoritas titik-titik mengikuti arah garis lurus, sehingga asumsi normalitas terpenuhi.

Analisis dengan pengujian hipotesis

Hipotesis:

H0:Galat berdistribusi normal

H1:Galat tidak bersistribusi normal

Kriteria keputusan:

H0 ditolak jika p-value < 0.05

Perhitungan:

shapiro.test(modelbps$residuals) 
## 
##  Shapiro-Wilk normality test
## 
## data:  modelbps$residuals
## W = 0.98405, p-value = 0.8888
library(nortest)
ad.test(modelbps$residuals)
## 
##  Anderson-Darling normality test
## 
## data:  modelbps$residuals
## A = 0.18144, p-value = 0.9063
lillie.test(modelbps$residuals)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  modelbps$residuals
## D = 0.074662, p-value = 0.9014

Kesimpulan asumsi 3:

pada ketiga perhitungan diatas diperoleh p-value = 0.8888 > 0.05, p-value = 0.9063 > 0.05, dan p-value = 0.9014 > 0.05 maka H0 diterima. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa galat berdistribusi normal. Dengan demikian, asumsi normalitas terpenuhi.

Asumsi 4: Ragam galat konstan atau homoskedastisitas (Homogenitas variansi)

plot(modelbps$fitted.values,modelbps$residuals,
xlab="Fitted Values",ylab="Residuals",
main="Plot Uji Ragam Galat konstan")
abline(h=0,col="blue",lty=2)

Analisis secara Visualisasi:

Pada plot uji ragam galat konstan di atas dapat diamati bahwa titik-titiknya menyebar dan tidak berpola di sekitar sumbu 𝑌 = 0 (dalam pita horizontal), maka ragam galat konstan (homoskedastisitas). Dengan demikian, asumsi Homogenitas variansi terpenuhi.

Asumsi 5: X dan Y berhubungan linear

modelbps <- lm(IPM~UHH, data=databps)
summary(modelbps)
## 
## Call:
## lm(formula = IPM ~ UHH, data = databps)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.2412 -1.4657  0.0606  1.2725  5.4580 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -43.9562    14.4193  -3.048  0.00459 ** 
## UHH           1.6099     0.1971   8.167  2.5e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.176 on 32 degrees of freedom
## Multiple R-squared:  0.6758, Adjusted R-squared:  0.6657 
## F-statistic:  66.7 on 1 and 32 DF,  p-value: 2.501e-09
plot(databps$UHH,databps$IPM, main="Scatterplot",xlab="UHH",ylab="IPM",pch=16)
abline(modelbps, col="blue")

Analisis secara visualisasi:

Pada scatterplot di atas dapat diamati titik-titiknya terletak disekitar garis regresi dan garis tersebut miring ke kanan, maka nilai koefisien korelasinya mendekati 1. Sehingga, terdapat hubungan linear positif yang kuat antara peubah bebas dan peubah respon. Dengan demikian, asumsi Linearitas terpenuhi.

Analisis dengan pengujian hipotesis

Hipotesis:

H0: Tidak ada hubungan linear yang signifikan antara UHH dan IPM (𝛽1 = 0)

H1: Ada hubungan linear yang signifikan antara UHH dan IPM (𝛽1 ≠ 0)

Taraf Signifikansi:

𝛼 = 0.05

Statistik Uji:

Uji F

Kriteria Keputusan:

H0 ditolak jika 𝐹 > 𝐹𝛼(1,𝑛−2) atau H0 ditolak jika p-value < 𝛼

Perhitungan:

F-value = 66.704

p-value = 2.501e-09

# Mencari F-value dan p-value menggunakan fungsi anova
anova(modelbps)
## Analysis of Variance Table
## 
## Response: IPM
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## UHH        1 315.79 315.793  66.704 2.501e-09 ***
## Residuals 32 151.50   4.734                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

F tabel = 4.149097

# Mencari F tabel
qf(0.95,df1=1, df2=32)
## [1] 4.149097

Kesimpulan:

karena F-value = 66.704 > 4.149097 atau p-value = 2.501e-09 < 0.05 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa ada hubungan linear yang signifikan antara UHH dan IPM di Indonesia pada tahun 2023.

Asumsi 6: Tidak ada outlier

plot(databps$UHH,databps$IPM,main="Plot Data")

Interpretasi secara Visualisasi: Pada plot data diatas dapat diamati bahwa tidak ditemukan outlier (nilai yang jauh berbeda dari nilai lainnya dalam kumpulan data). Dengan demikian, asumsi tidak adanya outlier terpenuhi.

SEMUA ASUMSI TERPENUHI