1. PENDAHULUAN

Indeks Pembangunan Manusia (IPM) merupakan indikator penting dalam mengukur kualitas hidup masyarakat. Salah satu faktor yang mempengaruhi IPM adalah tingkat pendidikan yang diwakili oleh Indeks Pendidikan.

Penelitian ini bertujuan untuk menganalisis pengaruh Indeks Pendidikan (X) terhadap Indeks Pembangunan Manusia (Y) menggunakan metode Regresi Linear Sederhana

2. INPUT DATA

# Data Indeks Pendidikan (X)
X <- c(
0.554,0.648,0.667,0.392,0.521,0.703,0.591,0.866,0.376,0.721,
0.869,0.703,0.664,0.759,0.795,0.942,0.732,0.469,0.826,0.807,
0.521,0.516,0.697,0.346,0.471,0.851,0.676,0.599,0.867,0.386,
0.359,0.916,0.884,0.591,0.519,0.787,0.744,0.723,0.39,0.61,
0.827,0.771,0.347,0.484,0.939,0.699,0.489,0.626,0.346
)

# Data Indeks Pembangunan Manusia (Y)
Y <- c(
0.633,0.785,0.707,0.537,0.542,0.756,0.662,0.818,0.489,0.757,
0.92,0.726,0.692,0.776,0.841,0.948,0.797,0.529,0.906,0.899,
0.596,0.599,0.752,0.516,0.545,0.904,0.74,0.667,0.844,0.473,
0.425,0.934,0.876,0.688,0.59,0.755,0.721,0.798,0.459,0.6,
0.856,0.825,0.512,0.63,0.941,0.746,0.596,0.549,0.467
)

data <- data.frame(X,Y)

head(data)
##       X     Y
## 1 0.554 0.633
## 2 0.648 0.785
## 3 0.667 0.707
## 4 0.392 0.537
## 5 0.521 0.542
## 6 0.703 0.756

3. VISUALISASI DATA

## Scatter Plot
plot(X,Y,
     main="Scatter Plot Indeks Pendidikan vs IPM",
     xlab="Indeks Pendidikan",
     ylab="Indeks Pembangunan Manusia",
     pch=19,
     col="pink")

Interpretasi:

Berdasarkan grafik scatter plot antara Indeks Pendidikan (X) dan Indeks Pembangunan Manusia (Y) terlihat bahwa titik-titik data membentuk pola yang cenderung menaik dari kiri bawah ke kanan atas. Hal ini menunjukkan bahwa terdapat hubungan positif antara Indeks Pendidikan dan Indeks Pembangunan Manusia. Artinya, semakin tinggi nilai Indeks Pendidikan maka cenderung semakin tinggi pula nilai IPM. Selain itu, pola sebaran titik data terlihat cukup mengikuti garis lurus, sehingga mengindikasikan bahwa hubungan antara kedua variabel tersebut bersifat linear. Kondisi ini menunjukkan bahwa metode regresi linear sederhana sesuai digunakan untuk menganalisis hubungan antara Indeks Pendidikan dan IPM. Tidak terlihat adanya pola penyimpangan yang ekstrem atau outlier yang signifikan pada grafik, sehingga hubungan antara kedua variabel dapat dikatakan cukup kuat dan konsisten.

4. MODEL REGRESI LINEAR SEDERHANA

## Model Regresi Linear

model <- lm(Y ~ X, data=data)

summary(model)
## 
## Call:
## lm(formula = Y ~ X, data = data)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.136452 -0.018545  0.004826  0.022396  0.081773 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  0.17968    0.02238   8.028 2.32e-10 ***
## X            0.80794    0.03350  24.118  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.04121 on 47 degrees of freedom
## Multiple R-squared:  0.9252, Adjusted R-squared:  0.9236 
## F-statistic: 581.7 on 1 and 47 DF,  p-value: < 2.2e-16

\[ Y_i = \beta_0 + \beta_1 X_i + \epsilon_i \] # 5. UJI ASUMSI KLASIK

load library

library(car)
## Warning: package 'car' was built under R version 4.4.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.4.2
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.4.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.4.1
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric

5.1 Uji Normalitas Residual

## Uji Normalitas Shapiro-Wilk

residuals_model <- residuals(model)

shapiro.test(residuals_model)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals_model
## W = 0.96428, p-value = 0.1421

Interpretasi: Dengan tingkat signifikansi α = 0.05, diperoleh bahwa p-value (0.1421) > 0.05, sehingga H₀ gagal ditolak.

Hipotesis pada uji Shapiro–Wilk adalah: H₀ : residual berdistribusi normal H₁ : residual tidak berdistribusi normal

Karena H₀ gagal ditolak, maka dapat disimpulkan bahwa residual pada model regresi berdistribusi normal. Dengan demikian, asumsi normalitas dalam model regresi linear sederhana terpenuhi.

Visualisasi

qqnorm(residuals_model)
qqline(residuals_model, col="red")

Interpretasi:

Normal Q–Q Plot digunakan untuk melihat apakah residual dari model regresi berdistribusi normal. Pada grafik tersebut, titik-titik residual dibandingkan dengan garis diagonal yang merepresentasikan distribusi normal teoritis. Berdasarkan grafik Normal Q–Q Plot, terlihat bahwa sebagian besar titik-titik residual berada di sekitar dan mengikuti garis diagonal. Meskipun terdapat sedikit penyimpangan pada beberapa titik di bagian ujung (tail), secara umum pola sebaran titik masih mengikuti garis lurus. Hal ini menunjukkan bahwa residual model regresi cenderung berdistribusi normal.Dengan demikian, berdasarkan Normal Q–Q Plot, dapat disimpulkan bahwa asumsi normalitas pada model regresi linear sederhana terpenuhi.

5.2 Uji Linearitas

## Uji Linearitas

crPlots(model)

Interpretasi:

Berdasarkan Component + Residual Plot (CR Plot) yang dihasilkan dari model regresi, terlihat bahwa titik-titik data menyebar mengikuti pola garis lurus yang meningkat dari kiri bawah ke kanan atas. Pola ini menunjukkan bahwa terdapat hubungan linear yang positif antara variabel X dan variabel Y, di mana peningkatan nilai X cenderung diikuti oleh peningkatan nilai Y. Selain itu, garis regresi linear yang ditunjukkan oleh garis biru putus-putus hampir berimpit dengan garis pemulusan (smooth) berwarna pink. Hal ini menunjukkan bahwa pola hubungan yang terbentuk pada data tidak memperlihatkan adanya penyimpangan yang berarti dari bentuk linear. Dengan kata lain, tidak terdapat indikasi hubungan non-linear yang signifikan antara variabel X dan Y. Sebaran titik-titik data juga terlihat relatif mengikuti arah garis regresi dan tidak membentuk pola lengkungan tertentu. Kondisi ini mengindikasikan bahwa asumsi linearitas pada model regresi telah terpenuhi, sehingga model regresi linear yang digunakan sudah cukup tepat untuk menggambarkan hubungan antara variabel X dan variabel Y dalam data tersebut.

5.3 Uji Homoskedastisitas

## Uji Breusch Pagan

bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 0.021392, df = 1, p-value = 0.8837

Interpretasi: Diperoleh p-value = 0.8837 > 0.05, sehingga H₀ gagal ditolak. Artinya tidak terdapat gejala heteroskedastisitas, sehingga asumsi homoskedastisitas pada model regresi terpenuhi.

Visualisasi

plot(fitted(model), residuals_model,
     xlab="Fitted Value",
     ylab="Residual",
     main="Plot Residual vs Fitted")
abline(h=0, col="red")

Interpretasi:

Berdasarkan plot Residual vs Fitted, terlihat bahwa titik-titik residual menyebar secara acak di sekitar garis nol dan tidak membentuk pola tertentu. Hal ini menunjukkan bahwa model regresi yang digunakan sudah cukup baik dan tidak terdapat indikasi pelanggaran asumsi linearitas maupun heteroskedastisitas.

5.4 Uji Non Autokorelasi

## Uji Durbin Watson

durbinWatsonTest(model)
##  lag Autocorrelation D-W Statistic p-value
##    1    -0.006137539      2.011108   0.986
##  Alternative hypothesis: rho != 0

Interpretasi: Diperoleh nilai Durbin–Watson = 2.011108 dengan p-value = 0.99 > 0.05, sehingga H₀ gagal ditolak. Artinya tidak terdapat autokorelasi pada residual, sehingga asumsi non-autokorelasi terpenuhi.

6. UJI SIGNIFIKANSI MODEL

6.1 Uji F (Kecocokan Model)

anova(model)
## Analysis of Variance Table
## 
## Response: Y
##           Df  Sum Sq Mean Sq F value    Pr(>F)    
## X          1 0.98795 0.98795  581.68 < 2.2e-16 ***
## Residuals 47 0.07983 0.00170                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretasi:

Berdasarkan hasil uji F (ANOVA) diperoleh nilai F hitung sebesar 581,68 dengan p-value < 2,2e-16 yang lebih kecil dari 0,05. Hal ini menunjukkan bahwa model regresi signifikan secara statistik, sehingga variabel X berpengaruh signifikan terhadap variabel Y dan model yang digunakan sudah layak untuk menjelaskan hubungan antara kedua variabel tersebut.

6.2 Uji t (Signifikansi Parameter)

summary(model)$coefficients
##              Estimate Std. Error   t value     Pr(>|t|)
## (Intercept) 0.1796788 0.02238240  8.027685 2.316127e-10
## X           0.8079445 0.03349953 24.118087 4.082343e-28
Interpretasi:
intercept memiliki nilai p-value = 2.316127e-10 (<0,05), sehingga signifikan. Artinya, konstanta dalam model berbeda secara signifikan dari nol.
Variabel X memiliki p-value = 4.082343e-28 (<0.05), sehingga signifikan. Artinya, variabel X berpengaruh signifikan terhadap variabel respon (Y) dalam model regresi. Kesimpulan: Parameter intercept dan X signifikan, sehingga X memiliki pengaruh nyata terhadap Y pada taraf signifikansi 5%

7. KOEFISIEN DETERMINASI DAN KORELASI

## Koefisien Determinasi

summary(model)$r.squared
## [1] 0.9252404

Interpretasi: Artinya 92.524% variasi pada variabel Y dapat dijelaskan oleh variabel X dalam model regresi, sedangkan 7.476% sisanya dijelaskan oleh faktor lain di luar model.

## Koefisien Korelasi

cor(X,Y)
## [1] 0.9618942

Interpretasi: Nilai korelasi 0.9619 menunjukkan bahwa hubungan antara variabel X dan Y sangat kuat dan bersifat positif. Artinya, semakin besar nilai X maka nilai Y cenderung meningkat.