Sumber data:
library(readxl)
databps <- read_excel("C:/Users/ASUS/Documents/UNY/SEM 2/ANALISIS REGRESI/Artikel/IPMUHH.xlsx")
data.frame(databps)
## Provinsi UHH IPM
## 1 ACEH 73.06 74.70
## 2 SUMATERA UTARA 73.67 75.13
## 3 SUMATERA BARAT 74.14 75.64
## 4 RIAU 74.18 74.95
## 5 JAMBI 73.84 73.73
## 6 SUMATERA SELATAN 74.04 73.18
## 7 BENGKULU 73.11 74.30
## 8 LAMPUNG 74.17 72.48
## 9 KEP. BANGKA BELITUNG 73.90 74.09
## 10 KEPULAUAN RIAU 74.90 79.08
## 11 DKI JAKARTA 75.81 83.55
## 12 JAWA BARAT 74.91 74.24
## 13 JAWA TENGAH 74.69 73.39
## 14 D I YOGYAKARTA 75.18 81.09
## 15 JAWA TIMUR 74.87 74.65
## 16 BANTEN 74.77 75.77
## 17 BALI 74.88 78.01
## 18 NUSA TENGGARA BARAT 72.02 72.37
## 19 NUSA TENGGARA TIMUR 71.57 68.40
## 20 KALIMANTAN BARAT 73.71 70.47
## 21 KALIMANTAN TENGAH 73.54 73.73
## 22 KALIMANTAN SELATAN 73.97 74.66
## 23 KALIMANTAN TIMUR 74.72 78.20
## 24 KALIMANTAN UTARA 73.54 72.88
## 25 SULAWESI UTARA 73.85 75.04
## 26 SULAWESI TENGAH 70.66 71.66
## 27 SULAWESI SELATAN 73.63 74.60
## 28 SULAWESI TENGGARA 71.79 72.94
## 29 GORONTALO 70.50 71.25
## 30 SULAWESI BARAT 70.76 69.80
## 31 MALUKU 70.45 72.75
## 32 MALUKU UTARA 70.76 70.98
## 33 PAPUA BARAT 68.51 67.47
## 34 PAPUA 68.17 63.01
summary(databps)
## Provinsi UHH IPM
## Length:34 Min. :68.17 Min. :63.01
## Class :character 1st Qu.:71.85 1st Qu.:72.40
## Mode :character Median :73.78 Median :73.91
## Mean :73.13 Mean :73.77
## 3rd Qu.:74.56 3rd Qu.:75.02
## Max. :75.81 Max. :83.55
modelbps <- lm(IPM~UHH, data=databps)
summary(modelbps)
##
## Call:
## lm(formula = IPM ~ UHH, data = databps)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.2412 -1.4657 0.0606 1.2725 5.4580
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -43.9562 14.4193 -3.048 0.00459 **
## UHH 1.6099 0.1971 8.167 2.5e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.176 on 32 degrees of freedom
## Multiple R-squared: 0.6758, Adjusted R-squared: 0.6657
## F-statistic: 66.7 on 1 and 32 DF, p-value: 2.501e-09
plot(databps$UHH,databps$IPM, main="Scatterplot",xlab="UHH",ylab="IPM",pch=16)
abline(modelbps, col="blue")
Interpretasi secara visualisasi:
semua titik-titik pada scatterplot di atas terletak disekitar garis regresi dan garis tersebut miring ke kanan, maka nilai koefisien korelasinya mendekati 1. Sehingga, terdapat hubungan linear positif yang kuat antara peubah bebas dan peubah respon.
JKG <- sum((databps$IPM-modelbps$fitted.values)^2)
JKG
## [1] 151.4954
JKR <- sum(((modelbps$fitted.values-mean(databps$IPM))^2))
JKR
## [1] 315.7935
JKT <- sum((databps$IPM-mean(databps$IPM))^2)
JKT
## [1] 467.2889
# Koefisien determinasi
r2 <- (JKT-JKG)/JKT
r2
## [1] 0.6757992
# Mencari koefisien korelasi menggunakan koefisien determinasi
sqrt(r2)
## [1] 0.8220701
# Mencari koefisien korelasi menggunakan fungsi cor.test
cor.test(databps$UHH, databps$IPM)
##
## Pearson's product-moment correlation
##
## data: databps$UHH and databps$IPM
## t = 8.1673, df = 32, p-value = 2.501e-09
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.6702239 0.9078556
## sample estimates:
## cor
## 0.8220701
Interpretasi:
0.8220701 merupakan nilai koefisien korelasi yang mendekati 1, sehingga terdapat hubungan linear yang kuat antara peubah bebas dan peubah respon.
modelbps <- lm(IPM~UHH, data=databps)
summary(modelbps)
##
## Call:
## lm(formula = IPM ~ UHH, data = databps)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.2412 -1.4657 0.0606 1.2725 5.4580
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -43.9562 14.4193 -3.048 0.00459 **
## UHH 1.6099 0.1971 8.167 2.5e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.176 on 32 degrees of freedom
## Multiple R-squared: 0.6758, Adjusted R-squared: 0.6657
## F-statistic: 66.7 on 1 and 32 DF, p-value: 2.501e-09
# Berdasarkan Persamaan Regresi menggunakan fungsi lm pada R diperoleh
b1 <- 1.6099
b0 <- -43.9562
Persamaan Regresi Dugaan:
yhat = (-43.9562) + (1.6099)x
Interpretasi:
Makna B1 = 1.6099, jika UHH meningkat sebesar 1 persen maka rata-rata IPM meningkat sebesar 1.6099 persen.
Makna B0 = -43.9562, jika UHH sebesar 0 persen maka rata-rata produksi padi sebesar -43.9562 persen. (tidak bermakna karena UHH tidak mungkin 0 dan IPM tidak mungkin negatif)
anova(modelbps)
## Analysis of Variance Table
##
## Response: IPM
## Df Sum Sq Mean Sq F value Pr(>F)
## UHH 1 315.79 315.793 66.704 2.501e-09 ***
## Residuals 32 151.50 4.734
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Interpretasi:
Berdasarkan hasil di atas diperoleh nilai SSR(Sum square residuals) = JKG (jumlah kuadrat galat) = 151.50
Hipotesis:
H0: Tidak ada hubungan linear yang signifikan antara UHH dan IPM (ρ = 0)
H1: Ada hubungan linear yang signifikan antara UHH dan IPM (ρ ≠ 0)
Taraf Signifikansi:
𝛼 = 0.05
Statistik Uji:
Uji t
Kriteria Keputusan:
H0 ditolak jika |t-value| > t(𝛼/2,𝑛−2)
Perhitungan:
t-value = 8.1673
cor.test(databps$UHH, databps$IPM)
##
## Pearson's product-moment correlation
##
## data: databps$UHH and databps$IPM
## t = 8.1673, df = 32, p-value = 2.501e-09
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.6702239 0.9078556
## sample estimates:
## cor
## 0.8220701
t tabel = 2.036933
# Mencari t tabel
qt(0.975,length(databps$UHH)-2)
## [1] 2.036933
Kesimpulan:
karena |t-value| = 8.1673 > 2.036933 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa ada hubungan linear yang signifikan antara UHH dan IPM di Indonesia pada tahun 2023.
Hipotesis:
H0: Tidak ada hubungan linear yang signifikan antara UHH dan IPM (𝛽1 = 0)
H1: Ada hubungan linear yang signifikan antara UHH dan IPM (𝛽1 ≠ 0)
Taraf Signifikansi:
𝛼 = 0.05
Statistik Uji:
Uji F
Kriteria Keputusan:
H0 ditolak jika 𝐹-value > 𝐹𝛼(1,𝑛−2) atau H0 ditolak jika p-value < 𝛼
Perhitungan:
F-value = 66.704
p-value = 2.501e-09
# Mencari F-value dan p-value menggunakan fungsi anova
anova(modelbps)
## Analysis of Variance Table
##
## Response: IPM
## Df Sum Sq Mean Sq F value Pr(>F)
## UHH 1 315.79 315.793 66.704 2.501e-09 ***
## Residuals 32 151.50 4.734
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
F tabel = 4.149097
# Mencari F tabel
qf(0.95,df1=1, df2=32)
## [1] 4.149097
Kesimpulan:
karena F-value = 66.704 > 4.149097 atau p-value = 2.501e-09 < 0.05 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa ada hubungan linear yang signifikan antara UHH dan IPM di Indonesia pada tahun 2023.
Hipotesis:
H0: Tidak terdapat pengaruh antara UHH (X) dan IPM (Y) (𝛽1 = 0)
H1: Terdapat pengaruh antara UHH (X) dan IPM (Y) (𝛽1 ≠ 0)
Taraf Signifikansi:
𝛼 = 0.05
Statistik Uji:
Uji t
Kriteria Keputusan:
H0 ditolak jika |t-value| > t(𝛼/2,𝑛−2)
Perhitungan:
t-value = 8.167158
# Mencari KTG untuk menghitung t-value
KTG <- JKG/(length(databps$UHH)-2)
KTG
## [1] 4.734232
# t-value β1
sb1sqr <- KTG/sum((databps$UHH-mean(databps$UHH))^2)
sb1 <- sqrt(sb1sqr)
tb1 <- b1/sb1
tb1
## [1] 8.167158
t tabel = 2.036933
# Mencari t tabel
qt(0.975,length(databps$UHH)-2)
## [1] 2.036933
Kesimpulan:
karena t-value = 8.167158 > 2.036933 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa terdapat pengaruh antara UHH (X) dan IPM (Y).
Hipotesis:
H0: Tidak terdapat perbedaan yang signifikan antara UHH (X) dan IPM (Y) (𝛽0 = 0)
H1: Terdapat perbedaan yang signifikan antara UHH (X) dan IPM (Y) (𝛽0 ≠ 0)
Taraf Signifikansi:
𝛼 = 0.05
Statistik Uji:
Uji t
Kriteria Keputusan:
H0 ditolak jika |t-value| > t(𝛼/2,𝑛−2)
Perhitungan:
t-value = -3.048438 |t-value| = 3.048438
# Mencari KTG untuk menghitung t-value
KTG <- JKG/(length(databps$UHH)-2)
KTG
## [1] 4.734232
# t-value β0
sb0sqr <- KTG*(1/length(databps$UHH)+((mean(databps$UHH)^2)/sum((databps$UHH-mean(databps$UHH))^2)))
sb0 <- sqrt(sb0sqr)
tb0 <- b0/sb0
tb0
## [1] -3.048438
t tabel = 2.036933
# Mencari t tabel
qt(0.975,length(databps$UHH)-2)
## [1] 2.036933
Kesimpulan:
karena |t-value| = 3.048438 > 2.036933 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa terdapat perbedaan yang signifikan antara UHH (X) dan IPM (Y)
confint(modelbps, level = 0.95)
## 2.5 % 97.5 %
## (Intercept) -73.327245 -14.58512
## UHH 1.208404 2.01144
Selang Kepercayaan β0:
-73.327245 < β0 < -14.58512
Selang Kepercayaan β1:
1.208404 < β1 < 2.01144
belum…
library(alr3)
## Loading required package: car
## Warning: package 'car' was built under R version 4.3.2
## Loading required package: carData
pureErrorAnova(modelbps)
## Analysis of Variance Table
##
## Response: IPM
## Df Sum Sq Mean Sq F value Pr(>F)
## UHH 1 315.793 315.793 597.2736 0.00167 **
## Residuals 32 151.495 4.734
## Lack of fit 30 150.438 5.015 9.4843 0.09974 .
## Pure Error 2 1.057 0.529
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Interpretasi:
Berdasarkan data di atas diperoleh nilai JKKM = 150.438 dan JKGM = 1.057
Hipotesis:
H0: Tidak ada ketidakpasan model regresi linear sederhana dengan data
H1: Ada ketidakpasan model regresi linear sederhana dengan data
Taraf Signifikansi:
𝛼 = 0.05
Statistik Uji:
Uji F
Kriteria Keputusan:
H0 ditolak jika 𝐹-value > 𝐹𝛼(k-2,𝑛−k)
Perhitungan:
F-value = 9.4843
F tabel = 19.46241
# Mencari f tabel
qf(0.95, df1=30, df2=2)
## [1] 19.46241
Kesimpulan:
karena F-value = 9.4843 < 19.46241 maka H0 diterima. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa ada tidak ada ketidakpasan model regresi linear sederhana dengan data. Dengan demikian, model regresi linear sederhana cocok digunakan pada data tersebut.
plot(databps$UHH,modelbps$residuals,
xlab="UHH (x)",ylab="Residuals",
main="Plot Uji Asumsi Rata-rata Galat bernilai nol")
abline(h=0,col="blue",lty=2)
Analisis dengan Visualisasi:
Pada plot Uji Asumsi 1 di atas dapat diamati bahwa sebagian titik-titik menyebar secara acak di sekitar galat sama dengan nol. Dengan demikian, memungkinkan asumsi rata-rata galat bernilai 0 terpenuhi.
c<-(1:34)
databps<-cbind(databps,c)
head(databps)
## Provinsi UHH IPM c
## 1 ACEH 73.06 74.70 1
## 2 SUMATERA UTARA 73.67 75.13 2
## 3 SUMATERA BARAT 74.14 75.64 3
## 4 RIAU 74.18 74.95 4
## 5 JAMBI 73.84 73.73 5
## 6 SUMATERA SELATAN 74.04 73.18 6
plot(databps$c,modelbps$residuals,
xlab="Amatan",ylab="Residuals",
main="Plot Uji Asumsi Galat Saling Bebas")
abline(h=0,col="blue",lty=2)
Analisis dengan visualisasi:
pada plot amatan vs residual di atas dapat diamati bahwa titik-titiknya menyebar secara acak dan tidak membentuk pola tertentu, maka galat saling bebas (independen). Dengan demikian, asumsi Galat Saling Bebas (Independen) terpenuhi.
Analisis dengan pengujian hipotesis
Hipotesis:
H0: Galat saling bebas
H1: Galat tidak saling bebas
Kriteria keputusan:
H0 ditolak jika p-value < 0.05
Perhitungan:
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.3.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.3.3
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
dwtest(modelbps) # p-value < 0.05 H0 ditolak atau terjadi autokorelasi (Galat tidak saling bebas)
##
## Durbin-Watson test
##
## data: modelbps
## DW = 1.8956, p-value = 0.3233
## alternative hypothesis: true autocorrelation is greater than 0
library(car)
dwt(modelbps)
## lag Autocorrelation D-W Statistic p-value
## 1 0.02309286 1.895645 0.682
## Alternative hypothesis: rho != 0
Kesimpulan asumsi 2:
pada kedua perhitungan diatas diperoleh p-value = 0.3233 > 0.05 dan p-value = 0.682 > 0.05 maka H0 diterima. Sehingga pada taraf signifikansi 0.05 dapat disimpulkan bahwa galat saling bebas atau tidak terjadi autokorelasi. Dengan demikian, asumsi independen terpenuhi.
qqnorm(modelbps$residuals,ylab = "Raw Residuals")
qqline(modelbps$residuals)
Analisis secara Visualisasi:
Pada Normal Q-Q plot di atas terlihat bahwa mayoritas titik-titik mengikuti arah garis lurus, sehingga asumsi normalitas terpenuhi.
Analisis dengan pengujian hipotesis
Hipotesis:
H0:Galat berdistribusi normal
H1:Galat tidak bersistribusi normal
Kriteria keputusan:
H0 ditolak jika p-value < 0.05
Perhitungan:
shapiro.test(modelbps$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelbps$residuals
## W = 0.98405, p-value = 0.8888
library(nortest)
ad.test(modelbps$residuals)
##
## Anderson-Darling normality test
##
## data: modelbps$residuals
## A = 0.18144, p-value = 0.9063
lillie.test(modelbps$residuals)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: modelbps$residuals
## D = 0.074662, p-value = 0.9014
Kesimpulan asumsi 3:
pada ketiga perhitungan diatas diperoleh p-value = 0.8888 > 0.05, p-value = 0.9063 > 0.05, dan p-value = 0.9014 > 0.05 maka H0 diterima. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa galat berdistribusi normal. Dengan demikian, asumsi normalitas terpenuhi.
plot(modelbps$fitted.values,modelbps$residuals,
xlab="Fitted Values",ylab="Residuals",
main="Plot Uji Ragam Galat konstan")
abline(h=0,col="blue",lty=2)
Analisis secara Visualisasi:
Pada plot uji ragam galat konstan di atas dapat diamati bahwa titik-titiknya menyebar dan tidak berpola di sekitar sumbu 𝑌 = 0 (dalam pita horizontal), maka ragam galat konstan (homoskedastisitas). Dengan demikian, asumsi Homogenitas variansi terpenuhi.
modelbps <- lm(IPM~UHH, data=databps)
summary(modelbps)
##
## Call:
## lm(formula = IPM ~ UHH, data = databps)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.2412 -1.4657 0.0606 1.2725 5.4580
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -43.9562 14.4193 -3.048 0.00459 **
## UHH 1.6099 0.1971 8.167 2.5e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.176 on 32 degrees of freedom
## Multiple R-squared: 0.6758, Adjusted R-squared: 0.6657
## F-statistic: 66.7 on 1 and 32 DF, p-value: 2.501e-09
plot(databps$UHH,databps$IPM, main="Scatterplot",xlab="UHH",ylab="IPM",pch=16)
abline(modelbps, col="blue")
Analisis secara visualisasi:
Pada scatterplot di atas dapat diamati titik-titiknya terletak disekitar garis regresi dan garis tersebut miring ke kanan, maka nilai koefisien korelasinya mendekati 1. Sehingga, terdapat hubungan linear positif yang kuat antara peubah bebas dan peubah respon. Dengan demikian, asumsi Linearitas terpenuhi.
Analisis dengan pengujian hipotesis
Hipotesis:
H0: Tidak ada hubungan linear yang signifikan antara UHH dan IPM (𝛽1 = 0)
H1: Ada hubungan linear yang signifikan antara UHH dan IPM (𝛽1 ≠ 0)
Taraf Signifikansi:
𝛼 = 0.05
Statistik Uji:
Uji F
Kriteria Keputusan:
H0 ditolak jika 𝐹 > 𝐹𝛼(1,𝑛−2) atau H0 ditolak jika p-value < 𝛼
Perhitungan:
F-value = 66.704
p-value = 2.501e-09
# Mencari F-value dan p-value menggunakan fungsi anova
anova(modelbps)
## Analysis of Variance Table
##
## Response: IPM
## Df Sum Sq Mean Sq F value Pr(>F)
## UHH 1 315.79 315.793 66.704 2.501e-09 ***
## Residuals 32 151.50 4.734
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
F tabel = 4.149097
# Mencari F tabel
qf(0.95,df1=1, df2=32)
## [1] 4.149097
Kesimpulan:
karena F-value = 66.704 > 4.149097 atau p-value = 2.501e-09 < 0.05 maka H0 ditolak. Sehingga, pada taraf signifikansi 0.05 dapat disimpulkan bahwa ada hubungan linear yang signifikan antara UHH dan IPM di Indonesia pada tahun 2023.
plot(databps$UHH,databps$IPM,main="Plot Data")
Interpretasi secara Visualisasi: Pada plot data diatas dapat diamati bahwa tidak ditemukan outlier (nilai yang jauh berbeda dari nilai lainnya dalam kumpulan data). Dengan demikian, asumsi tidak adanya outlier terpenuhi.
SEMUA ASUMSI TERPENUHI