This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see https://rpubs.com/Student_School1.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
install.packages("readxl", repos = "https://cloud.r-project.org")
## Installing package into 'C:/Users/asus/AppData/Local/R/win-library/4.5'
## (as 'lib' is unspecified)
## package 'readxl' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\asus\AppData\Local\Temp\RtmpA3Bvtb\downloaded_packages
library(readxl)
data = read_excel("C:\\Users\\asus\\Downloads\\Data Jabar.xlsx")
head(data)
## # A tibble: 6 × 5
## `Wilayah Jawa Barat` `Umur Harapan Hidup 2024` `Harapan Lama Sekolah 2024`
## <chr> <dbl> <dbl>
## 1 Bogor 72.2 12.8
## 2 Sukabumi 72.1 12.4
## 3 Cianjur 71.0 12.0
## 4 Bandung 74.5 12.7
## 5 Garut 72.3 12.2
## 6 Tasikmalaya 70.4 12.6
## # ℹ 2 more variables: `Rata-Rata Lama Sekolah 2024` <dbl>, `IPM 2024` <dbl>
Inilah data Umur Harapan Hidup, Harapan Lama Sekolah, Rata-Rata Lama Sekolah, Rata-Rata Lama Sekolah dan IPM diseluruh Wilayah Jawa Barat pada Tahun 2024
model = lm(data$`IPM 2024`~data$`Umur Harapan Hidup 2024`+data$`Rata-Rata Lama Sekolah 2024`)
summary(model)
##
## Call:
## lm(formula = data$`IPM 2024` ~ data$`Umur Harapan Hidup 2024` +
## data$`Rata-Rata Lama Sekolah 2024`)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.2794 -0.8087 -0.0842 0.8563 2.7732
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -13.0506 17.4823 -0.747 0.46261
## data$`Umur Harapan Hidup 2024` 0.9016 0.2613 3.451 0.00208 **
## data$`Rata-Rata Lama Sekolah 2024` 2.3347 0.2535 9.209 2.4e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.241 on 24 degrees of freedom
## Multiple R-squared: 0.9351, Adjusted R-squared: 0.9297
## F-statistic: 173 on 2 and 24 DF, p-value: 5.564e-15
Diambil data IPM 2024 untuk variabel Y, Umur Harapan Hidup 2024 untuk variabel X1 dan Rata-Rata Lama Sekolah 2024 untuk variabel X2.
Hasil estimasi regresi linear menunjukkan bahwa variabel Umur Harapan Hidup dan Rata-Rata Lama Sekolah memiliki pengaruh positif terhadap Indeks Pembangunan Manusia (IPM). Berdasarkan hasil estimasi parameter diperoleh persamaan regresi yaitu:
IPM = -13.0506 + 0.9016(Umur Harapan Hidup) + 2.3347(Rata-Rata Lama Sekolah).
Koefisien variabel Umur Harapan Hidup sebesar 0.9016 menunjukkan bahwa setiap peningkatan umur harapan hidup sebesar 1 tahun akan meningkatkan IPM sebesar 0.9016 poin, dengan asumsi variabel lain tetap. Hasil uji t menunjukkan nilai p-value sebesar 0.00208 yang lebih kecil dari 0.05, sehingga dapat disimpulkan bahwa variabel umur harapan hidup berpengaruh positif dan signifikan terhadap IPM.
Selanjutnya, koefisien variabel Rata-Rata Lama Sekolah sebesar 2.3347 menunjukkan bahwa setiap peningkatan rata-rata lama sekolah sebesar 1 tahun akan meningkatkan IPM sebesar 2.3347 poin, dengan asumsi variabel lain konstan. Nilai p-value yang diperoleh sebesar 2.4e-09 atau lebih kecil dari 0.05, sehingga dapat disimpulkan bahwa variabel rata-rata lama sekolah berpengaruh positif dan signifikan terhadap IPM.
Nilai koefisien determinasi (R²) sebesar 0.9351 menunjukkan bahwa sebesar 93.51% variasi IPM dapat dijelaskan oleh variabel umur harapan hidup dan rata-rata lama sekolah, sedangkan sisanya sebesar 6.49% dipengaruhi oleh faktor lain yang tidak dimasukkan dalam model. Selain itu, hasil uji F menunjukkan nilai F-statistic sebesar 173 dengan p-value sebesar 5.564e-15 yang lebih kecil dari 0.05, sehingga dapat disimpulkan bahwa secara simultan variabel umur harapan hidup dan rata-rata lama sekolah berpengaruh signifikan terhadap IPM.
Secara keseluruhan, model regresi yang digunakan memiliki kemampuan yang sangat baik dalam menjelaskan variasi IPM.
shapiro.test(residuals(model))
##
## Shapiro-Wilk normality test
##
## data: residuals(model)
## W = 0.97247, p-value = 0.6681
Hasil uji normalitas menggunakan Shapiro-Wilk menunjukkan nilai statistik W sebesar 0.97247 dengan p-value sebesar 0.6681. Karena nilai p-value lebih besar dari tingkat signifikansi 0.05, maka gagal menolak hipotesis nol. Hal ini menunjukkan bahwa residual pada model regresi berdistribusi normal. Dengan demikian, dapat disimpulkan bahwa asumsi normalitas pada model regresi telah terpenuhi.
qqnorm(residuals(model))
qqline(residuals(model), col = "red")
Berdasarkan grafik yang ditampilkan, terlihat bahwa sebagian besar titik
residual berada di sekitar dan mengikuti garis diagonal merah. Hal ini
menunjukkan bahwa distribusi residual mendekati distribusi normal.
Meskipun terdapat sedikit penyimpangan pada beberapa titik di bagian
ujung (ekor kiri dan kanan), penyimpangan tersebut masih relatif kecil
dan tidak menunjukkan pola yang ekstrem.
Dengan demikian, dapat disimpulkan bahwa residual pada model regresi cenderung berdistribusi normal, sehingga asumsi normalitas pada model regresi telah terpenuhi. Hasil ini juga konsisten dengan hasil uji Shapiro-Wilk sebelumnya yang menunjukkan p-value lebih besar dari 0.05, sehingga tidak terdapat bukti yang cukup untuk menolak asumsi normalitas.
Secara keseluruhan, model regresi yang digunakan memenuhi asumsi normalitas residual, sehingga hasil estimasi dan pengujian statistik pada model dapat dianggap valid untuk digunakan dalam analisis.
install.packages("car", repos = "https://cloud.r-project.org")
## Installing package into 'C:/Users/asus/AppData/Local/R/win-library/4.5'
## (as 'lib' is unspecified)
## package 'car' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\asus\AppData\Local\Temp\RtmpA3Bvtb\downloaded_packages
library(car)
## Loading required package: carData
vif(model)
## data$`Umur Harapan Hidup 2024` data$`Rata-Rata Lama Sekolah 2024`
## 2.383423 2.383423
Hasil uji multikolinearitas menggunakan Variance Inflation Factor (VIF) menunjukkan bahwa nilai VIF untuk variabel Umur Harapan Hidup 2024 dan Rata-Rata Lama Sekolah 2024 masing-masing sebesar 2.383423. Nilai VIF tersebut berada di bawah batas umum yang digunakan, yaitu 10 (bahkan masih di bawah batas ketat yaitu 5).
Hal ini menunjukkan bahwa tidak terdapat masalah multikolinearitas yang serius antara variabel independen dalam model regresi. Dengan demikian, variabel Umur Harapan Hidup dan Rata-Rata Lama Sekolah tidak memiliki hubungan yang terlalu kuat satu sama lain sehingga keduanya masih layak digunakan secara bersama-sama dalam model regresi.
Oleh karena itu, dapat disimpulkan bahwa asumsi tidak adanya multikolinearitas dalam model regresi telah terpenuhi, sehingga estimasi koefisien regresi yang dihasilkan dapat dianggap stabil dan dapat diinterpretasikan dengan baik.
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
bptest(model)
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 1.1403, df = 2, p-value = 0.5654
Hasil uji heteroskedastisitas menggunakan Breusch–Pagan test menunjukkan nilai BP (Breusch-Pagan) sebesar 1.1403 dengan derajat kebebasan (df) = 2 dan p-value sebesar 0.5654. Karena nilai p-value lebih besar dari tingkat signifikansi 0.05, maka gagal menolak hipotesis nol.
Hipotesis nol pada uji Breusch–Pagan menyatakan bahwa tidak terjadi heteroskedastisitas atau varians residual bersifat konstan (homoskedastisitas). Dengan demikian, dapat disimpulkan bahwa tidak terdapat masalah heteroskedastisitas pada model regresi.
Artinya, varians residual dari model regresi relatif konstan pada setiap nilai variabel independen. Oleh karena itu, asumsi homoskedastisitas dalam model regresi telah terpenuhi, sehingga model regresi yang digunakan dapat dianggap layak untuk analisis lebih lanjut.
library(car)
durbinWatsonTest(model)
## lag Autocorrelation D-W Statistic p-value
## 1 0.2015069 1.54511 0.15
## Alternative hypothesis: rho != 0
Hasil uji autokorelasi menggunakan Durbin–Watson test menunjukkan nilai Durbin–Watson (D-W) sebesar 1.54511 dengan nilai autokorelasi sebesar 0.2015069 dan p-value sebesar 0.17. Karena nilai p-value lebih besar dari tingkat signifikansi 0.05, maka gagal menolak hipotesis nol. Dengan demikian, dapat disimpulkan bahwa tidak terdapat masalah autokorelasi pada model regresi yang digunakan.
Selain itu, nilai Durbin–Watson yang mendekati angka 2 juga menunjukkan bahwa residual pada model regresi tidak memiliki korelasi satu sama lain. Oleh karena itu, asumsi tidak adanya autokorelasi dalam model regresi telah terpenuhi, sehingga model regresi dapat digunakan untuk analisis lebih lanjut secara valid.
library(lmtest)
resettest(model)
##
## RESET test
##
## data: model
## RESET = 0.67544, df1 = 2, df2 = 22, p-value = 0.5192
Hasil uji linearitas menggunakan RESET test menunjukkan nilai statistik RESET sebesar 0.67544 dengan derajat kebebasan df1 = 2 dan df2 = 22, serta p-value sebesar 0.5192. Karena nilai p-value lebih besar dari tingkat signifikansi 0.05, maka gagal menolak hipotesis nol. Dengan demikian, dapat disimpulkan bahwa model regresi yang digunakan telah memenuhi asumsi linearitas.
Artinya, hubungan antara variabel Umur Harapan Hidup dan Rata-Rata Lama Sekolah terhadap Indeks Pembangunan Manusia (IPM) dapat dijelaskan dengan baik menggunakan model regresi linear. Oleh karena itu, model regresi yang digunakan sudah sesuai dan tidak memerlukan penambahan bentuk fungsi lain seperti pangkat atau transformasi variabel.
par(mfrow = c(2,2))
plot(model)
Berdasarkan grafik terlihat bahwa titik-titik residual tersebar secara acak di sekitar garis horizontal nol dan tidak membentuk pola tertentu seperti pola melengkung atau pola kipas. Hal ini menunjukkan bahwa hubungan antara variabel independen dan variabel dependen bersifat linear serta tidak terdapat indikasi heteroskedastisitas yang kuat. Dengan demikian, asumsi linearitas dan homoskedastisitas pada model regresi dapat dianggap terpenuhi.
Dari grafik terlihat bahwa sebagian besar titik mengikuti garis diagonal, meskipun terdapat sedikit penyimpangan pada bagian ujung (ekor). Namun penyimpangan tersebut relatif kecil sehingga secara umum residual dapat dianggap berdistribusi normal. Hal ini menunjukkan bahwa asumsi normalitas residual pada model regresi telah terpenuhi.
Pada grafik terlihat bahwa titik-titik menyebar secara relatif merata di sepanjang garis horizontal tanpa membentuk pola tertentu seperti pola meningkat atau menurun. Hal ini menunjukkan bahwa varians residual relatif konstan. Dengan demikian, dapat disimpulkan bahwa tidak terdapat indikasi heteroskedastisitas yang serius dalam model regresi.
Dari grafik terlihat bahwa sebagian besar titik berada di dalam batas Cook’s Distance dan tidak ada titik yang melewati garis batas tersebut secara signifikan. Hal ini menunjukkan bahwa tidak terdapat observasi yang memiliki pengaruh sangat besar terhadap model. Dengan demikian, model regresi tidak dipengaruhi oleh outlier atau data yang terlalu berpengaruh.