Notes Theme: - Kelas E: cayman
- Kelas F: tactile
- Kelas G: architect
- Kelas H: hpstr
Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")Dalam penyampaian data, diperlukan cara penyampaian data yang menarik agar dapat menarik perhatian pembaca, tetapi selain manarik penyajian data juga harus dapat dimengerti oleh pembaca. Jika penyampaian datanya menarik namun susah dipahami, maka informasi yang akan disampaikan tidak akan tersampaikan oleh pembaca. Oleh karena itu diperlukan pemodelan data agar memudahkan pembaca memahami data yang ada dan agar data terlihat lebih menarik. Namun tidak semua model cocok dengan data yang akan dijadikan model statistik. Sehingga perlu adanya uji kecocokan model untuk menguji apakah model tersebut cocok dengan data yang akan disampaikan atau tidak. Regresi adalah salah satu metode yang digunakan untuk menentukan hubungan sebab-akibat antara variabel respon dengan variabel prediktor. Indeks Pembangunan Manusia (IPM) merupakan salah satu cara untuk mengukur keberhasilan kinerja suatu Negara atau Wilayah dalam bidang pembangunan manusia (BPS,2012). Indeks Pembangunan Manusia merupakan salah satu indikator untuk mengukur taraf kualitas fisik dan non-fisik penduduk (Andaiyani,2012). Indeks Pembangunan Manusia merupakan suatu indeks komposit yang mencakup tiga bidang pembangunan manusia yang dianggap sangat mendasar yang dilihat dari kualitas fisik dan non fisik penduduk. Tiga indikator tersebut antara lain adalah indikator kesehatan, tingkat pendidikan dan ekonomi. Indikator kesehatan dicerminkan dari angka harapan hidup, sedangkan kualitas non-fisik dicerminkan oleh tingkan pendidikan, angka melek huruf dan pendapatan perkapita. Pembangunan manusia lebih dari sekedar pembangunan ekonomi, peningkatan pendapatan dan lebih dari sekedar proses produksi komoditas serta akumulasi modal. Beberapa alasan perlu diperhatikannya Indeks Pembangunan Manusia dalam pertumbuhan suatu negara adalah : satu, banyak negara berkembang contohnya sendiri adalah Indonesia yang mampu mengalami perkembangan ekonomi namun disisi lain Indonesia juga belum bisa mengatasi masalah kesenjangan sosial dan kemiskinan. Dua, terdapat negara maju seperti Amerika, Inggris dan negara-negara di benua Eropa yang telah mengalami pertumbuhan dengan angka indeks pertumbuhan lebih dari 80 namun tidak mengurangi masalah sosial seperti penggunaan obat terlarang, aids, alkohol, kekerasan rumah tangga dan rasisme. Tiga, beberapa negara yang berpendapatan rendah mampu mencapai Indeks Pembangunan Manusia yang tinggi karena mampu menggunakan sumber daya manusianya secara bijak. Berdasarkan uraian yang telah diberikan, saya akan membuat model regresi linear yang memfokuskan antara antara angka harapan hidup, rata-rata pendapatan perkapita dengan indeks pembangunan manusia.
Regresi linear adalah sebuah metode dalam statistika untuk memodelkan hubungan antara variabel respon y (peubah acak terikat) dan satu atau lebih variabel prediktor x (peubah bebas). Salah satu kegunaan dari regresi linear adalah untuk melakukan prediksi berdasarkan data yang telah ada.
Regresi Linier Berganda hampir mirip dengan Regresi Linier sederhana, bedanya ada di peubah acak bebas x yang jumlahnya lebih dari satu dengan satu peubah acak terikat y. Model regresi yang melibatkan lebih dari satu variabel prediktor disebut regresi berganda (Montgomery, Peck, & Vining, 2012). Model matematika adalah sebagai berikut :
\[
Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + . . . + \beta_kX_k + \epsilon_i
\]
## Pengujian Parameter Regresi Berganda ### Uji Simultan/Serentak Uji serentak digunakan untuk mengetahui hubungan linier antara variabel respon (Y) terhadap variabel prediktor (X). Uji ini digunakan untuk menguji kecukupan model dengan hipotesis yang digunakan adalah
\[
H_0 : \beta_1=\beta_2=\beta_{3\ }=...=\beta_k\ =0
\] Statistik uji yang digunakan adalah \[
F_{hit}=\ \frac{{SSR}{k}}{{SSE}{(n-k-1)}}\ =\ \frac{MSR}{MSE}
\]
### Uji Parsial Setelah menentukan setidaknya salah satu variabel prediktor yang signifikan terhadap variabel respon, selanjutnya dilakukan pengujian parsial untuk mengetahui pengaruh variabel prediktor secara individual terhadap variabel respon. Hipotesis yang digunakan adalah
\[ H0 : \beta_k\ =0 \] \[ H1 : \beta_k ≠ 0; k=1,2,…,k \] Statistik uji yang digunakan adalah
\[ t\ =\ \frac{\widehat{\beta_k}}{se(\widehat{\beta_k})} \] Daerah penolakan : \[ Tolak\ H_0, jika \left|t\right| lebih\ besar\ dari\ pada\ tα/2;(n-k-1) \] (Montgomery, Peck, & Vining, 2012).
Koefisien determinasi (R2) adalah nilai yang menunjukkan seberapa besar kemampuan variabel prediktor dalam menjelaskan model dari variabel respon. Koefisien determinasi dalam model matematikanya dapat dituliskan sebagai berikut :
\[ R^2\ =\ \frac{SSR}{SST}\ =1\ -\ \frac{SSE}{SST} \] Karena SST merupakan ukuran variabilitas dari y tanpa mempertimbangkan efek regresi variabel prediktor dan SSE merupakan ukuran variabilitas dari y sisa setelah variabel prediktor, maka R2 sering disebut sebagai proporsi variasi yang dijelaskan oleh variabel prediktor. Karena 0 ≤ SSE ≤ SST maka 0 ≤ R2 ≤ 1. Nilai R2 yang mendekati 1 mennjukkan bahwa Sebagian besar variabilitas y dijelaskan oleh model regresi (Montgomery, Peck, & Vining, 2012).
Asumsi klasik yang harus dipenuhi pada model regresi adalah tidak adanya multikolinearitas, tidak terjadi heteroskdastisitas (varian residual identik), tidak autokorelasi (residual independen) dan berdistribusi normal.
Adalah suatu keadaan yang menunjukkan adanya korelasi atau hubungan kuat antara dua variabel prediktor atau lebih dalam sebuah model regresi berganda dengan menghitung Variance Inflasion Factors (VIF).
Terdapat tiga sumber utama penyebab multikolinearitas :
1. Metode pengumpulan data yang digunakan
2. Spesifikasi model
3. Pendefinisian model
Adanya multikolinieritas memiliki beberapa potensi dampak pada hasil estimasi koefisien regresi. Besar multikolinearitas dapat dilihat berdasarkan nilai VIFnya. Dalam model matematika VIF dapat dirumuskan sebagai berikut:
\[ VIF\ =\ \frac{1}{1-R^2} \]
Dimana R2 didapat dari model regresi variabel prediktor sebagai respon dengan variabel prediktor lain sebagai variabel prediktornya. Jika nilai VIF lebih dari 10 hal ini menunjukkan adanya multikolinearitas. Adapun cara untuk mengatasi multikolinearitas adalah 1. Menghapus atau mengeluarkan variabel prediktor yang menjadi penyebab multi kolinearitas. 2. Menambahkan data baru 3. Menggunakan Principal Component Analysis (PCA) yaitu dengan menyederhanakan atau menggabungkan jumlah variabel prediktor tanpa mereduksi satupun variabel prediktor (Montgomery, Peck, & Vining, 2012).
Adalah kondisi dimana variansi dan error tidak identik. Cara mengetahui adanya heteroskedastisitas dapat dengan cara melihat scatter plot antara residual kuadrat dengan variabel respon taksiran atau antara residual kuadrat dengan variabel prediktor. Apabila plot semakin melebar maka menunjukkan terjadinya heteroskedastisitas (Setiawan & Kusrini, 2010). Plot ACF dan PACF kuadrat residual juga dapat digunakan untuk mendeteksi terjadinya varian residual yang tidak Identik (Tsay, 2002). Pengujian yang dilakukan untuk mengetahui ada tidaknya heteroskedastisitas yaitu menggunakan Uji Glejser dengan meregresikan |e| terhadap X yang memiliki model sebagai berikut (Setiawan & Kusrini, Ekonometrika, 2010) :
\[ \left|e_i\right|\ =\ \beta_0+\ \beta_1X\ +\ V_i \] Dimana : |e_i| : Nilai mutlak residual error X : peubah bebas Vi : residual error _0 : konstanta _1 : koefisien regresi Dengan hipotesis Uji Glejser sebagai berikut : \[ H0 : \beta_1=\beta_2=\beta_{3\ }=...=\beta_k\ =0 (varian\ residual\ identik) \] \[ H1 : minimal\ terdapat\ satu\ \beta_k ≠ 0; k=1,2,…,k (varian\ residual\ tidak\ identik) \] Statistik Uji \[ F_{hit}=\ \frac{{MSR}_{\left|e_i\right|}terhadap\ X}{{MSE}_{\left|e_i\right|}terhadap\ X} (2.11) \]
\[ Daerah\ penolakan : Tolak\ H0\ jika\ Fhit > F1-α(1,n-2) \] Adapun cara untuk mengatasi heteroskedastisitas adalah sebagai berikut : 1. Menambah atau mengganti data sampel baru 2. Melakukan transformasi variabel prediktor terhadap variabel respon 3. Menggunakan metode estimasi GLS (Generalized Least Square)
Indeks Pembangunan Manusia merupakan suatu indeks komposit yang juga merupakan indikator yang dapat menggambarkan perkembangan pembangunan manusia secara terukur dan representatif. IPM pertama kali diperkenalkan oleh UNDP (United Nation Development Programme) pada tahun 1990.
Menurut BPS, Indeks Pembangunan Manusia (IPM) merupakan ukuran pencapaian pembangunan berbasis sejumlah komponen dasar kualitas hidup. Faktor yang mempengaruhi IPM ada banyak namun utamanya hanya ada tiga, yaitu angka harapan hidup, pendidikan dan standar hidup yang layak atau pendapatan rata-rata masyarakat pada suatu wilayah.
> library(lmtest)
> library(olsrr)
> library(readxl)> data <- read_excel('C:/Users/acer/Documents/Mahendra/Statistika UB/Semester 5/MPPI/Tugas Skripsi/Data Macam2 Praktikum.xlsx')
> View(data)
> str(data)
tibble[,4] [36 x 4] (S3: tbl_df/tbl/data.frame)
$ Provinsi : chr [1:36] "ACEH" "SUMATERA UTARA" "SUMATERA BARAT" "RIAU" ...
$ Angka_Harapan_Hidup : num [1:36] 70 69.2 69.5 71.7 71.2 ...
$ Pendapatan_Perkapita : num [1:36] 1534 1502 1641 1577 1987 ...
$ Indeks_Pembangunan_Manusia: num [1:36] 72 71.8 72.4 72.7 71.3 ...> knitr::kable(data, caption = "Data IPM")| Provinsi | Angka_Harapan_Hidup | Pendapatan_Perkapita | Indeks_Pembangunan_Manusia |
|---|---|---|---|
| ACEH | 69.975 | 1533.567 | 71.99 |
| SUMATERA UTARA | 69.150 | 1501.833 | 71.77 |
| SUMATERA BARAT | 69.520 | 1641.133 | 72.38 |
| RIAU | 71.650 | 1576.533 | 72.71 |
| JAMBI | 71.170 | 1987.233 | 71.29 |
| SUMATERA SELATAN | 69.930 | 1525.733 | 70.01 |
| BENGKULU | 69.370 | 1550.933 | 71.40 |
| LAMPUNG | 70.695 | 1333.967 | 69.69 |
| KEP, BANGKA BELITUNG | 70.680 | 1769.500 | 71.47 |
| KEP, RIAU | 69.990 | 2570.367 | 75.59 |
| DKI JAKARTA | 72.950 | 2594.800 | 80.77 |
| JAWA BARAT | 73.150 | 1900.867 | 72.09 |
| JAWA TENGAH | 74.405 | 1430.600 | 71.87 |
| DI YOGYAKARTA | 75.025 | 1213.167 | 79.97 |
| JAWA TIMUR | 71.345 | 1562.933 | 71.71 |
| BANTEN | 70.005 | 2273.133 | 72.45 |
| BALI | 72.155 | 1798.600 | 75.50 |
| NUSA TENGGARA BARAT | 66.510 | 1334.000 | 68.25 |
| NUSA TENGGARA TIMUR | 67.055 | 1049.900 | 65.19 |
| KALIMANTAN BARAT | 70.735 | 1575.500 | 67.66 |
| KALIMANTAN TENGAH | 69.750 | 1922.333 | 71.05 |
| KALIMANTAN SELATAN | 68.690 | 1678.233 | 70.91 |
| KALIMANTAN TIMUR | 74.375 | 2038.233 | 76.24 |
| KALIMANTAN UTARA | 72.535 | 1618.100 | 70.63 |
| SULAWESI UTARA | 71.745 | 1977.467 | 72.93 |
| SULAWESI TENGAH | 68.745 | 1691.433 | 69.55 |
| SULAWESI SELATAN | 70.620 | 1729.000 | 71.93 |
| SULAWESI TENGGARA | 71.340 | 1500.433 | 71.45 |
| GORONTALO | 68.115 | 1371.500 | 68.68 |
| SULAWESI BARAT | 65.110 | 1285.533 | 66.11 |
| MALUKU | 66.025 | 1551.333 | 69.49 |
| MALUKU UTARA | 68.375 | 1561.833 | 68.49 |
| PAPUA BARAT | 66.050 | 2327.067 | 65.09 |
| PAPUA | 65.835 | 2533.767 | 60.44 |
| MIN | 65.110 | 1049.900 | 60.44 |
| MAX | 75.025 | 2594.800 | 80.77 |
Data yang digunakan dalam penelitian ini adalah data sekunder yang berasal dari website resmi Badan Pusat Statistik. Data yang digunakan adalah data tingkat pendidikan terakhir yang dienyam oleh masyarakat tiap provinsi tahun 2020, angka harapan hidup tiap provinsi tahun 2020, data pendapatan perkapita tiap provinsi tahun 2020 dan Indeks Pembangunan Manusia tahun 2020.Dengan data pendapatan perkapita dikali 1000.
> summary(data)
Provinsi Angka_Harapan_Hidup Pendapatan_Perkapita
Length:36 Min. :65.11 Min. :1050
Class :character 1st Qu.:68.61 1st Qu.:1501
Mode :character Median :70.00 Median :1597
Mean :70.08 Mean :1727
3rd Qu.:71.67 3rd Qu.:1936
Max. :75.03 Max. :2595
Indeks_Pembangunan_Manusia
Min. :60.44
1st Qu.:69.29
Median :71.42
Mean :71.05
3rd Qu.:72.40
Max. :80.77 Berdasarkan hasil tersebut dapat diinterpretasikan bahwa rata-rata dari Angka Harapan Hidup adalah 70.08 tahun, dengan usia paling tinggi adalah 75.03 tahun dan paling rendah 65.11 tahun. Pendapatan perkapita rata-rata sebesar Rp. 1.727.000 dengan pendapatan perkapita tertinggi Rp. 2.595.000 dan pendapatan perkapita terendah Rp. 1.050.000. Nilai indeks pembangunan manusia memiliki rata-rata 71.05 dengan indeks tertinggi perdaerah sebesar 80.77 dan indeks terendah perdaerah adalah 60.44.
> # Analisis Regresi
> reg <- lm(Indeks_Pembangunan_Manusia~Angka_Harapan_Hidup+Pendapatan_Perkapita, data = data)
> summary(reg)
Call:
lm(formula = Indeks_Pembangunan_Manusia ~ Angka_Harapan_Hidup +
Pendapatan_Perkapita, data = data)
Residuals:
Min 1Q Median 3Q Max
-6.6261 -1.0471 -0.0012 1.7403 4.4269
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -22.385411 11.103923 -2.016 0.0520 .
Angka_Harapan_Hidup 1.288122 0.162592 7.922 3.89e-09 ***
Pendapatan_Perkapita 0.001834 0.001061 1.729 0.0932 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.542 on 33 degrees of freedom
Multiple R-squared: 0.6996, Adjusted R-squared: 0.6814
F-statistic: 38.42 on 2 and 33 DF, p-value: 2.415e-09Dari hasil tersebut didapat persamaan regresi sebagai berikut : \[ IndeksPembangunanManusia = -22.385411 + 1.288122AngkaHarapanHidup + 0.001834PendapatanPerkapita \]
> ## Normalitas
> residual <- resid(reg)
> qqnorm(residual, pch = 1, frame = FALSE)
> qqline(residual, col = "steelblue", lwd = 2)>
> shapiro.test(residual)
Shapiro-Wilk normality test
data: residual
W = 0.97571, p-value = 0.6003Berdasarkan hasil uji menggunakan qqplot menunjukkan bahwa residu berdistribusi normal dan shapiro-wilk tes menghasilkan nilai p−value(0.6003)>α(0.05) yang berarti H0 diterima. Maka kesimpulan bahwa residual atau galat menyebar normal
> ## Non Autokorelasi
> dwtest(reg)
Durbin-Watson test
data: reg
DW = 1.5295, p-value = 0.05812
alternative hypothesis: true autocorrelation is greater than 0Berdasarkan hasil uji Durbin watson menghasilkan nilai p−value(0.05812)>α(0.05) yang berarti H0 diterima. Maka dapat disimpulkan bahwa asumsi nonautokorelasi terpenuhi atau dapat disimpulkan bahwa tidak terjadi autokorelasi antar galat.
> ## Homoskedastisitas
> bptest(reg)
studentized Breusch-Pagan test
data: reg
BP = 3.9508, df = 2, p-value = 0.1387Berdasarkan hasil uji Breusch-Pagan didapatkan nilai p−value(0.1387)>α(0.05) yang berarti H0 diterima. Maka dapat disimpulkan bahwa ragam galat homogen.
> ## Non Multikolinearitas
> ols_vif_tol(reg)
Variables Tolerance VIF
1 Angka_Harapan_Hidup 0.9417618 1.06184
2 Pendapatan_Perkapita 0.9417618 1.06184Dari hasil diatas didapat nilai VIF mendekati 1 sehingga bisa dianggap jika nilai VIF sama dengan 1. Hal tersebut membuktikan bahwa tidak ada multikolinearitas pada variabel prediktor.
> ## Simultan
> summary(reg)
Call:
lm(formula = Indeks_Pembangunan_Manusia ~ Angka_Harapan_Hidup +
Pendapatan_Perkapita, data = data)
Residuals:
Min 1Q Median 3Q Max
-6.6261 -1.0471 -0.0012 1.7403 4.4269
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -22.385411 11.103923 -2.016 0.0520 .
Angka_Harapan_Hidup 1.288122 0.162592 7.922 3.89e-09 ***
Pendapatan_Perkapita 0.001834 0.001061 1.729 0.0932 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.542 on 33 degrees of freedom
Multiple R-squared: 0.6996, Adjusted R-squared: 0.6814
F-statistic: 38.42 on 2 and 33 DF, p-value: 2.415e-09Berdasarkan p−value statistik uji F pada hasil tersebut menunjukkan bahwa p−value(2.415e-09)<α(0.05), maka H0 ditolak. Dengan demikian, dapat disimpulkan bahwa angka harapan hidup dan pendapatan perkapita berpengaruh signifikan terhadap indeks pembangunan manusia.
> ## Partial
> summary(reg)
Call:
lm(formula = Indeks_Pembangunan_Manusia ~ Angka_Harapan_Hidup +
Pendapatan_Perkapita, data = data)
Residuals:
Min 1Q Median 3Q Max
-6.6261 -1.0471 -0.0012 1.7403 4.4269
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -22.385411 11.103923 -2.016 0.0520 .
Angka_Harapan_Hidup 1.288122 0.162592 7.922 3.89e-09 ***
Pendapatan_Perkapita 0.001834 0.001061 1.729 0.0932 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.542 on 33 degrees of freedom
Multiple R-squared: 0.6996, Adjusted R-squared: 0.6814
F-statistic: 38.42 on 2 and 33 DF, p-value: 2.415e-09Berdasarkan p−value statistik uji t angka harapan hidup pada bagian coefficient tersebut menunjukkan bahwa p−value(3.89e-09)>α(0.05), maka H0 ditolak. Dengan demikian, dapat disimpulkan bahwa angka harapan hidup berpengaruh signifikan terhadap indeks pembangunan manusia. Dapat diartikan setiap pertambahan 1 nilai angka harapan hidup, maka indeks pembangunan manusia akan meningkat sebesar 1.288122.
Berdasarkan p−value statistik uji t pendapatan perkapita pada bagian coefficient tersebut menunjukkan bahwa p−value(0.0932)>α(0.05), maka H0 ditolak. Dengan demikian, dapat disimpulkan bahwa pendapatan perkapita berpengaruh signifikan terhadap indeks pembangunan manusia. Dapat diartikan setiap pertambahan 1 nilai pendapatan perkapita, maka indeks pembangunan manusia akan meningkat sebesar 0.001834.
Koefisien Determinasi R2 dapat dilihat dari hasil diatas sebesar 0.6996 dan adjustedR2 sebesar 0.6814 Yang artinya, keragaman variabel respons dapat dijelaskan sebesar 69% atau 68% oleh variabel prediktor, dan sisanya dijelaskan oleh variabel lain yang tidak tercantum dalam model atau galat. Nilai tersebut tergolong cukup, maka dari itu disarankan untuk mengganti salah satu variabel prediktor yang tidak berpengaruh signifikan atau menambah variabel prediktor dengan variabel yang lebih memiliki hubungan dengan variabel response.
Dari hasil di atas dapat ditarik beberapa kesimpulan yakni :
Prasisto, Arif. (2004). Cara Mudah Mengatasi Masalah Statistik dan Rancangan Percobaan dengan SPSS 12. Jakarta : Elex Media Komputindo.
Kurniawan, Robert. (2016). Analisis Regresi Dasar dan Penerapannya dengan R. Jakarta : Kencana.
Said dan Chandra. (2005). Riset Keuangan : Pengujian-Pengujian Empiris. Jakarta : Gramedia Pustaka Utama.
Parjino, dkk. (2018). Kebijakan Multilateral dan Pembangunan Ekonomi Indonesia. Jakarta : Gramedia Pustaka Utama.
Hardy, Melissa A. (1993). Regression With Dummy Variables. London : SAGE Publications.
Draper dan Harry. (1998). Applied Regression Analysis. New Jersey : Wiley.