Masalah fertilitas merupakan salah satu indikator penting dalam kajian demografi dan pembangunan sosial-ekonomi. Tingkat fertilitas suatu wilayah dipengaruhi oleh berbagai faktor seperti tingkat pendidikan, kondisi ekonomi, struktur pekerjaan, serta faktor budaya dan agama. Pemahaman mengenai faktor-faktor yang memengaruhi fertilitas sangat penting dalam perumusan kebijakan kependudukan dan pembangunan manusia.
Dalam analisis statistika, hubungan antara fertilitas dan faktor-faktor penyebabnya dapat dikaji menggunakan model regresi linear berganda. Regresi linear berganda memungkinkan peneliti untuk menganalisis pengaruh lebih dari satu variabel independen terhadap satu variabel dependen secara simultan.
Dataset swiss yang tersedia dalam perangkat lunak R merupakan data historis mengenai tingkat fertilitas dan karakteristik sosial-ekonomi di berbagai provinsi Swiss pada tahun 1888. Dataset ini sering digunakan dalam pembelajaran regresi berganda karena memiliki struktur data yang jelas serta hubungan antarvariabel yang menarik untuk dianalisis.
Oleh karena itu, penelitian ini bertujuan untuk menganalisis faktor-faktor yang memengaruhi tingkat fertilitas di Swiss menggunakan pendekatan regresi linear berganda.
Berdasarkan latar belakang yang telah diuraikan, rumusan masalah dalam penelitian ini adalah:
Adapun tujuan dari penelitian ini adalah:
Penelitian ini diharapkan dapat memberikan manfaat sebagai berikut:
Data yang digunakan dalam penelitian ini merupakan dataset
swiss yang tersedia secara bawaan dalam perangkat lunak
R (package datasets). Dataset ini berisi data fertilitas
dan indikator sosial-ekonomi dari 47 provinsi di Swiss pada tahun
1888.
## 'data.frame': 47 obs. of 6 variables:
## $ Fertility : num 80.2 83.1 92.5 85.8 76.9 76.1 83.8 92.4 82.4 82.9 ...
## $ Agriculture : num 17 45.1 39.7 36.5 43.5 35.3 70.2 67.8 53.3 45.2 ...
## $ Examination : int 15 6 5 12 17 9 16 14 12 16 ...
## $ Education : int 12 9 5 7 15 7 7 8 7 13 ...
## $ Catholic : num 9.96 84.84 93.4 33.77 5.16 ...
## $ Infant.Mortality: num 22.2 22.2 20.2 20.3 20.6 26.6 23.6 24.9 21 24.4 ...
Dataset swiss terdiri dari 47 observasi dan 6 variabel, yaitu:
Dalam penelitian ini ditetapkan:
Model regresi yang akan diestimasi adalah:
\[ Y_i = \beta_0 + \beta_1 \text{Agriculture}_i + \beta_2 \text{Education}_i + \beta_3 \text{Catholic}_i + \varepsilon_i \]
di mana:
Metode analisis yang digunakan adalah regresi linear berganda dengan pendekatan Ordinary Least Squares (OLS).
Tahapan analisis yang dilakukan adalah:
## Fertility Agriculture Examination Education
## Min. :35.00 Min. : 1.20 Min. : 3.00 Min. : 1.00
## 1st Qu.:64.70 1st Qu.:35.90 1st Qu.:12.00 1st Qu.: 6.00
## Median :70.40 Median :54.10 Median :16.00 Median : 8.00
## Mean :70.14 Mean :50.66 Mean :16.49 Mean :10.98
## 3rd Qu.:78.45 3rd Qu.:67.65 3rd Qu.:22.00 3rd Qu.:12.00
## Max. :92.50 Max. :89.70 Max. :37.00 Max. :53.00
## Catholic Infant.Mortality
## Min. : 2.150 Min. :10.80
## 1st Qu.: 5.195 1st Qu.:18.15
## Median : 15.140 Median :20.00
## Mean : 41.144 Mean :19.94
## 3rd Qu.: 93.125 3rd Qu.:21.70
## Max. :100.000 Max. :26.60
pairs(swiss[, c("Fertility", "Agriculture", "Education", "Catholic")],
main = "Scatterplot Matrix Variabel Penelitian")model_swiss <- lm(Fertility ~ Agriculture + Education + Catholic, data = swiss)
summary(model_swiss)##
## Call:
## lm(formula = Fertility ~ Agriculture + Education + Catholic,
## data = swiss)
##
## Residuals:
## Min 1Q Median 3Q Max
## -15.178 -6.548 1.379 5.822 14.840
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 86.22502 4.73472 18.211 < 2e-16 ***
## Agriculture -0.20304 0.07115 -2.854 0.00662 **
## Education -1.07215 0.15580 -6.881 1.91e-08 ***
## Catholic 0.14520 0.03015 4.817 1.84e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 7.728 on 43 degrees of freedom
## Multiple R-squared: 0.6423, Adjusted R-squared: 0.6173
## F-statistic: 25.73 on 3 and 43 DF, p-value: 1.089e-09
##
## Shapiro-Wilk normality test
##
## data: residuals_model
## W = 0.97153, p-value = 0.3027
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.3.3
## Agriculture Education Catholic
## 2.011414 1.728747 1.217591
## Warning: package 'lmtest' was built under R version 4.3.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.3.3
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## studentized Breusch-Pagan test
##
## data: model_swiss
## BP = 2.7503, df = 3, p-value = 0.4317
Model regresi linear berganda yang diestimasi adalah:
\[ Fertility_i = \beta_0 + \beta_1 Agriculture_i + \beta_2 Education_i + \beta_3 Catholic_i + \varepsilon_i \]
Hasil estimasi model diperoleh sebagai berikut:
##
## Call:
## lm(formula = Fertility ~ Agriculture + Education + Catholic,
## data = swiss)
##
## Residuals:
## Min 1Q Median 3Q Max
## -15.178 -6.548 1.379 5.822 14.840
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 86.22502 4.73472 18.211 < 2e-16 ***
## Agriculture -0.20304 0.07115 -2.854 0.00662 **
## Education -1.07215 0.15580 -6.881 1.91e-08 ***
## Catholic 0.14520 0.03015 4.817 1.84e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 7.728 on 43 degrees of freedom
## Multiple R-squared: 0.6423, Adjusted R-squared: 0.6173
## F-statistic: 25.73 on 3 and 43 DF, p-value: 1.089e-09
Berdasarkan hasil estimasi, diperoleh persamaan regresi:
\[ \widehat{Fertility} = 86.225 - 0.203\,Agriculture - 1.072\,Education + 0.145\,Catholic \]
Interpretasi koefisien:
Secara substantif, hasil ini menunjukkan bahwa pendidikan memiliki pengaruh paling kuat terhadap penurunan fertilitas.
Seluruh variabel independen memiliki p-value < 0,01 sehingga signifikan pada tingkat signifikansi 5%. Hal ini menunjukkan bahwa:
Dengan demikian, masing-masing variabel secara parsial memiliki kontribusi yang bermakna terhadap variasi fertilitas.
Berdasarkan hasil estimasi diperoleh:
Karena p-value < 0,05, maka dapat disimpulkan bahwa secara simultan variabel Agriculture, Education, dan Catholic berpengaruh signifikan terhadap Fertility.
Model regresi secara keseluruhan signifikan dan layak digunakan.
## [1] 0.6422541
## [1] 0.6172951
Nilai:
Artinya sekitar 64% variasi Fertility dapat dijelaskan oleh ketiga variabel independen dalam model. Sisanya sebesar 36% dijelaskan oleh faktor lain di luar model.
Nilai ini tergolong cukup kuat untuk data sosial-ekonomi cross-section.
##
## Shapiro-Wilk normality test
##
## data: residuals_model
## W = 0.97153, p-value = 0.3027
Nilai p-value sebesar 0.3027 > 0.05 menunjukkan bahwa residual berdistribusi normal.
Hal ini juga didukung oleh Q-Q Plot yang menunjukkan pola mendekati garis diagonal.
## Agriculture Education Catholic
## 2.011414 1.728747 1.217591
Nilai VIF seluruh variabel < 5, sehingga dapat disimpulkan tidak terjadi multikolinearitas serius dalam model.
Koefisien regresi dapat diinterpretasikan secara stabil.
##
## studentized Breusch-Pagan test
##
## data: model_swiss
## BP = 2.7503, df = 3, p-value = 0.4317
Nilai p-value sebesar 0.4317 > 0.05 menunjukkan tidak terdapat heteroskedastisitas.
Dengan demikian, varians residual dapat dianggap konstan (homoskedastisitas terpenuhi).
##
## Durbin-Watson test
##
## data: model_swiss
## DW = 1.3599, p-value = 0.005731
## alternative hypothesis: true autocorrelation is greater than 0
Durbin-Watson menunjukkan p-value < 0.05 yang mengindikasikan adanya autokorelasi positif.
Namun perlu dicatat bahwa dataset swiss merupakan data cross-section, bukan time series. Oleh karena itu, autokorelasi tidak menjadi isu utama dalam konteks penelitian ini.
##
## RESET test
##
## data: model_swiss
## RESET = 0.055965, df1 = 2, df2 = 41, p-value = 0.9456
Nilai p-value sebesar 0.9456 > 0.05 menunjukkan bahwa model tidak mengalami kesalahan spesifikasi bentuk fungsional.
Model linear yang digunakan sudah tepat.
Nilai AIC model_full lebih kecil dibandingkan model utama, sehingga secara informasi statistik model dengan seluruh variabel memiliki performa yang lebih baik.
Hal ini menunjukkan bahwa variabel Examination dan Infant.Mortality berpotensi meningkatkan daya jelaskan model.
Beberapa observasi memiliki nilai Cook’s Distance dan leverage relatif tinggi, yaitu:
Observasi tersebut memiliki pengaruh cukup besar terhadap estimasi model, namun tidak sampai menyebabkan distorsi signifikan.
Hasil penelitian menunjukkan bahwa:
Pendidikan memiliki pengaruh negatif paling kuat terhadap fertilitas. Hal ini konsisten dengan teori transisi demografi yang menyatakan bahwa peningkatan pendidikan meningkatkan kesadaran keluarga berencana dan partisipasi perempuan dalam pasar kerja.
Persentase penduduk Katolik berpengaruh positif terhadap fertilitas, yang dapat dikaitkan dengan nilai-nilai religius terkait keluarga dan reproduksi pada periode historis tersebut.
Pengaruh negatif sektor pertanian menunjukkan adanya dinamika struktural ekonomi yang kompleks dalam masyarakat Swiss tahun 1888.
Secara keseluruhan, model mampu menjelaskan variasi fertilitas dengan cukup baik dan memenuhi asumsi klasik regresi linear berganda.
Berdasarkan hasil estimasi dan pengujian asumsi, dapat disimpulkan bahwa:
Dengan demikian, model regresi yang diestimasi layak digunakan untuk menjelaskan faktor-faktor yang memengaruhi fertilitas di Swiss tahun 1888.
Berdasarkan hasil estimasi regresi linear berganda dan pengujian asumsi klasik terhadap dataset swiss, diperoleh beberapa kesimpulan sebagai berikut:
Model regresi signifikan secara simultan.
Hasil uji F menunjukkan bahwa variabel Agriculture, Education, dan
Catholic secara bersama-sama berpengaruh signifikan terhadap tingkat
Fertility. Dengan demikian, model regresi yang diestimasi layak
digunakan untuk menjelaskan variasi fertilitas.
Seluruh variabel independen signifikan secara
parsial.
Hasil uji t menunjukkan bahwa:
Pendidikan merupakan variabel paling
dominan.
Koefisien Education memiliki nilai absolut terbesar dibandingkan
variabel lainnya, sehingga dapat disimpulkan bahwa tingkat pendidikan
memiliki pengaruh paling kuat dalam menurunkan fertilitas. Hal ini
konsisten dengan teori transisi demografi yang menyatakan bahwa
peningkatan pendidikan berkorelasi dengan penurunan angka
kelahiran.
Model memiliki daya jelaskan yang cukup
kuat.
Nilai \(R^2\) sebesar 0,642 menunjukkan
bahwa sekitar 64% variasi Fertility dapat dijelaskan oleh variabel
Agriculture, Education, dan Catholic. Sisanya dipengaruhi oleh faktor
lain di luar model.
Asumsi klasik regresi secara umum terpenuhi.
Hasil penelitian ini memiliki beberapa implikasi penting, yaitu:
Implikasi Akademis
Penelitian ini menunjukkan bahwa regresi linear berganda dapat digunakan
secara efektif dalam menganalisis fenomena sosial-ekonomi, khususnya
dalam studi demografi.
Implikasi Kebijakan
Temuan bahwa pendidikan berpengaruh signifikan dan negatif terhadap
fertilitas mengindikasikan bahwa peningkatan akses pendidikan dapat
menjadi instrumen kebijakan dalam pengendalian pertumbuhan
penduduk.
Implikasi Struktural Sosial
Pengaruh positif variabel Catholic terhadap fertilitas menunjukkan bahwa
faktor budaya dan agama memiliki peran penting dalam dinamika
kependudukan.
Penelitian ini memiliki beberapa keterbatasan, antara lain:
Berdasarkan hasil dan keterbatasan penelitian, beberapa saran yang dapat diberikan adalah:
Secara keseluruhan, penelitian ini menunjukkan bahwa faktor pendidikan, struktur ekonomi pertanian, dan komposisi agama memiliki pengaruh signifikan terhadap tingkat fertilitas di Swiss pada akhir abad ke-19. Model regresi yang dibangun telah memenuhi asumsi dasar dan memberikan hasil yang konsisten secara statistik maupun teoritis.
Dengan demikian, penelitian ini dapat menjadi referensi akademik dalam memahami hubungan antara faktor sosial-ekonomi dan dinamika kependudukan melalui pendekatan regresi linear berganda.