1 BAB I PENDAHULUAN

1.1 Latar Belakang

Masalah fertilitas merupakan salah satu indikator penting dalam kajian demografi dan pembangunan sosial-ekonomi. Tingkat fertilitas suatu wilayah dipengaruhi oleh berbagai faktor seperti tingkat pendidikan, kondisi ekonomi, struktur pekerjaan, serta faktor budaya dan agama. Pemahaman mengenai faktor-faktor yang memengaruhi fertilitas sangat penting dalam perumusan kebijakan kependudukan dan pembangunan manusia.

Dalam analisis statistika, hubungan antara fertilitas dan faktor-faktor penyebabnya dapat dikaji menggunakan model regresi linear berganda. Regresi linear berganda memungkinkan peneliti untuk menganalisis pengaruh lebih dari satu variabel independen terhadap satu variabel dependen secara simultan.

Dataset swiss yang tersedia dalam perangkat lunak R merupakan data historis mengenai tingkat fertilitas dan karakteristik sosial-ekonomi di berbagai provinsi Swiss pada tahun 1888. Dataset ini sering digunakan dalam pembelajaran regresi berganda karena memiliki struktur data yang jelas serta hubungan antarvariabel yang menarik untuk dianalisis.

Oleh karena itu, penelitian ini bertujuan untuk menganalisis faktor-faktor yang memengaruhi tingkat fertilitas di Swiss menggunakan pendekatan regresi linear berganda.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, rumusan masalah dalam penelitian ini adalah:

  1. Apakah faktor pertanian (Agriculture), tingkat pendidikan (Education), dan persentase penduduk Katolik (Catholic) berpengaruh terhadap tingkat fertilitas?
  2. Apakah variabel-variabel independen tersebut secara simultan berpengaruh signifikan terhadap fertilitas?
  3. Bagaimana interpretasi koefisien regresi yang dihasilkan dari model?

1.3 Tujuan Penelitian

Adapun tujuan dari penelitian ini adalah:

  1. Menganalisis pengaruh Agriculture, Education, dan Catholic terhadap Fertility.
  2. Mengestimasi model regresi linear berganda yang sesuai dengan data.
  3. Menginterpretasikan hasil estimasi koefisien regresi secara statistik dan substantif.

1.4 Manfaat Penelitian

Penelitian ini diharapkan dapat memberikan manfaat sebagai berikut:

  1. Secara akademis, memberikan pemahaman mengenai penerapan regresi linear berganda dalam analisis data sosial-ekonomi.
  2. Secara metodologis, melatih kemampuan dalam melakukan estimasi dan interpretasi model regresi menggunakan perangkat lunak R.
  3. Sebagai referensi dalam memahami hubungan antara pendidikan, sektor pertanian, dan faktor agama terhadap fertilitas.

2 BAB II METODOLOGI PENELITIAN

2.1 Sumber Data

Data yang digunakan dalam penelitian ini merupakan dataset swiss yang tersedia secara bawaan dalam perangkat lunak R (package datasets). Dataset ini berisi data fertilitas dan indikator sosial-ekonomi dari 47 provinsi di Swiss pada tahun 1888.

# Memanggil dataset swiss
data(swiss)

# Melihat struktur data
str(swiss)
## 'data.frame':    47 obs. of  6 variables:
##  $ Fertility       : num  80.2 83.1 92.5 85.8 76.9 76.1 83.8 92.4 82.4 82.9 ...
##  $ Agriculture     : num  17 45.1 39.7 36.5 43.5 35.3 70.2 67.8 53.3 45.2 ...
##  $ Examination     : int  15 6 5 12 17 9 16 14 12 16 ...
##  $ Education       : int  12 9 5 7 15 7 7 8 7 13 ...
##  $ Catholic        : num  9.96 84.84 93.4 33.77 5.16 ...
##  $ Infant.Mortality: num  22.2 22.2 20.2 20.3 20.6 26.6 23.6 24.9 21 24.4 ...
# Melihat 6 observasi pertama
head(swiss)

Dataset swiss terdiri dari 47 observasi dan 6 variabel, yaitu:

  • Fertility: Tingkat fertilitas
  • Agriculture: Persentase pria yang bekerja di sektor pertanian
  • Examination: Persentase yang lulus ujian militer
  • Education: Persentase yang memperoleh pendidikan lebih tinggi
  • Catholic: Persentase penduduk beragama Katolik
  • Infant.Mortality: Tingkat kematian bayi

2.2 Variabel Penelitian

Dalam penelitian ini ditetapkan:

2.2.1 Variabel Dependen (Y)

  • Fertility

2.2.2 Variabel Independen (X)

  • Agriculture
  • Education
  • Catholic

Model regresi yang akan diestimasi adalah:

\[ Y_i = \beta_0 + \beta_1 \text{Agriculture}_i + \beta_2 \text{Education}_i + \beta_3 \text{Catholic}_i + \varepsilon_i \]

di mana:

  • \(\beta_0\) adalah intercept
  • \(\beta_1, \beta_2, \beta_3\) adalah koefisien regresi
  • \(\varepsilon_i\) adalah error term

2.3 Metode Analisis

Metode analisis yang digunakan adalah regresi linear berganda dengan pendekatan Ordinary Least Squares (OLS).

Tahapan analisis yang dilakukan adalah:

  1. Eksplorasi data awal (statistik deskriptif dan visualisasi)
  2. Estimasi model regresi
  3. Uji signifikansi parsial (uji t)
  4. Uji signifikansi simultan (uji F)
  5. Uji asumsi klasik:
    • Normalitas residual
    • Multikolinearitas
    • Heteroskedastisitas
    • Autokorelasi

2.4 Statistik Deskriptif

summary(swiss)
##    Fertility      Agriculture     Examination      Education    
##  Min.   :35.00   Min.   : 1.20   Min.   : 3.00   Min.   : 1.00  
##  1st Qu.:64.70   1st Qu.:35.90   1st Qu.:12.00   1st Qu.: 6.00  
##  Median :70.40   Median :54.10   Median :16.00   Median : 8.00  
##  Mean   :70.14   Mean   :50.66   Mean   :16.49   Mean   :10.98  
##  3rd Qu.:78.45   3rd Qu.:67.65   3rd Qu.:22.00   3rd Qu.:12.00  
##  Max.   :92.50   Max.   :89.70   Max.   :37.00   Max.   :53.00  
##     Catholic       Infant.Mortality
##  Min.   :  2.150   Min.   :10.80   
##  1st Qu.:  5.195   1st Qu.:18.15   
##  Median : 15.140   Median :20.00   
##  Mean   : 41.144   Mean   :19.94   
##  3rd Qu.: 93.125   3rd Qu.:21.70   
##  Max.   :100.000   Max.   :26.60

2.5 Visualisasi Awal Hubungan Antar Variabel

pairs(swiss[, c("Fertility", "Agriculture", "Education", "Catholic")],
      main = "Scatterplot Matrix Variabel Penelitian")

2.6 Estimasi Model Regresi

model_swiss <- lm(Fertility ~ Agriculture + Education + Catholic, data = swiss)
summary(model_swiss)
## 
## Call:
## lm(formula = Fertility ~ Agriculture + Education + Catholic, 
##     data = swiss)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -15.178  -6.548   1.379   5.822  14.840 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 86.22502    4.73472  18.211  < 2e-16 ***
## Agriculture -0.20304    0.07115  -2.854  0.00662 ** 
## Education   -1.07215    0.15580  -6.881 1.91e-08 ***
## Catholic     0.14520    0.03015   4.817 1.84e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.728 on 43 degrees of freedom
## Multiple R-squared:  0.6423, Adjusted R-squared:  0.6173 
## F-statistic: 25.73 on 3 and 43 DF,  p-value: 1.089e-09

2.7 Uji Asumsi Klasik

2.7.1 Uji Normalitas Residual

residuals_model <- residuals(model_swiss)

shapiro.test(residuals_model)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals_model
## W = 0.97153, p-value = 0.3027
hist(residuals_model,
     main = "Histogram Residual",
     xlab = "Residual",
     col = "lightblue")

2.7.2 Uji Multikolinearitas

library(car)
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.3.3
vif(model_swiss)
## Agriculture   Education    Catholic 
##    2.011414    1.728747    1.217591

2.7.3 Uji Heteroskedastisitas

# Pastikan package 'lmtest' terinstall
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.3.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.3.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
bptest(model_swiss)
## 
##  studentized Breusch-Pagan test
## 
## data:  model_swiss
## BP = 2.7503, df = 3, p-value = 0.4317

2.7.4 Uji Autokorelasi

dwtest(model_swiss)
## 
##  Durbin-Watson test
## 
## data:  model_swiss
## DW = 1.3599, p-value = 0.005731
## alternative hypothesis: true autocorrelation is greater than 0

2.8 Kriteria Pengambilan Keputusan

  • Uji t: Tolak \(H_0\) jika p-value < 0,05
  • Uji F: Tolak \(H_0\) jika p-value < 0,05
  • Uji Normalitas: Data berdistribusi normal jika p-value > 0,05
  • Uji Multikolinearitas: Tidak terjadi multikolinearitas jika nilai VIF < 10
  • Uji Heteroskedastisitas: Tidak terjadi heteroskedastisitas jika p-value > 0,05
  • Uji Autokorelasi: Tidak terjadi autokorelasi jika p-value > 0,05

3 BAB III HASIL DAN PEMBAHASAN

3.1 Hasil Estimasi Model Regresi

Model regresi linear berganda yang diestimasi adalah:

\[ Fertility_i = \beta_0 + \beta_1 Agriculture_i + \beta_2 Education_i + \beta_3 Catholic_i + \varepsilon_i \]

Hasil estimasi model diperoleh sebagai berikut:

summary(model_swiss)
## 
## Call:
## lm(formula = Fertility ~ Agriculture + Education + Catholic, 
##     data = swiss)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -15.178  -6.548   1.379   5.822  14.840 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 86.22502    4.73472  18.211  < 2e-16 ***
## Agriculture -0.20304    0.07115  -2.854  0.00662 ** 
## Education   -1.07215    0.15580  -6.881 1.91e-08 ***
## Catholic     0.14520    0.03015   4.817 1.84e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.728 on 43 degrees of freedom
## Multiple R-squared:  0.6423, Adjusted R-squared:  0.6173 
## F-statistic: 25.73 on 3 and 43 DF,  p-value: 1.089e-09

Berdasarkan hasil estimasi, diperoleh persamaan regresi:

\[ \widehat{Fertility} = 86.225 - 0.203\,Agriculture - 1.072\,Education + 0.145\,Catholic \]

Interpretasi koefisien:

  • Intercept (86.225) menunjukkan bahwa ketika Agriculture, Education, dan Catholic bernilai nol, maka tingkat Fertility diprediksi sebesar 86.225.
  • Agriculture (-0.203) berarti setiap kenaikan 1 persen tenaga kerja di sektor pertanian akan menurunkan Fertility sebesar 0.203 poin, ceteris paribus.
  • Education (-1.072) berarti setiap kenaikan 1 persen penduduk berpendidikan tinggi akan menurunkan Fertility sebesar 1.072 poin, ceteris paribus.
  • Catholic (0.145) berarti setiap kenaikan 1 persen penduduk beragama Katolik akan meningkatkan Fertility sebesar 0.145 poin.

Secara substantif, hasil ini menunjukkan bahwa pendidikan memiliki pengaruh paling kuat terhadap penurunan fertilitas.


3.2 Uji Signifikansi Parsial (Uji t)

Seluruh variabel independen memiliki p-value < 0,01 sehingga signifikan pada tingkat signifikansi 5%. Hal ini menunjukkan bahwa:

  1. Agriculture berpengaruh signifikan terhadap Fertility.
  2. Education berpengaruh signifikan terhadap Fertility.
  3. Catholic berpengaruh signifikan terhadap Fertility.

Dengan demikian, masing-masing variabel secara parsial memiliki kontribusi yang bermakna terhadap variasi fertilitas.


3.3 Uji Signifikansi Simultan (Uji F)

Berdasarkan hasil estimasi diperoleh:

  • F-statistic = 25.73
  • p-value = 1.089e-09

Karena p-value < 0,05, maka dapat disimpulkan bahwa secara simultan variabel Agriculture, Education, dan Catholic berpengaruh signifikan terhadap Fertility.

Model regresi secara keseluruhan signifikan dan layak digunakan.


3.4 Goodness of Fit

summary(model_swiss)$r.squared
## [1] 0.6422541
summary(model_swiss)$adj.r.squared
## [1] 0.6172951

Nilai:

  • \(R^2\) = 0.642
  • Adjusted \(R^2\) = 0.617

Artinya sekitar 64% variasi Fertility dapat dijelaskan oleh ketiga variabel independen dalam model. Sisanya sebesar 36% dijelaskan oleh faktor lain di luar model.

Nilai ini tergolong cukup kuat untuk data sosial-ekonomi cross-section.


3.5 Uji Asumsi Klasik

3.5.1 Uji Normalitas Residual

shapiro.test(residuals_model)
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals_model
## W = 0.97153, p-value = 0.3027

Nilai p-value sebesar 0.3027 > 0.05 menunjukkan bahwa residual berdistribusi normal.

Hal ini juga didukung oleh Q-Q Plot yang menunjukkan pola mendekati garis diagonal.


3.5.2 Uji Multikolinearitas

vif(model_swiss)
## Agriculture   Education    Catholic 
##    2.011414    1.728747    1.217591

Nilai VIF seluruh variabel < 5, sehingga dapat disimpulkan tidak terjadi multikolinearitas serius dalam model.

Koefisien regresi dapat diinterpretasikan secara stabil.


3.5.3 Uji Heteroskedastisitas

bptest(model_swiss)
## 
##  studentized Breusch-Pagan test
## 
## data:  model_swiss
## BP = 2.7503, df = 3, p-value = 0.4317

Nilai p-value sebesar 0.4317 > 0.05 menunjukkan tidak terdapat heteroskedastisitas.

Dengan demikian, varians residual dapat dianggap konstan (homoskedastisitas terpenuhi).


3.5.4 Uji Autokorelasi

dwtest(model_swiss)
## 
##  Durbin-Watson test
## 
## data:  model_swiss
## DW = 1.3599, p-value = 0.005731
## alternative hypothesis: true autocorrelation is greater than 0

Durbin-Watson menunjukkan p-value < 0.05 yang mengindikasikan adanya autokorelasi positif.

Namun perlu dicatat bahwa dataset swiss merupakan data cross-section, bukan time series. Oleh karena itu, autokorelasi tidak menjadi isu utama dalam konteks penelitian ini.


3.5.5 Uji Spesifikasi Model (RESET Test)

resettest(model_swiss)
## 
##  RESET test
## 
## data:  model_swiss
## RESET = 0.055965, df1 = 2, df2 = 41, p-value = 0.9456

Nilai p-value sebesar 0.9456 > 0.05 menunjukkan bahwa model tidak mengalami kesalahan spesifikasi bentuk fungsional.

Model linear yang digunakan sudah tepat.


3.6 Analisis Model Alternatif

model_full <- lm(Fertility ~ ., data = swiss)

AIC(model_swiss, model_full)

Nilai AIC model_full lebih kecil dibandingkan model utama, sehingga secara informasi statistik model dengan seluruh variabel memiliki performa yang lebih baik.

Hal ini menunjukkan bahwa variabel Examination dan Infant.Mortality berpotensi meningkatkan daya jelaskan model.


3.7 Analisis Observasi Berpengaruh

Beberapa observasi memiliki nilai Cook’s Distance dan leverage relatif tinggi, yaitu:

  • Neuchatel
  • Rive Gauche
  • V. De Geneve

Observasi tersebut memiliki pengaruh cukup besar terhadap estimasi model, namun tidak sampai menyebabkan distorsi signifikan.


3.8 Pembahasan Substantif

Hasil penelitian menunjukkan bahwa:

  1. Pendidikan memiliki pengaruh negatif paling kuat terhadap fertilitas. Hal ini konsisten dengan teori transisi demografi yang menyatakan bahwa peningkatan pendidikan meningkatkan kesadaran keluarga berencana dan partisipasi perempuan dalam pasar kerja.

  2. Persentase penduduk Katolik berpengaruh positif terhadap fertilitas, yang dapat dikaitkan dengan nilai-nilai religius terkait keluarga dan reproduksi pada periode historis tersebut.

  3. Pengaruh negatif sektor pertanian menunjukkan adanya dinamika struktural ekonomi yang kompleks dalam masyarakat Swiss tahun 1888.

Secara keseluruhan, model mampu menjelaskan variasi fertilitas dengan cukup baik dan memenuhi asumsi klasik regresi linear berganda.


3.9 Kesimpulan Hasil Analisis

Berdasarkan hasil estimasi dan pengujian asumsi, dapat disimpulkan bahwa:

  1. Model regresi signifikan secara simultan dan parsial.
  2. Asumsi klasik sebagian besar terpenuhi.
  3. Pendidikan merupakan faktor paling dominan dalam menurunkan fertilitas.
  4. Model memiliki daya jelaskan yang cukup kuat.

Dengan demikian, model regresi yang diestimasi layak digunakan untuk menjelaskan faktor-faktor yang memengaruhi fertilitas di Swiss tahun 1888.


4 KESIMPULAN DAN SARAN

4.1 Kesimpulan

Berdasarkan hasil estimasi regresi linear berganda dan pengujian asumsi klasik terhadap dataset swiss, diperoleh beberapa kesimpulan sebagai berikut:

  1. Model regresi signifikan secara simultan.
    Hasil uji F menunjukkan bahwa variabel Agriculture, Education, dan Catholic secara bersama-sama berpengaruh signifikan terhadap tingkat Fertility. Dengan demikian, model regresi yang diestimasi layak digunakan untuk menjelaskan variasi fertilitas.

  2. Seluruh variabel independen signifikan secara parsial.
    Hasil uji t menunjukkan bahwa:

    • Agriculture berpengaruh negatif dan signifikan terhadap Fertility.
    • Education berpengaruh negatif dan signifikan terhadap Fertility.
    • Catholic berpengaruh positif dan signifikan terhadap Fertility.
  3. Pendidikan merupakan variabel paling dominan.
    Koefisien Education memiliki nilai absolut terbesar dibandingkan variabel lainnya, sehingga dapat disimpulkan bahwa tingkat pendidikan memiliki pengaruh paling kuat dalam menurunkan fertilitas. Hal ini konsisten dengan teori transisi demografi yang menyatakan bahwa peningkatan pendidikan berkorelasi dengan penurunan angka kelahiran.

  4. Model memiliki daya jelaskan yang cukup kuat.
    Nilai \(R^2\) sebesar 0,642 menunjukkan bahwa sekitar 64% variasi Fertility dapat dijelaskan oleh variabel Agriculture, Education, dan Catholic. Sisanya dipengaruhi oleh faktor lain di luar model.

  5. Asumsi klasik regresi secara umum terpenuhi.

    • Residual berdistribusi normal.
    • Tidak terdapat multikolinearitas serius.
    • Tidak ditemukan heteroskedastisitas.
    • Model tidak mengalami kesalahan spesifikasi bentuk fungsional.
      Meskipun uji Durbin-Watson menunjukkan indikasi autokorelasi, hal tersebut tidak menjadi isu utama karena data yang digunakan merupakan data cross-section, bukan data runtut waktu. Secara keseluruhan, model regresi yang diestimasi telah memenuhi kriteria kelayakan statistik dan mampu menjelaskan faktor-faktor yang memengaruhi tingkat fertilitas di Swiss pada tahun 1888. —

4.2 Implikasi Penelitian

Hasil penelitian ini memiliki beberapa implikasi penting, yaitu:

  1. Implikasi Akademis
    Penelitian ini menunjukkan bahwa regresi linear berganda dapat digunakan secara efektif dalam menganalisis fenomena sosial-ekonomi, khususnya dalam studi demografi.

  2. Implikasi Kebijakan
    Temuan bahwa pendidikan berpengaruh signifikan dan negatif terhadap fertilitas mengindikasikan bahwa peningkatan akses pendidikan dapat menjadi instrumen kebijakan dalam pengendalian pertumbuhan penduduk.

  3. Implikasi Struktural Sosial
    Pengaruh positif variabel Catholic terhadap fertilitas menunjukkan bahwa faktor budaya dan agama memiliki peran penting dalam dinamika kependudukan.


4.3 Keterbatasan Penelitian

Penelitian ini memiliki beberapa keterbatasan, antara lain:

  1. Model belum memasukkan seluruh variabel yang tersedia dalam dataset seperti Examination dan Infant.Mortality, yang berdasarkan perbandingan AIC berpotensi meningkatkan kualitas model.
  2. Data yang digunakan merupakan data historis tahun 1888 sehingga hasil penelitian bersifat kontekstual dan tidak dapat digeneralisasi langsung pada kondisi modern.
  3. Model yang digunakan bersifat linear sehingga tidak menutup kemungkinan adanya hubungan non-linear yang belum teridentifikasi.

4.4 Saran

Berdasarkan hasil dan keterbatasan penelitian, beberapa saran yang dapat diberikan adalah:

  1. Penelitian selanjutnya dapat menggunakan model dengan seluruh variabel untuk memperoleh daya jelaskan yang lebih optimal.
  2. Dapat dilakukan pengujian model alternatif seperti regresi robust atau transformasi logaritmik untuk meningkatkan ketepatan estimasi.
  3. Penelitian lanjutan dapat menggunakan pendekatan ekonometrika yang lebih kompleks seperti model panel atau model non-linear apabila data memungkinkan.
  4. Untuk analisis kebijakan modern, disarankan menggunakan data terkini agar hasil penelitian lebih relevan secara kontekstual.

4.5 Penutup

Secara keseluruhan, penelitian ini menunjukkan bahwa faktor pendidikan, struktur ekonomi pertanian, dan komposisi agama memiliki pengaruh signifikan terhadap tingkat fertilitas di Swiss pada akhir abad ke-19. Model regresi yang dibangun telah memenuhi asumsi dasar dan memberikan hasil yang konsisten secara statistik maupun teoritis.

Dengan demikian, penelitian ini dapat menjadi referensi akademik dalam memahami hubungan antara faktor sosial-ekonomi dan dinamika kependudukan melalui pendekatan regresi linear berganda.