Laporan Praktikum Komstat Regresi Linear Berganda IPM

Mahendra Jati Kusuma

22-05-2022


Notes Theme: - Kelas E: cayman
- Kelas F: tactile
- Kelas G: architect
- Kelas H: hpstr

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Dalam penyampaian data, diperlukan cara penyampaian data yang menarik agar dapat menarik perhatian pembaca, tetapi selain manarik penyajian data juga harus dapat dimengerti oleh pembaca. Jika penyampaian datanya menarik namun susah dipahami, maka informasi yang akan disampaikan tidak akan tersampaikan oleh pembaca. Oleh karena itu diperlukan pemodelan data agar memudahkan pembaca memahami data yang ada dan agar data terlihat lebih menarik. Namun tidak semua model cocok dengan data yang akan dijadikan model statistik. Sehingga perlu adanya uji kecocokan model untuk menguji apakah model tersebut cocok dengan data yang akan disampaikan atau tidak. Regresi adalah salah satu metode yang digunakan untuk menentukan hubungan sebab-akibat antara variabel respon dengan variabel prediktor. Indeks Pembangunan Manusia (IPM) merupakan salah satu cara untuk mengukur keberhasilan kinerja suatu Negara atau Wilayah dalam bidang pembangunan manusia (BPS,2012). Indeks Pembangunan Manusia merupakan salah satu indikator untuk mengukur taraf kualitas fisik dan non-fisik penduduk (Andaiyani,2012). Indeks Pembangunan Manusia merupakan suatu indeks komposit yang mencakup tiga bidang pembangunan manusia yang dianggap sangat mendasar yang dilihat dari kualitas fisik dan non fisik penduduk. Tiga indikator tersebut antara lain adalah indikator kesehatan, tingkat pendidikan dan ekonomi. Indikator kesehatan dicerminkan dari angka harapan hidup, sedangkan kualitas non-fisik dicerminkan oleh tingkan pendidikan, angka melek huruf dan pendapatan perkapita. Pembangunan manusia lebih dari sekedar pembangunan ekonomi, peningkatan pendapatan dan lebih dari sekedar proses produksi komoditas serta akumulasi modal. Beberapa alasan perlu diperhatikannya Indeks Pembangunan Manusia dalam pertumbuhan suatu negara adalah : satu, banyak negara berkembang contohnya sendiri adalah Indonesia yang mampu mengalami perkembangan ekonomi namun disisi lain Indonesia juga belum bisa mengatasi masalah kesenjangan sosial dan kemiskinan. Dua, terdapat negara maju seperti Amerika, Inggris dan negara-negara di benua Eropa yang telah mengalami pertumbuhan dengan angka indeks pertumbuhan lebih dari 80 namun tidak mengurangi masalah sosial seperti penggunaan obat terlarang, aids, alkohol, kekerasan rumah tangga dan rasisme. Tiga, beberapa negara yang berpendapatan rendah mampu mencapai Indeks Pembangunan Manusia yang tinggi karena mampu menggunakan sumber daya manusianya secara bijak. Berdasarkan uraian yang telah diberikan, saya akan membuat model regresi linear yang memfokuskan antara antara angka harapan hidup, rata-rata pendapatan perkapita dengan indeks pembangunan manusia.

2 TINJAUAN PUSTAKA

2.1 Regresi Linear

Regresi linear adalah sebuah metode dalam statistika untuk memodelkan hubungan antara variabel respon y (peubah acak terikat) dan satu atau lebih variabel prediktor x (peubah bebas). Salah satu kegunaan dari regresi linear adalah untuk melakukan prediksi berdasarkan data yang telah ada. 

2.2 Regresi Berganda

Regresi Linier Berganda hampir mirip dengan Regresi Linier sederhana, bedanya ada di peubah acak bebas x yang jumlahnya lebih dari satu dengan satu peubah acak terikat y. Model regresi yang melibatkan lebih dari satu variabel prediktor disebut regresi berganda (Montgomery, Peck, & Vining, 2012). Model matematika adalah sebagai berikut :

\[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + . . . + \beta_kX_k + \epsilon_i \]
## Pengujian Parameter Regresi Berganda ### Uji Simultan/Serentak Uji serentak digunakan untuk mengetahui hubungan linier antara variabel respon (Y) terhadap variabel prediktor (X). Uji ini digunakan untuk menguji kecukupan model dengan hipotesis yang digunakan adalah

\[ H_0 : \beta_1=\beta_2=\beta_{3\ }=...=\beta_k\ =0 \] Statistik uji yang digunakan adalah \[ F_{hit}=\ \frac{{SSR}{k}}{{SSE}{(n-k-1)}}\ =\ \frac{MSR}{MSE} \]
### Uji Parsial Setelah menentukan setidaknya salah satu variabel prediktor yang signifikan terhadap variabel respon, selanjutnya dilakukan pengujian parsial untuk mengetahui pengaruh variabel prediktor secara individual terhadap variabel respon. Hipotesis yang digunakan adalah

\[ H0 : \beta_k\ =0 \] \[ H1 : \beta_k ≠ 0; k=1,2,…,k \] Statistik uji yang digunakan adalah

\[ t\ =\ \frac{\widehat{\beta_k}}{se(\widehat{\beta_k})} \] Daerah penolakan : \[ Tolak\ H_0, jika \left|t\right| lebih\ besar\ dari\ pada\ tα/2;(n-k-1) \] (Montgomery, Peck, & Vining, 2012).

2.3 Koefisien Determinasi

Koefisien determinasi (R2) adalah nilai yang menunjukkan seberapa besar kemampuan variabel prediktor dalam menjelaskan model dari variabel respon. Koefisien determinasi dalam model matematikanya dapat dituliskan sebagai berikut :

\[ R^2\ =\ \frac{SSR}{SST}\ =1\ -\ \frac{SSE}{SST} \] Karena SST merupakan ukuran variabilitas dari y tanpa mempertimbangkan efek regresi variabel prediktor dan SSE merupakan ukuran variabilitas dari y sisa setelah variabel prediktor, maka R2 sering disebut sebagai proporsi variasi yang dijelaskan oleh variabel prediktor. Karena 0 ≤ SSE ≤ SST maka 0 ≤ R2 ≤ 1. Nilai R2 yang mendekati 1 mennjukkan bahwa Sebagian besar variabilitas y dijelaskan oleh model regresi (Montgomery, Peck, & Vining, 2012).

2.4 Pelanggaran Asumsi Klasik

Asumsi klasik yang harus dipenuhi pada model regresi adalah tidak adanya multikolinearitas, tidak terjadi heteroskdastisitas (varian residual identik), tidak autokorelasi (residual independen) dan berdistribusi normal.

2.4.1 Multikolinieritas

Adalah suatu keadaan yang menunjukkan adanya korelasi atau hubungan kuat antara dua variabel prediktor atau lebih dalam sebuah model regresi berganda dengan menghitung Variance Inflasion Factors (VIF).
Terdapat tiga sumber utama penyebab multikolinearitas :
1. Metode pengumpulan data yang digunakan
2. Spesifikasi model
3. Pendefinisian model 
Adanya multikolinieritas memiliki beberapa potensi dampak pada hasil estimasi koefisien regresi. Besar multikolinearitas dapat dilihat berdasarkan nilai VIFnya. Dalam model matematika VIF dapat dirumuskan sebagai berikut:

\[ VIF\ =\ \frac{1}{1-R^2} \]

Dimana R2 didapat dari model regresi variabel prediktor sebagai respon dengan variabel prediktor lain sebagai variabel prediktornya. Jika nilai VIF lebih dari 10 hal ini menunjukkan adanya multikolinearitas. Adapun cara untuk mengatasi multikolinearitas adalah 1. Menghapus atau mengeluarkan variabel prediktor yang menjadi penyebab multi kolinearitas. 2. Menambahkan data baru 3. Menggunakan Principal Component Analysis (PCA) yaitu dengan menyederhanakan atau menggabungkan jumlah variabel prediktor tanpa mereduksi satupun variabel prediktor (Montgomery, Peck, & Vining, 2012).

2.4.2 Heteroskedastisitas (Asumsi Identik)

Adalah kondisi dimana variansi dan error tidak identik. Cara mengetahui adanya heteroskedastisitas dapat dengan cara melihat scatter plot antara residual kuadrat dengan variabel respon taksiran atau antara residual kuadrat dengan variabel prediktor. Apabila plot semakin melebar maka menunjukkan terjadinya heteroskedastisitas (Setiawan & Kusrini, 2010). Plot ACF dan PACF kuadrat residual juga dapat digunakan untuk mendeteksi terjadinya varian residual yang tidak Identik (Tsay, 2002). Pengujian yang dilakukan untuk mengetahui ada tidaknya heteroskedastisitas yaitu menggunakan Uji Glejser dengan meregresikan |e| terhadap X yang memiliki model sebagai berikut (Setiawan & Kusrini, Ekonometrika, 2010) :

\[ \left|e_i\right|\ =\ \beta_0+\ \beta_1X\ +\ V_i \] Dimana : |e_i| : Nilai mutlak residual error X : peubah bebas Vi : residual error _0 : konstanta _1 : koefisien regresi Dengan hipotesis Uji Glejser sebagai berikut : \[ H0 : \beta_1=\beta_2=\beta_{3\ }=...=\beta_k\ =0 (varian\ residual\ identik) \] \[ H1 : minimal\ terdapat\ satu\ \beta_k ≠ 0; k=1,2,…,k (varian\ residual\ tidak\ identik) \] Statistik Uji \[ F_{hit}=\ \frac{{MSR}_{\left|e_i\right|}terhadap\ X}{{MSE}_{\left|e_i\right|}terhadap\ X} (2.11) \]

\[ Daerah\ penolakan : Tolak\ H0\ jika\ Fhit > F1-α(1,n-2) \] Adapun cara untuk mengatasi heteroskedastisitas adalah sebagai berikut : 1. Menambah atau mengganti data sampel baru 2. Melakukan transformasi variabel prediktor terhadap variabel respon 3. Menggunakan metode estimasi GLS (Generalized Least Square)

2.5 Tinjauan Non-Statistika

2.5.1 Indeks Pembangunan Manusia (IPM)

Indeks Pembangunan Manusia merupakan suatu indeks komposit yang juga merupakan indikator yang dapat menggambarkan perkembangan pembangunan manusia secara terukur dan representatif. IPM pertama kali diperkenalkan oleh UNDP (United Nation Development Programme) pada tahun 1990.
Menurut BPS, Indeks Pembangunan Manusia (IPM) merupakan ukuran pencapaian pembangunan berbasis sejumlah komponen dasar kualitas hidup. Faktor yang mempengaruhi IPM ada banyak namun utamanya hanya ada tiga, yaitu angka harapan hidup, pendidikan dan standar hidup yang layak atau pendapatan rata-rata masyarakat pada suatu wilayah.

3 LIBRARY

> library(lmtest)
> library(olsrr)
> library(readxl)

4 DATA DAN SUMBER DATA

4.1 Data

> data <- read_excel('C:/Users/acer/Documents/Mahendra/Statistika UB/Semester 5/MPPI/Tugas Skripsi/Data Macam2 Praktikum.xlsx')
> View(data)
> str(data)
tibble[,4] [36 x 4] (S3: tbl_df/tbl/data.frame)
 $ Provinsi                  : chr [1:36] "ACEH" "SUMATERA UTARA" "SUMATERA BARAT" "RIAU" ...
 $ Angka_Harapan_Hidup       : num [1:36] 70 69.2 69.5 71.7 71.2 ...
 $ Pendapatan_Perkapita      : num [1:36] 1534 1502 1641 1577 1987 ...
 $ Indeks_Pembangunan_Manusia: num [1:36] 72 71.8 72.4 72.7 71.3 ...
> knitr::kable(data, caption = "Data IPM")
Data IPM
Provinsi Angka_Harapan_Hidup Pendapatan_Perkapita Indeks_Pembangunan_Manusia
ACEH 69.975 1533.567 71.99
SUMATERA UTARA 69.150 1501.833 71.77
SUMATERA BARAT 69.520 1641.133 72.38
RIAU 71.650 1576.533 72.71
JAMBI 71.170 1987.233 71.29
SUMATERA SELATAN 69.930 1525.733 70.01
BENGKULU 69.370 1550.933 71.40
LAMPUNG 70.695 1333.967 69.69
KEP, BANGKA BELITUNG 70.680 1769.500 71.47
KEP, RIAU 69.990 2570.367 75.59
DKI JAKARTA 72.950 2594.800 80.77
JAWA BARAT 73.150 1900.867 72.09
JAWA TENGAH 74.405 1430.600 71.87
DI YOGYAKARTA 75.025 1213.167 79.97
JAWA TIMUR 71.345 1562.933 71.71
BANTEN 70.005 2273.133 72.45
BALI 72.155 1798.600 75.50
NUSA TENGGARA BARAT 66.510 1334.000 68.25
NUSA TENGGARA TIMUR 67.055 1049.900 65.19
KALIMANTAN BARAT 70.735 1575.500 67.66
KALIMANTAN TENGAH 69.750 1922.333 71.05
KALIMANTAN SELATAN 68.690 1678.233 70.91
KALIMANTAN TIMUR 74.375 2038.233 76.24
KALIMANTAN UTARA 72.535 1618.100 70.63
SULAWESI UTARA 71.745 1977.467 72.93
SULAWESI TENGAH 68.745 1691.433 69.55
SULAWESI SELATAN 70.620 1729.000 71.93
SULAWESI TENGGARA 71.340 1500.433 71.45
GORONTALO 68.115 1371.500 68.68
SULAWESI BARAT 65.110 1285.533 66.11
MALUKU 66.025 1551.333 69.49
MALUKU UTARA 68.375 1561.833 68.49
PAPUA BARAT 66.050 2327.067 65.09
PAPUA 65.835 2533.767 60.44
MIN 65.110 1049.900 60.44
MAX 75.025 2594.800 80.77

4.2 Sumber Data

Data yang digunakan dalam penelitian ini adalah data sekunder yang berasal dari website resmi Badan Pusat Statistik. Data yang digunakan adalah data tingkat pendidikan terakhir yang dienyam oleh masyarakat tiap provinsi tahun 2020, angka harapan hidup tiap provinsi tahun 2020, data pendapatan perkapita tiap provinsi tahun 2020 dan Indeks Pembangunan Manusia tahun 2020.Dengan data pendapatan perkapita dikali 1000.

5 HASIL DAN PEMBAHASAN

5.1 Statistika Deskriptif

> summary(data)
   Provinsi         Angka_Harapan_Hidup Pendapatan_Perkapita
 Length:36          Min.   :65.11       Min.   :1050        
 Class :character   1st Qu.:68.61       1st Qu.:1501        
 Mode  :character   Median :70.00       Median :1597        
                    Mean   :70.08       Mean   :1727        
                    3rd Qu.:71.67       3rd Qu.:1936        
                    Max.   :75.03       Max.   :2595        
 Indeks_Pembangunan_Manusia
 Min.   :60.44             
 1st Qu.:69.29             
 Median :71.42             
 Mean   :71.05             
 3rd Qu.:72.40             
 Max.   :80.77             

Berdasarkan hasil tersebut dapat diinterpretasikan bahwa rata-rata dari Angka Harapan Hidup adalah 70.08 tahun, dengan usia paling tinggi adalah 75.03 tahun dan paling rendah 65.11 tahun. Pendapatan perkapita rata-rata sebesar Rp. 1.727.000 dengan pendapatan perkapita tertinggi Rp. 2.595.000 dan pendapatan perkapita terendah Rp. 1.050.000. Nilai indeks pembangunan manusia memiliki rata-rata 71.05 dengan indeks tertinggi perdaerah sebesar 80.77 dan indeks terendah perdaerah adalah 60.44.

5.2 Model Regresi Linear Berganda

> # Analisis Regresi 
> reg <- lm(Indeks_Pembangunan_Manusia~Angka_Harapan_Hidup+Pendapatan_Perkapita, data = data)
> summary(reg)

Call:
lm(formula = Indeks_Pembangunan_Manusia ~ Angka_Harapan_Hidup + 
    Pendapatan_Perkapita, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-6.6261 -1.0471 -0.0012  1.7403  4.4269 

Coefficients:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)          -22.385411  11.103923  -2.016   0.0520 .  
Angka_Harapan_Hidup    1.288122   0.162592   7.922 3.89e-09 ***
Pendapatan_Perkapita   0.001834   0.001061   1.729   0.0932 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.542 on 33 degrees of freedom
Multiple R-squared:  0.6996,    Adjusted R-squared:  0.6814 
F-statistic: 38.42 on 2 and 33 DF,  p-value: 2.415e-09

Dari hasil tersebut didapat persamaan regresi sebagai berikut : \[ IndeksPembangunanManusia = -22.385411 + 1.288122AngkaHarapanHidup + 0.001834PendapatanPerkapita \]

5.3 Uji Asumsi Klasik

5.3.1 Normalitas

> ## Normalitas
> residual <- resid(reg)
> qqnorm(residual, pch = 1, frame = FALSE)
> qqline(residual, col = "steelblue", lwd = 2)

> 
> shapiro.test(residual)

    Shapiro-Wilk normality test

data:  residual
W = 0.97571, p-value = 0.6003

Berdasarkan hasil uji menggunakan qqplot menunjukkan bahwa residu berdistribusi normal dan shapiro-wilk tes menghasilkan nilai p−value(0.6003)>α(0.05) yang berarti H0 diterima. Maka kesimpulan bahwa residual atau galat menyebar normal

5.3.2 Autokorelasi

> ## Non Autokorelasi
> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 1.5295, p-value = 0.05812
alternative hypothesis: true autocorrelation is greater than 0

Berdasarkan hasil uji Durbin watson menghasilkan nilai p−value(0.05812)>α(0.05) yang berarti H0 diterima. Maka dapat disimpulkan bahwa asumsi nonautokorelasi terpenuhi atau dapat disimpulkan bahwa tidak terjadi autokorelasi antar galat.

5.3.3 Homoskedatisitas

> ## Homoskedastisitas
> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 3.9508, df = 2, p-value = 0.1387

Berdasarkan hasil uji Breusch-Pagan didapatkan nilai p−value(0.1387)>α(0.05) yang berarti H0 diterima. Maka dapat disimpulkan bahwa ragam galat homogen.

5.3.4 Multikolinearitas

> ## Non Multikolinearitas
> ols_vif_tol(reg)
             Variables Tolerance     VIF
1  Angka_Harapan_Hidup 0.9417618 1.06184
2 Pendapatan_Perkapita 0.9417618 1.06184

Dari hasil diatas didapat nilai VIF mendekati 1 sehingga bisa dianggap jika nilai VIF sama dengan 1. Hal tersebut membuktikan bahwa tidak ada multikolinearitas pada variabel prediktor.

5.4 Uji Simultan

> ## Simultan
> summary(reg)

Call:
lm(formula = Indeks_Pembangunan_Manusia ~ Angka_Harapan_Hidup + 
    Pendapatan_Perkapita, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-6.6261 -1.0471 -0.0012  1.7403  4.4269 

Coefficients:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)          -22.385411  11.103923  -2.016   0.0520 .  
Angka_Harapan_Hidup    1.288122   0.162592   7.922 3.89e-09 ***
Pendapatan_Perkapita   0.001834   0.001061   1.729   0.0932 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.542 on 33 degrees of freedom
Multiple R-squared:  0.6996,    Adjusted R-squared:  0.6814 
F-statistic: 38.42 on 2 and 33 DF,  p-value: 2.415e-09

Berdasarkan p−value statistik uji F pada hasil tersebut menunjukkan bahwa p−value(2.415e-09)<α(0.05), maka H0 ditolak. Dengan demikian, dapat disimpulkan bahwa angka harapan hidup dan pendapatan perkapita berpengaruh signifikan terhadap indeks pembangunan manusia.

5.5 Uji Parsial

> ## Partial
> summary(reg)

Call:
lm(formula = Indeks_Pembangunan_Manusia ~ Angka_Harapan_Hidup + 
    Pendapatan_Perkapita, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-6.6261 -1.0471 -0.0012  1.7403  4.4269 

Coefficients:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)          -22.385411  11.103923  -2.016   0.0520 .  
Angka_Harapan_Hidup    1.288122   0.162592   7.922 3.89e-09 ***
Pendapatan_Perkapita   0.001834   0.001061   1.729   0.0932 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.542 on 33 degrees of freedom
Multiple R-squared:  0.6996,    Adjusted R-squared:  0.6814 
F-statistic: 38.42 on 2 and 33 DF,  p-value: 2.415e-09

5.5.1 Angka Harapan Hidup

Berdasarkan p−value statistik uji t angka harapan hidup pada bagian coefficient tersebut menunjukkan bahwa p−value(3.89e-09)>α(0.05), maka H0 ditolak. Dengan demikian, dapat disimpulkan bahwa angka harapan hidup berpengaruh signifikan terhadap indeks pembangunan manusia. Dapat diartikan setiap pertambahan 1 nilai angka harapan hidup, maka indeks pembangunan manusia akan meningkat sebesar 1.288122.

5.5.2 Pendapatan Perkapita

Berdasarkan p−value statistik uji t pendapatan perkapita pada bagian coefficient tersebut menunjukkan bahwa p−value(0.0932)>α(0.05), maka H0 ditolak. Dengan demikian, dapat disimpulkan bahwa pendapatan perkapita berpengaruh signifikan terhadap indeks pembangunan manusia. Dapat diartikan setiap pertambahan 1 nilai pendapatan perkapita, maka indeks pembangunan manusia akan meningkat sebesar 0.001834.

5.6 Koefisien Determinasi

Koefisien Determinasi R2 dapat dilihat dari hasil diatas sebesar 0.6996 dan adjustedR2 sebesar 0.6814 Yang artinya, keragaman variabel respons dapat dijelaskan sebesar 69% atau 68% oleh variabel prediktor, dan sisanya dijelaskan oleh variabel lain yang tidak tercantum dalam model atau galat. Nilai tersebut tergolong cukup, maka dari itu disarankan untuk mengganti salah satu variabel prediktor yang tidak berpengaruh signifikan atau menambah variabel prediktor dengan variabel yang lebih memiliki hubungan dengan variabel response.

6 KESIMPULAN

Dari hasil di atas dapat ditarik beberapa kesimpulan yakni :

  1. Didapat persamaan regresi sebagai berikut. \[ IndeksPembangunanManusia = -22.385411 + 1.288122AngkaHarapanHidup + 0.001834PendapatanPerkapita \]
  2. Angka harapan hidup dan pendapatan perkapita berpengaruh terhadap indeks pembangunan manusia.
  3. Dapat diartikan setiap pertambahan 1 nilai angka harapan hidup, maka indeks pembangunan manusia akan meningkat sebesar 1.288122 dan setiap pertambahan 1 nilai pendapatan perkapita, maka indeks pembangunan manusia akan meningkat sebesar 0.001834.
  4. Keragaman variabel respons dapat dijelaskan sebesar 69% atau 68% oleh variabel prediktor.

7 DAFTAR PUSTAKA

  Prasisto, Arif. (2004). Cara Mudah Mengatasi Masalah Statistik dan Rancangan Percobaan dengan SPSS 12. Jakarta : Elex Media Komputindo.
  Kurniawan, Robert. (2016). Analisis Regresi Dasar dan Penerapannya dengan R. Jakarta : Kencana.
  Said dan Chandra. (2005). Riset Keuangan : Pengujian-Pengujian Empiris. Jakarta : Gramedia Pustaka Utama.
  Parjino, dkk. (2018). Kebijakan Multilateral dan Pembangunan Ekonomi Indonesia. Jakarta : Gramedia Pustaka Utama.
  Hardy, Melissa A. (1993). Regression With Dummy Variables. London : SAGE Publications.
  Draper dan Harry. (1998). Applied Regression Analysis. New Jersey : Wiley.