CM-SIM-22.knit

ANALISIS REGRESI LINEAR BERGANDA UNTUK MENGETAHUI FAKTOR-FAKTOR YANG BERPENGARUH TERHADAP TINGKAT KEMATIAN ANAK DI BAWAH LIMA TAHUN DI ASIA PADA TAHUN 2004

Syafina Anindiyasari - M0722075

Case Method SIM

Daftar Isi: LIBRARY INPUT DATA MODEL REGRESI KOEFISIEN DETERMINASI UJI SIMULTAN (F) UJI PARSIAL (T) - UJI NORMALITAS - UJI MULTIKOLINEARITAS - UJI HETEROSKEDASTISITAS - UJI AUTOKORELASI PENCILAN KESIMPULAN

Keberhasilan dari suatu perkembangan pembangunan dapat diukur dari berbagai indikator. Dari sekian banyak indikator, tingkat kematian anak di bawah umur lima tahun (angka kematian bayi dan anak balita) merupakan indikator yang berpengaruh terhadap perubahan sosial ekonomi keluarga dan kemajuan di bidang kesehatan.

Menurut data, pada 2004 diperkirakan 1293.7 juta anak di bawah lima tahun di Asia meninggal karena penyakit yang dapat dicegah dengan vaksin. Kira-kira 6300 kasus kematian ini disebabkan oleh penyakit Hepatitis B, Campak, Polio, dan penyakit lainnya yang dapat dicegah dengan imunisasi. Cakupan imunisasi yang rendak tentu akan berpengaruh pada bidang kesehatan dan membahayakan ibu dan anak. Negara Afganistan menyumbang sekitar 8.70% kematian anak di bawah lima tahun di Asia pada tahun 2004 dengan 3.16% kasus Hepatis B, 0.8% kasus Campak, dan 2.15% kasus polio. Kondisi tersebut tentu memiliki hubungan yang erat dengan faktor lingkungan. Faktor lingkungan meliputi lingkungan fisik, biologi, sosial budaya , dan ekonomi ynag berkontribusi pada tingginya kematian anak di bawah lima tahun di Asia pada tahun 2004.

Untuk mengetahui tingkat kematian serta pengaruhnya pada masa yang akan data, perlu dilakukan analisis faktor yang mempengaruhi kematian anak di bawah lima tahun. Data utama dalam analisis ini mengacu pada data kematian anak di bawah lima tahun di Asia tahun 2004, data Hepatitis B, Campak, dan Polio. Manfaat dilakukannya analisis ini sebagai acuan bagi pemerintah pada tiap negara di Asia untuk meningkatkan kelangsungan hidup anak. Analisis ini dilakukan dengan menggunakan regresi linear berganda, dimana data kematian anak di bawah lima tahun sebagai variabel dependen, data Hepatitis B, Campak, dan Polio sebagai variabel Independen. Tujuan analisis ini untuk memahami hubungan antar variabel independen dan variabel dependen serta memprediksi atau menjelaskan perubahan variabel dependen berdasarkan variabel independen yang terkait.

LIBRARY

Sebelum melanjutkan ke tahap berikutnya, siapkan terlebih dahulu Library yang akan digunakan.

library(readxl)
library(dplyr)
library(lmtest)
library(car)
library(ggplot2)

INPUT DATA

Analisis faktor-faktor yang mempengaruhi kematian anak di bawah lima tahun menggunakan data yang berisi tentang Hepatitis B, Campak, dan Polio dari 27 negara Asia dalam periode 2004 dengan format xlsx.

Data_SIM <- read_excel(path = "C:/Users/finan/OneDrive/Dokumen/Syafina/SMT 4/SIM/DATA CM.xlsx")
Data_SIM

## # A tibble: 2,864 × 22
##       No Country    Region  Year Infan…¹ Under…² Adult…³ Alcoh…⁴ Hepat…⁵ Measles
##    <dbl> <chr>      <chr>  <dbl>   <dbl>   <dbl>   <dbl>   <dbl>   <dbl>   <dbl>
##  1     1 Turkiye    Middl…  2015    11.1    13     106.     1.32      97      65
##  2     2 Spain      Europ…  2015     2.7     3.3    57.9   10.4       97      94
##  3     3 India      Asia    2007    51.5    67.9   201.     1.57      60      35
##  4     4 Guyana     South…  2006    32.8    40.5   222.     5.68      93      74
##  5     5 Israel     Middl…  2012     3.4     4.3    58.0    2.89      97      89
##  6     6 Costa Rica Centr…  2006     9.8    11.2    95.2    4.19      88      86
##  7     7 Russian F… Rest …  2015     6.6     8.2   223      8.06      97      97
##  8     8 Hungary    Europ…  2000     8.7    10.1   193.    12.2       88      99
##  9     9 Jordan     Middl…  2001    22      26.1   130.     0.52      97      87
## 10    10 Moldova    Rest …  2008    15.3    17.8   218.     7.72      97      92
## # … with 2,854 more rows, 12 more variables: BMI <dbl>, Polio <dbl>,
## #   Diphtheria <dbl>, Incidents_HIV <dbl>, GDP_per_capita <dbl>,
## #   Population_mln <dbl>, Thinness_ten_nineteen_years <dbl>,
## #   Thinness_five_nine_years <dbl>, Schooling <dbl>,
## #   Economy_status_Developed <dbl>, Economy_status_Developing <dbl>,
## #   Life_expectancy <dbl>, and abbreviated variable names ¹Infant_deaths,
## #   ²Under_five_deaths, ³Adult_mortality, ⁴Alcohol_consumption, ⁵Hepatitis_B

#Mengambil Data di Asia tahun 2004
data_filter <- filter(Data_SIM, Region == "Asia" & Year == 2004)%>%
  select(Under_five_deaths, Hepatitis_B, Measles, Polio)
data_filter

## # A tibble: 27 × 4
##    Under_five_deaths Hepatitis_B Measles Polio
##                <dbl>       <dbl>   <dbl> <dbl>
##  1               3.9          83      87    97
##  2              55.6          50      67    78
##  3              18            96      95    98
##  4              68.3          75      63    88
##  5              49.6          64      29    79
##  6              90.8          45      65    46
##  7              70.7          84      48    86
##  8             113.           67      16    50
##  9               8.3          94      91    95
## 10              46.8          99      99    99
## # … with 17 more rows

MODEL REGRESI

Regresi merupakan sebuah metode statistik yang dipakai unntuk memperkirakan hubungan antara sebuah variabel terikan dan satu variabel independen atau lebih. Analisis regresi memiliki beberapa variasi, yakni linear sederhana, linear ganda, dan nonlinear. Model yang paling umum ialah regresi linear sederhana dan linear ganda. Sementara itu, nonlinear biasa dipakaiuntuk kelompok data yang lebih kompleks karena hubungan antar variabel tidak sejalan. Pada analisis ini, digunakan analisis linear berganda. Regresi linear bergenda pada dasarnya hampir sama dnegan model linear sederhana, tetapi jumlah variabel independennya lebih dari satu. Berikut representasi matematis dari model regresi linear berganda:

\[Y = \beta_0 + \beta_1X_1 + \beta_2X_2 +...+\beta_pX_p + \epsilon\]

Catatan

Y = Variabel Dependen

X1, X2, X3 = Variabel Independen

β0 = Konstanta

β1, β2, β3= Koefisien Regresi

€ = Error atau residu

RE <- lm(Under_five_deaths~ Hepatitis_B + Measles + Polio, data = data_filter)
RE

## 
## Call:
## lm(formula = Under_five_deaths ~ Hepatitis_B + Measles + Polio, 
##     data = data_filter)
## 
## Coefficients:
## (Intercept)  Hepatitis_B      Measles        Polio  
##   166.02322      0.08538     -0.25076     -1.24229

summary(RE)

## 
## Call:
## lm(formula = Under_five_deaths ~ Hepatitis_B + Measles + Polio, 
##     data = data_filter)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -28.958 -14.355   1.908  17.207  37.447 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 166.02322   23.55275   7.049  3.5e-07 ***
## Hepatitis_B   0.08538    0.26812   0.318  0.75301    
## Measles      -0.25076    0.20051  -1.251  0.22365    
## Polio        -1.24229    0.39265  -3.164  0.00434 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 19.99 on 23 degrees of freedom
## Multiple R-squared:  0.585,  Adjusted R-squared:  0.5309 
## F-statistic: 10.81 on 3 and 23 DF,  p-value: 0.0001257

Interpretasi :

Dari hasil perhitungan regresi tersebut diperoleh nilai intercept Y sebesar 166.02322 dengan signifikansi sebesar 3.5e-07. Sementara variabel indpenden Hepatitis B (X1) memiliki p-value sebesar 0.75301, Campak (X2) sebesar 0.22365, dan Polio (X3) sebesar 0.00434. Koefisien determinasi Multiple R-Squared bernilai 0.585 dan Adjusted R-Squared sebesar 0.5309, yang artinya sekitar 53.09% dari variasi kematian anak di bawah lima tahun di Asia tahun 2004 dapat dijelaskan oleh model regresi ini, dan 46.91% dijelaskan oleh variabel lain yang tidak masuk dalam model.

Model regresi yang dihasilkan:

Y = 166.02322 + 0.08538X1 - 0.25076X2 - 1.24229X3

Interpretasi Model :

Nilai intercept yang didapat adalah 166.02322. Hal ini menunjukkan bahwa jika semua variabel independent (Hepatitis B, Campak, dan Polio) bernilai nol, maka kematian anka di bawah lima tahun di Asia tahun 2004 diperkirakan mencapai 166.02322%
Koefisien X1 atau variabel hepatitis B adalah 0.8538. Ini menunjukkan bahwa tiap peningkatan satu kasus dalam hepatitis B, diperkirakan akan meningkatkan kematian anak di bawah lima tahun di Asia tahun 2004 sebesar 0.08538%
Koefisien X2 atau variabel campak adalah -0.25076 Ini menunjukkan bahwa tiap peningkatan satu kasus dalam campak, diperkirakan akan menurunkan kematian anak di bawah lima tahun di Asia tahun 2004 sebesar 0.25076%
Koefisien X3 atau variabel polio adalah -1.24229. Ini menunjukkan bahwa tiap peningkatan satu kasus dalam polio, diperkirakan akan menurunkan kematian anak di bawah lima tahun di Asia tahun 2004 sebesar 1.24229%

KOEFISIEN DETERMINASI

summary(RE)

## 
## Call:
## lm(formula = Under_five_deaths ~ Hepatitis_B + Measles + Polio, 
##     data = data_filter)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -28.958 -14.355   1.908  17.207  37.447 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 166.02322   23.55275   7.049  3.5e-07 ***
## Hepatitis_B   0.08538    0.26812   0.318  0.75301    
## Measles      -0.25076    0.20051  -1.251  0.22365    
## Polio        -1.24229    0.39265  -3.164  0.00434 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 19.99 on 23 degrees of freedom
## Multiple R-squared:  0.585,  Adjusted R-squared:  0.5309 
## F-statistic: 10.81 on 3 and 23 DF,  p-value: 0.0001257

Koefisien determinasi yang dilambangkan dengan R^2 ( R kuadrat ) merupakan statistik yang mengukur goodness of fit suatu model regresi. Koefisien determinasi menunjukkan seberapa cocok suatu model regresi dengan kumpulan data, yaitu menunjukkan persentase yang dijelaskan oleh model regresi. Oleh karena itu, semakin tinggi koefisien determinasi maka semakin baik model regresinya.

Koefisien determinasi sama dengan satu dikurangi perbandingan antara varians sisa dan varians variabel terikat. Koefisien determinasi juga dapat dihitung dengan mengurangkan sisa jumlah kuadrat dengan mengurangkan satu dikurangi jumlah kuadrat. Nilai koefisien determinasi bisa berkisar antara 0 sampai 1, namun biasanya dinyatakan dalam persentase, sehingga minimumnya adalah 0% dan maksimumnya adalah 100%.

Namun ketika membandingkan dua model regresi, model dengan koefisien regresi yang lebih tinggi tidak selalu lebih baik. Misalnya, suatu model regresi mungkin memiliki koefisien regresi R 2 = 100% karena banyak variabel penjelas yang ditambahkan ke dalam model sehingga dapat menjelaskan semua observasi dengan sempurna. Namun model ini tentunya memberikan prediksi yang sangat buruk untuk nilai baru yang tidak digunakan untuk membangun model regresi.

Berdasarkan output summary model diatas, diketahui nilai koefisien determinasi atau R square adalah sebesar 0.7558. Nilai R square ini berasal dari pengkuadratan nilai koefisien korelasi atau ’R’nya. Besarnya angka koefisien determinasi (R square) adalah 0.7558 atau 75.58%. Artinya, variabel X1(Hepatitis B), X2 (Campak), dan X3(Polio) secara simultan (bersama-sama) berpengaruh sebanyak 75.58% terhadap variabel Y (kematian anak di bawah lima tahun di Asia tahun 2004). Sementara sebanyak 24.42% dipengaruhi oleh variabel lain diluar persamaan model regresi ini.

UJI SIMULTAN (F)

Uji F bertujuan untuk mencari apakah variabel independen secara bersama-sama (simultan) mempengaruhi variabel dependen. Uji F dilakukan untuk melihat pengaruh dari seluruh variabel independen secara bersama-sama terhadap variabel dependen. Tingkat signifikansi yang digunakan adalah sebesar 0.5 atau 5%, jika nilai signifikan F < 0.05 maka dapat diartikan bahwa variabel independen secara simultan mempengaruhi variabel dependen ataupun sebaliknya (Ghozali, 2016)

Hipotesis

H0 : β0 = β1 = β2 = β3 = 0 (X1, X2, dan X3 secara simultan tidak berpengaruh signifikan terhadap model)

H1 : β0 ≠ 0 atau βi ≠ 0 ; i = 1,2, 3 (Paling tidak terdapat 1 variabel βi yang tidak sama dengan 0 atauberpengaruh signifikan terhadap model)
Taraf Signifikansi

α = 0.05
Daerah kritis

H0 ditolak jika p-value < α = 0,05 atau F-value > F tabel(α;k;n-k-1) = Ftabel = 2,98
Statistik Uji

summary(RE)

## 
## Call:
## lm(formula = Under_five_deaths ~ Hepatitis_B + Measles + Polio, 
##     data = data_filter)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -28.958 -14.355   1.908  17.207  37.447 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 166.02322   23.55275   7.049  3.5e-07 ***
## Hepatitis_B   0.08538    0.26812   0.318  0.75301    
## Measles      -0.25076    0.20051  -1.251  0.22365    
## Polio        -1.24229    0.39265  -3.164  0.00434 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 19.99 on 23 degrees of freedom
## Multiple R-squared:  0.585,  Adjusted R-squared:  0.5309 
## F-statistic: 10.81 on 3 and 23 DF,  p-value: 0.0001257

Kesimpulan

Karena didapatkan F value sebesar 30.93 > 2.98 (F tabel) atau p-value sebesar 9.896e-09 < 0.05 maka H0 ditolak, yang artinya setidaknya terdapat satu variabel independen yang mempengaruhi variabel dependen secara signifikan.

UJI PARSIAL (T)

Uji T digunakana untuk menguji koefisien regresi secara parsial dari variabel independen terhadap variabel dependen, yaitu untuk melihat bagaimana pengarurh variabel Hepatitis B, Campak, dan Polio terhadap kematian anak di bawah lima tahun di Asia tahun 2004.

Hipotesis

H0 : βi = 0; i = 1, 2, 3 (Variabel Xi tidak berpengaruh signifikan terhadap model)

H1 : βi ≠ 0; i= 1, 2, 3 (Variabel nXi berpengaruh signifikan terhadap model)
Taraf Signifikansi

α = 0.05
Daerah Kritis

H0 ditolak jika p-value < α = 0.05
Statistik Uji

summary(RE)

## 
## Call:
## lm(formula = Under_five_deaths ~ Hepatitis_B + Measles + Polio, 
##     data = data_filter)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -28.958 -14.355   1.908  17.207  37.447 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 166.02322   23.55275   7.049  3.5e-07 ***
## Hepatitis_B   0.08538    0.26812   0.318  0.75301    
## Measles      -0.25076    0.20051  -1.251  0.22365    
## Polio        -1.24229    0.39265  -3.164  0.00434 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 19.99 on 23 degrees of freedom
## Multiple R-squared:  0.585,  Adjusted R-squared:  0.5309 
## F-statistic: 10.81 on 3 and 23 DF,  p-value: 0.0001257

Kesimpulan X1 : didapatkan p-value sebesar 0.010609 < 0.05, maka H0 ditolak. Artinya, variabel X1 atau Hepatitis B berpengaruh signifikan terhadap model Y atau kematian anak di bawah lima tahun di Asia tahun 2004.

X2 : didapatkan p-value sebesar 2.96e-05 < 0.05, maka H0 ditolak. Artinya, variabel X2 atau Campak berpengaruh signifikan terhadap model Y atau kematian anak di bawah lima tahun di Asia tahun 2004.

X3 : didapatkan p-value sebesar 0.002786 < 0.05, maka H0 ditolak. Artinya, variabel X3 atau polio berpengaruh signifikan terhadap model Y atau kematian anak di bawah lima tahun di Asia tahun 2004.

UJI ASUMSI

Uji asumsi pada dasarnya merupakan salah satu uji yang digunakan sebagai syarat statistik. Uji asumsi harus dipenuhi pada analisis linear berganda serta tidak pada regresi linear sederhana. Melakukan uji asumsi sebelum melakukan uji hipotesis dianggap sebagai salah satu syarat yang harus dilakukan pada penelitian kuantitatif. Jika hasil dari uji asumsi tidak sesuai dengan hipotesis, maka akan timbul bermacam-macam reaksi. Oleh karena itu, melakukan uji asumsi terlebih dahulu adalah hal yang penting dalam penelitian kuantitatif.

UJI NORMALITAS

Uji normalitas ialah sebuah uji yang bertujuan untuk melihat apakah nilai residu dari model regresi berdistribusi normal atau tidak. Model regresi yang baik adalah model yang memiliki residu dan berdistribusi secara normal. Uji normalitas tidak perlu dilakukan pada tiap variabel yang ada, namun hanya untuk nilai-nilai residu saja. Uji normalitas dapat dilakukan dengan P-Plot, histogram, chi-Square, kurtosis, skewness, dan kolmogorov smirnos. Meskipun memiliki banyak metode, uji normalitas tidak memiliki metode terbaik atau modle yang paling tepat.

Apabila ditemukan residu tidak normal akan tetap tetapi dekat dengan nilai kritis, maka metode lain pun dapat digunakan untuk memberikan justifikasi normal. Apabila jauh dari nilai normal, maka dapat dilakukan penggubahan data, menambahkan data observasi serta memangkas outlier. Transformasi pun dapat dilakukan dalam bentuk akar kuadrat, logaritma natural, inverses dan lainnya bergantung pada normal kurva apakah ke arah kanan, kiri atau tengah dan lainnya.

Hipotesis

H0 : Residu data berdistribusi normal

H1 : Residu data tidak berdistribusi normal
Taraf Signifikansi

α = 0.05
Daerah Kritis

H0 ditolak jika p-value < α = 0.05
Statistik Uji

# Histogram
ggplot(data.frame(Residual=resid(RE)), aes(x=Residual)) +
  geom_histogram(binwidth=0.5, fill="pink", color="lightblue") +
  labs(x = "Residual", y = "Count", title = "Histogram of Residuals")

#QQ Plot
qqnorm(resid(RE))
qqline(resid(RE))

#Uji Normalitas residual
shapiro.test((RE$residuals))

## 
##  Shapiro-Wilk normality test
## 
## data:  (RE$residuals)
## W = 0.94853, p-value = 0.1974

Kesimpulan

Berdasarkan hasil output, didapatkan p-value sebesar 0.1974 > 0.05, maka H0 gagal ditolak. Artinya, residu data berdistribusi normal.

UJI MULTIKOLINEARITAS

Jenis uji asumsi yang kedua ialah uji multikolinearitas yang dirancang guna menentukan apakah ada korelasi tinggi antara variabel independen dengan model regresi linier ganda, apabila ada korelasi tinggi antara variabel independen hubungan dengan variabel independen serta variabel dependen terganggu.

Alat statistik umumnya akan digunakan untuk dapat menguji dari gangguan multikolinieritas, alat yang dimaksud ialah variance inflation factor atau IVD, korelasi pearson antara variabel independen maupun pertimbangan dari nilai eigen serta indeks kondisi.

Hipotesis

H0 : Tidak terjadi gejala multikolinearitas pada data

H1 : Terjadi multikolinearitas pada data
Taraf Signifikansi

α = 0.05
Daerah kritis

H0 ditolak jika VIF > 10
Statistik Uji

viff<- vif(RE)
viff

## Hepatitis_B     Measles       Polio 
##    1.906206    1.825235    2.254778

plot(viff, type = "bar", main = "VIF Plot")

Kesimpulan

Berdasarkan hasil output, didapatkan semua nilai VIF < 10. Maka, H0 ditolak dan tidak terjadi gejala multikolinearitas pada data.

UJI HETEROSKEDASTISITAS

Pada uji heteroskedastisitas, peneliti dapat memeriksa apakah terdapat perbedaan yang tidak sama antara residu satu dengan pengamatan lainnya. Salah satu model dari regresi adalah model yang memenuhi syarat bahwa ada kesamaan pada varian antara residu satu dengan pengamatan dan lainnya yang disebut pula dengan homoskedastisitas.

Bukti dari heteroskedastisitas dapat dibuat melalui penggunaan metode scatterplot dengan memplot nilai prediktif atau zpred dengan nilai sisa atau sresid. Model yang baik adalah model ketika grafik tidak mengandung pola-pola tertentu, seperti berkumpul di tengah, memperbesar, menyempit maupun memperkecil, tes glejser, tes wei maupun tes park dapat digunakan pula sebagai tes statistik.

Ada beberapa solusi alternatif yang dapat digunakan apabila model tersebut melanggar asumsi dari heteroskedastisitas adalah dengan mengubah menjadi bentuk-bentuk logaritmik. Solusi alternatif tersebut dapat dilakukan apabila seluruh data positif atau seluruh variabel dapat dibagi dengan variabel lainnya yang mengalami gangguan serupa yaitu gangguan heteroskedastisitas.

Hipotesis

H0 : Variansi sisaan bersifat homogen

H1 : Variansi sisaan tidak bersifat homogen
Taraf Signifikansi

α = 0.05
Daerah kritis

H0 ditolak jika pvalue < α = 0.05
Statistik Uji

#Grafik
plot(RE, which = 1)

bp <- bptest(RE)
bp

## 
##  studentized Breusch-Pagan test
## 
## data:  RE
## BP = 2.9771, df = 3, p-value = 0.3952

Kesimpulan

Berdasarkan hasil output, didapatkan pvalue sebesar 0.3952 maka H0 diterima. Artinya, variansi sisaan bersifat homogen.

UJI AUTOKORELASI

Uji autokorelasi merupakan uji yang dilakukan untuk dapat melihat apakah terjadi korelasi di antara suatu periode dengan periode-periode sebelumnya. Sederhananya, uji autokorelasi merupakan analisis dari regresi yang terdiri dari pengujian pengaruh variabel independen pada variabel dependen, sehingga tidak boleh terjadi korelasi di antara pengamatan serta data observasi sebelumnya.

Ada beberapa cara yang dapat dilakukan untuk mengatasi masalah pada autokorelasi, salah satunya adalah dengan melakukan pengubahan data atau melakukan perubahan model regresi menjadi persamaan serta perbedaan secara umum. Selain itu, dapat pula dilakukan dengan cara memasukan salah satu variabel lag serta variabel lain yang masih berkaitan menjadi salah satu variabel bebas, sehingga pada akhirnya data observasi pun akan berkurang satu.

Hipotesis

H0 : Tidak terjadi autokorelasi pada data

H1 : Terjadi autokorelasi pada data
Taraf Signifikansi

α = 0.05
Daerah kritis

H0 ditolak jika pvalue < α = 0.05
Statistik Uji

dw <- dwtest(RE)
dw

## 
##  Durbin-Watson test
## 
## data:  RE
## DW = 2.5293, p-value = 0.9302
## alternative hypothesis: true autocorrelation is greater than 0

Kesimpulan

Berdasarkan hasil output, didapatkan pvalue sebesar 0.9302 > α = 0.05 maka H0 diterima. Artinya, tidak terjadi autokorelasi pada data

PENCILAN

Sebuah data dianggap memiliki pencilan apabila nilai DFFITS dari beberapa observasi melebihi batas kritis yang telah ditentukan. Cara menentukan batas :

|DFFITS| > 2√((k+1)/n)

       2√((3+1)/27)
       
     = 0.7698

nilai.pembanding.dffits = 2*(sqrt(4/27))
nilai.pembanding.dffits

## [1] 0.7698004

dffits(RE)

##           1           2           3           4           5           6 
## -0.37369540 -0.02102154 -0.15730073  0.24509119 -0.38070436 -0.35830219 
##           7           8           9          10          11          12 
##  0.28960151  0.33770884 -0.34951002  0.33496124 -1.24205335  0.29061398 
##          13          14          15          16          17          18 
##  0.21531244  0.09369903  0.57980088 -0.33408765 -0.44835352  0.29039719 
##          19          20          21          22          23          24 
## -0.22566291  0.10469381  0.56533562  0.37605634 -0.22064086  0.36738298 
##          25          26          27 
## -0.19899861 -0.48719843  0.05487498

Terdapat pencilan pada data ke-11.

KESIMPULAN

Berdasarkan hasil analisis regresi mengenai data kematian anak di bawah lima tahun di Asia pada tahun 2004, dapat ditarik kesimpulan sebagai berikut :

Data yang digunakan adalah data kematian anak di bawah lima di Asia pada tahun 2004 sebagai variabel dependen. Sementara variabel independennya adalah data hepatitis B, Campak, dan Polio.
Dari hasil analisis didapatkan model regresi linear berganda untuk kematian anak di bawah lima di Asia pada tahun 2004 adalah \[Y = 166.02322 + 0.08538X1 - 0.25076X2 - 1.24229X3\]
Setelah dilakukan uji T dan Uji F, semua variabel independen berpengaruh secara signifikan terhadap variabel dependen.
Melalui pengujian asumsi, didapatkan bahwa residu berdistribusi normal, variansi sisaan bersifat homogen, tidak terdapat autokorelasi antarvariabel, dan tidak terjadi multikolinearitas.
Terdapat pencilan pada data ke-11 yaitu -1.24205335, dimana nilai pembandingnya sebesar 0.7698004.
Berdasarkan model regresi didapatkan Rsquared sebesar 0,7758. Artinya sebanyak 75,58% variabel dependen mampu dijelaskan oleh variabel independen. Sementara sebanyak 24.42% dipengaruhi oleh variabel lain diluar persamaan model regresi inii.
Model regresi linear berganda ini cukup kuat dalam menjelaskan varibel dependen kematian anak di bawah lima tahun di Asia apada tahun 2004 dengan tiga variabel independent yaitu data hepatitis B, Campak, dan Polio.