Daftar Isi: LIBRARY INPUT DATA MODEL REGRESI KOEFISIEN DETERMINASI UJI SIMULTAN (F) UJI PARSIAL (T) - UJI NORMALITAS - UJI MULTIKOLINEARITAS - UJI HETEROSKEDASTISITAS - UJI AUTOKORELASI PENCILAN KESIMPULAN
Keberhasilan dari suatu perkembangan pembangunan dapat diukur dari berbagai indikator. Dari sekian banyak indikator, tingkat kematian anak di bawah umur lima tahun (angka kematian bayi dan anak balita) merupakan indikator yang berpengaruh terhadap perubahan sosial ekonomi keluarga dan kemajuan di bidang kesehatan.
Menurut data, pada 2004 diperkirakan 1293.7 juta anak di bawah lima tahun di Asia meninggal karena penyakit yang dapat dicegah dengan vaksin. Kira-kira 6300 kasus kematian ini disebabkan oleh penyakit Hepatitis B, Campak, Polio, dan penyakit lainnya yang dapat dicegah dengan imunisasi. Cakupan imunisasi yang rendak tentu akan berpengaruh pada bidang kesehatan dan membahayakan ibu dan anak. Negara Afganistan menyumbang sekitar 8.70% kematian anak di bawah lima tahun di Asia pada tahun 2004 dengan 3.16% kasus Hepatis B, 0.8% kasus Campak, dan 2.15% kasus polio. Kondisi tersebut tentu memiliki hubungan yang erat dengan faktor lingkungan. Faktor lingkungan meliputi lingkungan fisik, biologi, sosial budaya , dan ekonomi ynag berkontribusi pada tingginya kematian anak di bawah lima tahun di Asia pada tahun 2004.
Untuk mengetahui tingkat kematian serta pengaruhnya pada masa yang akan data, perlu dilakukan analisis faktor yang mempengaruhi kematian anak di bawah lima tahun. Data utama dalam analisis ini mengacu pada data kematian anak di bawah lima tahun di Asia tahun 2004, data Hepatitis B, Campak, dan Polio. Manfaat dilakukannya analisis ini sebagai acuan bagi pemerintah pada tiap negara di Asia untuk meningkatkan kelangsungan hidup anak. Analisis ini dilakukan dengan menggunakan regresi linear berganda, dimana data kematian anak di bawah lima tahun sebagai variabel dependen, data Hepatitis B, Campak, dan Polio sebagai variabel Independen. Tujuan analisis ini untuk memahami hubungan antar variabel independen dan variabel dependen serta memprediksi atau menjelaskan perubahan variabel dependen berdasarkan variabel independen yang terkait.
Sebelum melanjutkan ke tahap berikutnya, siapkan terlebih dahulu Library yang akan digunakan.
library(readxl)
library(dplyr)
library(lmtest)
library(car)
library(ggplot2)
Analisis faktor-faktor yang mempengaruhi kematian anak di bawah lima tahun menggunakan data yang berisi tentang Hepatitis B, Campak, dan Polio dari 27 negara Asia dalam periode 2004 dengan format xlsx.
Data_SIM <- read_excel(path = "C:/Users/finan/OneDrive/Dokumen/Syafina/SMT 4/SIM/DATA CM.xlsx")
Data_SIM
## # A tibble: 2,864 × 22
## No Country Region Year Infan…¹ Under…² Adult…³ Alcoh…⁴ Hepat…⁵ Measles
## <dbl> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 Turkiye Middl… 2015 11.1 13 106. 1.32 97 65
## 2 2 Spain Europ… 2015 2.7 3.3 57.9 10.4 97 94
## 3 3 India Asia 2007 51.5 67.9 201. 1.57 60 35
## 4 4 Guyana South… 2006 32.8 40.5 222. 5.68 93 74
## 5 5 Israel Middl… 2012 3.4 4.3 58.0 2.89 97 89
## 6 6 Costa Rica Centr… 2006 9.8 11.2 95.2 4.19 88 86
## 7 7 Russian F… Rest … 2015 6.6 8.2 223 8.06 97 97
## 8 8 Hungary Europ… 2000 8.7 10.1 193. 12.2 88 99
## 9 9 Jordan Middl… 2001 22 26.1 130. 0.52 97 87
## 10 10 Moldova Rest … 2008 15.3 17.8 218. 7.72 97 92
## # … with 2,854 more rows, 12 more variables: BMI <dbl>, Polio <dbl>,
## # Diphtheria <dbl>, Incidents_HIV <dbl>, GDP_per_capita <dbl>,
## # Population_mln <dbl>, Thinness_ten_nineteen_years <dbl>,
## # Thinness_five_nine_years <dbl>, Schooling <dbl>,
## # Economy_status_Developed <dbl>, Economy_status_Developing <dbl>,
## # Life_expectancy <dbl>, and abbreviated variable names ¹Infant_deaths,
## # ²Under_five_deaths, ³Adult_mortality, ⁴Alcohol_consumption, ⁵Hepatitis_B
#Mengambil Data di Asia tahun 2004
data_filter <- filter(Data_SIM, Region == "Asia" & Year == 2004)%>%
select(Under_five_deaths, Hepatitis_B, Measles, Polio)
data_filter
## # A tibble: 27 × 4
## Under_five_deaths Hepatitis_B Measles Polio
## <dbl> <dbl> <dbl> <dbl>
## 1 3.9 83 87 97
## 2 55.6 50 67 78
## 3 18 96 95 98
## 4 68.3 75 63 88
## 5 49.6 64 29 79
## 6 90.8 45 65 46
## 7 70.7 84 48 86
## 8 113. 67 16 50
## 9 8.3 94 91 95
## 10 46.8 99 99 99
## # … with 17 more rows
Regresi merupakan sebuah metode statistik yang dipakai unntuk memperkirakan hubungan antara sebuah variabel terikan dan satu variabel independen atau lebih. Analisis regresi memiliki beberapa variasi, yakni linear sederhana, linear ganda, dan nonlinear. Model yang paling umum ialah regresi linear sederhana dan linear ganda. Sementara itu, nonlinear biasa dipakaiuntuk kelompok data yang lebih kompleks karena hubungan antar variabel tidak sejalan. Pada analisis ini, digunakan analisis linear berganda. Regresi linear bergenda pada dasarnya hampir sama dnegan model linear sederhana, tetapi jumlah variabel independennya lebih dari satu. Berikut representasi matematis dari model regresi linear berganda:
\[Y = \beta_0 + \beta_1X_1 + \beta_2X_2 +...+\beta_pX_p + \epsilon\]
Catatan
Y = Variabel Dependen
X1, X2, X3 = Variabel Independen
β0 = Konstanta
β1, β2, β3= Koefisien Regresi
€ = Error atau residu
RE <- lm(Under_five_deaths~ Hepatitis_B + Measles + Polio, data = data_filter)
RE
##
## Call:
## lm(formula = Under_five_deaths ~ Hepatitis_B + Measles + Polio,
## data = data_filter)
##
## Coefficients:
## (Intercept) Hepatitis_B Measles Polio
## 166.02322 0.08538 -0.25076 -1.24229
summary(RE)
##
## Call:
## lm(formula = Under_five_deaths ~ Hepatitis_B + Measles + Polio,
## data = data_filter)
##
## Residuals:
## Min 1Q Median 3Q Max
## -28.958 -14.355 1.908 17.207 37.447
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 166.02322 23.55275 7.049 3.5e-07 ***
## Hepatitis_B 0.08538 0.26812 0.318 0.75301
## Measles -0.25076 0.20051 -1.251 0.22365
## Polio -1.24229 0.39265 -3.164 0.00434 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 19.99 on 23 degrees of freedom
## Multiple R-squared: 0.585, Adjusted R-squared: 0.5309
## F-statistic: 10.81 on 3 and 23 DF, p-value: 0.0001257
Interpretasi :
Dari hasil perhitungan regresi tersebut diperoleh nilai intercept Y sebesar 166.02322 dengan signifikansi sebesar 3.5e-07. Sementara variabel indpenden Hepatitis B (X1) memiliki p-value sebesar 0.75301, Campak (X2) sebesar 0.22365, dan Polio (X3) sebesar 0.00434. Koefisien determinasi Multiple R-Squared bernilai 0.585 dan Adjusted R-Squared sebesar 0.5309, yang artinya sekitar 53.09% dari variasi kematian anak di bawah lima tahun di Asia tahun 2004 dapat dijelaskan oleh model regresi ini, dan 46.91% dijelaskan oleh variabel lain yang tidak masuk dalam model.
Model regresi yang dihasilkan:
Y = 166.02322 + 0.08538X1 - 0.25076X2 - 1.24229X3
Interpretasi Model :
Nilai intercept yang didapat adalah 166.02322. Hal ini menunjukkan bahwa jika semua variabel independent (Hepatitis B, Campak, dan Polio) bernilai nol, maka kematian anka di bawah lima tahun di Asia tahun 2004 diperkirakan mencapai 166.02322%
Koefisien X1 atau variabel hepatitis B adalah 0.8538. Ini menunjukkan bahwa tiap peningkatan satu kasus dalam hepatitis B, diperkirakan akan meningkatkan kematian anak di bawah lima tahun di Asia tahun 2004 sebesar 0.08538%
Koefisien X2 atau variabel campak adalah -0.25076 Ini menunjukkan bahwa tiap peningkatan satu kasus dalam campak, diperkirakan akan menurunkan kematian anak di bawah lima tahun di Asia tahun 2004 sebesar 0.25076%
Koefisien X3 atau variabel polio adalah -1.24229. Ini menunjukkan bahwa tiap peningkatan satu kasus dalam polio, diperkirakan akan menurunkan kematian anak di bawah lima tahun di Asia tahun 2004 sebesar 1.24229%
summary(RE)
##
## Call:
## lm(formula = Under_five_deaths ~ Hepatitis_B + Measles + Polio,
## data = data_filter)
##
## Residuals:
## Min 1Q Median 3Q Max
## -28.958 -14.355 1.908 17.207 37.447
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 166.02322 23.55275 7.049 3.5e-07 ***
## Hepatitis_B 0.08538 0.26812 0.318 0.75301
## Measles -0.25076 0.20051 -1.251 0.22365
## Polio -1.24229 0.39265 -3.164 0.00434 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 19.99 on 23 degrees of freedom
## Multiple R-squared: 0.585, Adjusted R-squared: 0.5309
## F-statistic: 10.81 on 3 and 23 DF, p-value: 0.0001257
Koefisien determinasi yang dilambangkan dengan R^2 ( R kuadrat ) merupakan statistik yang mengukur goodness of fit suatu model regresi. Koefisien determinasi menunjukkan seberapa cocok suatu model regresi dengan kumpulan data, yaitu menunjukkan persentase yang dijelaskan oleh model regresi. Oleh karena itu, semakin tinggi koefisien determinasi maka semakin baik model regresinya.
Koefisien determinasi sama dengan satu dikurangi perbandingan antara varians sisa dan varians variabel terikat. Koefisien determinasi juga dapat dihitung dengan mengurangkan sisa jumlah kuadrat dengan mengurangkan satu dikurangi jumlah kuadrat. Nilai koefisien determinasi bisa berkisar antara 0 sampai 1, namun biasanya dinyatakan dalam persentase, sehingga minimumnya adalah 0% dan maksimumnya adalah 100%.
Namun ketika membandingkan dua model regresi, model dengan koefisien regresi yang lebih tinggi tidak selalu lebih baik. Misalnya, suatu model regresi mungkin memiliki koefisien regresi R 2 = 100% karena banyak variabel penjelas yang ditambahkan ke dalam model sehingga dapat menjelaskan semua observasi dengan sempurna. Namun model ini tentunya memberikan prediksi yang sangat buruk untuk nilai baru yang tidak digunakan untuk membangun model regresi.
Berdasarkan output summary model diatas, diketahui nilai koefisien determinasi atau R square adalah sebesar 0.7558. Nilai R square ini berasal dari pengkuadratan nilai koefisien korelasi atau ’R’nya. Besarnya angka koefisien determinasi (R square) adalah 0.7558 atau 75.58%. Artinya, variabel X1(Hepatitis B), X2 (Campak), dan X3(Polio) secara simultan (bersama-sama) berpengaruh sebanyak 75.58% terhadap variabel Y (kematian anak di bawah lima tahun di Asia tahun 2004). Sementara sebanyak 24.42% dipengaruhi oleh variabel lain diluar persamaan model regresi ini.
Uji F bertujuan untuk mencari apakah variabel independen secara bersama-sama (simultan) mempengaruhi variabel dependen. Uji F dilakukan untuk melihat pengaruh dari seluruh variabel independen secara bersama-sama terhadap variabel dependen. Tingkat signifikansi yang digunakan adalah sebesar 0.5 atau 5%, jika nilai signifikan F < 0.05 maka dapat diartikan bahwa variabel independen secara simultan mempengaruhi variabel dependen ataupun sebaliknya (Ghozali, 2016)
Hipotesis
H0 : β0 = β1 = β2 = β3 = 0 (X1, X2, dan X3 secara simultan tidak berpengaruh signifikan terhadap model)
H1 : β0 ≠ 0 atau βi ≠ 0 ; i = 1,2, 3 (Paling tidak terdapat 1 variabel βi yang tidak sama dengan 0 atauberpengaruh signifikan terhadap model)
Taraf Signifikansi
α = 0.05
Daerah kritis
H0 ditolak jika p-value < α = 0,05 atau F-value > F tabel(α;k;n-k-1) = Ftabel = 2,98
Statistik Uji
summary(RE)
##
## Call:
## lm(formula = Under_five_deaths ~ Hepatitis_B + Measles + Polio,
## data = data_filter)
##
## Residuals:
## Min 1Q Median 3Q Max
## -28.958 -14.355 1.908 17.207 37.447
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 166.02322 23.55275 7.049 3.5e-07 ***
## Hepatitis_B 0.08538 0.26812 0.318 0.75301
## Measles -0.25076 0.20051 -1.251 0.22365
## Polio -1.24229 0.39265 -3.164 0.00434 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 19.99 on 23 degrees of freedom
## Multiple R-squared: 0.585, Adjusted R-squared: 0.5309
## F-statistic: 10.81 on 3 and 23 DF, p-value: 0.0001257
Kesimpulan
Karena didapatkan F value sebesar 30.93 > 2.98 (F tabel) atau p-value sebesar 9.896e-09 < 0.05 maka H0 ditolak, yang artinya setidaknya terdapat satu variabel independen yang mempengaruhi variabel dependen secara signifikan.
Uji T digunakana untuk menguji koefisien regresi secara parsial dari variabel independen terhadap variabel dependen, yaitu untuk melihat bagaimana pengarurh variabel Hepatitis B, Campak, dan Polio terhadap kematian anak di bawah lima tahun di Asia tahun 2004.
Hipotesis
H0 : βi = 0; i = 1, 2, 3 (Variabel Xi tidak berpengaruh signifikan terhadap model)
H1 : βi ≠ 0; i= 1, 2, 3 (Variabel nXi berpengaruh signifikan terhadap model)
Taraf Signifikansi
α = 0.05
Daerah Kritis
H0 ditolak jika p-value < α = 0.05
Statistik Uji
summary(RE)
##
## Call:
## lm(formula = Under_five_deaths ~ Hepatitis_B + Measles + Polio,
## data = data_filter)
##
## Residuals:
## Min 1Q Median 3Q Max
## -28.958 -14.355 1.908 17.207 37.447
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 166.02322 23.55275 7.049 3.5e-07 ***
## Hepatitis_B 0.08538 0.26812 0.318 0.75301
## Measles -0.25076 0.20051 -1.251 0.22365
## Polio -1.24229 0.39265 -3.164 0.00434 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 19.99 on 23 degrees of freedom
## Multiple R-squared: 0.585, Adjusted R-squared: 0.5309
## F-statistic: 10.81 on 3 and 23 DF, p-value: 0.0001257
Kesimpulan X1 : didapatkan p-value sebesar 0.010609 < 0.05, maka H0 ditolak. Artinya, variabel X1 atau Hepatitis B berpengaruh signifikan terhadap model Y atau kematian anak di bawah lima tahun di Asia tahun 2004.
X2 : didapatkan p-value sebesar 2.96e-05 < 0.05, maka H0 ditolak. Artinya, variabel X2 atau Campak berpengaruh signifikan terhadap model Y atau kematian anak di bawah lima tahun di Asia tahun 2004.
X3 : didapatkan p-value sebesar 0.002786 < 0.05, maka H0 ditolak. Artinya, variabel X3 atau polio berpengaruh signifikan terhadap model Y atau kematian anak di bawah lima tahun di Asia tahun 2004.
Uji asumsi pada dasarnya merupakan salah satu uji yang digunakan sebagai syarat statistik. Uji asumsi harus dipenuhi pada analisis linear berganda serta tidak pada regresi linear sederhana. Melakukan uji asumsi sebelum melakukan uji hipotesis dianggap sebagai salah satu syarat yang harus dilakukan pada penelitian kuantitatif. Jika hasil dari uji asumsi tidak sesuai dengan hipotesis, maka akan timbul bermacam-macam reaksi. Oleh karena itu, melakukan uji asumsi terlebih dahulu adalah hal yang penting dalam penelitian kuantitatif.
Uji normalitas ialah sebuah uji yang bertujuan untuk melihat apakah nilai residu dari model regresi berdistribusi normal atau tidak. Model regresi yang baik adalah model yang memiliki residu dan berdistribusi secara normal. Uji normalitas tidak perlu dilakukan pada tiap variabel yang ada, namun hanya untuk nilai-nilai residu saja. Uji normalitas dapat dilakukan dengan P-Plot, histogram, chi-Square, kurtosis, skewness, dan kolmogorov smirnos. Meskipun memiliki banyak metode, uji normalitas tidak memiliki metode terbaik atau modle yang paling tepat.
Apabila ditemukan residu tidak normal akan tetap tetapi dekat dengan nilai kritis, maka metode lain pun dapat digunakan untuk memberikan justifikasi normal. Apabila jauh dari nilai normal, maka dapat dilakukan penggubahan data, menambahkan data observasi serta memangkas outlier. Transformasi pun dapat dilakukan dalam bentuk akar kuadrat, logaritma natural, inverses dan lainnya bergantung pada normal kurva apakah ke arah kanan, kiri atau tengah dan lainnya.
Hipotesis
H0 : Residu data berdistribusi normal
H1 : Residu data tidak berdistribusi normal
Taraf Signifikansi
α = 0.05
Daerah Kritis
H0 ditolak jika p-value < α = 0.05
Statistik Uji
# Histogram
ggplot(data.frame(Residual=resid(RE)), aes(x=Residual)) +
geom_histogram(binwidth=0.5, fill="pink", color="lightblue") +
labs(x = "Residual", y = "Count", title = "Histogram of Residuals")
#QQ Plot
qqnorm(resid(RE))
qqline(resid(RE))
#Uji Normalitas residual
shapiro.test((RE$residuals))
##
## Shapiro-Wilk normality test
##
## data: (RE$residuals)
## W = 0.94853, p-value = 0.1974
Kesimpulan
Berdasarkan hasil output, didapatkan p-value sebesar 0.1974 > 0.05, maka H0 gagal ditolak. Artinya, residu data berdistribusi normal.
Jenis uji asumsi yang kedua ialah uji multikolinearitas yang dirancang guna menentukan apakah ada korelasi tinggi antara variabel independen dengan model regresi linier ganda, apabila ada korelasi tinggi antara variabel independen hubungan dengan variabel independen serta variabel dependen terganggu.
Alat statistik umumnya akan digunakan untuk dapat menguji dari gangguan multikolinieritas, alat yang dimaksud ialah variance inflation factor atau IVD, korelasi pearson antara variabel independen maupun pertimbangan dari nilai eigen serta indeks kondisi.
Hipotesis
H0 : Tidak terjadi gejala multikolinearitas pada data
H1 : Terjadi multikolinearitas pada data
Taraf Signifikansi
α = 0.05
Daerah kritis
H0 ditolak jika VIF > 10
Statistik Uji
viff<- vif(RE)
viff
## Hepatitis_B Measles Polio
## 1.906206 1.825235 2.254778
plot(viff, type = "bar", main = "VIF Plot")
Kesimpulan
Berdasarkan hasil output, didapatkan semua nilai VIF < 10. Maka, H0 ditolak dan tidak terjadi gejala multikolinearitas pada data.
Pada uji heteroskedastisitas, peneliti dapat memeriksa apakah terdapat perbedaan yang tidak sama antara residu satu dengan pengamatan lainnya. Salah satu model dari regresi adalah model yang memenuhi syarat bahwa ada kesamaan pada varian antara residu satu dengan pengamatan dan lainnya yang disebut pula dengan homoskedastisitas.
Bukti dari heteroskedastisitas dapat dibuat melalui penggunaan metode scatterplot dengan memplot nilai prediktif atau zpred dengan nilai sisa atau sresid. Model yang baik adalah model ketika grafik tidak mengandung pola-pola tertentu, seperti berkumpul di tengah, memperbesar, menyempit maupun memperkecil, tes glejser, tes wei maupun tes park dapat digunakan pula sebagai tes statistik.
Ada beberapa solusi alternatif yang dapat digunakan apabila model tersebut melanggar asumsi dari heteroskedastisitas adalah dengan mengubah menjadi bentuk-bentuk logaritmik. Solusi alternatif tersebut dapat dilakukan apabila seluruh data positif atau seluruh variabel dapat dibagi dengan variabel lainnya yang mengalami gangguan serupa yaitu gangguan heteroskedastisitas.
Hipotesis
H0 : Variansi sisaan bersifat homogen
H1 : Variansi sisaan tidak bersifat homogen
Taraf Signifikansi
α = 0.05
Daerah kritis
H0 ditolak jika pvalue < α = 0.05
Statistik Uji
#Grafik
plot(RE, which = 1)
bp <- bptest(RE)
bp
##
## studentized Breusch-Pagan test
##
## data: RE
## BP = 2.9771, df = 3, p-value = 0.3952
Kesimpulan
Berdasarkan hasil output, didapatkan pvalue sebesar 0.3952 maka H0 diterima. Artinya, variansi sisaan bersifat homogen.
Uji autokorelasi merupakan uji yang dilakukan untuk dapat melihat apakah terjadi korelasi di antara suatu periode dengan periode-periode sebelumnya. Sederhananya, uji autokorelasi merupakan analisis dari regresi yang terdiri dari pengujian pengaruh variabel independen pada variabel dependen, sehingga tidak boleh terjadi korelasi di antara pengamatan serta data observasi sebelumnya.
Ada beberapa cara yang dapat dilakukan untuk mengatasi masalah pada autokorelasi, salah satunya adalah dengan melakukan pengubahan data atau melakukan perubahan model regresi menjadi persamaan serta perbedaan secara umum. Selain itu, dapat pula dilakukan dengan cara memasukan salah satu variabel lag serta variabel lain yang masih berkaitan menjadi salah satu variabel bebas, sehingga pada akhirnya data observasi pun akan berkurang satu.
Hipotesis
H0 : Tidak terjadi autokorelasi pada data
H1 : Terjadi autokorelasi pada data
Taraf Signifikansi
α = 0.05
Daerah kritis
H0 ditolak jika pvalue < α = 0.05
Statistik Uji
dw <- dwtest(RE)
dw
##
## Durbin-Watson test
##
## data: RE
## DW = 2.5293, p-value = 0.9302
## alternative hypothesis: true autocorrelation is greater than 0
Kesimpulan
Berdasarkan hasil output, didapatkan pvalue sebesar 0.9302 > α = 0.05 maka H0 diterima. Artinya, tidak terjadi autokorelasi pada data
Sebuah data dianggap memiliki pencilan apabila nilai DFFITS dari beberapa observasi melebihi batas kritis yang telah ditentukan. Cara menentukan batas :
|DFFITS| > 2√((k+1)/n)
2√((3+1)/27)
= 0.7698
nilai.pembanding.dffits = 2*(sqrt(4/27))
nilai.pembanding.dffits
## [1] 0.7698004
dffits(RE)
## 1 2 3 4 5 6
## -0.37369540 -0.02102154 -0.15730073 0.24509119 -0.38070436 -0.35830219
## 7 8 9 10 11 12
## 0.28960151 0.33770884 -0.34951002 0.33496124 -1.24205335 0.29061398
## 13 14 15 16 17 18
## 0.21531244 0.09369903 0.57980088 -0.33408765 -0.44835352 0.29039719
## 19 20 21 22 23 24
## -0.22566291 0.10469381 0.56533562 0.37605634 -0.22064086 0.36738298
## 25 26 27
## -0.19899861 -0.48719843 0.05487498
Terdapat pencilan pada data ke-11.
Berdasarkan hasil analisis regresi mengenai data kematian anak di bawah lima tahun di Asia pada tahun 2004, dapat ditarik kesimpulan sebagai berikut :
Data yang digunakan adalah data kematian anak di bawah lima di Asia pada tahun 2004 sebagai variabel dependen. Sementara variabel independennya adalah data hepatitis B, Campak, dan Polio.
Dari hasil analisis didapatkan model regresi linear berganda untuk kematian anak di bawah lima di Asia pada tahun 2004 adalah \[Y = 166.02322 + 0.08538X1 - 0.25076X2 - 1.24229X3\]
Setelah dilakukan uji T dan Uji F, semua variabel independen berpengaruh secara signifikan terhadap variabel dependen.
Melalui pengujian asumsi, didapatkan bahwa residu berdistribusi normal, variansi sisaan bersifat homogen, tidak terdapat autokorelasi antarvariabel, dan tidak terjadi multikolinearitas.
Terdapat pencilan pada data ke-11 yaitu -1.24205335, dimana nilai pembandingnya sebesar 0.7698004.
Berdasarkan model regresi didapatkan Rsquared sebesar 0,7758. Artinya sebanyak 75,58% variabel dependen mampu dijelaskan oleh variabel independen. Sementara sebanyak 24.42% dipengaruhi oleh variabel lain diluar persamaan model regresi inii.
Model regresi linear berganda ini cukup kuat dalam menjelaskan varibel dependen kematian anak di bawah lima tahun di Asia apada tahun 2004 dengan tiga variabel independent yaitu data hepatitis B, Campak, dan Polio.