ANOVA dua arah membandingkan perbedaan rata-rata antara kelompok yang telah dibagi pada dua variabel independen yang selanjutnya disebut faktor. Anda perlu memiliki dua variabel independen berskala data kategorik dan satu variabel terikat berskala data kuantitatif.
Tujuan dari uji ANOVA dua arah dengan variabel independen Region dan Economy_status_Developed serta variabel dependen Life_expectancy adalah untuk menguji apakah terdapat perbedaan signifikan dalam harapan hidup rata-rata antara wilayah-wilayah yang berbeda dan antara negara maju dan negara berkembang.Dengan menerapkan ANOVA dua arah, Anda dapat mengetahui apakah terdapat efek independen dari wilayah (Region), efek independen dari status ekonomi (Economy_status_Developed), serta interaksi antara kedua faktor tersebut terhadap variabel dependen (Life_expectancy).
Proses yang pertama dilakukan adalah persiapan library yang akan digunakan dalam analisis data menggunakan R. Dengan mempersiapkan library-library ini, kita dapat menggunakan berbagai fungsi dan alat yang diperlukan untuk melakukan analisis data dengan lebih efisien dan efektif.
library(readxl)
library(rmarkdown)
library(dplyr)
library(prettydoc)
library(knitr)
library(psych)
library(stats)
library(DT)Langkah pertama yang kita lakukan adalah proses pengimporan data dari file Excel ke dalam R. Setelah itu dilakukan Pemilihan data berdasarkan tahun 2015 dan dipilih kolom-kolom yang akan ditampilkan yaitu:
# Mengimpor file excel
data <- read_excel("dataset.xlsx")
# Memilih data berdasarkan tahun 2015
data_filter <- data %>%
filter(Year == 2015) %>%
select(Region, Economy_status_Developed, Life_expectancy)
# Menampilkan data yang telah terpilih
datatable(
data_filter,
options = list(pageLength = 10),
rownames = FALSE,
colnames = c("Wilayah", "Status Negara", "Rata-rata Harapan Hidup"),
class = 'display'
)Disini dilakukan penghitungan statistika deskriptif untuk variabel dependen yaitu Life_expectancy (Rata-rata Harapan Hidup). Statistika deskriptif ini memberikan gambaran tentang sebaran dan karakteristik data pada variabel tersebut.
desc <- describe(data_filter$Life_expectancy)
desc_filtered <- desc %>%
select(-trimmed, -mad, -skew, -kurtosis, -se)
knitr::kable(
desc_filtered,
"pipe",
align = "ccccccccc"
)| vars | n | mean | sd | median | min | max | range | |
|---|---|---|---|---|---|---|---|---|
| X1 | 1 | 179 | 71.46369 | 7.83227 | 73 | 50.9 | 83.8 | 32.9 |
Berdasarkan analisis terhadap variabel X1(Life_expectancy) dengan jumlah observasi sebanyak 179, diperoleh statistik deskriptif sebagai berikut. Rata-rata (mean) sebesar 71.46369 dengan standar deviasi (sd) sebesar 7.83227. Median dari variabel adalah 73, yang menunjukkan nilai tengah dari distribusi data. Nilai minimum (min) pada variabel tersebut adalah 50.9, sedangkan nilai maksimum (max) mencapai 83.8. Rentang (range) data sebesar 32.9, yaitu selisih antara nilai maksimum dan nilai minimum.
Berdasarkan statistik deskriptif tersebut, kita dapat menyimpulkan bahwa pada variabel X1(Life_expectancy) , rata-rata (mean) adalah sekitar 71.46. Standar deviasi (sd) yang relatif kecil, yaitu sekitar 7.83, menunjukkan bahwa sebagian besar nilai dalam data cenderung berada cukup dekat dengan rata-rata. Median yang hampir sama dengan rata-rata menunjukkan bahwa distribusi data X1(Life_expectancy) cukup simetris atau mendekati simetris. Rentang (range) data yang mencapai 32.9 menunjukkan variasi yang cukup besar antara nilai minimum dan nilai maksimum, menandakan adanya perbedaan yang signifikan di dalam data tersebut.
Kita akan melakukan Uji ANOVA Dua Arah, pastikan untuk memperhatikan asumsi-asumsi yang berkaitan dengan uji ANOVA, seperti asumsi normalitas dan homogenitas varians, serta melihat interpretasi hasilnya dengan mempertimbangkan konteks penelitian Anda. Setelah dilakukan uji asumsi normalitas serta Homogenitas dan hasilnya memenuhi maka dilanjutkan dengan uji ANOVA Dua Arah.
# Melakukan analisis ANOVA dua arah
anova_result <- aov(Life_expectancy ~ Region * Economy_status_Developed, data = data)
summary(anova_result)## Df Sum Sq Mean Sq F value Pr(>F)
## Region 8 157346 19668 668.86 < 2e-16 ***
## Economy_status_Developed 1 11048 11048 375.71 < 2e-16 ***
## Region:Economy_status_Developed 4 1076 269 9.15 2.42e-07 ***
## Residuals 2850 83806 29
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Dalam sintaks di atas, variabel dependen Life_expectancy dianalisis terhadap kedua variabel independen Region dan Economy_status_Developed menggunakan fungsi aov(). Interaksi antara kedua variabel independen ditunjukkan dengan tanda asterisk(*). Fungsi summary() digunakan untuk melihat hasil ringkasan analisis ANOVA dua arah.
Berdasarkan hasil uji ANOVA yang Anda berikan, kita dapat memberikan interpretasi sebagai berikut:
Dalam kesimpulan, hasil uji ANOVA menunjukkan bahwa variabel Region, Economy_status_Developed, dan interaksi antara keduanya secara signifikan mempengaruhi variabel dependen Life_expectancy. Namun, untuk menafsirkan secara lebih detail mengenai perbedaan dan hubungan antara variabel tersebut, perlu dilakukan analisis lanjutan seperti uji perbandingan kelompok (post-hoc test) atau analisis regresi yang lebih mendalam.