ANOVA dua arah membandingkan perbedaan rata-rata antara kelompok yang telah dibagi pada dua variabel independen yang selanjutnya disebut faktor. Anda perlu memiliki dua variabel independen berskala data kategorik dan satu variabel terikat berskala data kuantitatif.

Tujuan dari uji ANOVA dua arah dengan variabel independen Region dan Economy_status_Developed serta variabel dependen Life_expectancy adalah untuk menguji apakah terdapat perbedaan signifikan dalam harapan hidup rata-rata antara wilayah-wilayah yang berbeda dan antara negara maju dan negara berkembang.Dengan menerapkan ANOVA dua arah, Anda dapat mengetahui apakah terdapat efek independen dari wilayah (Region), efek independen dari status ekonomi (Economy_status_Developed), serta interaksi antara kedua faktor tersebut terhadap variabel dependen (Life_expectancy).



Library

Proses yang pertama dilakukan adalah persiapan library yang akan digunakan dalam analisis data menggunakan R. Dengan mempersiapkan library-library ini, kita dapat menggunakan berbagai fungsi dan alat yang diperlukan untuk melakukan analisis data dengan lebih efisien dan efektif.

library(readxl)
library(rmarkdown)
library(dplyr)
library(prettydoc)
library(knitr)
library(psych)
library(stats)
library(DT)


Pemilihan Data

Langkah pertama yang kita lakukan adalah proses pengimporan data dari file Excel ke dalam R. Setelah itu dilakukan Pemilihan data berdasarkan tahun 2015 dan dipilih kolom-kolom yang akan ditampilkan yaitu:

  1. Region : Variabel independen/faktor kategorikal yang menggambarkan wilayah tempat negara tersebut berada.
  2. Economy_status_Developed : Variabel independen/faktor kategorikal yang menunjukkan apakah suatu negara diklasifikasikan sebagai negara maju (developed) atau tidak (developing).
  3. Life_expectancy : Variabel dependen yang menggambarkan harapan hidup rata-rata di berbagai tahun.
# Mengimpor file excel
data <- read_excel("dataset.xlsx")


# Memilih data berdasarkan tahun 2015
data_filter <- data %>%
  filter(Year == 2015) %>%
  select(Region, Economy_status_Developed, Life_expectancy)

# Menampilkan data yang telah terpilih
datatable(
  data_filter,
  options = list(pageLength = 10),
  rownames = FALSE,
  colnames = c("Wilayah", "Status Negara", "Rata-rata Harapan Hidup"),
  class = 'display'
  )


Statistika Deskriptif

Disini dilakukan penghitungan statistika deskriptif untuk variabel dependen yaitu Life_expectancy (Rata-rata Harapan Hidup). Statistika deskriptif ini memberikan gambaran tentang sebaran dan karakteristik data pada variabel tersebut.

desc <- describe(data_filter$Life_expectancy)
desc_filtered <- desc %>%
  select(-trimmed, -mad, -skew, -kurtosis, -se)
knitr::kable(
  desc_filtered,
  "pipe",
  align = "ccccccccc"
  )
vars n mean sd median min max range
X1 1 179 71.46369 7.83227 73 50.9 83.8 32.9

Berdasarkan analisis terhadap variabel X1(Life_expectancy) dengan jumlah observasi sebanyak 179, diperoleh statistik deskriptif sebagai berikut. Rata-rata (mean) sebesar 71.46369 dengan standar deviasi (sd) sebesar 7.83227. Median dari variabel adalah 73, yang menunjukkan nilai tengah dari distribusi data. Nilai minimum (min) pada variabel tersebut adalah 50.9, sedangkan nilai maksimum (max) mencapai 83.8. Rentang (range) data sebesar 32.9, yaitu selisih antara nilai maksimum dan nilai minimum.

Berdasarkan statistik deskriptif tersebut, kita dapat menyimpulkan bahwa pada variabel X1(Life_expectancy) , rata-rata (mean) adalah sekitar 71.46. Standar deviasi (sd) yang relatif kecil, yaitu sekitar 7.83, menunjukkan bahwa sebagian besar nilai dalam data cenderung berada cukup dekat dengan rata-rata. Median yang hampir sama dengan rata-rata menunjukkan bahwa distribusi data X1(Life_expectancy) cukup simetris atau mendekati simetris. Rentang (range) data yang mencapai 32.9 menunjukkan variasi yang cukup besar antara nilai minimum dan nilai maksimum, menandakan adanya perbedaan yang signifikan di dalam data tersebut.



Analisis Data

Kita akan melakukan Uji ANOVA Dua Arah, pastikan untuk memperhatikan asumsi-asumsi yang berkaitan dengan uji ANOVA, seperti asumsi normalitas dan homogenitas varians, serta melihat interpretasi hasilnya dengan mempertimbangkan konteks penelitian Anda. Setelah dilakukan uji asumsi normalitas serta Homogenitas dan hasilnya memenuhi maka dilanjutkan dengan uji ANOVA Dua Arah.

# Melakukan analisis ANOVA dua arah
anova_result <- aov(Life_expectancy ~ Region * Economy_status_Developed, data = data)
summary(anova_result)
##                                   Df Sum Sq Mean Sq F value   Pr(>F)    
## Region                             8 157346   19668  668.86  < 2e-16 ***
## Economy_status_Developed           1  11048   11048  375.71  < 2e-16 ***
## Region:Economy_status_Developed    4   1076     269    9.15 2.42e-07 ***
## Residuals                       2850  83806      29                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Dalam sintaks di atas, variabel dependen Life_expectancy dianalisis terhadap kedua variabel independen Region dan Economy_status_Developed menggunakan fungsi aov(). Interaksi antara kedua variabel independen ditunjukkan dengan tanda asterisk(*). Fungsi summary() digunakan untuk melihat hasil ringkasan analisis ANOVA dua arah.



Kesimpulan

Berdasarkan hasil uji ANOVA yang Anda berikan, kita dapat memberikan interpretasi sebagai berikut:

  1. Variabel Region secara signifikan mempengaruhi variabel dependen Life_expectancy. Nilai p-value yang sangat kecil (< 2e-16) menunjukkan bahwa terdapat perbedaan yang signifikan dalam harapan hidup rata-rata di antara kelompok wilayah. Dalam konteks ini, setidaknya ada satu pasangan kelompok wilayah yang memiliki perbedaan yang signifikan dalam harapan hidup rata-rata.
  2. Variabel Economy_status_Developed juga secara signifikan mempengaruhi variabel dependen Life_expectancy. Nilai p-value yang sangat kecil (< 2e-16) menunjukkan bahwa terdapat perbedaan yang signifikan dalam harapan hidup rata-rata antara negara maju dan negara berkembang. Dalam konteks ini, negara maju memiliki harapan hidup rata-rata yang berbeda secara signifikan dari negara berkembang.
  3. Terdapat interaksi yang signifikan antara variabel Region dan Economy_status_Developed terhadap variabel dependen Life_expectancy. Nilai p-value yang kecil (2.42e-07) menunjukkan bahwa efek dari status ekonomi terhadap harapan hidup rata-rata dapat berbeda di setiap kelompok wilayah. Dengan kata lain, pengaruh status ekonomi terhadap harapan hidup rata-rata memiliki variasi yang signifikan di antara kelompok wilayah yang berbeda.
  4. Bagian Residuals menunjukkan sisa variabilitas yang tidak dijelaskan oleh variabel independen dalam model ANOVA. Sum of Squares (Sum Sq) dan Mean Squares (Mean Sq) pada bagian Residuals mewakili variasi yang tidak dapat dijelaskan oleh faktor-faktor yang telah dimasukkan dalam model.

Dalam kesimpulan, hasil uji ANOVA menunjukkan bahwa variabel Region, Economy_status_Developed, dan interaksi antara keduanya secara signifikan mempengaruhi variabel dependen Life_expectancy. Namun, untuk menafsirkan secara lebih detail mengenai perbedaan dan hubungan antara variabel tersebut, perlu dilakukan analisis lanjutan seperti uji perbandingan kelompok (post-hoc test) atau analisis regresi yang lebih mendalam.