Uji Mann-Whitney merupakan uji non parametrik yang digunakan untuk mengetahui ada atau tidaknya perbedaan dari dua sampel yang independen, yaitu sampel life expectation (angka harapan hidup) di berbagai negara pada tahun 2000 dan tahun 2015. Nantinya akan diambil kesimpulan apakah ada perbedaan diantara kedua sampel yang berbeda tahun tersebut. Hasil kesimpulan dapat digunakan acuan untuk mempelajari lebih lanjut mengenai faktor-faktor yang memengaruhi Life Expectation (Angka Harapan Hidup), sehingga dapat diambil solusi demi kehidupan masyarakat yang lebih baik.
library(readxl)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.2.3
data <- read_excel("C:/Users/ASUS/Downloads/data_case_method.xlsx", sheet = "Data UAS")
## New names:
## • `No` -> `No...1`
## • `Country` -> `Country...2`
## • `Region` -> `Region...3`
## • `No` -> `No...5`
## • `Country` -> `Country...6`
## • `Region` -> `Region...7`
data
## # A tibble: 179 × 8
## No...1 Country...2 Region...3 Life Expectation tah…¹ No...5 Country...6
## <dbl> <chr> <chr> <dbl> <dbl> <chr>
## 1 8 Hungary European Un… 71.2 1 Turkiye
## 2 69 Afghanistan Asia 55.8 2 Spain
## 3 88 Solomon Islands Oceania 67.4 7 Russian Fe…
## 4 89 Congo Dem. Rep. Africa 50 28 Cameroon
## 5 99 Honduras Central Ame… 70.7 44 Gambia The
## 6 123 Togo Africa 53.5 58 Algeria
## 7 127 Ireland European Un… 76.5 75 Oman
## 8 136 Costa Rica Central Ame… 77.5 102 Madagascar
## 9 148 Malawi Africa 45.1 111 Norway
## 10 172 Zimbabwe Africa 44.6 113 Vietnam
## # ℹ 169 more rows
## # ℹ abbreviated name: ¹`Life Expectation tahun 2000`
## # ℹ 2 more variables: Region...7 <chr>, `Life Expectation tahun 2015` <dbl>
summary(data$'Life Expectation tahun 2000')
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 39.40 58.90 69.70 66.36 73.65 81.10
summary(data$'Life Expectation tahun 2015')
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 50.90 66.30 73.00 71.46 76.85 83.80
result <- wilcox.test(data$'Life Expectation tahun 2000', data$'Life Expectation tahun 2015')
result
##
## Wilcoxon rank sum test with continuity correction
##
## data: data$"Life Expectation tahun 2000" and data$"Life Expectation tahun 2015"
## W = 11415, p-value = 2.556e-06
## alternative hypothesis: true location shift is not equal to 0
df <- data.frame(
Group = c(rep("Life Expectation tahun 2000", length(data$'Life Expectation tahun 2000')), rep("Life Expectation tahun 2015", length(data$'Life Expectation tahun 2015'))),
Value = c(data$'Life Expectation tahun 2000', data$'Life Expectation tahun 2015')
)
ggplot(df, aes(x = Group, y = Value)) +
geom_boxplot() +
labs(x = "Life Expectation", y = "Value") +
ggtitle("Boxplot Life Expectation tahun 2000 dan 2015")
Uji Mann Whitney menggunakan hipotesis sebagai berikut; H0: Tidak ada perbedaan antara Life Expectation (Angka Harapan Hidup) pada tahun 2000 dan tahun 2015; H1: Ada perbedaan antara Life Expectation (Angka Harapan Hidup) pada tahun 2000 dan tahun 2015. Didapatkan nilai p-value=2.55e-06 atau setara dengan 0.00000225 dan <0.05, maka H0 ditolak dan kedua sampel (Life Expectation tahun 2000 dan Life Expectation tahun 2015) terdapat perbedaan yang signifikan.
Jika dilihat dari boxplot, data Life Expectation tahun 2015 cenderung memiliki angka yang lebih besar dibandingkan dengan data Life Expectation tahun 2000. Perbedaan ini tentunya dapat dipengaruhi ole berbagai faktor, diantaranya keadaan lingkungan, ketersediaan pangan, pendidikan, kebijakan pemerintah maupun perekonomian masyarakat dan sebagainya. Oleh karena itu, perlu ada langkah untuk menjaga Life Expectation (Angka Harapan Hidup) demi kehidupan masyarakat yang lebih baik.