ANALISIS STATISTIK DESKRIPTIF DAN RANK KENDALL TAU DATA KEMATIAN GLOBAL TAHUN 2002


Analisis statistika deskriptif bertujuan untuk memberikan ringkasan dan pemahaman awal tentang karakteristik data yang diamati. Statistik deskriptif membantu menggambarkan dan meringkas data secara numerik, sehingga memudahkan dalam memahami distribusi data, nilai-nilai tengah, dan variasi data. Analisis statistika deskriptif sering digunakan sebagai langkah pertama dalam menjelajahi data sebelum melanjutkan ke analisis lebih lanjut.

Uji Kendall Tau juga dikenal sebagai korelasi tau-b Kendall, adalah metode statistik yang digunakan untuk menguji hubungan antara dua variabel ordinal. Metode ini mengukur tingkat kesepakatan atau keseragaman peringkat antara kedua variabel tersebut.Uji Kendall Tau bekerja dengan membandingkan peringkat relatif dari pasangan pengamatan pada kedua variabel. Pasangan pengamatan terdiri dari nilai-nilai ordinal yang terkait antara dua variabel. Misalnya, jika Anda memiliki dua variabel X dan Y, setiap pasangan pengamatan terdiri dari nilai X dan Y yang sesuai.

Load Libraries

{r}
library(readxl)
library(dplyr)
library(ggplot2)
library(markdown)
library(Kendall)


Input dan Filter Data

Pada proses ini, dilakukan pengambilan data yang akan digunakan dari komputer. Selain itu, dilakukan filter data, yaitu pemilihan tahun dari data yang akan digunakan untuk analisis. Tahun dapat diinputkan dari 2000 sampai 2015. Pengguna dapat menyesuaikan tahun yang ingin dipilih dengan cara menuliskannya pada filter(Year == ““). Berikut merupakan variabel-variabel yang akan digunakan dalam analisis ini:

{r}
 data_case_method <- read_excel("SIM UHUY/RMarkdown/data_case_method.xlsx")
 View(data_case_method)
 library(readxl)

library(dplyr)
filtered_data <- filter(data_case_method, Year == 2002)

Statistik Deskriptif

Pada tahap ini dilakukan analisis statistik deskriptif lima angka untuk memberikan gambaran tentang data Kematian Global tahun 2002 - 2004 yang digunakan dalam analisis ini.

{r}
  summary_stats <- summary(filtered_data)
  summary_stats      
  

Korelasi Rank Kendall Data dan Scatter Plotnya

Korelasi Rank Kendall Variabel Infant Death dan Adult Mortality

{r}
  cor_result1 <- cor(filtered_data$Infant_deaths, filtered_data$Adult_mortality, method = "kendall")
  cor_result1

Karena nilai korelasi rank kendall variabel Infant Death dan Adult Mortality tahun 2002 adalah 0.6589 maka kedua variabel memiliki korelasi positif yang kuat.

{r}
  ggplot(filtered_data, aes(x = Infant_deaths, y = Adult_mortality)) +
     geom_point() +
     labs(x = "Infant_deaths", y = "Adult_mortality", title = "Scatter Plot 1")
    

Korelasi Rank Kendall Tau Variabel Under Five Deaths dan Adult Mortality

{r}
  cor_result2 <- cor(filtered_data$Under_five_deaths, filtered_data$Adult_mortality, method = "kendall")
  cor_result2

Karena nilai korelasi rank kendall variabel Under Five Deaths dan Adult Mortality tahun 2002 adalah 0.673 maka kedua variabel memiliki korelasi positif yang kuat.

{r}
  ggplot(filtered_data, aes(x = Under_five_deaths, y = Adult_mortality)) +
     geom_point() +
     labs(x = "Under_five_deaths", y = "Adult_mortality", title = "Scatter Plot 2")
    

Korelasi Rank kendall Variabel Under Five Deaths dan Adult Mortality

{r}
  cor_result3 <- cor(filtered_data$Incidents_HIV, filtered_data$Adult_mortality, method = "kendall")
  cor_result3

Karena nilai korelasi rank kendall variabel Incidents HIV dan Adult Mortality tahun 2002 adalah 0.492 maka kedua variabel memiliki korelasi positif yang cukup kuat.

{r}
  ggplot(filtered_data, aes(x = Incidents_HIV, y = Adult_mortality)) +
     geom_point() +
     labs(x = "Incidents_HIV", y = "Adult_mortality", title = "Scatter Plot 3")