ANALISIS STATISTIK DESKRIPTIF DAN RANK SPEARMAN DATA KEMATIAN GLOBAL TAHUN 2000-2015


Analisis statistika deskriptif bertujuan untuk memberikan ringkasan dan pemahaman awal tentang karakteristik data yang diamati. Statistik deskriptif membantu menggambarkan dan meringkas data secara numerik, sehingga memudahkan dalam memahami distribusi data, nilai-nilai tengah, dan variasi data. Analisis statistika deskriptif sering digunakan sebagai langkah pertama dalam menjelajahi data sebelum melanjutkan ke analisis lebih lanjut.

Uji rank Spearman adalah metode statistik nonparametrik yang digunakan untuk menguji apakah ada hubungan monotone antara dua variabel. Uji ini didasarkan pada peringkat (ranking) data, bukan pada nilai aktualnya. Uji Spearman cocok digunakan ketika hubungan antara variabel tidak memenuhi asumsi linieritas dalam analisis korelasi Pearson. Uji ini menghitung koefisien korelasi ranK (rank correlation coefficient) yang mengukur kekuatan dan arah hubungan antara variabel. Selain itu, uji Spearman juga menghasilkan p-value untuk mengevaluasi signifikansi statistik dari koefisien korelasi.

Load Libraries

{r}
library(readxl)
library(dplyr)
library(ggplot2)
library(markdown)
library(psych)


Input dan Filter Data

Pada proses ini, dilakukan pengambilan data yang akan digunakan dari komputer. Selain itu, dilakukan filter data, yaitu pemilihan tahun dari data yang akan digunakan untuk analisis. Tahun dapat diinputkan dari 2000 sampai 2015. Pengguna dapat menyesuaikan tahun yang ingin dipilih dengan cara menuliskannya pada filter(Year == ““). Berikut merupakan variabel-variabel yang akan digunakan dalam analisis ini:

  {r}  
 data <- readxl::read_excel("C:\\Users\\ACER\\Downloads\\datamarkdown.xlsx")
  
 filtered_data <- data %>%
    filter(Year == 2000) %>%
  print
  
  

Statistik Deskriptif

Pada tahap ini dilakukan analisis statistik deskriptif lima angka untuk memberikan gambaran tentang data Kematian Global tahun 2000 sampai 2015 yang digunakan dalam analisis ini.

    {r}
  summary_stats <- summary(filtered_data)
  summary_stats      
  


Korelasi Rank Spearman Data dan Scatter Plotnya

Korelasi Rank Spearman Variabel Infant Death dan Adult Mortality

  {r}
  cor_result1 <- cor(filtered_data$Infant_deaths, filtered_data$Adult_mortality, method = "spearman")
  cor_result1

Karena nilai korelasi rank spearman variabel Infant Death dan Adult Mortality tahun 2000 adalah 0.634 maka kedua variabel memiliki korelasi positif yang cukup kuat.

  {r}
  ggplot(filtered_data, aes(x = Infant_deaths, y = Adult_mortality)) +
     geom_point() +
     labs(x = "Infant_deaths", y = "Adult_mortality", title = "Scatter Plot 1")
    

Korelasi Rank Spearman Variabel Under Five Deaths dan Adult Mortality

  {r}
  cor_result2 <- cor(filtered_data$Under_five_deaths, filtered_data$Adult_mortality, method = "spearman")
  cor_result2

Karena nilai korelasi rank spearman variabel Under Five Deaths dan Adult Mortality tahun 2000 adalah 0.866 maka kedua variabel memiliki korelasi positif yang cukup kuat.

  {r}
  ggplot(filtered_data, aes(x = Under_five_deaths, y = Adult_mortality)) +
     geom_point() +
     labs(x = "Under_five_deaths", y = "Adult_mortality", title = "Scatter Plot 2")
    

Korelasi Rank Spearman Variabel Under Five Deaths dan Adult Mortality

  {r}
  cor_result3 <- cor(filtered_data$Incidents_HIV, filtered_data$Adult_mortality, method = "spearman")
  cor_result3

Karena nilai korelasi rank spearman variabel Incidents HIV dan Adult Mortality tahun 2000 adalah 0.634 maka kedua variabel memiliki korelasi positif yang cukup kuat.

  {r}
  ggplot(filtered_data, aes(x = Incidents_HIV, y = Adult_mortality)) +
     geom_point() +
     labs(x = "Incidents_HIV", y = "Adult_mortality", title = "Scatter Plot 3")