ANALISIS STATISTIK DESKRIPTIF DAN RANK KENDALL TAU DATA KEMATIAN GLOBAL TAHUN 2002
Analisis statistika deskriptif bertujuan untuk memberikan ringkasan dan pemahaman awal tentang karakteristik data yang diamati. Statistik deskriptif membantu menggambarkan dan meringkas data secara numerik, sehingga memudahkan dalam memahami distribusi data, nilai-nilai tengah, dan variasi data. Analisis statistika deskriptif sering digunakan sebagai langkah pertama dalam menjelajahi data sebelum melanjutkan ke analisis lebih lanjut.
Uji Kendall Tau juga dikenal sebagai korelasi tau-b Kendall, adalah metode statistik yang digunakan untuk menguji hubungan antara dua variabel ordinal. Metode ini mengukur tingkat kesepakatan atau keseragaman peringkat antara kedua variabel tersebut.Uji Kendall Tau bekerja dengan membandingkan peringkat relatif dari pasangan pengamatan pada kedua variabel. Pasangan pengamatan terdiri dari nilai-nilai ordinal yang terkait antara dua variabel. Misalnya, jika Anda memiliki dua variabel X dan Y, setiap pasangan pengamatan terdiri dari nilai X dan Y yang sesuai.
Load Libraries
{r}
library(readxl)
library(dplyr)
library(ggplot2)
library(markdown)
library(Kendall)
Input dan Filter Data
Pada proses ini, dilakukan pengambilan data yang akan digunakan dari komputer. Selain itu, dilakukan filter data, yaitu pemilihan tahun dari data yang akan digunakan untuk analisis. Tahun dapat diinputkan dari 2000 sampai 2015. Pengguna dapat menyesuaikan tahun yang ingin dipilih dengan cara menuliskannya pada filter(Year == ““). Berikut merupakan variabel-variabel yang akan digunakan dalam analisis ini:
{r}
data_case_method <- read_excel("SIM UHUY/RMarkdown/data_case_method.xlsx")
View(data_case_method)
library(readxl)
library(dplyr)
filtered_data <- filter(data_case_method, Year == 2002)
Statistik Deskriptif
Pada tahap ini dilakukan analisis statistik deskriptif lima angka untuk memberikan gambaran tentang data Kematian Global tahun 2002 - 2004 yang digunakan dalam analisis ini.
{r}
summary_stats <- summary(filtered_data)
summary_stats
Korelasi Rank Kendall Data dan Scatter Plotnya
Korelasi Rank Kendall Variabel Infant Death dan Adult Mortality
{r}
cor_result1 <- cor(filtered_data$Infant_deaths, filtered_data$Adult_mortality, method = "kendall")
cor_result1
Karena nilai korelasi rank kendall variabel Infant Death dan Adult Mortality tahun 2002 adalah 0.6589 maka kedua variabel memiliki korelasi positif yang kuat.
{r}
ggplot(filtered_data, aes(x = Infant_deaths, y = Adult_mortality)) +
geom_point() +
labs(x = "Infant_deaths", y = "Adult_mortality", title = "Scatter Plot 1")
Korelasi Rank Kendall Tau Variabel Under Five Deaths dan Adult Mortality
{r}
cor_result2 <- cor(filtered_data$Under_five_deaths, filtered_data$Adult_mortality, method = "kendall")
cor_result2
Karena nilai korelasi rank kendall variabel Under Five Deaths dan Adult Mortality tahun 2002 adalah 0.673 maka kedua variabel memiliki korelasi positif yang kuat.
{r}
ggplot(filtered_data, aes(x = Under_five_deaths, y = Adult_mortality)) +
geom_point() +
labs(x = "Under_five_deaths", y = "Adult_mortality", title = "Scatter Plot 2")
Korelasi Rank kendall Variabel Under Five Deaths dan Adult Mortality
{r}
cor_result3 <- cor(filtered_data$Incidents_HIV, filtered_data$Adult_mortality, method = "kendall")
cor_result3
Karena nilai korelasi rank kendall variabel Incidents HIV dan Adult Mortality tahun 2002 adalah 0.492 maka kedua variabel memiliki korelasi positif yang cukup kuat.
{r}
ggplot(filtered_data, aes(x = Incidents_HIV, y = Adult_mortality)) +
geom_point() +
labs(x = "Incidents_HIV", y = "Adult_mortality", title = "Scatter Plot 3")