This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.

Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.

#Estadistica Descriptiva

#Alexander Sailema

#22/11/2025

library(dplyr)
library(gt)

#Cargar los Datos
datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",
                sep = ",")



#Tablas Cualitativas Nominales

#Water_Source_Type

Tipo_Fuente_Agua<-datos$Water_Source_Type

# Tabla de distribución de frecuencia

TDF_Tipo_Fuente_Agua<-data.frame(table(Tipo_Fuente_Agua))

ni <- TDF_Tipo_Fuente_Agua$Freq
hi <- round((ni / sum(ni)) * 100, 2)
Tipo_Fuente_Agua <- TDF_Tipo_Fuente_Agua$Tipo_Fuente_Agua
TDF_Tipo_Fuente_Agua <- data.frame(Tipo_Fuente_Agua, ni, hi)
Summary <- data.frame(Tipo_Fuente_Agua = "TOTAL", ni = sum(ni),hi = 100)

TDF_Tipo_Fuente_Agua_suma<-rbind(TDF_Tipo_Fuente_Agua, Summary)
colnames(TDF_Tipo_Fuente_Agua_suma) <- c("Tipo Fuente Agua", "ni", "hi(%)")


#Graficas
# Diagrama de barrras local ni

barplot(ni, main = "Gráfica N°31: Distribución de frecuencias de los Tipos de Fuente de Agua",
        xlab = "Fuente de Agua",
        ylab = "Cantidad",
        col = "red",
        ylim = c(0,619),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Tipo_Fuente_Agua$Tipo_Fuente_Agua)

#Diagrama de barras global ni 

barplot(ni, main = "Gráfica N°32: Distribución de frecuencias de los Tipos de Fuente de Agua",
        xlab = "Fuente de Agua",
        ylab = "Cantidad",
        col = "skyblue",
        ylim = c(0,3000),
        las=1,
        cex.names = 0.6,
        names.arg = TDF_Tipo_Fuente_Agua$Tipo_Fuente_Agua)

#Diagrama de barras local hi(%)

barplot(hi, main = "Gráfica N°33: Distribución de frecuencias porcentual de los Tipos de Fuente de Agua",
        xlab = "Fuente de Agua",
        ylab = "Porcentaje",
        col = "green",
        ylim = c(0,21),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Tipo_Fuente_Agua$Tipo_Fuente_Agua)

#Diagrama de barras global hi(%)

barplot(hi, main = "Gráfica N°35: Distribución de frecuencias porcentual de 
los Tipos de Fuente de Agua",
        xlab = "Fuente de Agua",
        ylab = "Porcentaje",
        col = "blue",
        ylim = c(0,100),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Tipo_Fuente_Agua$Tipo_Fuente_Agua)

#Diagrama circular

etiqueta_pie <- paste(TDF_Tipo_Fuente_Agua$hi, "%")
pie(hi,
    main = "Gráfica N°36 Distribución porcentual de los Tipos de Fuente de Agua",
    radius = 1,
    labels = etiqueta_pie,
    col = rev(heat.colors(length(hi))),
    cex = 0.8,
    cex.main = 1)

legend("topright",
       legend = TDF_Tipo_Fuente_Agua$Tipo_Fuente_Agua,
       fill = colores <- c(rev(heat.colors(10))),
       cex = 0.5,
       title = "Leyenda")