UNIVERSIDAD CENTRAL DEL ECUADOR

ESTUDIO ESTADÍSTICO DE LA CONTAMINACIÓN DEL SUELO Y SU IMPACTO EN LA SALUD

FECHA: 24/12/2025

#Cargar los datos 
setwd("/cloud/project")
datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",sep = ",")
# 1. Preparación de datos (Filtrado de 'Moderate')
datos_binarios <- datos[datos$Disease_Severity %in% c("Severe", "Mild"), ]

# 2. Frecuencias Reales (Probabilidades)
tabla_real <- prop.table(table(datos_binarios$Disease_Severity))
# Aseguramos el orden: Mild primero, luego Severe
prob_real <- as.numeric(tabla_real[c("Mild", "Severe")]) 

# 3. Probabilidades del Modelo (Bernoulli)
prob_modelo <- c(0.5, 0.5) 
grafica_matrix <- rbind(prob_real, prob_modelo)
par(mar = c(5, 5, 4, 8)) 
posiciones <- barplot(grafica_matrix, 
                      beside = TRUE, 
                      main = "Modelo de probabilidad Bernoulli para los niveles de enfermedad",
                      xlab = "", 
                      ylab = "Cantidad-Probabilidad",
                      col = c("skyblue", "blue"),
                      names.arg = c("Leve", "Severo"),
                      ylim = c(0, max(grafica_matrix) + 0.1),
                      las = 1) 

mtext("Nivel de Enfermedad", side = 1, line = 3)

legend(x = 6.5, y = 0.2, 
       legend = c("Real", "Modelo"), 
       fill = c("skyblue", "blue"), 
       bty = "o", 
       xpd = TRUE)