UNIVERSIDAD CENTRAL DEL ECUADOR
ESTUDIO ESTADÍSTICO DE LA CONTAMINACIÓN DEL SUELO Y SU IMPACTO EN LA SALUD
FECHA: 24/12/2025
#Cargar los datos
setwd("/cloud/project")
datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",sep = ",")
# 1. Preparación de datos (Filtrado de 'Moderate')
datos_binarios <- datos[datos$Disease_Severity %in% c("Severe", "Mild"), ]
# 2. Frecuencias Reales (Probabilidades)
tabla_real <- prop.table(table(datos_binarios$Disease_Severity))
# Aseguramos el orden: Mild primero, luego Severe
prob_real <- as.numeric(tabla_real[c("Mild", "Severe")])
# 3. Probabilidades del Modelo (Bernoulli)
prob_modelo <- c(0.5, 0.5)
grafica_matrix <- rbind(prob_real, prob_modelo)
par(mar = c(5, 5, 4, 8))
posiciones <- barplot(grafica_matrix,
beside = TRUE,
main = "Modelo de probabilidad Bernoulli para los niveles de enfermedad",
xlab = "",
ylab = "Cantidad-Probabilidad",
col = c("skyblue", "blue"),
names.arg = c("Leve", "Severo"),
ylim = c(0, max(grafica_matrix) + 0.1),
las = 1)
mtext("Nivel de Enfermedad", side = 1, line = 3)
legend(x = 6.5, y = 0.2,
legend = c("Real", "Modelo"),
fill = c("skyblue", "blue"),
bty = "o",
xpd = TRUE)