UNIVERSIDAD CENTRAL DEL ECUADOR

ESTUDIO ESTADÍSTICO DE LA CONTAMINACIÓN DEL SUELO Y SU IMPACTO EN LA SALUD

FECHA: 24/12/2025

#Estadistica Descriptiva

#24/12/2025

#Cargar Datos
library(gt)
library(dplyr)

datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",
                sep = ",")


#Tipo de fuente de agua

Sintomas_Salud <- datos$Health_Symptoms



TDF_Sintomas <-data.frame(table(Sintomas_Salud))

ni <- TDF_Sintomas$Freq
hi <- round((ni / sum(ni)) * 100, 2)
Pi <- hi 

Sintomas_Salud <- TDF_Sintomas$Sintomas_Salud

TDF_Sintomas <- data.frame(Sintomas_Salud, ni, hi, Pi)

Summary <- data.frame(
  Sintomas_Salud = "TOTAL",
  ni = sum(ni),
  hi = 100,
  Pi = 100
)

TDF_Sintomas_Suma <- rbind(TDF_Sintomas, Summary)

colnames(TDF_Sintomas_Suma) <- c("Sintomas", "ni", "hi(%)", "Pi(%)")


# TABLA 

TDF_Sintomas_Suma %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nro. 4*"),
    subtitle = md("Tabla de distribución y probabilidades de los sintomas de salud")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 4
Tabla de distribución y probabilidades de los sintomas de salud
Sintomas ni hi(%) Pi(%)
Abdominal Pain 473 15.77 15.77
Breathing Difficulty 514 17.13 17.13
Fatigue 502 16.73 16.73
Headache 488 16.27 16.27
Nausea 500 16.67 16.67
Rash 523 17.43 17.43
TOTAL 3000 100.00 100.00
Autor: Grupo 3
barplot(hi, main = "Gráfica N°7: Distribución porcentual de 
        los sintomas de salud",
        xlab = "Sintomas",
        ylab = "Porcentaje",
        col = "green",
        ylim = c(0,26),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Sintomas$Sintomas_Salud)

barplot(hi, main = "Gráfica N°8: Distribución para la probabilidad de 
         los sintomas de salud",
        xlab = "Sintomas",
        ylab = "Probabilidad",
        col = "green",
        ylim = c(0,26),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Sintomas$Sintomas_Salud)

# ¿ Cuál es la probabilidad de tener dificultades para respirar?

prob_respirar <- TDF_Sintomas$Pi[
  TDF_Sintomas$Sintomas_Salud == "Breathing Difficulty"
]

cat(
  "¿Cuál es la probabilidad de tener dificultades para respirar?\n",
  "La probabilidad de tener dificultades para respirar es",
  prob_respirar, "%.\n"
)
## ¿Cuál es la probabilidad de tener dificultades para respirar?
##  La probabilidad de tener dificultades para respirar es 17.13 %.