UNIVERSIDAD CENTRAL DEL ECUADOR

ESTUDIO ESTADÍSTICO DE LA CONTAMINACIÓN DEL SUELO Y SU IMPACTO EN LA SALUD

FECHA: 24/12/2025

#Estadistica Descriptiva

#24/12/2025

#Cargar Datos
library(gt)
library(dplyr)

datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",
                sep = ",")


#Tipo de fuente de agua

Tipo_fuente_agua <- datos$Water_Source_Type



TDF_Tipo_fuente_agua <-data.frame(table(Tipo_fuente_agua))

ni <- TDF_Tipo_fuente_agua$Freq
hi <- round((ni / sum(ni)) * 100, 2)
Pi <- hi 

Tipo_fuente_agua <- TDF_Tipo_fuente_agua$Tipo_fuente_agua

TDF_Tipo_fuente_agua <- data.frame(Tipo_fuente_agua, ni, hi, Pi)

Summary <- data.frame(
  Tipo_fuente_agua = "TOTAL",
  ni = sum(ni),
  hi = 100,
  Pi = 100
)

TDF_Tipo_fuente_agua_suma <- rbind(TDF_Tipo_fuente_agua, Summary)

colnames(TDF_Tipo_fuente_agua_suma) <- c("Textura Suelo", "ni", "hi(%)", "Pi(%)")


# TABLA 

TDF_Tipo_fuente_agua_suma %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nro. 2*"),
    subtitle = md("Tabla de distribución y probabilidades de los tipos de fuente de agua")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 2
Tabla de distribución y probabilidades de los tipos de fuente de agua
Textura Suelo ni hi(%) Pi(%)
Irrigation Canal 591 19.70 19.70
Lake 596 19.87 19.87
Rainwater 602 20.07 20.07
River 592 19.73 19.73
Well 619 20.63 20.63
TOTAL 3000 100.00 100.00
Autor: Grupo 3
barplot(hi, main = "Gráfica N°3: Distribución porcentual de 
        los tipos de fuente de agua",
        xlab = "Textura de Suelo",
        ylab = "Porcentaje",
        col = "green",
        ylim = c(0,26),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Tipo_fuente_agua$Tipo_fuente_agua)

barplot(hi, main = "Gráfica N°4: Distribución para la probabilidad de 
         los tipos de fuente de agua",
        xlab = "Textura de Suelo",
        ylab = "Probabilidad",
        col = "green",
        ylim = c(0,26),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_Tipo_fuente_agua$Tipo_fuente_agua)

# ¿ Cuál es la probabilidad de que un río sea una fuente de agua?

prob_rio <- TDF_Tipo_fuente_agua$Pi[
  TDF_Tipo_fuente_agua$Tipo_fuente_agua == "River"
]

cat(
  "¿Cuál es la probabilidad de que un río sea una fuente de agua?\n",
  "La probabilidad de encontrar un río como fuente de agua es de",
  prob_rio, "%.\n"
)
## ¿Cuál es la probabilidad de que un río sea una fuente de agua?
##  La probabilidad de encontrar un río como fuente de agua es de 19.73 %.