UNIVERSIDAD CENTRAL DEL ECUADOR

PROYECTO:ESTUDIO ESTADÍSTICO DE LA CONTAMINACIÓN DEL SUELO Y SU IMPACTO EN LA SALUD

FECHA: 22/11/2025

#Cargar los datos 


datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",sep = ",")

#Tipo de contaminante

library(dplyr)
library(gt)
# TABLA DE FRECUENCIAS pollutant_type

Pollutant <- datos$Pollutant_Type
# Tabla de distribuciones

TDF_pollutant <- data.frame(table(Pollutant))

# Frecuencia absoluta

ni <- TDF_pollutant$Freq

# Frecuencia relativa en %

hi <- round((ni / sum(ni)) * 100, 2)

# Crear tabla final

TDF_pollutant <- data.frame(
  `Tipo de Contaminante` = TDF_pollutant$Pollutant,
  `ni` = ni,
  `hi %` = hi
)

# Fila total

TDF_pollutant_final <- rbind(
  TDF_pollutant,
  data.frame(
    `Tipo de Contaminante` = "TOTAL",
    `ni` = sum(ni),
    `hi %` = 100
  )
)

# ===============================

# TABLA 

TDF_pollutant_final %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nro. 3*"),
    subtitle = md("**Tabla de distribución de frecuencias del tipo de contaminante del suelo identificado**")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 3
Tabla de distribución de frecuencias del tipo de contaminante del suelo identificado
Tipo.de.Contaminante ni hi..
Arsenic 489 16.30
Cadmium 516 17.20
Chromium 509 16.97
Lead 529 17.63
Mercury 458 15.27
Pesticides 499 16.63
TOTAL 3000 100.00
Autor: Grupo 3
#Graficas
# Diagrama de barrras local ni

barplot(ni, main = "Gráfica N°11: Distribución de frecuencias de los tipos de contaminantes encontrados ",
        xlab = "Tipos de contaminante",
        ylab = "Cantidad",
        col = "red",
        ylim = c(0,600),
        las = 2,
        cex.names = 0.55,
        names.arg = TDF_pollutant$Pollutant)

#Diagrama de barras global ni 

barplot(ni, main = "Gráfica N°12: Distribución de frecuencias de los tipos de contaminantes encontrados ",
        xlab = "Tipos de contaminante",
        ylab = "Cantidad",
        col = "skyblue",
        ylim = c(0,3000),
        las=2,
        cex.names = 0.6,
        names.arg = TDF_pollutant$Pollutant)

#Diagrama de barras local hi(%)

barplot(hi, main = "Gráfica N°13: Distribución de frecuencias porcentual de los tipos de contaminante encontrados",
        xlab = "Tipos de contaminante",
        ylab = "Porcentaje",
        col = "green",
        ylim = c(0,20),
        las = 2,
        cex.names = 0.6,
        names.arg = TDF_pollutant$Pollutant)

#Diagrama de barras global hi(%)

barplot(hi, main = "Gráfica N°14: Distribución de frecuencias porcentual de 
los tipos de contaminante encontrados",
        xlab = "Tipos de contaminante",
        ylab = "Porcentaje",
        col = "blue",
        ylim = c(0,100),
        las = 2,
        cex.names = 0.6,
        names.arg = TDF_pollutant$Pollutant)

# Etiquetas con número + símbolo %
etiquetas <- paste0(hi, " %")


colores <- c("yellow", "khaki1", "gold", "orange", "darkorange", "red")


par(mar = c(2, 2, 4, 6))

pie(
  hi,
  labels = etiquetas,
  col = colores,
  main = "Gráfica N°15 Distribución porcentual de los contaminates encontrados",
  cex = 1
)

legend(
  "topright",
  legend = TDF_pollutant$Tipo.de.Contaminante,
  fill = colores,
  title = "Leyenda",
  cex = 0.8,
  xpd = TRUE
)