FECHA: 22/11/2025
#Cargar los datos
datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",sep = ",")
#Tipo de contaminante
library(dplyr)
library(gt)
# TABLA DE FRECUENCIAS pollutant_type
Pollutant <- datos$Pollutant_Type
# Tabla de distribuciones
TDF_pollutant <- data.frame(table(Pollutant))
# Frecuencia absoluta
ni <- TDF_pollutant$Freq
# Frecuencia relativa en %
hi <- round((ni / sum(ni)) * 100, 2)
# Crear tabla final
TDF_pollutant <- data.frame(
`Tipo de Contaminante` = TDF_pollutant$Pollutant,
`ni` = ni,
`hi %` = hi
)
# Fila total
TDF_pollutant_final <- rbind(
TDF_pollutant,
data.frame(
`Tipo de Contaminante` = "TOTAL",
`ni` = sum(ni),
`hi %` = 100
)
)
# ===============================
# TABLA
TDF_pollutant_final %>%
gt() %>%
tab_header(
title = md("*Tabla Nro. 3*"),
subtitle = md("**Tabla de distribución de frecuencias del tipo de contaminante del suelo identificado**")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 3")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
)
| Tabla Nro. 3 |
| Tabla de distribución de frecuencias del tipo de contaminante del suelo identificado |
| Tipo.de.Contaminante |
ni |
hi.. |
| Arsenic |
489 |
16.30 |
| Cadmium |
516 |
17.20 |
| Chromium |
509 |
16.97 |
| Lead |
529 |
17.63 |
| Mercury |
458 |
15.27 |
| Pesticides |
499 |
16.63 |
| TOTAL |
3000 |
100.00 |
| Autor: Grupo 3 |
#Graficas
# Diagrama de barrras local ni
barplot(ni, main = "Gráfica N°11: Distribución de frecuencias de los tipos de contaminantes encontrados ",
xlab = "Tipos de contaminante",
ylab = "Cantidad",
col = "red",
ylim = c(0,600),
las = 2,
cex.names = 0.55,
names.arg = TDF_pollutant$Pollutant)

#Diagrama de barras global ni
barplot(ni, main = "Gráfica N°12: Distribución de frecuencias de los tipos de contaminantes encontrados ",
xlab = "Tipos de contaminante",
ylab = "Cantidad",
col = "skyblue",
ylim = c(0,3000),
las=2,
cex.names = 0.6,
names.arg = TDF_pollutant$Pollutant)

#Diagrama de barras local hi(%)
barplot(hi, main = "Gráfica N°13: Distribución de frecuencias porcentual de los tipos de contaminante encontrados",
xlab = "Tipos de contaminante",
ylab = "Porcentaje",
col = "green",
ylim = c(0,20),
las = 2,
cex.names = 0.6,
names.arg = TDF_pollutant$Pollutant)

#Diagrama de barras global hi(%)
barplot(hi, main = "Gráfica N°14: Distribución de frecuencias porcentual de
los tipos de contaminante encontrados",
xlab = "Tipos de contaminante",
ylab = "Porcentaje",
col = "blue",
ylim = c(0,100),
las = 2,
cex.names = 0.6,
names.arg = TDF_pollutant$Pollutant)

# Etiquetas con número + símbolo %
etiquetas <- paste0(hi, " %")
colores <- c("yellow", "khaki1", "gold", "orange", "darkorange", "red")
par(mar = c(2, 2, 4, 6))
pie(
hi,
labels = etiquetas,
col = colores,
main = "Gráfica N°15 Distribución porcentual de los contaminates encontrados",
cex = 1
)
legend(
"topright",
legend = TDF_pollutant$Tipo.de.Contaminante,
fill = colores,
title = "Leyenda",
cex = 0.8,
xpd = TRUE
)
