UNIVERSIDAD CENTRAL DEL ECUADOR
ESTUDIO ESTADÍSTICO DE LA CONTAMINACIÓN DEL SUELO Y SU IMPACTO EN LA SALUD
FECHA: 19/11/2025
# =========================
# ESTADÍSTICA Descriptiva
# Fecha: 19/11/2025
# =========================
library(gt)
library(dplyr)
# -------------------------
# Cargar datos
# -------------------------
setwd("C:/Users/Alexander/Downloads")
datos <- read.csv(
"soil_pollution_diseases.csv",
sep = ",",
stringsAsFactors = FALSE
)
# =========================
# TABLAS CUALITATIVAS NOMINALES
# =========================
Industria_Cercana <- datos$Nearby_Industry
TDF_Industria_Cercana <- data.frame(table(Industria_Cercana))
ni <- TDF_Industria_Cercana$Freq
hi <- round((ni / sum(ni)) * 100, 2)
TDF_Industria_Cercana <- data.frame(
Industria_Cercana = TDF_Industria_Cercana$Industria_Cercana,
ni,
hi
)
Summary <- data.frame(
Industria_Cercana = "TOTAL",
ni = sum(ni),
hi = 100
)
TDF_Industria_Cercana_suma <- rbind(TDF_Industria_Cercana, Summary)
colnames(TDF_Industria_Cercana_suma) <- c("Industria Cercana", "ni", "hi(%)")
# =========================
# TABLA
# =========================
TDF_Industria_Cercana_suma %>%
gt() %>%
tab_header(
title = md("*Tabla Nro. 5*"),
subtitle = md("**Tabla de distribución de la industria cercana**")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 3")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
)
| Tabla Nro. 5 | ||
| Tabla de distribución de la industria cercana | ||
| Industria Cercana | ni | hi(%) |
|---|---|---|
| Agriculture | 621 | 20.70 |
| Chemical | 619 | 20.63 |
| Mining | 594 | 19.80 |
| None | 582 | 19.40 |
| Textile | 584 | 19.47 |
| TOTAL | 3000 | 100.00 |
| Autor: Grupo 3 | ||
# =========================
# GRÁFICAS
# =========================
# Diagrama de barras local ni
barplot(ni,
main = "Gráfica N°21: Distribución de la industria cercana",
xlab = "Industria Cercana",
ylab = "Cantidad",
col = "red",
ylim = c(0,600),
las = 2,
cex.names = 0.6,
names.arg = TDF_Industria_Cercana$Industria_Cercana)
# Diagrama de barras global ni
barplot(ni,
main = "Gráfica N°22: Distribución de la industria cercana",
xlab = "Industria Cercana",
ylab = "Cantidad",
col = "skyblue",
ylim = c(0,3000),
las = 2,
cex.names = 0.6,
names.arg = TDF_Industria_Cercana$Industria_Cercana)
# Diagrama de barras local hi(%)
barplot(hi,
main = "Gráfica N°23: Distribución porcentual de la industria cercana",
xlab = "Industria Cercana",
ylab = "Porcentaje",
col = "green",
ylim = c(0,20),
las = 2,
cex.names = 0.6,
names.arg = TDF_Industria_Cercana$Industria_Cercana)
# Diagrama de barras global hi(%)
barplot(hi,
main = "Gráfica N°24: Distribución porcentual de la industria cercana",
xlab = "Industria Cercana",
ylab = "Porcentaje",
col = "blue",
ylim = c(0,100),
las = 2,
cex.names = 0.6,
names.arg = TDF_Industria_Cercana$Industria_Cercana)
# =========================
# DIAGRAMA CIRCULAR
# =========================
etiquetas <- paste0(hi, " %")
colores <- c("yellow", "khaki1", "gold", "orange", "darkorange", "red")
par(mar = c(2, 2, 4, 6))
pie(
hi,
labels = etiquetas,
col = colores,
main = "Gráfica N°25 Distribución porcentual de la industria cercana",
cex = 1
)
legend(
"topright",
legend = TDF_Industria_Cercana$Industria_Cercana,
fill = colores,
title = "Leyenda",
cex = 0.5,
xpd = TRUE
)
# =========================
# INDICADORES
# =========================
# Función de moda (si no está creada antes)
moda <- function(x) {
frec <- table(x)
names(frec)[which.max(frec)]
}
# Cálculo de la moda
moda_industria <- moda(Industria_Cercana)
moda_industria
## [1] "Agriculture"
# =========================
# CONCLUSIÓN
# =========================
cat("El valor más frecuente de la Industria Cercana es:", moda_industria)
## El valor más frecuente de la Industria Cercana es: Agriculture