UNIVERSIDAD CENTRAL DEL ECUADOR
ESTUDIO ESTADĆSTICO DE LA CONTAMINACIĆN DEL SUELO Y SU IMPACTO EN LA SALUD
FECHA: 19/11/2025
#EstadĆstica Descriptiva
#19/11/2025
#Carga de datos
library(gt)
library(dplyr)
setwd("/cloud/project")
datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",sep = ",")
#Tablas Cualitativas Nominales
#Industria Cercana
Industria_Cercana <- datos$Nearby_Industry
#Tabla de distribución de frecuencia
TDF_Industria_Cercana <- data.frame(table(Industria_Cercana))
ni <- TDF_Industria_Cercana$Freq
hi <- round((ni / sum(ni)) *100,2)
Industria_Cercana <- TDF_Industria_Cercana$Industria_Cercana
TDF_Industria_Cercana <- data.frame(Industria_Cercana,ni,hi)
Summary <- data.frame(Industria_Cercana = "TOTAL", ni=sum(ni), hi = 100)
TDF_Industria_Cercana_Suma<- rbind(TDF_Industria_Cercana,Summary)
colnames(TDF_Industria_Cercana) <- c("Industria Cercana", "ni", "hi(%)")
# TABLA
TDF_Industria_Cercana_Suma%>%
gt() %>%
tab_header(
title = md("*Tabla Nro. 5*"),
subtitle = md("**Tabla de distribución de las Industrias Cercanas*")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 3")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
)
| Tabla Nro. 5 | ||
| *Tabla de distribución de las Industrias Cercanas | ||
| Industria_Cercana | ni | hi |
|---|---|---|
| Agriculture | 621 | 20.70 |
| Chemical | 619 | 20.63 |
| Mining | 594 | 19.80 |
| None | 582 | 19.40 |
| Textile | 584 | 19.47 |
| TOTAL | 3000 | 100.00 |
| Autor: Grupo 3 | ||
#Graficas
# Diagrama de barrras local ni
barplot(ni, main = "GrÔfica N°21: Distribución
de las Industrias Cercanas",
xlab = "Industria cercana",
ylab = "Cantidad",
col = "red",
ylim = c(0,700),
las = 1,
cex.names = 0.8,
names.arg = TDF_Industria_Cercana$`Industria Cercana`)
#Diagrama de barras global ni
barplot(ni, main = "GrÔfica N°22: Distribución
de las Industrias Cercanas",
xlab = "Industria cercana",
ylab = "Cantidad",
col = "skyblue",
ylim = c(0,3000),
las=1,
cex.names = 0.8,
names.arg = TDF_Industria_Cercana$`Industria Cercana`)
#Diagrama de barras local hi(%)
barplot(hi, main = "GrÔfica N°23: Distribución porcentual
de las Industrias Cercanas",
xlab = "Industria Cercana",
ylab = "Porcentaje",
col = "green",
ylim = c(0,25),
las = 1,
cex.names = 0.8,
names.arg = TDF_Industria_Cercana$`Industria Cercana`)
#Diagrama de barras global hi(%)
barplot(hi, main = "GrÔfica N°24: Distribución porcentual
de las Industrias Cercanas",
xlab = "Industria Cercana",
ylab = "Porcentaje",
col = "blue",
ylim = c(0,100),
las = 1,
cex.names = 0.8,
names.arg = TDF_Industria_Cercana$`Industria Cercana`)
#Diagrama circular
etiqueta_pie <- paste(TDF_Industria_Cercana$hi, "%")
pie(hi,
main = "GrÔfica N°25: Distribución porcentual
de las Industrias Cercanas",
radius = 1,
labels = etiqueta_pie,
col = rev(heat.colors(length(hi))),
cex = 0.8,
cex.main = 1)
legend("topright",
legend = TDF_Industria_Cercana$`Industria Cercana` ,
fill = colores <- c(rev(heat.colors(7))),
cex = 0.6,
title = "Leyenda")
# INDICADORES
# Función de moda
moda <- function(x) {
frec <- table(x)
names(frec)[which.max(frec)]
}
# Moda de la variable Industria Cercana
moda(datos$Nearby_Industry)
## [1] "Agriculture"