UNIVERSIDAD CENTRAL DEL ECUADOR

ESTUDIO ESTADƍSTICO DE LA CONTAMINACIƓN DEL SUELO Y SU IMPACTO EN LA SALUD

FECHA: 19/11/2025

#EstadĆ­stica Descriptiva

#19/11/2025

#Carga de datos

library(gt)
library(dplyr)


setwd("/cloud/project")
datos<-read.csv("soil_pollution_diseases.csv",header = TRUE,dec = ".",sep = ",")

#Tablas Cualitativas Nominales

#Industria Cercana

Industria_Cercana <- datos$Nearby_Industry

#Tabla de distribución de frecuencia

TDF_Industria_Cercana <- data.frame(table(Industria_Cercana))

ni <- TDF_Industria_Cercana$Freq
hi <- round((ni / sum(ni)) *100,2)
Industria_Cercana <- TDF_Industria_Cercana$Industria_Cercana
TDF_Industria_Cercana <- data.frame(Industria_Cercana,ni,hi)
Summary <- data.frame(Industria_Cercana = "TOTAL", ni=sum(ni), hi = 100)

TDF_Industria_Cercana_Suma<- rbind(TDF_Industria_Cercana,Summary)
colnames(TDF_Industria_Cercana) <- c("Industria Cercana", "ni", "hi(%)")


# TABLA 

TDF_Industria_Cercana_Suma%>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nro. 5*"),
    subtitle = md("**Tabla de distribución de las Industrias Cercanas*")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 5
*Tabla de distribución de las Industrias Cercanas
Industria_Cercana ni hi
Agriculture 621 20.70
Chemical 619 20.63
Mining 594 19.80
None 582 19.40
Textile 584 19.47
TOTAL 3000 100.00
Autor: Grupo 3
#Graficas
# Diagrama de barrras local ni

barplot(ni, main = "GrÔfica N°21: Distribución 
        de las Industrias Cercanas",
        xlab = "Industria cercana",
        ylab = "Cantidad",
        col = "red",
        ylim = c(0,700),
        las = 1,
        cex.names = 0.8,
        names.arg = TDF_Industria_Cercana$`Industria Cercana`)

#Diagrama de barras global ni 

barplot(ni, main = "GrÔfica N°22: Distribución
de las Industrias Cercanas",
        xlab = "Industria cercana",
        ylab = "Cantidad",
        col = "skyblue",
        ylim = c(0,3000),
        las=1,
        cex.names = 0.8,
        names.arg = TDF_Industria_Cercana$`Industria Cercana`)

#Diagrama de barras local hi(%)

barplot(hi, main = "GrÔfica N°23: Distribución porcentual
de las Industrias Cercanas",
        xlab = "Industria Cercana",
        ylab = "Porcentaje",
        col = "green",
        ylim = c(0,25),
        las = 1,
        cex.names = 0.8,
        names.arg = TDF_Industria_Cercana$`Industria Cercana`)

#Diagrama de barras global hi(%)

barplot(hi, main = "GrÔfica N°24: Distribución porcentual
de las Industrias Cercanas",
        xlab = "Industria Cercana",
        ylab = "Porcentaje",
        col = "blue",
        ylim = c(0,100),
        las = 1,
        cex.names = 0.8,
        names.arg = TDF_Industria_Cercana$`Industria Cercana`)

#Diagrama circular

etiqueta_pie <- paste(TDF_Industria_Cercana$hi, "%")
pie(hi,
    main = "GrÔfica N°25: Distribución porcentual 
    de las Industrias Cercanas",
    radius = 1,
    labels = etiqueta_pie,
    col = rev(heat.colors(length(hi))),
    cex = 0.8,
    cex.main = 1)

legend("topright",
       legend = TDF_Industria_Cercana$`Industria Cercana` ,
       fill = colores <- c(rev(heat.colors(7))),
       cex = 0.6,
       title = "Leyenda")

# INDICADORES

# Función de moda
moda <- function(x) {
  frec <- table(x)         
  names(frec)[which.max(frec)]  
}

# Moda de la variable Industria Cercana
moda(datos$Nearby_Industry)
## [1] "Agriculture"