0. librerias

library(gt)
library(dplyr)

## 
## Adjuntando el paquete: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

1. Leer datos

datos <- read.csv(
  "waterPollution.csv",
  sep = ",",
  stringsAsFactors = FALSE
)

2. Extracción de la variable

datos$waste_treatment_recycling_percent

3. Tabla de distribución de frecuencias

# =========================
# CREAR VARIABLE ORDINAL
# =========================

datos$Waste_treatment_recycling_Category <- cut(
  datos$waste_treatment_recycling_percent,
  breaks = c(0.76, 15, 22.26, 27.25, 35, 47.83),
  labels = c(
    "Deficiente",
    "Bajo",
    "Moderado",
    "Bueno",
    "Excelente"
  ),
  include.lowest = TRUE,
  ordered_result = TRUE
)


# =========================
# TABLA DE FRECUENCIAS
# =========================

TDF_Reciclaje <- data.frame(
  table(datos$Waste_treatment_recycling_Category)
)

ni <- TDF_Reciclaje$Freq

hi <- round((ni / sum(ni)) * 100, 2)

TDF_Reciclaje <- data.frame(
  Categoria = TDF_Reciclaje$Var1,
  ni,
  hi
)

# =========================
# FILA TOTAL
# =========================

Summary <- data.frame(
  Categoria = "TOTAL",
  ni = sum(ni),
  hi = 100
)

TDF_Reciclaje_suma <- rbind(
  TDF_Reciclaje,
  Summary
)

colnames(TDF_Reciclaje_suma) <- c(
  "Categoría",
  "ni",
  "hi (%)"
)

# =========================
# TABLA FORMATEADA
# =========================

library(gt)

TDF_Reciclaje_suma %>%
  gt() %>%
  tab_header(
    title = md("Tabla Nro. 1"),
    subtitle = md("*Distribución de frecuencia del Nivel 
                  de Tratamiento y Reciclaje de Residuos
                  en la calidad de agua 
                  de Europa(1991-2017*")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  )

Categoría	ni	hi (%)
Tabla Nro. 1
Distribución de frecuencia del Nivel de Tratamiento y Reciclaje de Residuos en la calidad de agua de Europa(1991-2017
Deficiente	249	1.25
Bajo	13265	66.68
Moderado	4888	24.57
Bueno	950	4.78
Excelente	541	2.72
TOTAL	19893	100.00
Autor: Grupo 3

4.Gráficas

4.1. histograma

# =========================
# GRÁFICA DE BARRAS
# Frecuencia absoluta (ni)
# =========================

barplot(TDF_Reciclaje$ni,
        main = "Gráfica N°1: Distribución de frecuencia 
        del nivel de tratamiento y reciclaje de residuos 
        de la calidad de agua en Europa (1991-2017)",
        xlab = "Nivel de tratamiento y reciclaje",
        ylab = "Cantidad",
        col = "skyblue",
        ylim = c(0, max(TDF_Reciclaje$ni) * 1.1),
        names.arg = TDF_Reciclaje$Categoria,
        las = 1,
        cex.names = 0.7)

4.2. Histograma general

# =========================
# GRÁFICA DE BARRAS (ni)
# =========================

barplot(ni,
        main = "Gráfica N°2: Distribución de frecuiencia 
        del nivel de tratamiento y reciclaje de residuos 
        de la calidad de agua en Europa (1991-2017)",
        xlab = "Nivel de tratamiento y reciclaje",
        ylab = "Cantidad",
        col = "red",
        ylim = c(0, max(20000)),
        las = 1,
        cex.names = 0.8,
        names.arg = TDF_Reciclaje$Categoria)

4.3. Histograma porcentual

# =========================
# GRÁFICA DE BARRAS
# Frecuencia relativa (hi)
# =========================

barplot(TDF_Reciclaje$hi,
        main = "Gráfica N°3: Distribución porcentual
        del nivel de tratamiento y reciclaje de residuos 
        de la calidad de agua en Europa (1991-2017)",
        xlab = "Nivel de tratamiento y reciclaje",
        ylab = "Porcentaje (%)",
        col = "skyblue",
        ylim = c(0, max(TDF_Reciclaje$hi) * 1.1),
        names.arg = TDF_Reciclaje$Categoria,
        las = 1,
        cex.names = 0.9)

4.4. Histograma porcentual general

# =========================
# GRÁFICA DE BARRAS (hi)
# =========================

barplot(hi,
        main = "Gráfica N°4: Distribución porcentual
        del nivel de tratamiento y reciclaje de residuos 
        de la calidad de agua en Europa(1991-2017)",
        xlab = "Nivel de tratamiento y reciclaje",
        ylab = "Porcentaje (%)",
        col = "red",
        ylim = c(0, 100),
        las = 1,
        cex.names = 0.8,
        names.arg = TDF_Reciclaje$Categoria)

4.5. Diagrama circular

# =========================
# DIAGRAMA CIRCULAR
# =========================

etiquetas <- paste0(hi, " %")

colores <- c(
  "lightcoral",
  "khaki",
  "lightblue",
  "lightgreen",
  "plum"
)

par(mar = c(2, 2, 4, 6))

pie(
  hi,
  labels = etiquetas,
  col = colores,
  main = " Gráfica N°5: Distribución del Nivel de Tratamiento
  y Reciclaje de Residuos de la calidad de agua 
  en Europa (1991-2017)",
  cex = 1
)

legend(
  "topright",
  legend = TDF_Reciclaje$Categoria,
  fill = colores,
  title = "Categorías",
  cex = 0.8,
  xpd = TRUE
)

5. Indicadores Estadísticos

# ===========================================================
# INDICADORES ESTADÍSTICOS
# ===========================================================
library(dplyr)
library(gt)

# 1. Estructura de la tabla con los datos fijos
tabla_indicadores <- data.frame(
  Variable = "Nivel de reciclaje",
  Rango = "-",
  X = "-",
  Me = "Moderado",
  Mo = "Deficiente",
  V = "-",
  Sd = "-",
  Cv = "-",
  As = "-",
  K = "-",
  Valores_Atipicos = "No aplica",
  stringsAsFactors = FALSE
)

# 2. Diseño de la tabla con formato gt
tabla_indicadores_gt <- tabla_indicadores %>%
  gt() %>%
  tab_header(
    title = "Tabla Nro. 2",
    subtitle = "Indicadores estadisticos del nivel de tratamiento y reciclaje de residuos de la calidad de agua en Europa (1991-2017)"
  ) %>%
  cols_label(
    Variable = "Variable",
    Rango = "Rango",
    X = "X",
    Me = "Me",
    Mo = "Mo",
    V = "V",
    Sd = "Sd",
    Cv = "Cv",
    As = "As",
    K = "K",
    Valores_Atipicos = "Valores Atipicos"
  ) %>%
  tab_source_note(
    source_note = "Autor: Grupo 3"
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    column_labels.border.bottom.color = "black",
    row.striping.include_table_body = TRUE,
    table.align = "center"
  )

# 3. Mostrar la tabla formateada en el documento final
tabla_indicadores_gt

Variable	Rango	X	Me	Mo	V	Sd	Cv	As	K	Valores Atipicos
Tabla Nro. 2
Indicadores estadisticos del nivel de tratamiento y reciclaje de residuos de la calidad de agua en Europa (1991-2017)
Nivel de reciclaje	-	-	Moderado	Deficiente	-	-	-	-	-	No aplica
Autor: Grupo 3

5. Conclusión

#El valor más frecuente del nivel de tratamiento y reciclaje de residuos es Deficiente, mientras que la mediana indica que el 50% de los datos se posiciona en un nivel Moderado o inferior.

Categoría reciclaje de residuos

Universidad Central del Ecuador

06/05/2026

0. librerias

1. Leer datos

2. Extracción de la variable

3. Tabla de distribución de frecuencias

4.Gráficas

4.1. histograma

4.2. Histograma general

4.3. Histograma porcentual

4.4. Histograma porcentual general

4.5. Diagrama circular

5. Indicadores Estadísticos

5. Conclusión