0. librerias

library(gt)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

1. Leer datos

datos <- read.csv(
  "waterPollution.csv",
  sep = ",",
  stringsAsFactors = FALSE
)

2. Extracción de la variable

datos$waste_treatment_recycling_percent

3. Tabla de distribución de frecuencias

# =========================
# CREAR VARIABLE ORDINAL
# =========================

datos$Waste_treatment_recycling_Category <- cut(
  datos$waste_treatment_recycling_percent,
  breaks = c(0.76, 15, 22.26, 27.25, 35, 47.83),
  labels = c(
    "Deficiente",
    "Bajo",
    "Moderado",
    "Bueno",
    "Excelente"
  ),
  include.lowest = TRUE,
  ordered_result = TRUE
)


# =========================
# TABLA DE FRECUENCIAS
# =========================

TDF_Reciclaje <- data.frame(
  table(datos$Waste_treatment_recycling_Category)
)

ni <- TDF_Reciclaje$Freq

hi <- round((ni / sum(ni)) * 100, 2)

TDF_Reciclaje <- data.frame(
  Categoria = TDF_Reciclaje$Var1,
  ni,
  hi
)

# =========================
# FILA TOTAL
# =========================

Summary <- data.frame(
  Categoria = "TOTAL",
  ni = sum(ni),
  hi = 100
)

TDF_Reciclaje_suma <- rbind(
  TDF_Reciclaje,
  Summary
)

colnames(TDF_Reciclaje_suma) <- c(
  "Categoría",
  "ni",
  "hi (%)"
)

# =========================
# TABLA FORMATEADA
# =========================

library(gt)

TDF_Reciclaje_suma %>%
  gt() %>%
  tab_header(
    title = md("Tabla Nro. 1"),
    subtitle = md("*Distribución de frecuencia del Nivel 
                  de Tratamiento y Reciclaje de Residuos
                  en la calidad de agua 
                  de Europa(1991-2017*")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  )
Tabla Nro. 1
Distribución de frecuencia del Nivel de Tratamiento y Reciclaje de Residuos en la calidad de agua de Europa(1991-2017
Categoría ni hi (%)
Deficiente 249 1.25
Bajo 13265 66.68
Moderado 4888 24.57
Bueno 950 4.78
Excelente 541 2.72
TOTAL 19893 100.00
Autor: Grupo 3

4.Gráficas

4.1. histograma

# =========================
# GRÁFICA DE BARRAS
# Frecuencia absoluta (ni)
# =========================

barplot(TDF_Reciclaje$ni,
        main = "Gráfica N°1: Distribución de frecuencia 
        del nivel de tratamiento y reciclaje de residuos 
        de la calidad de agua en Europa (1991-2017)",
        xlab = "Nivel de tratamiento y reciclaje",
        ylab = "Cantidad",
        col = "skyblue",
        ylim = c(0, max(TDF_Reciclaje$ni) * 1.1),
        names.arg = TDF_Reciclaje$Categoria,
        las = 1,
        cex.names = 0.7)

4.2. Histograma general

# =========================
# GRÁFICA DE BARRAS (ni)
# =========================

barplot(ni,
        main = "Gráfica N°2: Distribución de frecuiencia 
        del nivel de tratamiento y reciclaje de residuos 
        de la calidad de agua en Europa (1991-2017)",
        xlab = "Nivel de tratamiento y reciclaje",
        ylab = "Cantidad",
        col = "red",
        ylim = c(0, max(20000)),
        las = 1,
        cex.names = 0.8,
        names.arg = TDF_Reciclaje$Categoria)

4.3. Histograma porcentual

# =========================
# GRÁFICA DE BARRAS
# Frecuencia relativa (hi)
# =========================

barplot(TDF_Reciclaje$hi,
        main = "Gráfica N°3: Distribución porcentual
        del nivel de tratamiento y reciclaje de residuos 
        de la calidad de agua en Europa (1991-2017)",
        xlab = "Nivel de tratamiento y reciclaje",
        ylab = "Porcentaje (%)",
        col = "skyblue",
        ylim = c(0, max(TDF_Reciclaje$hi) * 1.1),
        names.arg = TDF_Reciclaje$Categoria,
        las = 1,
        cex.names = 0.9)

4.4. Histograma porcentual general

# =========================
# GRÁFICA DE BARRAS (hi)
# =========================

barplot(hi,
        main = "Gráfica N°4: Distribución porcentual
        del nivel de tratamiento y reciclaje de residuos 
        de la calidad de agua en Europa(1991-2017)",
        xlab = "Nivel de tratamiento y reciclaje",
        ylab = "Porcentaje (%)",
        col = "red",
        ylim = c(0, 100),
        las = 1,
        cex.names = 0.8,
        names.arg = TDF_Reciclaje$Categoria)

4.5. Diagrama circular

# =========================
# DIAGRAMA CIRCULAR
# =========================

etiquetas <- paste0(hi, " %")

colores <- c(
  "lightcoral",
  "khaki",
  "lightblue",
  "lightgreen",
  "plum"
)

par(mar = c(2, 2, 4, 6))

pie(
  hi,
  labels = etiquetas,
  col = colores,
  main = " Gráfica N°5: Distribución del Nivel de Tratamiento
  y Reciclaje de Residuos de la calidad de agua 
  en Europa (1991-2017)",
  cex = 1
)

legend(
  "topright",
  legend = TDF_Reciclaje$Categoria,
  fill = colores,
  title = "Categorías",
  cex = 0.8,
  xpd = TRUE
)

5. Indicadores Estadísticos

# ===========================================================
# INDICADORES ESTADÍSTICOS
# ===========================================================
library(dplyr)
library(gt)

# 1. Estructura de la tabla con los datos fijos
tabla_indicadores <- data.frame(
  Variable = "Nivel de reciclaje",
  Rango = "-",
  X = "-",
  Me = "Moderado",
  Mo = "Deficiente",
  V = "-",
  Sd = "-",
  Cv = "-",
  As = "-",
  K = "-",
  Valores_Atipicos = "No aplica",
  stringsAsFactors = FALSE
)

# 2. Diseño de la tabla con formato gt
tabla_indicadores_gt <- tabla_indicadores %>%
  gt() %>%
  tab_header(
    title = "Tabla Nro. 2",
    subtitle = "Indicadores estadisticos del nivel de tratamiento y reciclaje de residuos de la calidad de agua en Europa (1991-2017)"
  ) %>%
  cols_label(
    Variable = "Variable",
    Rango = "Rango",
    X = "X",
    Me = "Me",
    Mo = "Mo",
    V = "V",
    Sd = "Sd",
    Cv = "Cv",
    As = "As",
    K = "K",
    Valores_Atipicos = "Valores Atipicos"
  ) %>%
  tab_source_note(
    source_note = "Autor: Grupo 3"
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    column_labels.border.bottom.color = "black",
    row.striping.include_table_body = TRUE,
    table.align = "center"
  )

# 3. Mostrar la tabla formateada en el documento final
tabla_indicadores_gt
Tabla Nro. 2
Indicadores estadisticos del nivel de tratamiento y reciclaje de residuos de la calidad de agua en Europa (1991-2017)
Variable Rango X Me Mo V Sd Cv As K Valores Atipicos
Nivel de reciclaje - - Moderado Deficiente - - - - - No aplica
Autor: Grupo 3

5. Conclusión

#El valor más frecuente del nivel de tratamiento y reciclaje de residuos es Deficiente, mientras que la mediana indica que el 50% de los datos se posiciona en un nivel Moderado o inferior.