0. librerias
library(gt)
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
1. Leer datos
datos <- read.csv(
"waterPollution.csv",
sep = ",",
stringsAsFactors = FALSE
)
3. Tabla de distribución de frecuencias
# =========================
# CREAR VARIABLE ORDINAL
# =========================
datos$Waste_treatment_recycling_Category <- cut(
datos$waste_treatment_recycling_percent,
breaks = c(0.76, 15, 22.26, 27.25, 35, 47.83),
labels = c(
"Deficiente",
"Bajo",
"Moderado",
"Bueno",
"Excelente"
),
include.lowest = TRUE,
ordered_result = TRUE
)
# =========================
# TABLA DE FRECUENCIAS
# =========================
TDF_Reciclaje <- data.frame(
table(datos$Waste_treatment_recycling_Category)
)
ni <- TDF_Reciclaje$Freq
hi <- round((ni / sum(ni)) * 100, 2)
TDF_Reciclaje <- data.frame(
Categoria = TDF_Reciclaje$Var1,
ni,
hi
)
# =========================
# FILA TOTAL
# =========================
Summary <- data.frame(
Categoria = "TOTAL",
ni = sum(ni),
hi = 100
)
TDF_Reciclaje_suma <- rbind(
TDF_Reciclaje,
Summary
)
colnames(TDF_Reciclaje_suma) <- c(
"Categoría",
"ni",
"hi (%)"
)
# =========================
# TABLA FORMATEADA
# =========================
library(gt)
TDF_Reciclaje_suma %>%
gt() %>%
tab_header(
title = md("Tabla Nro. 1"),
subtitle = md("*Distribución de frecuencia del Nivel
de Tratamiento y Reciclaje de Residuos
en la calidad de agua
de Europa(1991-2017*")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 3")
)
| Tabla Nro. 1 |
| Distribución de frecuencia del Nivel
de Tratamiento y Reciclaje de Residuos
en la calidad de agua
de Europa(1991-2017 |
| Categoría |
ni |
hi (%) |
| Deficiente |
249 |
1.25 |
| Bajo |
13265 |
66.68 |
| Moderado |
4888 |
24.57 |
| Bueno |
950 |
4.78 |
| Excelente |
541 |
2.72 |
| TOTAL |
19893 |
100.00 |
| Autor: Grupo 3 |
4.Gráficas
4.1. histograma
# =========================
# GRÁFICA DE BARRAS
# Frecuencia absoluta (ni)
# =========================
barplot(TDF_Reciclaje$ni,
main = "Gráfica N°1: Distribución de frecuencia
del nivel de tratamiento y reciclaje de residuos
de la calidad de agua en Europa (1991-2017)",
xlab = "Nivel de tratamiento y reciclaje",
ylab = "Cantidad",
col = "skyblue",
ylim = c(0, max(TDF_Reciclaje$ni) * 1.1),
names.arg = TDF_Reciclaje$Categoria,
las = 1,
cex.names = 0.7)

4.2. Histograma general
# =========================
# GRÁFICA DE BARRAS (ni)
# =========================
barplot(ni,
main = "Gráfica N°2: Distribución de frecuiencia
del nivel de tratamiento y reciclaje de residuos
de la calidad de agua en Europa (1991-2017)",
xlab = "Nivel de tratamiento y reciclaje",
ylab = "Cantidad",
col = "red",
ylim = c(0, max(20000)),
las = 1,
cex.names = 0.8,
names.arg = TDF_Reciclaje$Categoria)

4.3. Histograma porcentual
# =========================
# GRÁFICA DE BARRAS
# Frecuencia relativa (hi)
# =========================
barplot(TDF_Reciclaje$hi,
main = "Gráfica N°3: Distribución porcentual
del nivel de tratamiento y reciclaje de residuos
de la calidad de agua en Europa (1991-2017)",
xlab = "Nivel de tratamiento y reciclaje",
ylab = "Porcentaje (%)",
col = "skyblue",
ylim = c(0, max(TDF_Reciclaje$hi) * 1.1),
names.arg = TDF_Reciclaje$Categoria,
las = 1,
cex.names = 0.9)

4.4. Histograma porcentual general
# =========================
# GRÁFICA DE BARRAS (hi)
# =========================
barplot(hi,
main = "Gráfica N°4: Distribución porcentual
del nivel de tratamiento y reciclaje de residuos
de la calidad de agua en Europa(1991-2017)",
xlab = "Nivel de tratamiento y reciclaje",
ylab = "Porcentaje (%)",
col = "red",
ylim = c(0, 100),
las = 1,
cex.names = 0.8,
names.arg = TDF_Reciclaje$Categoria)

4.5. Diagrama circular
# =========================
# DIAGRAMA CIRCULAR
# =========================
etiquetas <- paste0(hi, " %")
colores <- c(
"lightcoral",
"khaki",
"lightblue",
"lightgreen",
"plum"
)
par(mar = c(2, 2, 4, 6))
pie(
hi,
labels = etiquetas,
col = colores,
main = " Gráfica N°5: Distribución del Nivel de Tratamiento
y Reciclaje de Residuos de la calidad de agua
en Europa (1991-2017)",
cex = 1
)
legend(
"topright",
legend = TDF_Reciclaje$Categoria,
fill = colores,
title = "Categorías",
cex = 0.8,
xpd = TRUE
)

5. Indicadores Estadísticos
# ===========================================================
# INDICADORES ESTADÍSTICOS
# ===========================================================
library(dplyr)
library(gt)
# 1. Estructura de la tabla con los datos fijos
tabla_indicadores <- data.frame(
Variable = "Nivel de reciclaje",
Rango = "-",
X = "-",
Me = "Moderado",
Mo = "Deficiente",
V = "-",
Sd = "-",
Cv = "-",
As = "-",
K = "-",
Valores_Atipicos = "No aplica",
stringsAsFactors = FALSE
)
# 2. Diseño de la tabla con formato gt
tabla_indicadores_gt <- tabla_indicadores %>%
gt() %>%
tab_header(
title = "Tabla Nro. 2",
subtitle = "Indicadores estadisticos del nivel de tratamiento y reciclaje de residuos de la calidad de agua en Europa (1991-2017)"
) %>%
cols_label(
Variable = "Variable",
Rango = "Rango",
X = "X",
Me = "Me",
Mo = "Mo",
V = "V",
Sd = "Sd",
Cv = "Cv",
As = "As",
K = "K",
Valores_Atipicos = "Valores Atipicos"
) %>%
tab_source_note(
source_note = "Autor: Grupo 3"
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
column_labels.border.bottom.color = "black",
row.striping.include_table_body = TRUE,
table.align = "center"
)
# 3. Mostrar la tabla formateada en el documento final
tabla_indicadores_gt
| Tabla Nro. 2 |
| Indicadores estadisticos del nivel de tratamiento y reciclaje de residuos de la calidad de agua en Europa (1991-2017) |
| Variable |
Rango |
X |
Me |
Mo |
V |
Sd |
Cv |
As |
K |
Valores Atipicos |
| Nivel de reciclaje |
- |
- |
Moderado |
Deficiente |
- |
- |
- |
- |
- |
No aplica |
| Autor: Grupo 3 |
5. Conclusión
#El valor más frecuente del nivel de tratamiento y reciclaje de residuos es Deficiente, mientras que la mediana indica que el 50% de los datos se posiciona en un nivel Moderado o inferior.