0.Carga de librerias
library(gt)
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
1. Leer datos
datos <- read.csv(
"waterPollution.csv",
sep = ",",
stringsAsFactors = FALSE
)
3. Tabla de distribución de frecuencias
# =========================
# VARIABLE ORDINAL
# =========================
Nivel_combustible <- cut(
datos$combustibleRenewables_2009_2014,
breaks = c(1.06, 4.40, 5, 26),
labels = c("Bajo", "Moderado", "Alto"),
include.lowest = TRUE,
ordered_result = TRUE
)
summary(datos$combustibleRenewables_2009_2014)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NAs
## 1.064 4.363 4.458 4.653 4.458 25.982 107
# =========================
# TABLA DE FRECUENCIAS
# =========================
TDF_combustible <- data.frame(table(Nivel_combustible))
# Frecuencia absoluta
ni <- TDF_combustible$Freq
# Frecuencia relativa
hi <- round((ni / sum(ni)) * 100, 2)
# Construcción tabla
TDF_combustible <- data.frame(
Nivel_combustible = TDF_combustible$Nivel_combustible,
ni,
hi
)
# =========================
# FILA TOTAL
# =========================
Summary <- data.frame(
Nivel_combustible = "TOTAL",
ni = sum(ni),
hi = 100
)
# Unir tabla y total
TDF_combustible_suma <- rbind(TDF_combustible, Summary)
# Cambiar nombres columnas
colnames(TDF_combustible_suma) <- c(
"Nivel_Combustible",
"ni",
"hi(%)"
)
# =========================
# TABLA FORMATEADA
# =========================
TDF_combustible_suma %>%
gt() %>%
tab_header(
title = md("Tabla Nro. 1"),
subtitle = md("*Distribución del Nivel de Uso
de Combustibles Renovables de la calidad de
agua en Europa(1991-2017)*")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 3")
)
| Tabla Nro. 1 |
| Distribución del Nivel de Uso
de Combustibles Renovables de la calidad de
agua en Europa(1991-2017) |
| Nivel_Combustible |
ni |
hi(%) |
| Bajo |
8020 |
40.32 |
| Moderado |
9661 |
48.56 |
| Alto |
2212 |
11.12 |
| TOTAL |
19893 |
100.00 |
| Autor: Grupo 3 |
4. Gráficas
4.1. Histograma
# =========================
# GRÁFICA DE BARRAS
# Frecuencia absoluta (ni)
# =========================
barplot(TDF_combustible$ni,
main = "Gráfica N°1: Distribución del nivel
de uso de combustibles renovables y residuos
de la calidad de
agua en Europa(1991-2017)",
xlab = "Nivel de combustible renovable",
ylab = "Cantidad",
col = "skyblue",
ylim = c(0, max(TDF_combustible$ni) * 1.1),
names.arg = TDF_combustible$Nivel_combustible,
las = 1,
cex.names = 0.9)

4.2. Histograma general
# =========================
# GRÁFICA DE BARRAS (ni)
# Con tamaño muestral = 20000
# =========================
barplot(ni,
main = "Gráfica N°2: Distribución del
nivel de uso de combustibles renovables y
residuos de la calidad
de agua en Europa(1991-2017)",
xlab = "Nivel de combustible renovable",
ylab = "Cantidad",
col = "red",
ylim = c(0, 20000),
las = 1,
cex.names = 0.8,
names.arg = TDF_combustible$Nivel_combustible)

4.3. Hstograma porcentual
# =========================
# GRÁFICA DE BARRAS
# Frecuencia relativa (hi)
# =========================
barplot(TDF_combustible$hi,
main = "Gráfica N°3: Distribución porcentual
del nivel de uso de combustibles renovables
y residuos de la
calidad de agua en Europa(1991-2017)",
xlab = "Nivel de combustible renovable",
ylab = "Porcentaje",
col = "skyblue",
ylim = c(0, max(TDF_combustible$hi) * 1.1),
names.arg = TDF_combustible$Nivel_combustible,
las = 1,
cex.names = 0.9)

4.4. Histograma porcentual general
# =========================
# GRÁFICA DE BARRAS (hi)
# Con tamaño muestral = 20000
# =========================
barplot(hi,
main = "Gráfica N°4: Distribución porcentual
del nivel de uso de combustibles renovables
y residuos de la calidad de agua
en Europa(1991.2017)",
xlab = "Nivel de combustible renovable",
ylab = "Porcentaje",
col = "red",
ylim = c(0, 100),
las = 1,
cex.names = 0.8,
names.arg = TDF_combustible$Nivel_combustible)

4.4. Diagrama circular
# =========================
# DIAGRAMA CIRCULAR
# =========================
etiquetas <- paste0(hi, " %")
colores <- c("lightsteelblue", "lightblue", "powderblue")
par(mar = c(2, 2, 4, 6))
pie(
hi,
labels = etiquetas,
col = colores,
main = " Gráfica N°5:Distribución del Nivel de
Uso de Combustibles Renovables de la calidad de
agua en Europa(1991-2017)",
cex = 1
)
legend(
"topright",
legend = TDF_combustible$Nivel_combustible,
fill = colores,
title = "Leyenda",
cex = 0.8,
xpd = TRUE
)

5. Indicadores Estadísticos
# 5. Indicadores Estadísticos
# =================================================================
# CÁLCULO DE MEDIDAS DE POSICIÓN PARA VARIABLE ORDINAL
# =================================================================
# 1. Mediana (Me): Buscamos la categoría donde el porcentaje acumulado pasa el 50%
porcentaje_acumulado <- cumsum(hi)
posicion_mediana <- which(porcentaje_acumulado >= 50)[1]
mediana_val <- TDF_combustible$Nivel_combustible[posicion_mediana]
# 2. Moda (Mo): Categoría con la frecuencia absoluta más alta (ni)
posicion_moda <- which.max(ni)
moda_val <- TDF_combustible$Nivel_combustible[posicion_moda]
# 3. Construcción de la matriz de indicadores estadísticos
tabla_indicadores <- data.frame(
Variable = "Nivel de combustible renovable",
Rango = "-",
X = "-",
Me = as.character(mediana_val),
Mo = as.character(moda_val),
V = "-",
Sd = "-",
Cv = "-",
As = "-",
K = "-",
Valores_Atipicos = "No aplica",
stringsAsFactors = FALSE
)
# 4. Formateo visual con la librería gt
tabla_indicadores_gt <- tabla_indicadores %>%
gt() %>%
tab_header(
title = "Tabla Nro. 3",
subtitle = "Indicadores estadísticos del nivel de uso de combustibles renovables en Europa (1991-2017)"
) %>%
cols_label(
Variable = "Variable",
Rango = "Rango",
X = "X",
Me = "Me",
Mo = "Mo",
V = "V",
Sd = "Sd",
Cv = "Cv",
As = "As",
K = "K",
Valores_Atipicos = "Valores Atípicos"
) %>%
tab_source_note(
source_note = "Autor: Grupo 3"
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
column_labels.border.bottom.color = "black",
row.striping.include_table_body = TRUE,
table.align = "center"
)
# Desplegar la tabla formateada en el HTML
tabla_indicadores_gt
| Tabla Nro. 3 |
| Indicadores estadísticos del nivel de uso de combustibles renovables en Europa (1991-2017) |
| Variable |
Rango |
X |
Me |
Mo |
V |
Sd |
Cv |
As |
K |
Valores Atípicos |
| Nivel de combustible renovable |
- |
- |
Moderado |
Moderado |
- |
- |
- |
- |
- |
No aplica |
| Autor: Grupo 3 |
6. Conclusión
#El valor más frecuente del nivel de uso de combustibles renovables
es el nivel Moderado, mientras que la mitad de los datos se encuentra en
un nivel Moderado.