0.Carga de librerias

library(gt)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

1. Leer datos

datos <- read.csv(
  "waterPollution.csv",
  sep = ",",
  stringsAsFactors = FALSE
)

2. Extracción de la variable

Nivel_combustible <- datos$combustibleRenewables_2009_2014

3. Tabla de distribución de frecuencias

# =========================
# VARIABLE ORDINAL
# =========================

Nivel_combustible <- cut(
  datos$combustibleRenewables_2009_2014,
  breaks = c(1.06, 4.40, 5, 26),
  labels = c("Bajo", "Moderado", "Alto"),
  include.lowest = TRUE,
  ordered_result = TRUE
)

summary(datos$combustibleRenewables_2009_2014)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.     NAs 
##   1.064   4.363   4.458   4.653   4.458  25.982     107
# =========================
# TABLA DE FRECUENCIAS
# =========================

TDF_combustible <- data.frame(table(Nivel_combustible))

# Frecuencia absoluta
ni <- TDF_combustible$Freq

# Frecuencia relativa
hi <- round((ni / sum(ni)) * 100, 2)

# Construcción tabla
TDF_combustible <- data.frame(
  Nivel_combustible = TDF_combustible$Nivel_combustible,
  ni,
  hi
)

# =========================
# FILA TOTAL
# =========================

Summary <- data.frame(
  Nivel_combustible = "TOTAL",
  ni = sum(ni),
  hi = 100
)

# Unir tabla y total
TDF_combustible_suma <- rbind(TDF_combustible, Summary)

# Cambiar nombres columnas
colnames(TDF_combustible_suma) <- c(
  "Nivel_Combustible",
  "ni",
  "hi(%)"
)

# =========================
# TABLA FORMATEADA
# =========================

TDF_combustible_suma %>%
  gt() %>%
  tab_header(
    title = md("Tabla Nro. 1"),
    subtitle = md("*Distribución del Nivel de Uso 
    de Combustibles Renovables de la calidad de 
                  agua en Europa(1991-2017)*")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  )
Tabla Nro. 1
Distribución del Nivel de Uso de Combustibles Renovables de la calidad de agua en Europa(1991-2017)
Nivel_Combustible ni hi(%)
Bajo 8020 40.32
Moderado 9661 48.56
Alto 2212 11.12
TOTAL 19893 100.00
Autor: Grupo 3

4. Gráficas

4.1. Histograma

# =========================
# GRÁFICA DE BARRAS
# Frecuencia absoluta (ni)
# =========================

barplot(TDF_combustible$ni,
        main = "Gráfica N°1: Distribución del nivel 
        de uso de combustibles renovables y residuos
        de la calidad de
        agua en Europa(1991-2017)",
        xlab = "Nivel de combustible renovable",
        ylab = "Cantidad",
        col = "skyblue",
        ylim = c(0, max(TDF_combustible$ni) * 1.1),
        names.arg = TDF_combustible$Nivel_combustible,
        las = 1,
        cex.names = 0.9)

4.2. Histograma general

# =========================
# GRÁFICA DE BARRAS (ni)
# Con tamaño muestral = 20000
# =========================

barplot(ni,
        main = "Gráfica N°2: Distribución del
        nivel de uso de combustibles renovables y 
        residuos de la calidad 
        de agua en Europa(1991-2017)",
        xlab = "Nivel de combustible renovable",
        ylab = "Cantidad",
        col = "red",
        ylim = c(0, 20000),
        las = 1,
        cex.names = 0.8,
        names.arg = TDF_combustible$Nivel_combustible)

4.3. Hstograma porcentual

# =========================
# GRÁFICA DE BARRAS
# Frecuencia relativa (hi)
# =========================

barplot(TDF_combustible$hi,
        main = "Gráfica N°3: Distribución porcentual 
        del nivel de uso de combustibles renovables 
        y residuos de la
        calidad de agua en Europa(1991-2017)",
        xlab = "Nivel de combustible renovable",
        ylab = "Porcentaje",
        col = "skyblue",
        ylim = c(0, max(TDF_combustible$hi) * 1.1),
        names.arg = TDF_combustible$Nivel_combustible,
        las = 1,
        cex.names = 0.9)

4.4. Histograma porcentual general

# =========================
# GRÁFICA DE BARRAS (hi)
# Con tamaño muestral = 20000
# =========================

barplot(hi,
        main = "Gráfica N°4: Distribución porcentual 
        del nivel de uso de combustibles renovables 
        y residuos de la calidad de agua 
        en Europa(1991.2017)",
        xlab = "Nivel de combustible renovable",
        ylab = "Porcentaje",
        col = "red",
        ylim = c(0, 100),
        las = 1,
        cex.names = 0.8,
        names.arg = TDF_combustible$Nivel_combustible)

4.4. Diagrama circular

# =========================
# DIAGRAMA CIRCULAR
# =========================

etiquetas <- paste0(hi, " %")

colores <- c("lightsteelblue", "lightblue", "powderblue")

par(mar = c(2, 2, 4, 6))

pie(
  hi,
  labels = etiquetas,
  col = colores,
  main = " Gráfica N°5:Distribución del Nivel de
  Uso de Combustibles Renovables de la calidad de 
  agua en Europa(1991-2017)",
  cex = 1
)

legend(
  "topright",
  legend = TDF_combustible$Nivel_combustible,
  fill = colores,
  title = "Leyenda",
  cex = 0.8,
  xpd = TRUE
)

5. Indicadores Estadísticos

# 5. Indicadores Estadísticos
# =================================================================
# CÁLCULO DE MEDIDAS DE POSICIÓN PARA VARIABLE ORDINAL
# =================================================================

# 1. Mediana (Me): Buscamos la categoría donde el porcentaje acumulado pasa el 50%
porcentaje_acumulado <- cumsum(hi)
posicion_mediana <- which(porcentaje_acumulado >= 50)[1]
mediana_val <- TDF_combustible$Nivel_combustible[posicion_mediana]

# 2. Moda (Mo): Categoría con la frecuencia absoluta más alta (ni)
posicion_moda <- which.max(ni)
moda_val <- TDF_combustible$Nivel_combustible[posicion_moda]

# 3. Construcción de la matriz de indicadores estadísticos
tabla_indicadores <- data.frame(
  Variable = "Nivel de combustible renovable",
  Rango = "-",
  X = "-",
  Me = as.character(mediana_val),
  Mo = as.character(moda_val),
  V = "-",
  Sd = "-",
  Cv = "-",
  As = "-",
  K = "-",
  Valores_Atipicos = "No aplica",
  stringsAsFactors = FALSE
)

# 4. Formateo visual con la librería gt
tabla_indicadores_gt <- tabla_indicadores %>%
  gt() %>%
  tab_header(
    title = "Tabla Nro. 3",
    subtitle = "Indicadores estadísticos del nivel de uso de combustibles renovables en Europa (1991-2017)"
  ) %>%
  cols_label(
    Variable = "Variable",
    Rango = "Rango",
    X = "X",
    Me = "Me",
    Mo = "Mo",
    V = "V",
    Sd = "Sd",
    Cv = "Cv",
    As = "As",
    K = "K",
    Valores_Atipicos = "Valores Atípicos"
  ) %>%
  tab_source_note(
    source_note = "Autor: Grupo 3"
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    column_labels.border.bottom.color = "black",
    row.striping.include_table_body = TRUE,
    table.align = "center"
  )

# Desplegar la tabla formateada en el HTML
tabla_indicadores_gt
Tabla Nro. 3
Indicadores estadísticos del nivel de uso de combustibles renovables en Europa (1991-2017)
Variable Rango X Me Mo V Sd Cv As K Valores Atípicos
Nivel de combustible renovable - - Moderado Moderado - - - - - No aplica
Autor: Grupo 3

6. Conclusión

#El valor más frecuente del nivel de uso de combustibles renovables es el nivel Moderado, mientras que la mitad de los datos se encuentra en un nivel Moderado.