0. Librerias

library(gt)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

1. Leer Datos

datos <- read.csv(
  "waterPollution.csv",
  sep = ",",
  stringsAsFactors = FALSE
)

2. Extracción de Variable

datos$parameterWaterBodyCategory <- recode(
  datos$parameterWaterBodyCategory,
  "GW" = "Aguas subterráneas",
  "LW" = "Agua de lagos",
  "RW" = "Agua de ríos"
)

3. Tabla de distribución de frecuencia

# =========================
# TABLAS CUALITATIVAS NOMINALES
# =========================

PWB <- datos$parameterWaterBodyCategory

TDF_PWB <- data.frame(table(PWB))

ni <- TDF_PWB$Freq
hi <- round((ni / sum(ni)) * 100, 2)

TDF_PWB <- data.frame(PWB = TDF_PWB$PWB, ni, hi)
Summary <- data.frame(PWB = "TOTAL", ni = sum(ni), hi = 100)

TDF_PWB_suma <- rbind(TDF_PWB, Summary)
colnames(TDF_PWB_suma) <- c("Cuerpos de agua", "ni", "hi(%)")

# =========================
# TABLA
# =========================

TDF_PWB_suma %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nro. 1*"),
    subtitle = md("**Distribución de Frecuencias de las Categorias de cuerpos de agua en el estudio de calidad de agua en Europa(1991-2017)**")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )
Tabla Nro. 1
Distribución de Frecuencias de las Categorias de cuerpos de agua en el estudio de calidad de agua en Europa(1991-2017)
Cuerpos de agua ni hi(%)
Agua de lagos 61 0.30
Agua de ríos 19416 97.08
Aguas subterráneas 523 2.61
TOTAL 20000 100.00
Autor: Grupo 3

4. Gráficas

4.1 Histograma

# =========================
# DIAGRAMA DE BARRAS LOCAL ni
# =========================
barplot(ni,
        main = "Gráfica N°1: Distribución de las 
        Categorias de cuerpos de agua en el estudio de calidad de 
        agua en Europa(1991-2017)",
        xlab = "Categoria de cuerpo de agua",
        ylab = "Cantidad",
        col = "orchid",
        ylim = c(0,max(ni)),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_PWB$PWB)

4.2 Histograma general

# =========================
# DIAGRAMA DE BARRAS GLOBAL ni
# =========================
barplot(ni,
        main = "Gráfica N°2: Distribución general de las 
        Categorias de cuerpos de agua en el estudio de calidad 
        de agua en Europa(1991-2017)",
        xlab = "Categoria de cuerpo de agua",
        ylab = "Cantidad",
        col = "orchid",
        ylim = c(0,20000),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_PWB$PWB)

4.3 Histograma Porcentual

# =========================
# DIAGRAMA DE BARRAS LOCAL hi
# =========================
barplot(hi,
        main = "Gráfica N°3: Distribución porcentual de las 
        Categorias de cuerpos de agua en el estudio de calidad 
        de agua en Europa(1991-2017)",
        xlab = "Categoria de cuerpo de agua",
        ylab = "Porcentaje",
        col = "mistyrose",
        ylim = c(0,max(hi)),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_PWB$PWB)

4.4 Histograma Porcentual general

# =========================
# DIAGRAMA DE BARRAS GLOBAL hi
# =========================
# 
barplot(hi,
        main = "Gráfica N°4: Distribución porcentual general de las 
        Categorias de cuerpos de agua en el estudio de calidad 
        de agua en Europa(1991-2017)",
        xlab = "Categoria de cuerpo de agua",
        ylab = "Porcentaje",
        col = "mistyrose",
        ylim = c(0,100),
        las = 1,
        cex.names = 0.6,
        names.arg = TDF_PWB$PWB)

4.5 Diagrama Circular

# =========================
# DIAGRAMA CIRCULAR
# =========================

etiquetas <- paste0(hi, " %")

colores <- c("tomato", "turquoise", "violet", "violetred", "wheat", "yellow")

par(mar = c(2, 2, 4, 6))

pie(
  hi,
  labels = etiquetas,
  col = colores,
  main = "Gráfica N°5: Distribución porcentual de las 
  Categorias de cuerpos de agua en el estudio de calidad 
  de agua en Europa(1991-2017)",
  cex = 1
)

legend(
  "topright",
  legend = TDF_PWB$PWB,
  fill = colores,
  title = "Leyenda",
  cex = 0.5,
  xpd = TRUE
)

5. Indicadores Estadísticos

# =========================
# INDICADORES ESTADÍSTICOS
# =========================

# Moda
frecuencia_max <- max(TDF_PWB$ni)

modas <- TDF_PWB$PWB[
  TDF_PWB$ni == frecuencia_max
]

Mo_PWB <- paste(modas, collapse = " - ")

# Tabla resumen

tabla_indicadores <- data.frame(
  Variable = "Categoría de cuerpo de agua",
  Rango = "-",
  X = "-",
  Me = "-",
  Mo = Mo_PWB,
  V = "-",
  Sd = "-",
  Cv = "-",
  As = "-",
  K = "-",
  Valores_Atipicos = "No aplica"
)

# Mostrar tabla

tabla_indicadores_gt <- tabla_indicadores %>%
  gt() %>%
  tab_header(
    title = md("*Tabla Nro. 3*"),
    subtitle = md("**Indicadores estadísticos de la categoría de cuerpos de agua en el estudio de calidad de agua en Europa(1991-2017)**")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    column_labels.border.bottom.color = "black",
    row.striping.include_table_body = TRUE
  )

tabla_indicadores_gt
Tabla Nro. 3
Indicadores estadísticos de la categoría de cuerpos de agua en el estudio de calidad de agua en Europa(1991-2017)
Variable Rango X Me Mo V Sd Cv As K Valores_Atipicos
Categoría de cuerpo de agua - - - Agua de ríos - - - - - No aplica
Autor: Grupo 3

6. Conclusión

# =========================
# CONCLUSIÓN
# =========================
#El valor más frecuente de la variable Categoria de cuerpo de agua es el Agua de ríos