0. Librerias
library(gt)
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
1. Leer Datos
datos <- read.csv(
"waterPollution.csv",
sep = ",",
stringsAsFactors = FALSE
)
3. Tabla de distribución de frecuencia
# =========================
# TABLAS CUALITATIVAS NOMINALES
# =========================
PWB <- datos$parameterWaterBodyCategory
TDF_PWB <- data.frame(table(PWB))
ni <- TDF_PWB$Freq
hi <- round((ni / sum(ni)) * 100, 2)
TDF_PWB <- data.frame(PWB = TDF_PWB$PWB, ni, hi)
Summary <- data.frame(PWB = "TOTAL", ni = sum(ni), hi = 100)
TDF_PWB_suma <- rbind(TDF_PWB, Summary)
colnames(TDF_PWB_suma) <- c("Cuerpos de agua", "ni", "hi(%)")
# =========================
# TABLA
# =========================
TDF_PWB_suma %>%
gt() %>%
tab_header(
title = md("*Tabla Nro. 1*"),
subtitle = md("**Distribución de Frecuencias de las Categorias de cuerpos de agua en el estudio de calidad de agua en Europa(1991-2017)**")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 3")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
table.border.top.style = "solid",
table.border.bottom.style = "solid",
column_labels.border.top.color = "black",
column_labels.border.bottom.color = "black",
column_labels.border.bottom.width = px(2),
row.striping.include_table_body = TRUE,
heading.border.bottom.color = "black",
heading.border.bottom.width = px(2),
table_body.hlines.color = "gray",
table_body.border.bottom.color = "black"
)
| Tabla Nro. 1 |
| Distribución de Frecuencias de las Categorias de cuerpos de agua en el estudio de calidad de agua en Europa(1991-2017) |
| Cuerpos de agua |
ni |
hi(%) |
| Agua de lagos |
61 |
0.30 |
| Agua de ríos |
19416 |
97.08 |
| Aguas subterráneas |
523 |
2.61 |
| TOTAL |
20000 |
100.00 |
| Autor: Grupo 3 |
4. Gráficas
4.1 Histograma
# =========================
# DIAGRAMA DE BARRAS LOCAL ni
# =========================
barplot(ni,
main = "Gráfica N°1: Distribución de las
Categorias de cuerpos de agua en el estudio de calidad de
agua en Europa(1991-2017)",
xlab = "Categoria de cuerpo de agua",
ylab = "Cantidad",
col = "orchid",
ylim = c(0,max(ni)),
las = 1,
cex.names = 0.6,
names.arg = TDF_PWB$PWB)

4.2 Histograma general
# =========================
# DIAGRAMA DE BARRAS GLOBAL ni
# =========================
barplot(ni,
main = "Gráfica N°2: Distribución general de las
Categorias de cuerpos de agua en el estudio de calidad
de agua en Europa(1991-2017)",
xlab = "Categoria de cuerpo de agua",
ylab = "Cantidad",
col = "orchid",
ylim = c(0,20000),
las = 1,
cex.names = 0.6,
names.arg = TDF_PWB$PWB)

4.3 Histograma Porcentual
# =========================
# DIAGRAMA DE BARRAS LOCAL hi
# =========================
barplot(hi,
main = "Gráfica N°3: Distribución porcentual de las
Categorias de cuerpos de agua en el estudio de calidad
de agua en Europa(1991-2017)",
xlab = "Categoria de cuerpo de agua",
ylab = "Porcentaje",
col = "mistyrose",
ylim = c(0,max(hi)),
las = 1,
cex.names = 0.6,
names.arg = TDF_PWB$PWB)

4.4 Histograma Porcentual general
# =========================
# DIAGRAMA DE BARRAS GLOBAL hi
# =========================
#
barplot(hi,
main = "Gráfica N°4: Distribución porcentual general de las
Categorias de cuerpos de agua en el estudio de calidad
de agua en Europa(1991-2017)",
xlab = "Categoria de cuerpo de agua",
ylab = "Porcentaje",
col = "mistyrose",
ylim = c(0,100),
las = 1,
cex.names = 0.6,
names.arg = TDF_PWB$PWB)

4.5 Diagrama Circular
# =========================
# DIAGRAMA CIRCULAR
# =========================
etiquetas <- paste0(hi, " %")
colores <- c("tomato", "turquoise", "violet", "violetred", "wheat", "yellow")
par(mar = c(2, 2, 4, 6))
pie(
hi,
labels = etiquetas,
col = colores,
main = "Gráfica N°5: Distribución porcentual de las
Categorias de cuerpos de agua en el estudio de calidad
de agua en Europa(1991-2017)",
cex = 1
)
legend(
"topright",
legend = TDF_PWB$PWB,
fill = colores,
title = "Leyenda",
cex = 0.5,
xpd = TRUE
)

5. Indicadores Estadísticos
# =========================
# INDICADORES ESTADÍSTICOS
# =========================
# Moda
frecuencia_max <- max(TDF_PWB$ni)
modas <- TDF_PWB$PWB[
TDF_PWB$ni == frecuencia_max
]
Mo_PWB <- paste(modas, collapse = " - ")
# Tabla resumen
tabla_indicadores <- data.frame(
Variable = "Categoría de cuerpo de agua",
Rango = "-",
X = "-",
Me = "-",
Mo = Mo_PWB,
V = "-",
Sd = "-",
Cv = "-",
As = "-",
K = "-",
Valores_Atipicos = "No aplica"
)
# Mostrar tabla
tabla_indicadores_gt <- tabla_indicadores %>%
gt() %>%
tab_header(
title = md("*Tabla Nro. 3*"),
subtitle = md("**Indicadores estadísticos de la categoría de cuerpos de agua en el estudio de calidad de agua en Europa(1991-2017)**")
) %>%
tab_source_note(
source_note = md("Autor: Grupo 3")
) %>%
tab_options(
table.border.top.color = "black",
table.border.bottom.color = "black",
column_labels.border.bottom.color = "black",
row.striping.include_table_body = TRUE
)
tabla_indicadores_gt
| Tabla Nro. 3 |
| Indicadores estadísticos de la categoría de cuerpos de agua en el estudio de calidad de agua en Europa(1991-2017) |
| Variable |
Rango |
X |
Me |
Mo |
V |
Sd |
Cv |
As |
K |
Valores_Atipicos |
| Categoría de cuerpo de agua |
- |
- |
- |
Agua de ríos |
- |
- |
- |
- |
- |
No aplica |
| Autor: Grupo 3 |
6. Conclusión
# =========================
# CONCLUSIÓN
# =========================
#El valor más frecuente de la variable Categoria de cuerpo de agua es el Agua de ríos