1 CARGA DE DATOS Y LIBRERÍAS

# Ruta completa al archivo
datos <- read.csv("C:/Users/Grace/Favorites/Restudio (Estadistica)/Sedimentos Marinos.csv",
                  header = TRUE,
                  sep = ";",
                  dec = ".")

# Extraer la variable MONTH_ANAL
month_anal <- as.numeric(datos$MONTH_ANAL)

# Mantener solo meses válidos
month_clean <- month_anal[
  month_anal >= 1 & month_anal <= 12 & month_anal != -9999
]

# Tamaño de muestra
n <- length(month_clean)
cat("Tamaño de la muestra (n): ", n, "\n")
## Tamaño de la muestra (n):  13655

2 CARGA DE LIBRERÍAS

library(dplyr)
library(knitr)
library(gt)

3 TABLA DE DISTRIBUCIÓN DE FRECUENCIA

TABLA DE DISTRIBUCIÓN DE FRECUENCIA

# Frecuencia absoluta (ni)
ni <- table(month_clean)

# Frecuencia relativa (hi)
hi <- round(prop.table(ni) * 100, 2)

# Tabla principal
tabla_final <- data.frame(
  Mes = names(ni),
  ni = as.numeric(ni),
  hi = as.numeric(hi)
)

# Fila TOTAL
fila_total <- data.frame(
  Mes = "TOTAL",
  ni = sum(tabla_final$ni),
  hi = sum(tabla_final$hi)
)
fila_total$hi <- 100

# Tabla total
tabla_Total <- rbind(tabla_final, fila_total)
tabla_Total
##      Mes    ni     hi
## 1      1  1535  11.26
## 2      2   935   6.86
## 3      3   973   7.14
## 4      4   895   6.57
## 5      5  1167   8.56
## 6      6  1147   8.42
## 7      7  1234   9.05
## 8      8  1314   9.64
## 9      9   838   6.15
## 10    10  1222   8.97
## 11    11  1119   8.21
## 12    12  1249   9.16
## 13 TOTAL 13628 100.00

4 TABLA FINAL CON ESTILO

tablaMes <- tabla_Total %>%
  gt() %>%
  tab_header(
    title = md("**Tabla N° 1**"),
    subtitle = md("**Frecuencias absolutas y relativas del mes de análisis de las muestras de sedimentos marinos**")
  ) %>%
  tab_source_note(
    source_note = md("Grupo 3")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black",
    row.striping.include_table_body = TRUE
  )

tablaMes
Tabla N° 1
Frecuencias absolutas y relativas del mes de análisis de las muestras de sedimentos marinos
Mes ni hi
1 1535 11.26
2 935 6.86
3 973 7.14
4 895 6.57
5 1167 8.56
6 1147 8.42
7 1234 9.05
8 1314 9.64
9 838 6.15
10 1222 8.97
11 1119 8.21
12 1249 9.16
TOTAL 13628 100.00
Grupo 3

5 GRÁFICAS DE DISTRIBUCIÓN DE FRECUENCIA

# Diagrama de barras de frecuencia absoluta local
barplot(
  tabla_Total$ni[1:(nrow(tabla_Total)-1)],
  main = "Gráfica Nº1: Distribución de los meses de análisis Local",
  cex.main = 0.8,
  col = "gray",
  xlab = "Mes",
  ylab = "Cantidad (ni)",
  names.arg = tabla_Total$Mes[1:(nrow(tabla_Total)-1)]
)

# Diagrama de barras de frecuencia absoluta global
barplot(
  tabla_Total$ni[1:(nrow(tabla_Total)-1)],
  main = "Gráfica Nº2: Distribución de los meses de análisis Global",
  cex.main = 0.8,
  xlab = "Mes",
  ylab = "Cantidad (ni)",
  col = "gray",
  names.arg = tabla_Total$Mes[1:(nrow(tabla_Total)-1)],
  ylim = c(0, max(tabla_Total$ni[1:(nrow(tabla_Total)-1)]) * 1.2)
)

# Frecuencia relativa local
hi_local <- as.numeric(tabla_Total$hi[1:(nrow(tabla_Total)-1)])
barplot(
  hi_local,
  main = "Gráfica Nº3: Distribución de porcentaje de los meses de análisis Local",
  cex.main = 0.8,
  xlab = "Mes",
  ylab = "Porcentaje (%)",
  col = "gray",
  names.arg = tabla_Total$Mes[1:(nrow(tabla_Total)-1)]
)

# Frecuencia relativa global
hi_global <- as.numeric(tabla_Total$hi[1:(nrow(tabla_Total)-1)])
barplot(
  hi_global,
  main = "Gráfica Nº4: Distribución de porcentaje de los meses de análisis Global",
  cex.main = 0.8,
  xlab = "Mes",
  ylab = "Porcentaje (%)",
  col = "gray",
  names.arg = tabla_Total$Mes[1:(nrow(tabla_Total)-1)],
  ylim = c(0, 100)
)

# Diagrama Circular
hi_mes <- as.numeric(tabla_Total$hi[1:(nrow(tabla_Total)-1)])
meses <- tabla_Total$Mes[1:(nrow(tabla_Total)-1)]
Colores <- colorRampPalette(c("red", "green"))(length(hi_mes))
etiquetas <- paste0(hi_mes, "%")
par(mfrow = c(1,2))
par(mar = c(2,2,4,2))
pie(
  hi_mes,
  radius = 0.8,
  col = Colores,
  labels = etiquetas,
  main = "Gráfica Nº5: Distribución porcentual del mes de análisis",
  cex.main = 0.8
)
plot.new()
legend(
  "center",
  title = "Mes",
  legend = meses,
  fill = Colores,
  cex = 0.7,
  bg = "white",
  box.lwd = 0.7
)

## Indicadores estadísticos

# Tabla de frecuencias
tabla_mes <- table(month_clean)

# Moda
moda_mes <- names(tabla_mes)[which.max(as.numeric(tabla_mes))]
moda_mes
## [1] "1"

6 Tabla de indicadores estadísticos

Variable <- c("Mes")
TablaIndicadores <- data.frame(Variable, moda_mes)
colnames(TablaIndicadores) <- c("Variable", "Moda")
kable(TablaIndicadores, format = "markdown", caption = "Tabla N°2: Indicadores estadísticos del mes de análisis")
Tabla N°2: Indicadores estadísticos del mes de análisis
Variable Moda
Mes 1

7 Conclusiones

La variable MONTH_ANAL (mes de análisis de las muestras) presenta valores que fluctúa en 1, con una distribución relativamente uniforme a lo largo del año. La moda se encuentra en el mes con mayor frecuencia de análisis (generalmente uno de los meses centrales del año, como julio o agosto, según los datos), lo que refleja una actividad de laboratorio continua sin marcada estacionalidad.

Este comportamiento resulta beneficioso para el análisis de sedimentos marinos, ya que la ausencia de sesgo estacional fuerte indica que los análisis se realizaron de forma equilibrada durante todo el año, permitiendo una evaluación más confiable de la composición de las muestras sin influencia dominante de condiciones estacionales en los procesos de laboratorio.