1 Objetivo del análisis
2 1. Configuración inicial
3 2. Lectura del archivo Excel
4 3. Preparación de la base mensual
5 4. Conversión a serie de tiempo mensual
6 5. Gráfico general de la serie mensual
7 6. Tendencia anual de la serie
8 7. Promedio mensual climatológico
9 8. Distribución mensual mediante boxplot
10 9. Mapa de calor año-mes
11 10. Análisis por estación climática
- 11.1 10.1 Tendencia de la estación lluviosa
- 11.2 10.2 Tendencia de la estación seca
- 11.3 10.3 Comparación entre estación lluviosa y seca
- 11.4 10.4 Tendencia del acumulado por estación climática
12 11. Tendencia mensual independiente: enero, febrero, marzo y demás meses
- 12.1 11.1 Generación automática de un gráfico individual por cada mes
13 12. Gráfico estacional tipo season plot
14 13. Gráfico de subseries mensuales
15 14. Descomposición clásica de la serie
16 15. Descomposición STL
17 16. Media móvil de 12 meses y 24 meses
18 17. Anomalías mensuales respecto al promedio histórico del mes
19 18. Autocorrelación y autocorrelación parcial
20 19. Tabla resumen estadística general
21 20. Exportación de bases procesadas
22 21. Recomendación de interpretación

1 Objetivo del análisis

Este documento transforma los datos mensuales del archivo Excel en una serie de tiempo con frecuencia mensual, iniciando en enero de 1988. Además, genera gráficos exploratorios, gráficos de tendencia, análisis por estación climática, análisis por mes específico, descomposición de la serie, autocorrelación y anomalías mensuales. Todos los gráficos se muestran dentro del documento y también se guardan automáticamente en una carpeta local para su posterior uso en informes, artículos o publicaciones en RPubs.

2 1. Configuración inicial

En este bloque se definen las opciones generales del documento, se cargan los paquetes necesarios y se crea una función para guardar los gráficos en alta resolución.

knitr::opts_chunk$set(
  echo = TRUE,
  message = FALSE,
  warning = FALSE,
  fig.width = 11,
  fig.height = 6,
  dpi = 300,
  out.width = "100%"
)

# Paquetes requeridos
paquetes <- c(
  "readxl", "dplyr", "tidyr", "lubridate", "ggplot2",
  "forecast", "zoo", "scales", "stringr", "knitr"
)

paquetes_faltantes <- paquetes[!paquetes %in% rownames(installed.packages())]
if (length(paquetes_faltantes) > 0) {
  install.packages(paquetes_faltantes, dependencies = TRUE)
}

invisible(lapply(paquetes, library, character.only = TRUE))

## 
## Adjuntando el paquete: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

## 
## Adjuntando el paquete: 'lubridate'

## The following objects are masked from 'package:base':
## 
##     date, intersect, setdiff, union

## 
## Adjuntando el paquete: 'zoo'

## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric

# Carpeta para guardar los gráficos generados
carpeta_graficos <- "graficos_series_tiempo"
if (!dir.exists(carpeta_graficos)) dir.create(carpeta_graficos)

# Función para guardar gráficos con calidad publicable
guardar_grafico <- function(grafico, nombre, ancho = 12, alto = 7, dpi = 300) {
  ggplot2::ggsave(
    filename = file.path(carpeta_graficos, nombre),
    plot = grafico,
    width = ancho,
    height = alto,
    dpi = dpi,
    bg = "white"
  )
}

# Paleta institucional sugerida
color_principal <- "#005B96"
color_secundario <- "#F2A900"
color_terciario <- "#2E7D32"
color_alerta <- "#C62828"
color_gris <- "#4D4D4D"

3 2. Lectura del archivo Excel

Este bloque lee el archivo Excel desde la ruta indicada. En Windows se recomienda usar / en lugar de \. Si el archivo no se encuentra en la ruta definida, R abrirá una ventana para seleccionarlo manualmente.

ruta_archivo <- "C:/Users/nicol/OneDrive/Desktop/Nueva carpeta/Baba.xlsx"

if (!file.exists(ruta_archivo)) {
  message("No se encontró el archivo en la ruta indicada. Seleccione el archivo manualmente.")
  ruta_archivo <- file.choose()
}

datos_raw <- readxl::read_excel(ruta_archivo, sheet = "Hoja1")

# Revisión rápida de la estructura original
str(datos_raw)

## tibble [420 × 1] (S3: tbl_df/tbl/data.frame)
##  $ Suma de Valor: num [1:420] 194.5 194.5 249.4 1047.2 25.4 ...

head(datos_raw)

4 3. Preparación de la base mensual

El archivo contiene una columna de datos mensuales. En este bloque se crea una fecha mensual desde enero de 1988, se identifican año, mes, nombre del mes y estación climática. Para la estación lluviosa se considera diciembre a mayo; para la estación seca, junio a noviembre.

meses_esp <- c(
  "Enero", "Febrero", "Marzo", "Abril", "Mayo", "Junio",
  "Julio", "Agosto", "Septiembre", "Octubre", "Noviembre", "Diciembre"
)

serie_df <- datos_raw %>%
  dplyr::rename(valor = 1) %>%
  dplyr::mutate(valor = as.numeric(valor)) %>%
  dplyr::filter(!is.na(valor)) %>%
  dplyr::mutate(
    fecha = seq.Date(from = as.Date("1988-01-01"), by = "month", length.out = dplyr::n()),
    anio = lubridate::year(fecha),
    mes = lubridate::month(fecha),
    mes_nombre = factor(meses_esp[mes], levels = meses_esp),
    estacion = dplyr::case_when(
      mes %in% c(12, 1, 2, 3, 4, 5) ~ "Lluviosa (dic-may)",
      mes %in% c(6, 7, 8, 9, 10, 11) ~ "Seca (jun-nov)",
      TRUE ~ NA_character_
    ),
    # Diciembre se asigna al año climático siguiente para analizar la estación lluviosa completa.
    anio_estacion = dplyr::if_else(mes == 12, anio + 1L, anio)
  )

knitr::kable(head(serie_df, 12), caption = "Primeros 12 registros de la base procesada")

Primeros 12 registros de la base procesada
valor	fecha	anio	mes	mes_nombre	estacion	anio_estacion
194.5	1988-01-01	1988	1	Enero	Lluviosa (dic-may)	1988
194.5	1988-02-01	1988	2	Febrero	Lluviosa (dic-may)	1988
249.4	1988-03-01	1988	3	Marzo	Lluviosa (dic-may)	1988
1047.2	1988-04-01	1988	4	Abril	Lluviosa (dic-may)	1988
25.4	1988-05-01	1988	5	Mayo	Lluviosa (dic-may)	1988
210.3	1988-06-01	1988	6	Junio	Seca (jun-nov)	1988
752.4	1988-07-01	1988	7	Julio	Seca (jun-nov)	1988
712.9	1988-08-01	1988	8	Agosto	Seca (jun-nov)	1988
552.5	1988-09-01	1988	9	Septiembre	Seca (jun-nov)	1988
528.0	1988-10-01	1988	10	Octubre	Seca (jun-nov)	1988
206.6	1988-11-01	1988	11	Noviembre	Seca (jun-nov)	1988
198.0	1988-12-01	1988	12	Diciembre	Lluviosa (dic-may)	1989

knitr::kable(tail(serie_df, 12), caption = "Últimos 12 registros de la base procesada")

Últimos 12 registros de la base procesada
valor	fecha	anio	mes	mes_nombre	estacion	anio_estacion
21.0	2022-01-01	2022	1	Enero	Lluviosa (dic-may)	2022
1.6	2022-02-01	2022	2	Febrero	Lluviosa (dic-may)	2022
160.6	2022-03-01	2022	3	Marzo	Lluviosa (dic-may)	2022
44.1	2022-04-01	2022	4	Abril	Lluviosa (dic-may)	2022
47.3	2022-05-01	2022	5	Mayo	Lluviosa (dic-may)	2022
3.8	2022-06-01	2022	6	Junio	Seca (jun-nov)	2022
102.1	2022-07-01	2022	7	Julio	Seca (jun-nov)	2022
373.7	2022-08-01	2022	8	Agosto	Seca (jun-nov)	2022
58.4	2022-09-01	2022	9	Septiembre	Seca (jun-nov)	2022
58.4	2022-10-01	2022	10	Octubre	Seca (jun-nov)	2022
2.2	2022-11-01	2022	11	Noviembre	Seca (jun-nov)	2022
3.2	2022-12-01	2022	12	Diciembre	Lluviosa (dic-may)	2023

5 4. Conversión a serie de tiempo mensual

Aquí se convierte la columna numérica en un objeto ts de R, con frecuencia 12 porque los datos son mensuales.

serie_ts <- ts(serie_df$valor, start = c(1988, 1), frequency = 12)

serie_ts

##         Jan    Feb    Mar    Apr    May    Jun    Jul    Aug    Sep    Oct
## 1988  194.5  194.5  249.4 1047.2   25.4  210.3  752.4  712.9  552.5  528.0
## 1989  473.2  224.9  476.5  503.8  214.4  438.3  761.3  167.0  223.3  562.6
## 1990  104.9   35.2  276.7  264.9  516.7  437.3  207.3  261.6  175.8  211.1
## 1991  521.9  249.7  722.1  689.6  120.6  440.4  959.5  365.2  745.0  330.8
## 1992  919.5  507.9  323.5  616.8  566.1  740.7  501.9  407.7  608.0  540.6
## 1993  109.2  618.4  243.9  652.4  467.0  632.6  350.2  350.2  561.5  438.8
## 1994  121.7  846.6  565.1  307.5  361.4  590.6   50.5  775.6  282.3  326.7
## 1995  609.0  131.0  263.7  764.3  812.6 1109.8  732.5  664.2  565.0  344.2
## 1996  371.8  415.8  836.4  322.8  259.7  154.3  154.3  877.3   86.0  190.3
## 1997  400.2  479.6  123.0  389.6  562.9  541.3  289.1  283.0  101.2  621.0
## 1998  279.6   61.4  412.2 1024.9  484.8  209.0  430.8  552.3  397.0  243.8
## 1999  349.2  623.2   72.7  381.9  575.7  575.7  239.3  128.1    3.6    3.6
## 2000    6.5   21.6    4.0  164.7  104.2   22.8   32.1   14.8  688.3   84.6
## 2001    6.2  206.2  690.1  179.3  207.0   25.2  101.0   38.4   91.3    1.9
## 2002  105.9   55.0  142.1    1.9    1.9   12.8  472.8    1.5    0.0    0.0
## 2003    0.0    1.0    0.0   10.9   11.1   35.3    1.0  131.6   23.3    0.0
## 2004  219.5  210.9    5.6   10.4    0.0    5.2    9.0   23.8   23.8    3.8
## 2005   17.5    4.9   31.6   31.6    3.7    4.7    0.0    8.2    0.0  455.1
## 2006    0.0    3.1    1.6    1.4    0.0    2.7    4.4    0.0    0.0    8.4
## 2007   62.8    1.8    0.0    1.9    0.0    3.5    1.1    1.6    0.0    1.2
## 2008    7.3  103.3  103.3    0.0    0.0    0.0    0.0    0.0   51.6    0.0
## 2009    4.2    0.0    1.4    0.0    0.0    0.0    0.0    0.0    1.8    0.0
## 2010    0.0    0.0    0.0    0.0    1.5    0.0    0.0    1.6    0.0    4.4
## 2011    0.0    0.0    0.0    0.0    0.0    0.0    2.8  143.6    7.2    0.0
## 2012    1.1    0.0    0.0    0.0    0.0    0.0    0.0    0.0    0.0  234.4
## 2013    8.0    0.0    0.0    0.0    0.0    0.0    1.6    0.0    3.3    0.0
## 2014    4.5    0.0    0.0    4.6    0.0   20.6   50.2    2.8    0.0   10.5
## 2015    6.7    2.9    3.4    0.0    5.1    4.2    1.3    2.0   84.0    1.1
## 2016    1.3   13.9    6.0    6.2    0.0    0.0    3.3    2.8    2.6    0.0
## 2017    0.0    0.0    7.2    1.4  351.8   95.6   27.0    6.3    8.3    1.2
## 2018    1.2    5.9   11.1    1.3   26.5   13.9    0.0  560.6    4.7   13.0
## 2019    5.9   32.5    0.0    0.0   13.5    2.0    6.7    0.0    6.5    8.6
## 2020    0.0    3.6   49.3  616.9  189.1  113.0  102.9   89.6   31.6   75.0
## 2021  124.2   30.3  131.3  261.0   39.3   92.1  916.4   50.4  143.7   54.2
## 2022   21.0    1.6  160.6   44.1   47.3    3.8  102.1  373.7   58.4   58.4
##         Nov    Dec
## 1988  206.6  198.0
## 1989   77.1  177.8
## 1990  458.0  521.9
## 1991  758.3  698.9
## 1992  491.0  356.5
## 1993  403.8  403.8
## 1994  787.4  519.4
## 1995  300.5  282.2
## 1996  190.3  149.1
## 1997  466.4  380.7
## 1998  327.9   77.0
## 1999    6.9  737.4
## 2000   35.3   51.5
## 2001   20.2   53.8
## 2002  433.5   49.2
## 2003    1.8    2.4
## 2004   17.8    2.9
## 2005    1.3    0.0
## 2006    3.6   90.6
## 2007    1.1    0.0
## 2008    0.0    0.0
## 2009   51.9   10.4
## 2010    0.0    0.0
## 2011    2.1    0.0
## 2012    2.0   11.9
## 2013    2.2    3.5
## 2014    3.7    2.7
## 2015    3.1    0.0
## 2016    0.0    0.0
## 2017    4.7    7.8
## 2018    0.0    1.5
## 2019    8.6    0.0
## 2020   17.4  128.8
## 2021    6.8   63.8
## 2022    2.2    3.2

summary(serie_ts)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    1.60   26.75  171.67  280.25 1109.80

6 5. Gráfico general de la serie mensual

Este gráfico permite observar la evolución completa de la variable en el tiempo, incluyendo valores altos, valores bajos, cambios de régimen y posibles eventos extremos.

p_serie_general <- ggplot(serie_df, aes(x = fecha, y = valor)) +
  geom_line(color = color_principal, linewidth = 0.55) +
  geom_smooth(method = "loess", se = FALSE, color = color_alerta, linewidth = 0.9) +
  labs(
    title = "Serie mensual completa",
    subtitle = "Línea azul: datos mensuales; línea roja: tendencia suavizada",
    x = "Fecha",
    y = "Valor observado"
  ) +
  scale_x_date(date_breaks = "3 years", date_labels = "%Y") +
  theme_minimal(base_size = 14) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

p_serie_general

guardar_grafico(p_serie_general, "01_serie_mensual_completa.png")

7 6. Tendencia anual de la serie

Este bloque resume la serie por año y calcula la tendencia anual. Es útil cuando se desea reducir la variabilidad mensual y observar cambios de mediano o largo plazo.

serie_anual <- serie_df %>%
  dplyr::group_by(anio) %>%
  dplyr::summarise(
    promedio_anual = mean(valor, na.rm = TRUE),
    acumulado_anual = sum(valor, na.rm = TRUE),
    maximo_anual = max(valor, na.rm = TRUE),
    minimo_anual = min(valor, na.rm = TRUE),
    .groups = "drop"
  )

p_tendencia_anual <- ggplot(serie_anual, aes(x = anio, y = promedio_anual)) +
  geom_line(color = color_gris, linewidth = 0.6) +
  geom_point(color = color_principal, size = 2) +
  geom_smooth(method = "lm", se = TRUE, color = color_alerta, fill = "#FADBD8", linewidth = 1) +
  labs(
    title = "Tendencia anual del promedio mensual",
    subtitle = "La línea roja representa la tendencia lineal estimada",
    x = "Año",
    y = "Promedio anual"
  ) +
  theme_minimal(base_size = 14)

p_tendencia_anual

guardar_grafico(p_tendencia_anual, "02_tendencia_anual_promedio.png")

modelo_tendencia_anual <- lm(promedio_anual ~ anio, data = serie_anual)
summary(modelo_tendencia_anual)

## 
## Call:
## lm(formula = promedio_anual ~ anio, data = serie_anual)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -182.71 -103.69  -15.97   93.36  230.37 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 29487.25    4051.08   7.279 2.37e-08 ***
## anio          -14.62       2.02  -7.237 2.67e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 120.7 on 33 degrees of freedom
## Multiple R-squared:  0.6134, Adjusted R-squared:  0.6017 
## F-statistic: 52.37 on 1 and 33 DF,  p-value: 2.674e-08

8 7. Promedio mensual climatológico

Este gráfico muestra el comportamiento promedio de cada mes considerando todos los años disponibles. Es útil para identificar la estacionalidad intraanual.

promedio_mensual <- serie_df %>%
  dplyr::group_by(mes, mes_nombre) %>%
  dplyr::summarise(
    promedio = mean(valor, na.rm = TRUE),
    mediana = median(valor, na.rm = TRUE),
    desviacion = sd(valor, na.rm = TRUE),
    .groups = "drop"
  )

p_promedio_mensual <- ggplot(promedio_mensual, aes(x = mes_nombre, y = promedio, group = 1)) +
  geom_col(fill = color_principal, alpha = 0.82) +
  geom_line(color = color_secundario, linewidth = 1.2) +
  geom_point(color = color_alerta, size = 3) +
  labs(
    title = "Promedio mensual histórico",
    subtitle = "Promedio de cada mes calculado para todo el periodo disponible",
    x = "Mes",
    y = "Promedio mensual"
  ) +
  theme_minimal(base_size = 14) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

p_promedio_mensual

guardar_grafico(p_promedio_mensual, "03_promedio_mensual_historico.png")

knitr::kable(promedio_mensual, digits = 2, caption = "Estadísticos mensuales históricos")

Estadísticos mensuales históricos
mes	mes_nombre	promedio	mediana	desviacion
1	Enero	144.53	17.5	219.32
2	Febrero	145.33	30.3	222.65
3	Marzo	168.97	49.3	235.44
4	Abril	237.24	31.6	315.04
5	Mayo	170.55	26.5	230.62
6	Junio	186.79	22.8	279.45
7	Julio	207.57	50.2	295.27
8	Agosto	199.95	50.4	262.69
9	Septiembre	158.05	31.6	232.89
10	Octubre	153.07	13.0	203.08
11	Noviembre	145.53	8.6	227.58
12	Diciembre	142.48	49.2	211.07

9 8. Distribución mensual mediante boxplot

El boxplot permite comparar la variabilidad de cada mes. Es especialmente útil para detectar meses con mayor dispersión o valores extremos.

p_boxplot_mensual <- ggplot(serie_df, aes(x = mes_nombre, y = valor, fill = mes_nombre)) +
  geom_boxplot(alpha = 0.85, outlier.color = color_alerta, outlier.size = 2) +
  labs(
    title = "Distribución de valores por mes",
    subtitle = "Comparación de variabilidad mensual en todo el periodo analizado",
    x = "Mes",
    y = "Valor observado"
  ) +
  theme_minimal(base_size = 14) +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1),
    legend.position = "none"
  )

p_boxplot_mensual

guardar_grafico(p_boxplot_mensual, "04_boxplot_mensual.png")

10 9. Mapa de calor año-mes

El mapa de calor permite observar patrones temporales combinando años y meses. Es útil para identificar periodos húmedos, secos, anomalías o valores extremos.

p_heatmap <- ggplot(serie_df, aes(x = mes_nombre, y = factor(anio), fill = valor)) +
  geom_tile(color = "white", linewidth = 0.15) +
  scale_fill_gradientn(
    colours = c("#F7FBFF", "#6BAED6", "#2171B5", "#08306B"),
    name = "Valor"
  ) +
  labs(
    title = "Mapa de calor mensual por año",
    subtitle = "Cada celda representa el valor mensual observado",
    x = "Mes",
    y = "Año"
  ) +
  theme_minimal(base_size = 13) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

p_heatmap

guardar_grafico(p_heatmap, "05_mapa_calor_anio_mes.png", ancho = 12, alto = 10)

11 10. Análisis por estación climática

En este bloque se separa la serie en estación lluviosa y estación seca. Para la estación lluviosa se considera diciembre a mayo; por ello, diciembre se asigna al año climático siguiente.

resumen_estacional <- serie_df %>%
  dplyr::group_by(estacion, anio_estacion) %>%
  dplyr::summarise(
    promedio_estacional = mean(valor, na.rm = TRUE),
    acumulado_estacional = sum(valor, na.rm = TRUE),
    maximo_estacional = max(valor, na.rm = TRUE),
    minimo_estacional = min(valor, na.rm = TRUE),
    n_meses = dplyr::n(),
    .groups = "drop"
  ) %>%
  dplyr::filter(n_meses == 6)

knitr::kable(head(resumen_estacional, 12), digits = 2, caption = "Resumen por estación climática")

Resumen por estación climática
estacion	anio_estacion	promedio_estacional	acumulado_estacional	maximo_estacional	minimo_estacional	n_meses
Lluviosa (dic-may)	1989	348.47	2090.8	503.8	198.0	6
Lluviosa (dic-may)	1990	229.37	1376.2	516.7	35.2	6
Lluviosa (dic-may)	1991	470.97	2825.8	722.1	120.6	6
Lluviosa (dic-may)	1992	605.45	3632.7	919.5	323.5	6
Lluviosa (dic-may)	1993	407.90	2447.4	652.4	109.2	6
Lluviosa (dic-may)	1994	434.35	2606.1	846.6	121.7	6
Lluviosa (dic-may)	1995	516.67	3100.0	812.6	131.0	6
Lluviosa (dic-may)	1996	414.78	2488.7	836.4	259.7	6
Lluviosa (dic-may)	1997	350.73	2104.4	562.9	123.0	6
Lluviosa (dic-may)	1998	440.60	2643.6	1024.9	61.4	6
Lluviosa (dic-may)	1999	346.62	2079.7	623.2	72.7	6
Lluviosa (dic-may)	2000	173.07	1038.4	737.4	4.0	6

11.1 10.1 Tendencia de la estación lluviosa

Este gráfico presenta la tendencia de la estación lluviosa, definida de diciembre a mayo.

lluviosa <- resumen_estacional %>%
  dplyr::filter(estacion == "Lluviosa (dic-may)")

p_lluviosa <- ggplot(lluviosa, aes(x = anio_estacion, y = promedio_estacional)) +
  geom_line(color = color_gris, linewidth = 0.6) +
  geom_point(color = color_principal, size = 2.2) +
  geom_smooth(method = "lm", se = TRUE, color = color_alerta, fill = "#FADBD8", linewidth = 1) +
  labs(
    title = "Tendencia de la estación lluviosa",
    subtitle = "Estación lluviosa definida como diciembre a mayo",
    x = "Año climático",
    y = "Promedio estacional"
  ) +
  theme_minimal(base_size = 14)

p_lluviosa

guardar_grafico(p_lluviosa, "06_tendencia_estacion_lluviosa.png")

modelo_lluviosa <- lm(promedio_estacional ~ anio_estacion, data = lluviosa)
summary(modelo_lluviosa)

## 
## Call:
## lm(formula = promedio_estacional ~ anio_estacion, data = lluviosa)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -189.81  -94.94  -14.19   89.59  240.31 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   29936.728   4307.355   6.950 7.16e-08 ***
## anio_estacion   -14.845      2.148  -6.912 7.97e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 122.9 on 32 degrees of freedom
## Multiple R-squared:  0.5989, Adjusted R-squared:  0.5863 
## F-statistic: 47.78 on 1 and 32 DF,  p-value: 7.973e-08

11.2 10.2 Tendencia de la estación seca

Este gráfico presenta la tendencia de la estación seca, definida de junio a noviembre.

seca <- resumen_estacional %>%
  dplyr::filter(estacion == "Seca (jun-nov)")

p_seca <- ggplot(seca, aes(x = anio_estacion, y = promedio_estacional)) +
  geom_line(color = color_gris, linewidth = 0.6) +
  geom_point(color = color_terciario, size = 2.2) +
  geom_smooth(method = "lm", se = TRUE, color = color_alerta, fill = "#FADBD8", linewidth = 1) +
  labs(
    title = "Tendencia de la estación seca",
    subtitle = "Estación seca definida como junio a noviembre",
    x = "Año",
    y = "Promedio estacional"
  ) +
  theme_minimal(base_size = 14)

p_seca

guardar_grafico(p_seca, "07_tendencia_estacion_seca.png")

modelo_seca <- lm(promedio_estacional ~ anio_estacion, data = seca)
summary(modelo_seca)

## 
## Call:
## lm(formula = promedio_estacional ~ anio_estacion, data = seca)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -188.15 -103.80  -31.94   96.46  295.90 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   29910.816   4469.268   6.693 1.28e-07 ***
## anio_estacion   -14.831      2.229  -6.653 1.43e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 133.2 on 33 degrees of freedom
## Multiple R-squared:  0.5729, Adjusted R-squared:   0.56 
## F-statistic: 44.27 on 1 and 33 DF,  p-value: 1.429e-07

11.3 10.3 Comparación entre estación lluviosa y seca

Este gráfico permite comparar ambas estaciones climáticas en una misma figura.

p_comparacion_estaciones <- ggplot(resumen_estacional, aes(x = anio_estacion, y = promedio_estacional, color = estacion)) +
  geom_line(linewidth = 0.7) +
  geom_point(size = 2) +
  geom_smooth(method = "lm", se = FALSE, linewidth = 0.9) +
  scale_color_manual(values = c("Lluviosa (dic-may)" = color_principal, "Seca (jun-nov)" = color_terciario)) +
  labs(
    title = "Comparación de tendencias por estación climática",
    subtitle = "Promedio estacional anual para estación lluviosa y estación seca",
    x = "Año climático",
    y = "Promedio estacional",
    color = "Estación"
  ) +
  theme_minimal(base_size = 14)

p_comparacion_estaciones

guardar_grafico(p_comparacion_estaciones, "08_comparacion_tendencias_estacionales.png")

11.4 10.4 Tendencia del acumulado por estación climática

Si la variable analizada corresponde a precipitación, el acumulado estacional suele ser más informativo que el promedio, porque representa el volumen total registrado durante la estación lluviosa o seca. Este bloque genera una comparación de acumulados por estación.

p_acumulado_estacional <- ggplot(resumen_estacional, aes(x = anio_estacion, y = acumulado_estacional, color = estacion)) +
  geom_line(linewidth = 0.7) +
  geom_point(size = 2) +
  geom_smooth(method = "lm", se = FALSE, linewidth = 0.9) +
  scale_color_manual(values = c("Lluviosa (dic-may)" = color_principal, "Seca (jun-nov)" = color_terciario)) +
  labs(
    title = "Tendencia del acumulado por estación climática",
    subtitle = "Recomendado cuando la variable corresponde a precipitación u otra magnitud acumulable",
    x = "Año climático",
    y = "Acumulado estacional",
    color = "Estación"
  ) +
  theme_minimal(base_size = 14)

p_acumulado_estacional

guardar_grafico(p_acumulado_estacional, "08b_tendencia_acumulado_estacional.png")

modelo_acumulado_lluviosa <- lm(acumulado_estacional ~ anio_estacion, data = lluviosa)
modelo_acumulado_seca <- lm(acumulado_estacional ~ anio_estacion, data = seca)
summary(modelo_acumulado_lluviosa)

## 
## Call:
## lm(formula = acumulado_estacional ~ anio_estacion, data = lluviosa)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1138.83  -569.67   -85.13   537.53  1441.88 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   179620.37   25844.13   6.950 7.16e-08 ***
## anio_estacion    -89.07      12.89  -6.912 7.97e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 737.2 on 32 degrees of freedom
## Multiple R-squared:  0.5989, Adjusted R-squared:  0.5863 
## F-statistic: 47.78 on 1 and 32 DF,  p-value: 7.973e-08

summary(modelo_acumulado_seca)

## 
## Call:
## lm(formula = acumulado_estacional ~ anio_estacion, data = seca)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1128.9  -622.8  -191.7   578.8  1775.4 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   179464.89   26815.61   6.693 1.28e-07 ***
## anio_estacion    -88.98      13.37  -6.653 1.43e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 799.1 on 33 degrees of freedom
## Multiple R-squared:  0.5729, Adjusted R-squared:   0.56 
## F-statistic: 44.27 on 1 and 33 DF,  p-value: 1.429e-07

12 11. Tendencia mensual independiente: enero, febrero, marzo y demás meses

Este bloque analiza cada mes por separado. Por ejemplo, enero se compara únicamente contra los eneros de todos los años; febrero contra los febreros de todos los años, y así sucesivamente.

p_tendencia_meses_facetas <- ggplot(serie_df, aes(x = anio, y = valor)) +
  geom_line(color = color_gris, linewidth = 0.45) +
  geom_point(color = color_principal, size = 1.5) +
  geom_smooth(method = "lm", se = TRUE, color = color_alerta, fill = "#FADBD8", linewidth = 0.75) +
  facet_wrap(~ mes_nombre, scales = "free_y", ncol = 3) +
  labs(
    title = "Tendencia independiente por mes",
    subtitle = "Cada panel compara el mismo mes a través de todos los años",
    x = "Año",
    y = "Valor observado"
  ) +
  theme_minimal(base_size = 13)

p_tendencia_meses_facetas

guardar_grafico(p_tendencia_meses_facetas, "09_tendencia_independiente_por_mes_facetas.png", ancho = 14, alto = 10)

12.1 11.1 Generación automática de un gráfico individual por cada mes

Este bloque imprime y guarda un gráfico separado para cada mes. Los archivos se guardan en la carpeta graficos_series_tiempo.

for (m in levels(serie_df$mes_nombre)) {
  datos_mes <- serie_df %>% dplyr::filter(mes_nombre == m)
  
  p_mes <- ggplot(datos_mes, aes(x = anio, y = valor)) +
    geom_line(color = color_gris, linewidth = 0.55) +
    geom_point(color = color_principal, size = 2) +
    geom_smooth(method = "lm", se = TRUE, color = color_alerta, fill = "#FADBD8", linewidth = 0.95) +
    labs(
      title = paste("Tendencia histórica del mes de", m),
      subtitle = paste("Comparación de", m, "en todos los años disponibles"),
      x = "Año",
      y = "Valor observado"
    ) +
    theme_minimal(base_size = 14)
  
  print(p_mes)
  
  nombre_archivo <- paste0("10_tendencia_mes_", stringr::str_to_lower(stringr::str_replace_all(m, " ", "_")), ".png")
  guardar_grafico(p_mes, nombre_archivo, ancho = 10, alto = 5.5)
}

13 12. Gráfico estacional tipo `season plot`

Este gráfico muestra la forma anual de la serie, comparando los meses dentro de cada año. Es útil para observar si la estacionalidad se mantiene estable o cambia en el tiempo.

p_season <- forecast::ggseasonplot(serie_ts, year.labels = FALSE, continuous = TRUE) +
  labs(
    title = "Gráfico estacional mensual",
    subtitle = "Comparación de la forma intraanual de la serie",
    x = "Mes",
    y = "Valor observado"
  ) +
  theme_minimal(base_size = 14)

p_season

guardar_grafico(p_season, "11_grafico_estacional_seasonplot.png")

14 13. Gráfico de subseries mensuales

El gráfico de subseries permite observar, para cada mes, la media mensual y la variabilidad interna a lo largo del tiempo.

p_subseries <- forecast::ggsubseriesplot(serie_ts) +
  labs(
    title = "Gráfico de subseries mensuales",
    subtitle = "Evolución de cada mes y comparación con su media histórica",
    x = "Mes",
    y = "Valor observado"
  ) +
  theme_minimal(base_size = 14)

p_subseries

guardar_grafico(p_subseries, "12_grafico_subseries_mensuales.png")

15 14. Descomposición clásica de la serie

La descomposición separa la serie en tres componentes: tendencia, estacionalidad y residuo. Se aplica una descomposición aditiva, adecuada cuando la amplitud estacional no depende fuertemente del nivel de la serie.

desc_aditiva <- stats::decompose(serie_ts, type = "additive")

p_desc_aditiva <- forecast::autoplot(desc_aditiva) +
  labs(title = "Descomposición clásica aditiva de la serie") +
  theme_minimal(base_size = 14)

p_desc_aditiva

guardar_grafico(p_desc_aditiva, "13_descomposicion_clasica_aditiva.png", ancho = 12, alto = 8)

16 15. Descomposición STL

La descomposición STL es flexible y suele ser más robusta para series ambientales mensuales porque permite una estimación suavizada de la tendencia y de la estacionalidad.

desc_stl <- stats::stl(serie_ts, s.window = "periodic")

p_desc_stl <- forecast::autoplot(desc_stl) +
  labs(title = "Descomposición STL de la serie mensual") +
  theme_minimal(base_size = 14)

p_desc_stl

guardar_grafico(p_desc_stl, "14_descomposicion_stl.png", ancho = 12, alto = 8)

17 16. Media móvil de 12 meses y 24 meses

Las medias móviles permiten suavizar la serie y visualizar mejor los cambios de mediano plazo. La media móvil de 12 meses reduce el efecto de la estacionalidad anual.

serie_df <- serie_df %>%
  dplyr::mutate(
    media_movil_12 = zoo::rollmean(valor, k = 12, fill = NA, align = "center"),
    media_movil_24 = zoo::rollmean(valor, k = 24, fill = NA, align = "center")
  )

p_medias_moviles <- ggplot(serie_df, aes(x = fecha)) +
  geom_line(aes(y = valor), color = "#B0B0B0", linewidth = 0.35) +
  geom_line(aes(y = media_movil_12), color = color_principal, linewidth = 0.9) +
  geom_line(aes(y = media_movil_24), color = color_alerta, linewidth = 1) +
  labs(
    title = "Serie mensual con medias móviles",
    subtitle = "Gris: serie original; azul: media móvil 12 meses; rojo: media móvil 24 meses",
    x = "Fecha",
    y = "Valor observado"
  ) +
  scale_x_date(date_breaks = "3 years", date_labels = "%Y") +
  theme_minimal(base_size = 14) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

p_medias_moviles

guardar_grafico(p_medias_moviles, "15_medias_moviles_12_24_meses.png")

18 17. Anomalías mensuales respecto al promedio histórico del mes

La anomalía se calcula como la diferencia entre el valor observado y el promedio histórico de su respectivo mes. Este análisis permite identificar meses por encima o por debajo del comportamiento esperado.

climatologia_mensual <- serie_df %>%
  dplyr::group_by(mes) %>%
  dplyr::summarise(promedio_mes = mean(valor, na.rm = TRUE), .groups = "drop")

serie_anomalias <- serie_df %>%
  dplyr::left_join(climatologia_mensual, by = "mes") %>%
  dplyr::mutate(
    anomalia = valor - promedio_mes,
    tipo_anomalia = dplyr::if_else(anomalia >= 0, "Positiva", "Negativa")
  )

p_anomalias <- ggplot(serie_anomalias, aes(x = fecha, y = anomalia, fill = tipo_anomalia)) +
  geom_col(width = 25, alpha = 0.9) +
  geom_hline(yintercept = 0, color = "black", linewidth = 0.4) +
  scale_fill_manual(values = c("Positiva" = color_principal, "Negativa" = color_alerta)) +
  labs(
    title = "Anomalías mensuales",
    subtitle = "Diferencia entre el valor observado y el promedio histórico del mismo mes",
    x = "Fecha",
    y = "Anomalía",
    fill = "Tipo"
  ) +
  scale_x_date(date_breaks = "3 years", date_labels = "%Y") +
  theme_minimal(base_size = 14) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

p_anomalias

guardar_grafico(p_anomalias, "16_anomalias_mensuales.png", ancho = 13, alto = 6.5)

19 18. Autocorrelación y autocorrelación parcial

La autocorrelación permite evaluar si los valores actuales dependen de valores pasados. En series mensuales ambientales es común observar autocorrelación en rezagos de 12 meses.

p_acf <- forecast::ggAcf(serie_ts, lag.max = 60) +
  labs(
    title = "Función de autocorrelación ACF",
    subtitle = "Rezagos mensuales hasta 60 meses"
  ) +
  theme_minimal(base_size = 14)

p_pacf <- forecast::ggPacf(serie_ts, lag.max = 60) +
  labs(
    title = "Función de autocorrelación parcial PACF",
    subtitle = "Rezagos mensuales hasta 60 meses"
  ) +
  theme_minimal(base_size = 14)

p_acf

guardar_grafico(p_acf, "17_acf_serie_mensual.png")

p_pacf

guardar_grafico(p_pacf, "18_pacf_serie_mensual.png")

20 19. Tabla resumen estadística general

Esta tabla sintetiza la serie mensual y permite reportar los valores principales del periodo analizado.

resumen_general <- serie_df %>%
  dplyr::summarise(
    fecha_inicio = min(fecha),
    fecha_fin = max(fecha),
    n_meses = dplyr::n(),
    promedio = mean(valor, na.rm = TRUE),
    mediana = median(valor, na.rm = TRUE),
    desviacion_estandar = sd(valor, na.rm = TRUE),
    minimo = min(valor, na.rm = TRUE),
    maximo = max(valor, na.rm = TRUE),
    coef_variacion = sd(valor, na.rm = TRUE) / mean(valor, na.rm = TRUE) * 100
  )

knitr::kable(resumen_general, digits = 2, caption = "Resumen estadístico general de la serie mensual")

Resumen estadístico general de la serie mensual
fecha_inicio	fecha_fin	n_meses	promedio	mediana	desviacion_estandar	minimo	maximo	coef_variacion
1988-01-01	2022-12-01	420	171.67	26.75	245.39	0	1109.8	142.94

21 20. Exportación de bases procesadas

Este bloque guarda las bases procesadas en formato CSV para que puedan ser usadas posteriormente en otros análisis.

write.csv(serie_df, file = "serie_mensual_procesada.csv", row.names = FALSE)
write.csv(serie_anual, file = "serie_anual_resumen.csv", row.names = FALSE)
write.csv(resumen_estacional, file = "serie_estacional_resumen.csv", row.names = FALSE)
write.csv(promedio_mensual, file = "promedio_mensual_historico.csv", row.names = FALSE)
write.csv(serie_anomalias, file = "serie_anomalias_mensuales.csv", row.names = FALSE)

22 21. Recomendación de interpretación

Para una interpretación rigurosa, no conviene concluir que existe una tendencia climática solo por observar una pendiente visual. La tendencia debe evaluarse con el modelo lineal, los intervalos de confianza y, si corresponde, con pruebas no paramétricas adicionales. También debe considerarse la calidad de la serie, presencia de datos faltantes, cambios de estación meteorológica, cambios de instrumentos o cambios en el entorno de medición.

Análisis de serie de tiempo mensual

Cindy Intriago, Mabel Jaramillo, Puente Nicolas, Sosa Nidia

04/07/2026

1 Objetivo del análisis

2 1. Configuración inicial

3 2. Lectura del archivo Excel

4 3. Preparación de la base mensual

5 4. Conversión a serie de tiempo mensual

6 5. Gráfico general de la serie mensual

7 6. Tendencia anual de la serie

8 7. Promedio mensual climatológico

9 8. Distribución mensual mediante boxplot

10 9. Mapa de calor año-mes

11 10. Análisis por estación climática

11.1 10.1 Tendencia de la estación lluviosa

11.2 10.2 Tendencia de la estación seca

11.3 10.3 Comparación entre estación lluviosa y seca

11.4 10.4 Tendencia del acumulado por estación climática

12 11. Tendencia mensual independiente: enero, febrero, marzo y demás meses

12.1 11.1 Generación automática de un gráfico individual por cada mes

13 12. Gráfico estacional tipo `season plot`

14 13. Gráfico de subseries mensuales

15 14. Descomposición clásica de la serie

16 15. Descomposición STL

17 16. Media móvil de 12 meses y 24 meses

18 17. Anomalías mensuales respecto al promedio histórico del mes

19 18. Autocorrelación y autocorrelación parcial

20 19. Tabla resumen estadística general

21 20. Exportación de bases procesadas

22 21. Recomendación de interpretación

Análisis de serie de tiempo mensual

Cindy Intriago, Mabel Jaramillo, Puente Nicolas, Sosa Nidia

04/07/2026

1 Objetivo del análisis

2 1. Configuración inicial

3 2. Lectura del archivo Excel

4 3. Preparación de la base mensual

5 4. Conversión a serie de tiempo mensual

6 5. Gráfico general de la serie mensual

7 6. Tendencia anual de la serie

8 7. Promedio mensual climatológico

9 8. Distribución mensual mediante boxplot

10 9. Mapa de calor año-mes

11 10. Análisis por estación climática

11.1 10.1 Tendencia de la estación lluviosa

11.2 10.2 Tendencia de la estación seca

11.3 10.3 Comparación entre estación lluviosa y seca

11.4 10.4 Tendencia del acumulado por estación climática

12 11. Tendencia mensual independiente: enero, febrero, marzo y demás meses

12.1 11.1 Generación automática de un gráfico individual por cada mes

13 12. Gráfico estacional tipo season plot

14 13. Gráfico de subseries mensuales

15 14. Descomposición clásica de la serie

16 15. Descomposición STL

17 16. Media móvil de 12 meses y 24 meses

18 17. Anomalías mensuales respecto al promedio histórico del mes

19 18. Autocorrelación y autocorrelación parcial

20 19. Tabla resumen estadística general

21 20. Exportación de bases procesadas

22 21. Recomendación de interpretación

13 12. Gráfico estacional tipo `season plot`