season plotEste documento transforma los datos mensuales del archivo Excel en una serie de tiempo con frecuencia mensual, iniciando en enero de 1988. Además, genera gráficos exploratorios, gráficos de tendencia, análisis por estación climática, análisis por mes específico, descomposición de la serie, autocorrelación y anomalías mensuales. Todos los gráficos se muestran dentro del documento y también se guardan automáticamente en una carpeta local para su posterior uso en informes, artículos o publicaciones en RPubs.
En este bloque se definen las opciones generales del documento, se cargan los paquetes necesarios y se crea una función para guardar los gráficos en alta resolución.
knitr::opts_chunk$set(
echo = TRUE,
message = FALSE,
warning = FALSE,
fig.width = 11,
fig.height = 6,
dpi = 300,
out.width = "100%"
)
# Paquetes requeridos
paquetes <- c(
"readxl", "dplyr", "tidyr", "lubridate", "ggplot2",
"forecast", "zoo", "scales", "stringr", "knitr"
)
paquetes_faltantes <- paquetes[!paquetes %in% rownames(installed.packages())]
if (length(paquetes_faltantes) > 0) {
install.packages(paquetes_faltantes, dependencies = TRUE)
}
invisible(lapply(paquetes, library, character.only = TRUE))
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
##
## Adjuntando el paquete: 'lubridate'
## The following objects are masked from 'package:base':
##
## date, intersect, setdiff, union
##
## Adjuntando el paquete: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
# Carpeta para guardar los gráficos generados
carpeta_graficos <- "graficos_series_tiempo"
if (!dir.exists(carpeta_graficos)) dir.create(carpeta_graficos)
# Función para guardar gráficos con calidad publicable
guardar_grafico <- function(grafico, nombre, ancho = 12, alto = 7, dpi = 300) {
ggplot2::ggsave(
filename = file.path(carpeta_graficos, nombre),
plot = grafico,
width = ancho,
height = alto,
dpi = dpi,
bg = "white"
)
}
# Paleta institucional sugerida
color_principal <- "#005B96"
color_secundario <- "#F2A900"
color_terciario <- "#2E7D32"
color_alerta <- "#C62828"
color_gris <- "#4D4D4D"
Este bloque lee el archivo Excel desde la ruta indicada. En Windows
se recomienda usar / en lugar de \. Si el
archivo no se encuentra en la ruta definida, R abrirá una ventana para
seleccionarlo manualmente.
ruta_archivo <- "C:/Users/nicol/OneDrive/Desktop/Nueva carpeta/Baba.xlsx"
if (!file.exists(ruta_archivo)) {
message("No se encontró el archivo en la ruta indicada. Seleccione el archivo manualmente.")
ruta_archivo <- file.choose()
}
datos_raw <- readxl::read_excel(ruta_archivo, sheet = "Hoja1")
# Revisión rápida de la estructura original
str(datos_raw)
## tibble [420 × 1] (S3: tbl_df/tbl/data.frame)
## $ Suma de Valor: num [1:420] 194.5 194.5 249.4 1047.2 25.4 ...
head(datos_raw)
El archivo contiene una columna de datos mensuales. En este bloque se crea una fecha mensual desde enero de 1988, se identifican año, mes, nombre del mes y estación climática. Para la estación lluviosa se considera diciembre a mayo; para la estación seca, junio a noviembre.
meses_esp <- c(
"Enero", "Febrero", "Marzo", "Abril", "Mayo", "Junio",
"Julio", "Agosto", "Septiembre", "Octubre", "Noviembre", "Diciembre"
)
serie_df <- datos_raw %>%
dplyr::rename(valor = 1) %>%
dplyr::mutate(valor = as.numeric(valor)) %>%
dplyr::filter(!is.na(valor)) %>%
dplyr::mutate(
fecha = seq.Date(from = as.Date("1988-01-01"), by = "month", length.out = dplyr::n()),
anio = lubridate::year(fecha),
mes = lubridate::month(fecha),
mes_nombre = factor(meses_esp[mes], levels = meses_esp),
estacion = dplyr::case_when(
mes %in% c(12, 1, 2, 3, 4, 5) ~ "Lluviosa (dic-may)",
mes %in% c(6, 7, 8, 9, 10, 11) ~ "Seca (jun-nov)",
TRUE ~ NA_character_
),
# Diciembre se asigna al año climático siguiente para analizar la estación lluviosa completa.
anio_estacion = dplyr::if_else(mes == 12, anio + 1L, anio)
)
knitr::kable(head(serie_df, 12), caption = "Primeros 12 registros de la base procesada")
| valor | fecha | anio | mes | mes_nombre | estacion | anio_estacion |
|---|---|---|---|---|---|---|
| 194.5 | 1988-01-01 | 1988 | 1 | Enero | Lluviosa (dic-may) | 1988 |
| 194.5 | 1988-02-01 | 1988 | 2 | Febrero | Lluviosa (dic-may) | 1988 |
| 249.4 | 1988-03-01 | 1988 | 3 | Marzo | Lluviosa (dic-may) | 1988 |
| 1047.2 | 1988-04-01 | 1988 | 4 | Abril | Lluviosa (dic-may) | 1988 |
| 25.4 | 1988-05-01 | 1988 | 5 | Mayo | Lluviosa (dic-may) | 1988 |
| 210.3 | 1988-06-01 | 1988 | 6 | Junio | Seca (jun-nov) | 1988 |
| 752.4 | 1988-07-01 | 1988 | 7 | Julio | Seca (jun-nov) | 1988 |
| 712.9 | 1988-08-01 | 1988 | 8 | Agosto | Seca (jun-nov) | 1988 |
| 552.5 | 1988-09-01 | 1988 | 9 | Septiembre | Seca (jun-nov) | 1988 |
| 528.0 | 1988-10-01 | 1988 | 10 | Octubre | Seca (jun-nov) | 1988 |
| 206.6 | 1988-11-01 | 1988 | 11 | Noviembre | Seca (jun-nov) | 1988 |
| 198.0 | 1988-12-01 | 1988 | 12 | Diciembre | Lluviosa (dic-may) | 1989 |
knitr::kable(tail(serie_df, 12), caption = "Últimos 12 registros de la base procesada")
| valor | fecha | anio | mes | mes_nombre | estacion | anio_estacion |
|---|---|---|---|---|---|---|
| 21.0 | 2022-01-01 | 2022 | 1 | Enero | Lluviosa (dic-may) | 2022 |
| 1.6 | 2022-02-01 | 2022 | 2 | Febrero | Lluviosa (dic-may) | 2022 |
| 160.6 | 2022-03-01 | 2022 | 3 | Marzo | Lluviosa (dic-may) | 2022 |
| 44.1 | 2022-04-01 | 2022 | 4 | Abril | Lluviosa (dic-may) | 2022 |
| 47.3 | 2022-05-01 | 2022 | 5 | Mayo | Lluviosa (dic-may) | 2022 |
| 3.8 | 2022-06-01 | 2022 | 6 | Junio | Seca (jun-nov) | 2022 |
| 102.1 | 2022-07-01 | 2022 | 7 | Julio | Seca (jun-nov) | 2022 |
| 373.7 | 2022-08-01 | 2022 | 8 | Agosto | Seca (jun-nov) | 2022 |
| 58.4 | 2022-09-01 | 2022 | 9 | Septiembre | Seca (jun-nov) | 2022 |
| 58.4 | 2022-10-01 | 2022 | 10 | Octubre | Seca (jun-nov) | 2022 |
| 2.2 | 2022-11-01 | 2022 | 11 | Noviembre | Seca (jun-nov) | 2022 |
| 3.2 | 2022-12-01 | 2022 | 12 | Diciembre | Lluviosa (dic-may) | 2023 |
Aquí se convierte la columna numérica en un objeto ts de
R, con frecuencia 12 porque los datos son mensuales.
serie_ts <- ts(serie_df$valor, start = c(1988, 1), frequency = 12)
serie_ts
## Jan Feb Mar Apr May Jun Jul Aug Sep Oct
## 1988 194.5 194.5 249.4 1047.2 25.4 210.3 752.4 712.9 552.5 528.0
## 1989 473.2 224.9 476.5 503.8 214.4 438.3 761.3 167.0 223.3 562.6
## 1990 104.9 35.2 276.7 264.9 516.7 437.3 207.3 261.6 175.8 211.1
## 1991 521.9 249.7 722.1 689.6 120.6 440.4 959.5 365.2 745.0 330.8
## 1992 919.5 507.9 323.5 616.8 566.1 740.7 501.9 407.7 608.0 540.6
## 1993 109.2 618.4 243.9 652.4 467.0 632.6 350.2 350.2 561.5 438.8
## 1994 121.7 846.6 565.1 307.5 361.4 590.6 50.5 775.6 282.3 326.7
## 1995 609.0 131.0 263.7 764.3 812.6 1109.8 732.5 664.2 565.0 344.2
## 1996 371.8 415.8 836.4 322.8 259.7 154.3 154.3 877.3 86.0 190.3
## 1997 400.2 479.6 123.0 389.6 562.9 541.3 289.1 283.0 101.2 621.0
## 1998 279.6 61.4 412.2 1024.9 484.8 209.0 430.8 552.3 397.0 243.8
## 1999 349.2 623.2 72.7 381.9 575.7 575.7 239.3 128.1 3.6 3.6
## 2000 6.5 21.6 4.0 164.7 104.2 22.8 32.1 14.8 688.3 84.6
## 2001 6.2 206.2 690.1 179.3 207.0 25.2 101.0 38.4 91.3 1.9
## 2002 105.9 55.0 142.1 1.9 1.9 12.8 472.8 1.5 0.0 0.0
## 2003 0.0 1.0 0.0 10.9 11.1 35.3 1.0 131.6 23.3 0.0
## 2004 219.5 210.9 5.6 10.4 0.0 5.2 9.0 23.8 23.8 3.8
## 2005 17.5 4.9 31.6 31.6 3.7 4.7 0.0 8.2 0.0 455.1
## 2006 0.0 3.1 1.6 1.4 0.0 2.7 4.4 0.0 0.0 8.4
## 2007 62.8 1.8 0.0 1.9 0.0 3.5 1.1 1.6 0.0 1.2
## 2008 7.3 103.3 103.3 0.0 0.0 0.0 0.0 0.0 51.6 0.0
## 2009 4.2 0.0 1.4 0.0 0.0 0.0 0.0 0.0 1.8 0.0
## 2010 0.0 0.0 0.0 0.0 1.5 0.0 0.0 1.6 0.0 4.4
## 2011 0.0 0.0 0.0 0.0 0.0 0.0 2.8 143.6 7.2 0.0
## 2012 1.1 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 234.4
## 2013 8.0 0.0 0.0 0.0 0.0 0.0 1.6 0.0 3.3 0.0
## 2014 4.5 0.0 0.0 4.6 0.0 20.6 50.2 2.8 0.0 10.5
## 2015 6.7 2.9 3.4 0.0 5.1 4.2 1.3 2.0 84.0 1.1
## 2016 1.3 13.9 6.0 6.2 0.0 0.0 3.3 2.8 2.6 0.0
## 2017 0.0 0.0 7.2 1.4 351.8 95.6 27.0 6.3 8.3 1.2
## 2018 1.2 5.9 11.1 1.3 26.5 13.9 0.0 560.6 4.7 13.0
## 2019 5.9 32.5 0.0 0.0 13.5 2.0 6.7 0.0 6.5 8.6
## 2020 0.0 3.6 49.3 616.9 189.1 113.0 102.9 89.6 31.6 75.0
## 2021 124.2 30.3 131.3 261.0 39.3 92.1 916.4 50.4 143.7 54.2
## 2022 21.0 1.6 160.6 44.1 47.3 3.8 102.1 373.7 58.4 58.4
## Nov Dec
## 1988 206.6 198.0
## 1989 77.1 177.8
## 1990 458.0 521.9
## 1991 758.3 698.9
## 1992 491.0 356.5
## 1993 403.8 403.8
## 1994 787.4 519.4
## 1995 300.5 282.2
## 1996 190.3 149.1
## 1997 466.4 380.7
## 1998 327.9 77.0
## 1999 6.9 737.4
## 2000 35.3 51.5
## 2001 20.2 53.8
## 2002 433.5 49.2
## 2003 1.8 2.4
## 2004 17.8 2.9
## 2005 1.3 0.0
## 2006 3.6 90.6
## 2007 1.1 0.0
## 2008 0.0 0.0
## 2009 51.9 10.4
## 2010 0.0 0.0
## 2011 2.1 0.0
## 2012 2.0 11.9
## 2013 2.2 3.5
## 2014 3.7 2.7
## 2015 3.1 0.0
## 2016 0.0 0.0
## 2017 4.7 7.8
## 2018 0.0 1.5
## 2019 8.6 0.0
## 2020 17.4 128.8
## 2021 6.8 63.8
## 2022 2.2 3.2
summary(serie_ts)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 1.60 26.75 171.67 280.25 1109.80
Este gráfico permite observar la evolución completa de la variable en el tiempo, incluyendo valores altos, valores bajos, cambios de régimen y posibles eventos extremos.
p_serie_general <- ggplot(serie_df, aes(x = fecha, y = valor)) +
geom_line(color = color_principal, linewidth = 0.55) +
geom_smooth(method = "loess", se = FALSE, color = color_alerta, linewidth = 0.9) +
labs(
title = "Serie mensual completa",
subtitle = "Línea azul: datos mensuales; línea roja: tendencia suavizada",
x = "Fecha",
y = "Valor observado"
) +
scale_x_date(date_breaks = "3 years", date_labels = "%Y") +
theme_minimal(base_size = 14) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
p_serie_general
guardar_grafico(p_serie_general, "01_serie_mensual_completa.png")
Este bloque resume la serie por año y calcula la tendencia anual. Es útil cuando se desea reducir la variabilidad mensual y observar cambios de mediano o largo plazo.
serie_anual <- serie_df %>%
dplyr::group_by(anio) %>%
dplyr::summarise(
promedio_anual = mean(valor, na.rm = TRUE),
acumulado_anual = sum(valor, na.rm = TRUE),
maximo_anual = max(valor, na.rm = TRUE),
minimo_anual = min(valor, na.rm = TRUE),
.groups = "drop"
)
p_tendencia_anual <- ggplot(serie_anual, aes(x = anio, y = promedio_anual)) +
geom_line(color = color_gris, linewidth = 0.6) +
geom_point(color = color_principal, size = 2) +
geom_smooth(method = "lm", se = TRUE, color = color_alerta, fill = "#FADBD8", linewidth = 1) +
labs(
title = "Tendencia anual del promedio mensual",
subtitle = "La línea roja representa la tendencia lineal estimada",
x = "Año",
y = "Promedio anual"
) +
theme_minimal(base_size = 14)
p_tendencia_anual
guardar_grafico(p_tendencia_anual, "02_tendencia_anual_promedio.png")
modelo_tendencia_anual <- lm(promedio_anual ~ anio, data = serie_anual)
summary(modelo_tendencia_anual)
##
## Call:
## lm(formula = promedio_anual ~ anio, data = serie_anual)
##
## Residuals:
## Min 1Q Median 3Q Max
## -182.71 -103.69 -15.97 93.36 230.37
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 29487.25 4051.08 7.279 2.37e-08 ***
## anio -14.62 2.02 -7.237 2.67e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 120.7 on 33 degrees of freedom
## Multiple R-squared: 0.6134, Adjusted R-squared: 0.6017
## F-statistic: 52.37 on 1 and 33 DF, p-value: 2.674e-08
Este gráfico muestra el comportamiento promedio de cada mes considerando todos los años disponibles. Es útil para identificar la estacionalidad intraanual.
promedio_mensual <- serie_df %>%
dplyr::group_by(mes, mes_nombre) %>%
dplyr::summarise(
promedio = mean(valor, na.rm = TRUE),
mediana = median(valor, na.rm = TRUE),
desviacion = sd(valor, na.rm = TRUE),
.groups = "drop"
)
p_promedio_mensual <- ggplot(promedio_mensual, aes(x = mes_nombre, y = promedio, group = 1)) +
geom_col(fill = color_principal, alpha = 0.82) +
geom_line(color = color_secundario, linewidth = 1.2) +
geom_point(color = color_alerta, size = 3) +
labs(
title = "Promedio mensual histórico",
subtitle = "Promedio de cada mes calculado para todo el periodo disponible",
x = "Mes",
y = "Promedio mensual"
) +
theme_minimal(base_size = 14) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
p_promedio_mensual
guardar_grafico(p_promedio_mensual, "03_promedio_mensual_historico.png")
knitr::kable(promedio_mensual, digits = 2, caption = "Estadísticos mensuales históricos")
| mes | mes_nombre | promedio | mediana | desviacion |
|---|---|---|---|---|
| 1 | Enero | 144.53 | 17.5 | 219.32 |
| 2 | Febrero | 145.33 | 30.3 | 222.65 |
| 3 | Marzo | 168.97 | 49.3 | 235.44 |
| 4 | Abril | 237.24 | 31.6 | 315.04 |
| 5 | Mayo | 170.55 | 26.5 | 230.62 |
| 6 | Junio | 186.79 | 22.8 | 279.45 |
| 7 | Julio | 207.57 | 50.2 | 295.27 |
| 8 | Agosto | 199.95 | 50.4 | 262.69 |
| 9 | Septiembre | 158.05 | 31.6 | 232.89 |
| 10 | Octubre | 153.07 | 13.0 | 203.08 |
| 11 | Noviembre | 145.53 | 8.6 | 227.58 |
| 12 | Diciembre | 142.48 | 49.2 | 211.07 |
El boxplot permite comparar la variabilidad de cada mes. Es especialmente útil para detectar meses con mayor dispersión o valores extremos.
p_boxplot_mensual <- ggplot(serie_df, aes(x = mes_nombre, y = valor, fill = mes_nombre)) +
geom_boxplot(alpha = 0.85, outlier.color = color_alerta, outlier.size = 2) +
labs(
title = "Distribución de valores por mes",
subtitle = "Comparación de variabilidad mensual en todo el periodo analizado",
x = "Mes",
y = "Valor observado"
) +
theme_minimal(base_size = 14) +
theme(
axis.text.x = element_text(angle = 45, hjust = 1),
legend.position = "none"
)
p_boxplot_mensual
guardar_grafico(p_boxplot_mensual, "04_boxplot_mensual.png")
El mapa de calor permite observar patrones temporales combinando años y meses. Es útil para identificar periodos húmedos, secos, anomalías o valores extremos.
p_heatmap <- ggplot(serie_df, aes(x = mes_nombre, y = factor(anio), fill = valor)) +
geom_tile(color = "white", linewidth = 0.15) +
scale_fill_gradientn(
colours = c("#F7FBFF", "#6BAED6", "#2171B5", "#08306B"),
name = "Valor"
) +
labs(
title = "Mapa de calor mensual por año",
subtitle = "Cada celda representa el valor mensual observado",
x = "Mes",
y = "Año"
) +
theme_minimal(base_size = 13) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
p_heatmap
guardar_grafico(p_heatmap, "05_mapa_calor_anio_mes.png", ancho = 12, alto = 10)
En este bloque se separa la serie en estación lluviosa y estación seca. Para la estación lluviosa se considera diciembre a mayo; por ello, diciembre se asigna al año climático siguiente.
resumen_estacional <- serie_df %>%
dplyr::group_by(estacion, anio_estacion) %>%
dplyr::summarise(
promedio_estacional = mean(valor, na.rm = TRUE),
acumulado_estacional = sum(valor, na.rm = TRUE),
maximo_estacional = max(valor, na.rm = TRUE),
minimo_estacional = min(valor, na.rm = TRUE),
n_meses = dplyr::n(),
.groups = "drop"
) %>%
dplyr::filter(n_meses == 6)
knitr::kable(head(resumen_estacional, 12), digits = 2, caption = "Resumen por estación climática")
| estacion | anio_estacion | promedio_estacional | acumulado_estacional | maximo_estacional | minimo_estacional | n_meses |
|---|---|---|---|---|---|---|
| Lluviosa (dic-may) | 1989 | 348.47 | 2090.8 | 503.8 | 198.0 | 6 |
| Lluviosa (dic-may) | 1990 | 229.37 | 1376.2 | 516.7 | 35.2 | 6 |
| Lluviosa (dic-may) | 1991 | 470.97 | 2825.8 | 722.1 | 120.6 | 6 |
| Lluviosa (dic-may) | 1992 | 605.45 | 3632.7 | 919.5 | 323.5 | 6 |
| Lluviosa (dic-may) | 1993 | 407.90 | 2447.4 | 652.4 | 109.2 | 6 |
| Lluviosa (dic-may) | 1994 | 434.35 | 2606.1 | 846.6 | 121.7 | 6 |
| Lluviosa (dic-may) | 1995 | 516.67 | 3100.0 | 812.6 | 131.0 | 6 |
| Lluviosa (dic-may) | 1996 | 414.78 | 2488.7 | 836.4 | 259.7 | 6 |
| Lluviosa (dic-may) | 1997 | 350.73 | 2104.4 | 562.9 | 123.0 | 6 |
| Lluviosa (dic-may) | 1998 | 440.60 | 2643.6 | 1024.9 | 61.4 | 6 |
| Lluviosa (dic-may) | 1999 | 346.62 | 2079.7 | 623.2 | 72.7 | 6 |
| Lluviosa (dic-may) | 2000 | 173.07 | 1038.4 | 737.4 | 4.0 | 6 |
Este gráfico presenta la tendencia de la estación lluviosa, definida de diciembre a mayo.
lluviosa <- resumen_estacional %>%
dplyr::filter(estacion == "Lluviosa (dic-may)")
p_lluviosa <- ggplot(lluviosa, aes(x = anio_estacion, y = promedio_estacional)) +
geom_line(color = color_gris, linewidth = 0.6) +
geom_point(color = color_principal, size = 2.2) +
geom_smooth(method = "lm", se = TRUE, color = color_alerta, fill = "#FADBD8", linewidth = 1) +
labs(
title = "Tendencia de la estación lluviosa",
subtitle = "Estación lluviosa definida como diciembre a mayo",
x = "Año climático",
y = "Promedio estacional"
) +
theme_minimal(base_size = 14)
p_lluviosa
guardar_grafico(p_lluviosa, "06_tendencia_estacion_lluviosa.png")
modelo_lluviosa <- lm(promedio_estacional ~ anio_estacion, data = lluviosa)
summary(modelo_lluviosa)
##
## Call:
## lm(formula = promedio_estacional ~ anio_estacion, data = lluviosa)
##
## Residuals:
## Min 1Q Median 3Q Max
## -189.81 -94.94 -14.19 89.59 240.31
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 29936.728 4307.355 6.950 7.16e-08 ***
## anio_estacion -14.845 2.148 -6.912 7.97e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 122.9 on 32 degrees of freedom
## Multiple R-squared: 0.5989, Adjusted R-squared: 0.5863
## F-statistic: 47.78 on 1 and 32 DF, p-value: 7.973e-08
Este gráfico presenta la tendencia de la estación seca, definida de junio a noviembre.
seca <- resumen_estacional %>%
dplyr::filter(estacion == "Seca (jun-nov)")
p_seca <- ggplot(seca, aes(x = anio_estacion, y = promedio_estacional)) +
geom_line(color = color_gris, linewidth = 0.6) +
geom_point(color = color_terciario, size = 2.2) +
geom_smooth(method = "lm", se = TRUE, color = color_alerta, fill = "#FADBD8", linewidth = 1) +
labs(
title = "Tendencia de la estación seca",
subtitle = "Estación seca definida como junio a noviembre",
x = "Año",
y = "Promedio estacional"
) +
theme_minimal(base_size = 14)
p_seca
guardar_grafico(p_seca, "07_tendencia_estacion_seca.png")
modelo_seca <- lm(promedio_estacional ~ anio_estacion, data = seca)
summary(modelo_seca)
##
## Call:
## lm(formula = promedio_estacional ~ anio_estacion, data = seca)
##
## Residuals:
## Min 1Q Median 3Q Max
## -188.15 -103.80 -31.94 96.46 295.90
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 29910.816 4469.268 6.693 1.28e-07 ***
## anio_estacion -14.831 2.229 -6.653 1.43e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 133.2 on 33 degrees of freedom
## Multiple R-squared: 0.5729, Adjusted R-squared: 0.56
## F-statistic: 44.27 on 1 and 33 DF, p-value: 1.429e-07
Este gráfico permite comparar ambas estaciones climáticas en una misma figura.
p_comparacion_estaciones <- ggplot(resumen_estacional, aes(x = anio_estacion, y = promedio_estacional, color = estacion)) +
geom_line(linewidth = 0.7) +
geom_point(size = 2) +
geom_smooth(method = "lm", se = FALSE, linewidth = 0.9) +
scale_color_manual(values = c("Lluviosa (dic-may)" = color_principal, "Seca (jun-nov)" = color_terciario)) +
labs(
title = "Comparación de tendencias por estación climática",
subtitle = "Promedio estacional anual para estación lluviosa y estación seca",
x = "Año climático",
y = "Promedio estacional",
color = "Estación"
) +
theme_minimal(base_size = 14)
p_comparacion_estaciones
guardar_grafico(p_comparacion_estaciones, "08_comparacion_tendencias_estacionales.png")
Si la variable analizada corresponde a precipitación, el acumulado estacional suele ser más informativo que el promedio, porque representa el volumen total registrado durante la estación lluviosa o seca. Este bloque genera una comparación de acumulados por estación.
p_acumulado_estacional <- ggplot(resumen_estacional, aes(x = anio_estacion, y = acumulado_estacional, color = estacion)) +
geom_line(linewidth = 0.7) +
geom_point(size = 2) +
geom_smooth(method = "lm", se = FALSE, linewidth = 0.9) +
scale_color_manual(values = c("Lluviosa (dic-may)" = color_principal, "Seca (jun-nov)" = color_terciario)) +
labs(
title = "Tendencia del acumulado por estación climática",
subtitle = "Recomendado cuando la variable corresponde a precipitación u otra magnitud acumulable",
x = "Año climático",
y = "Acumulado estacional",
color = "Estación"
) +
theme_minimal(base_size = 14)
p_acumulado_estacional
guardar_grafico(p_acumulado_estacional, "08b_tendencia_acumulado_estacional.png")
modelo_acumulado_lluviosa <- lm(acumulado_estacional ~ anio_estacion, data = lluviosa)
modelo_acumulado_seca <- lm(acumulado_estacional ~ anio_estacion, data = seca)
summary(modelo_acumulado_lluviosa)
##
## Call:
## lm(formula = acumulado_estacional ~ anio_estacion, data = lluviosa)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1138.83 -569.67 -85.13 537.53 1441.88
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 179620.37 25844.13 6.950 7.16e-08 ***
## anio_estacion -89.07 12.89 -6.912 7.97e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 737.2 on 32 degrees of freedom
## Multiple R-squared: 0.5989, Adjusted R-squared: 0.5863
## F-statistic: 47.78 on 1 and 32 DF, p-value: 7.973e-08
summary(modelo_acumulado_seca)
##
## Call:
## lm(formula = acumulado_estacional ~ anio_estacion, data = seca)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1128.9 -622.8 -191.7 578.8 1775.4
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 179464.89 26815.61 6.693 1.28e-07 ***
## anio_estacion -88.98 13.37 -6.653 1.43e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 799.1 on 33 degrees of freedom
## Multiple R-squared: 0.5729, Adjusted R-squared: 0.56
## F-statistic: 44.27 on 1 and 33 DF, p-value: 1.429e-07
Este bloque analiza cada mes por separado. Por ejemplo, enero se compara únicamente contra los eneros de todos los años; febrero contra los febreros de todos los años, y así sucesivamente.
p_tendencia_meses_facetas <- ggplot(serie_df, aes(x = anio, y = valor)) +
geom_line(color = color_gris, linewidth = 0.45) +
geom_point(color = color_principal, size = 1.5) +
geom_smooth(method = "lm", se = TRUE, color = color_alerta, fill = "#FADBD8", linewidth = 0.75) +
facet_wrap(~ mes_nombre, scales = "free_y", ncol = 3) +
labs(
title = "Tendencia independiente por mes",
subtitle = "Cada panel compara el mismo mes a través de todos los años",
x = "Año",
y = "Valor observado"
) +
theme_minimal(base_size = 13)
p_tendencia_meses_facetas
guardar_grafico(p_tendencia_meses_facetas, "09_tendencia_independiente_por_mes_facetas.png", ancho = 14, alto = 10)
Este bloque imprime y guarda un gráfico separado para cada mes. Los
archivos se guardan en la carpeta
graficos_series_tiempo.
for (m in levels(serie_df$mes_nombre)) {
datos_mes <- serie_df %>% dplyr::filter(mes_nombre == m)
p_mes <- ggplot(datos_mes, aes(x = anio, y = valor)) +
geom_line(color = color_gris, linewidth = 0.55) +
geom_point(color = color_principal, size = 2) +
geom_smooth(method = "lm", se = TRUE, color = color_alerta, fill = "#FADBD8", linewidth = 0.95) +
labs(
title = paste("Tendencia histórica del mes de", m),
subtitle = paste("Comparación de", m, "en todos los años disponibles"),
x = "Año",
y = "Valor observado"
) +
theme_minimal(base_size = 14)
print(p_mes)
nombre_archivo <- paste0("10_tendencia_mes_", stringr::str_to_lower(stringr::str_replace_all(m, " ", "_")), ".png")
guardar_grafico(p_mes, nombre_archivo, ancho = 10, alto = 5.5)
}
season plotEste gráfico muestra la forma anual de la serie, comparando los meses dentro de cada año. Es útil para observar si la estacionalidad se mantiene estable o cambia en el tiempo.
p_season <- forecast::ggseasonplot(serie_ts, year.labels = FALSE, continuous = TRUE) +
labs(
title = "Gráfico estacional mensual",
subtitle = "Comparación de la forma intraanual de la serie",
x = "Mes",
y = "Valor observado"
) +
theme_minimal(base_size = 14)
p_season
guardar_grafico(p_season, "11_grafico_estacional_seasonplot.png")
El gráfico de subseries permite observar, para cada mes, la media mensual y la variabilidad interna a lo largo del tiempo.
p_subseries <- forecast::ggsubseriesplot(serie_ts) +
labs(
title = "Gráfico de subseries mensuales",
subtitle = "Evolución de cada mes y comparación con su media histórica",
x = "Mes",
y = "Valor observado"
) +
theme_minimal(base_size = 14)
p_subseries
guardar_grafico(p_subseries, "12_grafico_subseries_mensuales.png")
La descomposición separa la serie en tres componentes: tendencia, estacionalidad y residuo. Se aplica una descomposición aditiva, adecuada cuando la amplitud estacional no depende fuertemente del nivel de la serie.
desc_aditiva <- stats::decompose(serie_ts, type = "additive")
p_desc_aditiva <- forecast::autoplot(desc_aditiva) +
labs(title = "Descomposición clásica aditiva de la serie") +
theme_minimal(base_size = 14)
p_desc_aditiva
guardar_grafico(p_desc_aditiva, "13_descomposicion_clasica_aditiva.png", ancho = 12, alto = 8)
La descomposición STL es flexible y suele ser más robusta para series ambientales mensuales porque permite una estimación suavizada de la tendencia y de la estacionalidad.
desc_stl <- stats::stl(serie_ts, s.window = "periodic")
p_desc_stl <- forecast::autoplot(desc_stl) +
labs(title = "Descomposición STL de la serie mensual") +
theme_minimal(base_size = 14)
p_desc_stl
guardar_grafico(p_desc_stl, "14_descomposicion_stl.png", ancho = 12, alto = 8)
Las medias móviles permiten suavizar la serie y visualizar mejor los cambios de mediano plazo. La media móvil de 12 meses reduce el efecto de la estacionalidad anual.
serie_df <- serie_df %>%
dplyr::mutate(
media_movil_12 = zoo::rollmean(valor, k = 12, fill = NA, align = "center"),
media_movil_24 = zoo::rollmean(valor, k = 24, fill = NA, align = "center")
)
p_medias_moviles <- ggplot(serie_df, aes(x = fecha)) +
geom_line(aes(y = valor), color = "#B0B0B0", linewidth = 0.35) +
geom_line(aes(y = media_movil_12), color = color_principal, linewidth = 0.9) +
geom_line(aes(y = media_movil_24), color = color_alerta, linewidth = 1) +
labs(
title = "Serie mensual con medias móviles",
subtitle = "Gris: serie original; azul: media móvil 12 meses; rojo: media móvil 24 meses",
x = "Fecha",
y = "Valor observado"
) +
scale_x_date(date_breaks = "3 years", date_labels = "%Y") +
theme_minimal(base_size = 14) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
p_medias_moviles
guardar_grafico(p_medias_moviles, "15_medias_moviles_12_24_meses.png")
La anomalía se calcula como la diferencia entre el valor observado y el promedio histórico de su respectivo mes. Este análisis permite identificar meses por encima o por debajo del comportamiento esperado.
climatologia_mensual <- serie_df %>%
dplyr::group_by(mes) %>%
dplyr::summarise(promedio_mes = mean(valor, na.rm = TRUE), .groups = "drop")
serie_anomalias <- serie_df %>%
dplyr::left_join(climatologia_mensual, by = "mes") %>%
dplyr::mutate(
anomalia = valor - promedio_mes,
tipo_anomalia = dplyr::if_else(anomalia >= 0, "Positiva", "Negativa")
)
p_anomalias <- ggplot(serie_anomalias, aes(x = fecha, y = anomalia, fill = tipo_anomalia)) +
geom_col(width = 25, alpha = 0.9) +
geom_hline(yintercept = 0, color = "black", linewidth = 0.4) +
scale_fill_manual(values = c("Positiva" = color_principal, "Negativa" = color_alerta)) +
labs(
title = "Anomalías mensuales",
subtitle = "Diferencia entre el valor observado y el promedio histórico del mismo mes",
x = "Fecha",
y = "Anomalía",
fill = "Tipo"
) +
scale_x_date(date_breaks = "3 years", date_labels = "%Y") +
theme_minimal(base_size = 14) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
p_anomalias
guardar_grafico(p_anomalias, "16_anomalias_mensuales.png", ancho = 13, alto = 6.5)
La autocorrelación permite evaluar si los valores actuales dependen de valores pasados. En series mensuales ambientales es común observar autocorrelación en rezagos de 12 meses.
p_acf <- forecast::ggAcf(serie_ts, lag.max = 60) +
labs(
title = "Función de autocorrelación ACF",
subtitle = "Rezagos mensuales hasta 60 meses"
) +
theme_minimal(base_size = 14)
p_pacf <- forecast::ggPacf(serie_ts, lag.max = 60) +
labs(
title = "Función de autocorrelación parcial PACF",
subtitle = "Rezagos mensuales hasta 60 meses"
) +
theme_minimal(base_size = 14)
p_acf
guardar_grafico(p_acf, "17_acf_serie_mensual.png")
p_pacf
guardar_grafico(p_pacf, "18_pacf_serie_mensual.png")
Esta tabla sintetiza la serie mensual y permite reportar los valores principales del periodo analizado.
resumen_general <- serie_df %>%
dplyr::summarise(
fecha_inicio = min(fecha),
fecha_fin = max(fecha),
n_meses = dplyr::n(),
promedio = mean(valor, na.rm = TRUE),
mediana = median(valor, na.rm = TRUE),
desviacion_estandar = sd(valor, na.rm = TRUE),
minimo = min(valor, na.rm = TRUE),
maximo = max(valor, na.rm = TRUE),
coef_variacion = sd(valor, na.rm = TRUE) / mean(valor, na.rm = TRUE) * 100
)
knitr::kable(resumen_general, digits = 2, caption = "Resumen estadístico general de la serie mensual")
| fecha_inicio | fecha_fin | n_meses | promedio | mediana | desviacion_estandar | minimo | maximo | coef_variacion |
|---|---|---|---|---|---|---|---|---|
| 1988-01-01 | 2022-12-01 | 420 | 171.67 | 26.75 | 245.39 | 0 | 1109.8 | 142.94 |
Este bloque guarda las bases procesadas en formato CSV para que puedan ser usadas posteriormente en otros análisis.
write.csv(serie_df, file = "serie_mensual_procesada.csv", row.names = FALSE)
write.csv(serie_anual, file = "serie_anual_resumen.csv", row.names = FALSE)
write.csv(resumen_estacional, file = "serie_estacional_resumen.csv", row.names = FALSE)
write.csv(promedio_mensual, file = "promedio_mensual_historico.csv", row.names = FALSE)
write.csv(serie_anomalias, file = "serie_anomalias_mensuales.csv", row.names = FALSE)
Para una interpretación rigurosa, no conviene concluir que existe una tendencia climática solo por observar una pendiente visual. La tendencia debe evaluarse con el modelo lineal, los intervalos de confianza y, si corresponde, con pruebas no paramétricas adicionales. También debe considerarse la calidad de la serie, presencia de datos faltantes, cambios de estación meteorológica, cambios de instrumentos o cambios en el entorno de medición.