Tarea Práctica 1

Pacheco Méndez Irma Valeria, Rodríguez Salum Leyla Damaris

2025-09-07

En este documento nuestro propósito es analizar la tendencia y estacionalidad de la temperatura promedio mensual en México.

Así mismo, aplicaremos las transformaciones requeridas para adecuar nuestra serie de datos y, en un futuro, aplicar un modelo estadístico, con el objetivo de predecir temperaturas y así poder preveer distintas acciones.

Los datos analizados corresponden a una base de datos del clima mensual a nivel nacional en México desde el 01/01/1985 hasta el 01/06/2025, proporcionados por el Servicio Meteorológico Nacional (SMN), dependiente de la Comisión Nacional del Agua (CONAGUA), extraída de: https://smn.conagua.gob.mx/es/climatologia/temperaturas-y-lluvias/resumenes-mensuales-de-temperaturas-y-lluvias

El gráfico de nuestros datos se ve de la siguiente forma:

En primera instancia podemos observar que los datos siguen una tendencia a la alza, y a la vez la gráfica muestra una alta estacionalidad, hay un patrón cíclico anual, con picos y valles bien definidos cada 12 meses.

Pero para tener un mejor claridad sobre los datos haremos la descomposición por estacionalidad, tendencia y residuo:

Podemos observar un incremento sostenido en la temperatura promedio mensual a lo largo del tiempo.

En los primeros años (antes del 2000), la tendencia es más estable; a partir de la década de 2000 se nota un crecimiento más claro, con fluctuaciones intermedias.

En los últimos años, la temperatura se mantiene en niveles más altos en comparación con los años noventa, esto sugiere una señal de calentamiento climático en México.

Vemos que existe un patrón recurrente anual que refleja los cambios de estación: meses de temperaturas más bajas (invierno) y meses de temperaturas más altas (verano).

La estacionalidad es consistente en todo el periodo, lo que indica que los ciclos climáticos siguen siendo estables en cuanto a periodicidad.

Aunque en la mayor parte de la serie se mantiene alrededor de cero, en algunos años aparecen variaciones más pronunciadas, probablemente relacionadas con fenómenos climáticos extremos (p. ej. El Niño, sequías, olas de calor).

Entonces podemos concluir que tiene tendencia creciente entonces no es estacionaria en media y tiene estacionalidad anual fuerte lo que significa que tampoco es estacionaria en varianza a lo largo de los años. Por lo tanto necesitamos transformar la serie y dejarla más estable (estacionaria).

Para esto dado que la estacionalidad está muy marcada, haremos diferenciación estacional, esto para eliminar la estacionalidad anual, o de 12 meses.

Podemos ver que la estacionalidad desapareció casi por completo ya que en la gráfica ya no se ven los ciclos anuales tan marcados, lo que significa que el componente estacional fue eliminado.

También podemos notar que la serie ahora oscila alrededor de cero y nuestra media está más estabilizada.

Aunque todavía hay fluctuaciones grandes en los últimos años esto puede deberse a fenómenos climáticos extremos recientes (olas de calor, sequías).

Sin embargo para verificar que en efecto, la serie es estacionaria aplicamos la prueba de Dickey-Fuller aumentada (ADF).

Nuestros resultados: p-value = 0.01 Como el p-value es menor a .05,concluimos que nuestra serie ya es estacionaria después de aplicar la transformación. Por lo tanto podemos seguir con los procedimientos para poder realizar las predicciones correspondientes.

Ahora realizamos los autocorrelogramas para tener una mejor visión de nuestros datos y así poder tener un mejor acercamiento a el modelo que deberíamos usar.

Al analizar cómo se comportan los datos a lo largo del tiempo, notamos que tienden a repetirse de forma parecida cada 12 meses. Es decir, hay una especie de patrón anual que se repite, lo que indica una estacionalidad marcada (como las estaciones del año o los cambios de temperatura mes a mes).

Además, este patrón no desaparece rápidamente, lo que nos muestra que los datos no eran estables al principio y hubo que transformarlos un poco para poder analizarlos correctamente.

También se observa que los valores más recientes influyen en los siguientes de forma clara durante los primeros meses, lo cual nos ayuda a decidir qué tipo de modelo usar para hacer predicciones. En este caso, el modelo que se ajusta mejor es uno que tiene en cuenta tanto esa repetición anual como la influencia de los últimos 2 o 3 meses.

Al observar cómo los valores pasados influyen en los actuales, notamos que los primeros 2 o 3 meses anteriores tienen un impacto importante. Después de eso, la influencia se va perdiendo y ya no es significativa.

Esto nos indica que, para hacer buenas predicciones, es suficiente considerar los datos de los últimos 2 o 3 meses. Por eso, el modelo que mejor se adapta a esta situación incluye una parte que toma en cuenta esa relación con los meses más recientes.

Usamos la función auto.arima para que el propio programa elija el modelo más adecuado según el comportamiento de los datos. Esto nos facilita mucho el proceso, ya que permite ajustar un modelo confiable de manera automática y rápida. Gracias a esto, podemos realizar predicciones futuras de forma más precisa y sin complicaciones innecesarias.

El modelo ajustado a nuestros datos fue un ARIMA(3,0,3)(0,1,2)[12] con drift. Aunque suene técnico, podemos entenderlo de forma sencilla:

La primera parte del modelo (3,0,3) se refiere a cómo los valores pasados influyen en los actuales. En este caso, el modelo tiene en cuenta los últimos tres meses anteriores para hacer sus cálculos, tanto en forma directa como indirecta.

El 0 en el medio indica que no fue necesario ajustar por una tendencia general a lo largo del tiempo.

La parte (0,1,2)[12] nos dice que hay un patrón que se repite cada 12 meses, como una especie de “ciclo anual”. Para capturar esto, el modelo aplica una transformación que resalta esa repetición y considera los dos años anteriores (lag 12 y 24) para mejorar las predicciones.

El “drift” indica que hay una ligera tendencia constante en los datos a lo largo del tiempo, lo que puede representar un aumento o una disminución leve y continua.

Para comprobar si el modelo que ajustamos representa bien nuestros datos, aplicamos la prueba de Ljung-Box. Esta prueba nos ayuda a verificar si los errores del modelo (es decir, lo que no pudo predecir) parecen comportarse como ruido aleatorio o si todavía queda algún patrón sin capturar.

Si el resultado de la prueba muestra que no hay patrones importantes en los residuos, eso significa que el modelo está haciendo un buen trabajo.

La prueba de Ljung-Box arrojó un p-value de 0.5505, lo cual es mayor que 0.05 esto indica que el modelo ha logrado capturar correctamente la estructura de los datos hasta el rezago 12, y que no quedan patrones importantes sin explicar. Por lo tanto, podemos considerar que el modelo es adecuado y ya podemos avanzar con las predicciones con mayor confianza.

Dado que nuestros datos están hasta Junio de 2025, podemos hacer el pronostico para los siguientes 3 meses, ya que tenemos información actualizada y podemos comparar.

Los resultados obtenidos por el modelo fueron los siguientes:

Julio 2025: 26.17

Agosto 2025: 26.40

Septiembre 2025: 25.38

Al compararlos con los datos reales más recientes proporcionados por la misma fuente:

Julio 2025: 26.10

Agosto 2025: 26.60

Septiembre 2025: 25.50

se observa que las diferencias entre las predicciones y los valores reales fueron mínimas, con variaciones menores a 0.2 grados en todos los casos.

Esto demuestra que el modelo logró captar correctamente el comportamiento general del clima en el corto plazo, manteniéndose bastante cercano a los valores reales. Por lo tanto, se considera que el modelo es confiable para realizar predicciones mensuales, especialmente cuando se busca anticipar tendencias con una o pocas semanas de anticipación.

Este tipo de herramienta puede tener diversos usos, dependiendo de las necesidades del usuario, y permite tomar decisiones más informadas basadas en datos.