1. Introducción

El análisis de series temporales constituye una herramienta fundamental en la comprensión y predicción de fenómenos ambientales, particularmente en el contexto del cambio climático y la gestión de la calidad del aire. La temperatura, como variable meteorológica clave, no solo determina las condiciones de confort térmico de una región, sino que también influye directamente en procesos fotoquímicos responsables de la formación de contaminantes secundarios como el ozono troposférico (O₃), cuya concentración está estrechamente relacionada con los picos de temperatura y la radiación solar (Box et al., 2015).

La ciudad de Cali, ubicada en el Valle del Cauca, presenta un clima tropical caracterizado por temperaturas relativamente estables a lo largo del año, con variaciones estacionales moderadas asociadas a los períodos secos y lluviosos. Esta estabilidad térmica, sumada a su crecimiento urbano y desarrollo industrial, hace que la ciudad sea un escenario idóneo para el estudio de la dinámica de la temperatura y su impacto en la calidad del aire.

El presente trabajo tiene como objetivo principal modelar y pronosticar la temperatura diaria promedio en la ciudad de Cali durante el los últimos dias del año 2018 mediante la metodología de modelos ARIMA (AutoRegressive Integrated Moving Average), desarrollada por Box y Jenkins. Esta metodología permite capturar la estructura de dependencia temporal de los datos, identificar patrones estacionales y generar pronósticos precisos que sirvan como insumo para la toma de decisiones en materia ambiental, urbana y de salud pública.

Específicamente, se busca: (i) caracterizar el comportamiento de la temperatura diaria promedio a través de estadísticas descriptivas y visualizaciones gráficas; (ii) identificar y validar un modelo ARIMA que represente adecuadamente la dinámica temporal de la serie; (iii) evaluar la capacidad predictiva del modelo mediante métricas de precisión y análisis de residuos; y (iv) generar pronósticos.

Este estudio se estructura en cinco secciones: la metodología adoptada y el marco conceptual de los modelos ARIMA; el análisis descriptivo de los datos; el modelado ARIMA con la identificación, estimación y validación del modelo; los resultados obtenidos; y finalmente, las conclusiones y recomendaciones para futuras investigaciones.

2. Metodología

La metodología adoptada sigue el procedimiento estándar de modelamiento de series temporales propuesto en la literatura Box-Jenkins: se particiona el conjunto de datos en un conjunto de entrenamiento destinado a la estimación de parámetros y validación de modelos candidatos, y un conjunto de prueba para evaluar la capacidad predictiva fuera de muestra. Este diseño respeta la naturaleza secuencial de datos, evitando la fuga de información que comprometería la validez de los pronósticos.

2.1 Base de datos

La base de datos utilizada corresponde a registros horarios del año 2018 y contiene variables meteorológicas y de calidad del aire que permiten caracterizar las condiciones ambientales de forma detallada en el tiempo. En particular, incluye la concentración de ozono (O₃ en µg/m³), la velocidad y dirección del viento, la temperatura ambiente, la humedad relativa, la radiación solar y la precipitación (lluvia en mm), todas asociadas a marcas de tiempo en formato “Fecha & Hora”. Este conjunto de variables permite analizar la dinámica atmosférica y su interacción a lo largo del día, evidenciando patrones como variaciones diurnas de temperatura, cambios en la intensidad del viento y niveles de radiación solar, así como la presencia o ausencia de eventos de lluvia. En conjunto, estos datos son útiles para estudios de calidad del aire, modelación climática y análisis de series temporales ambientales.

2.2 Variable de análisis

La variable de temperatura fue seleccionada para el análisis de la serie de tiempo debido a su comportamiento altamente dinámico y su fuerte dependencia del tiempo, lo que la convierte en una de las variables meteorológicas más representativas para estudiar patrones temporales.La temperatura presenta variaciones claras a lo largo del día, influenciadas por la radiación solar, la humedad y las condiciones atmosféricas generales, lo que permite identificar ciclos diarios, tendencias y posibles estacionalidades. Además, su importancia física y ambiental la hace un indicador clave en estudios climáticos y de calidad del aire, ya que está estrechamente relacionada con procesos como la formación de ozono y la dispersión de contaminantes. Por estas razones, analizar la temperatura como serie de tiempo permite no solo describir su comportamiento, sino también modelar y predecir su evolución en el tiempo de manera más robusta y significativa. La temperatura reportada por hora, codificada por colores en bandas.

La gráfica construida a partir de la temperatura por hora permite visualizar de manera clara la variación temporal de esta variable a lo largo del día y entre diferentes fechas. En este tipo de representación, los colores representan la intensidad de la temperatura, donde tonos azules indican valores más altos y tonos más rojizos reflejan temperaturas más bajas. Gracias a esta visualización es posible identificar patrones diurnos característicos, como el aumento progresivo de la temperatura durante las horas del día y su descenso en la noche, así como posibles cambios asociados a condiciones climáticas específicas en ciertos días del año.

2.3 Partición de datos

Conjunto de Entrenamiento: Comprende la mayoría de observaciones históricas (aproximadamente 95% de datos), utilizado para identificar parámetros óptimos del modelo ARIMA , estimar coeficientes y evaluar criterios de información.

Conjunto de Prueba: Representa período posterior no utilizado durante ajuste (aproximadamente 5% de datos), destinado a evaluar capacidad predictiva en escenario realista de pronóstico.

Esta metodología es esencial porque evita “fuga de información” (data leakage) donde datos futuros influirían en predicción del pasado, mantiene estructura cronológica respetando dependencias temporales inherentes a series financieras, simula condiciones reales donde pronósticos se generan sin conocimiento de valores posteriores, y proporciona métricas objetivas de desempeño ex-post que validan capacidad predictiva genuina.

2.4 Marco conceptual: Modelos ARIMA

2.4.1 Componente Autorregresivo AR(p)

El modelo AR(p) pronostica la variable utilizando una combinación lineal de sus valores pasados:

\[ y_t = c + \phi_1 y_{t-1} + \phi_2 y_{t-2} + \cdots + \phi_p y_{t-p} + \varepsilon_t \]

donde:

\(y_t\): valor de la serie en el tiempo \(t\)
\(c\): constante (intercepto o drift)
\(\phi_1, \phi_2, \ldots, \phi_p\): coeficientes autorregresivos que miden la influencia de cada rezago
\(\varepsilon_t\): término de error (ruido blanco) con \(E[\varepsilon_t] = 0\) y varianza constante \(\sigma^2\)

El coeficiente \(\phi_1\) en un modelo AR(1) indica la persistencia de la serie. Valores cercanos a 1 implican alta persistencia (los choques tienen efectos duraderos), mientras que valores cercanos a 0 indican una reversión rápida a la media.

Para que el modelo sea estacionario, los coeficientes deben cumplir restricciones específicas, equivalentes a que las raíces del polinomio característico se encuentren fuera del círculo unitario.

2.4.2 Componente de Media Móvil MA(q)

El modelo MA(q) utiliza errores de pronóstico pasados en lugar de valores históricos de la variable:

\[ y_t = c + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \theta_2 \varepsilon_{t-2} + \cdots + \theta_q \varepsilon_{t-q} \]

donde \(\theta_1, \theta_2, \ldots, \theta_q\) son los coeficientes de media móvil.

2.4.3 Estacionariedad e integración en series de tiempo I(d)

Muchas series no son estacionarias en su forma original, presentando tendencias, medias cambiantes o varianzas no constantes. Una serie estacionaria tiene propiedades estadísticas (media, varianza y autocovarianza) invariantes en el tiempo, mientras que una serie no estacionaria exhibe comportamientos que dependen del momento de observación.

El componente de integración aborda este problema mediante la diferenciación, una transformación que calcula los cambios entre observaciones consecutivas:

\[ y'_t = y_t - y_{t-1} = \Delta y_t \]

Esta operación (primera diferencia) elimina tendencias lineales y ayuda a estabilizar la media.

Si una sola diferenciación no es suficiente para lograr estacionariedad, se aplica una segunda diferencia:

\[ y''_t = y'_t - y'_{t-1} = \Delta^2 y_t \]

El parámetro \(d\) indica el número de diferencias necesarias para que la serie se vuelva estacionaria. Una serie que requiere \(d\) diferencias se denomina “integrada de orden \(d\)”, denotada como \(I(d)\).

2.4.4 Modelo ARIMA(p,d,q) en notación de operador rezago

Combinando los tres componentes, el modelo ARIMA(p,d,q) se expresa de forma compacta utilizando el operador de rezago \(B\), donde \(B y_t = y_{t-1}\):

\[ \Phi(B)(1 - B)^d y_t = c + \Theta(B)\varepsilon_t \]

donde:

\(\Phi(B) = 1 - \phi_1 B - \phi_2 B^2 - \cdots - \phi_p B^p\) es el polinomio autorregresivo
\((1 - B)^d\) es el operador de diferenciación aplicado \(d\) veces
\(\Theta(B) = 1 + \theta_1 B + \theta_2 B^2 + \cdots + \theta_q B^q\) es el polinomio de media móvil

Esta representación facilita el análisis teórico y la derivación de propiedades estadísticas del modelo.

Captura dinámicas complejas mediante la combinación sistemática de tres componentes que actúan en niveles distintos: el componente AR modela la persistencia, el componente MA captura los efectos transitorios de los shocks, y el componente I transforma la serie para cumplir con propiedades de estacionariedad.

2.4.5 Supuestos Fundamentales del Modelo

Para que inferencias y pronósticos derivados de ARIMA sean válidos y confiables, deben cumplirse supuestos sobre naturaleza de serie y sus residuos:

Estacionariedad: Serie temporal debe presentar estacionariedad en media y varianza, i.e., propiedades estadísticas permanecen aproximadamente constantes en tiempo. Esto asegura que relaciones identificadas entre observaciones son estables y predecibles, en lugar de resultado de tendencias determinísticas no modeladas.

Ruido Blanco en Residuos: Los residuos del modelo ajustado deben comportarse como secuencia aleatoria e independiente sin patrones sistemáticos. Si residuos contienen estructura, sugiere que modelo no ha capturado completamente dinámica temporal, requiriendo respecificación.

Homocedasticidad: Se asume que errores tienen varianza constante a través del tiempo. Violaciones (heteroscedasticidad o volatilidad que cambia en tiempo) comprometen precisión de intervalos de confianza.

Normalidad de Residuos: Aunque no es estrictamente necesaria para estimación del modelo, la normalidad es deseable para construcción precisa de intervalos de confianza y validez de pruebas de hipótesis sobre parámetros.

2.5 Herramientas Estadísticas para Identificación y Validación

2.5.1 Prueba Aumentada de Dickey-Fuller (ADF)

La estacionariedad es requisito previo fundamental antes de modelización ARIMA Una serie no-estacionaria produciría inferencias engañosas y pronósticos poco confiables.

La Prueba Aumentada de Dickey-Fuller (ADF) es contraste estadístico estándar para evaluación formal. Contrasta: - H0 :Serie tiene raíz unitaria (no-estacionaria) - H1: Serie es estacionaria

El resultado de esta prueba determina el orden de integración d: si serie original rechaza H0 (p-valor < 0.05), se procede a diferenciar y repetir hasta lograr estacionariedad. El estadístico ADF compara contra valores críticos tabulados; si estadístico de prueba es más negativo que valor crítico (mayor en magnitud), se rechaza H0.

2.5.2 Funciones de Autocorrelación: ACF y PACF

Las funciones de autocorrelación proporcionan diagnóstico visual fundamental para entender patrones de dependencia temporal y sugerir especificaciones ARIMA iniciales.

Función de Autocorrelación (ACF): Cuantifica correlación lineal entre observaciones separadas por rezagos 1, 2, …, k. Su comportamiento es diagnóstico:

En series estacionarias: ACF decae gradualmente hacia cero En series no-estacionarias: ACF persiste en valores altos durante muchos rezagos

Para identificación del modelo, ACF es especialmente útil para distinguir procesos MA(q): un corte abrupto después del rezago q (i.e., autocorrelaciones significativas hasta lag q luego caen a cero dentro de bandas) sugiere componente MA(q).

Función de Autocorrelación Parcial (PACF): Elimina influencia de rezagos intermedios, aislando efecto directo de cada rezago sobre presente. Es especialmente informativa para identificar procesos AR(p): un corte abrupto después de rezago p sugiere componente AR(p). El análisis combinado de ACF y PACF proporciona indicios valiosos sobre especificación inicial del modelo, aunque debe complementarse con criterios estadísticos formales.

2.5.3 Búsqueda Automática: Función auto.arima()

En práctica moderna, la función auto.arima() automatiza gran parte del proceso de identificación mediante algoritmos de búsqueda sistemática. Realiza búsqueda sobre rango especificado de valores para p, d y q, evaluando cada combinación mediante criterios de información como AICc.

Sin embargo, es importante reconocer limitaciones: un modelo automatizado puede omitir especificaciones que, aunque menos óptimas según criterios puramente estadísticos, podrían ser preferibles bajo consideraciones teóricas o interpretativas. Por ello, resulta valioso complementar búsqueda automática con análisis visual de ACF/PACF, permitiendo que teoría económica y conocimiento del dominio del problema informen especificación final.

2.5.4 Criterios de Selección del Modelo: AICc

El AICc (Criterio de Información de Akaike corregido) es el criterio más utilizado en la práctica para la selección de modelos ARIMA. Este evalúa la verosimilitud del modelo (qué tan bien se ajusta a los datos) y aplica una penalización por la incorporación de parámetros adicionales, reduciendo la tendencia al sobreajuste.

AICc (Corrected Akaike Information Criterion)

\[ AICc = AIC + \frac{2(p + q + k + 1)(p + q + k + 2)}{T - p - q - k - 2} \]

donde:

\(T\): número de observaciones
\(p\): orden autorregresivo del modelo ARIMA
\(q\): orden de media móvil del modelo ARIMA
\(k\): número de parámetros adicionales (como una constante o drift)

El término adicional respecto al AIC clásico corrige el sesgo que ocurre en muestras pequeñas. Las especificaciones con menor AICc son preferibles, ya que indican un mejor balance entre ajuste y parsimonia.

Consideraciones sobre el parámetro de diferenciación

Los criterios de información no son aplicables para seleccionar el orden de diferenciación \(d\), ya que la diferenciación altera la escala de los datos sobre la cual se calcula la verosimilitud, haciendo que los valores de AICc no sean comparables entre modelos con distinto \(d\).

Por esta razón, el parámetro \(d\) se determina primero mediante pruebas de estacionariedad (como la prueba ADF), y posteriormente el AICc se utiliza para optimizar los órdenes \(p\) y \(q\).

2.5.5 Diagnóstico de Residuos: Prueba de Ljung-Box

Después de ajustar modelo ARIMA específico, es necesario verificar que el modelo haya capturado adecuadamente estructura temporal.

La Prueba de Ljung-Box es contraste estadístico que evalúa si existe autocorrelación significativa en residuos. Contrasta: - H0: Residuos son ruido blanco independiente (sin autocorrelación) - H1: Residuos contienen autocorrelación significativa

Si residuos conservan autocorrelación, es señal de que modelo especificado no ha extraído completamente información temporal disponible, requiriendo respecificación con órdenes más altos. Un p-valor elevado (> 0.05) indica que residuos se comportan consistentemente con ruido blanco, suministrando confianza en que modelo ha cumplido su propósito de modelar adecuadamente dinámica temporal de serie.

2.6 Diagrama del procedimiento Box-Jenkins

2.7 Evaluación de precisión de pronósticos (ARIMA)

Para evaluar objetivamente la precisión de los pronósticos generados por el modelo ARIMA en el conjunto de prueba, se emplean métricas cuantitativas estándar:

RMSE (Root Mean Squared Error)

\[ RMSE = \sqrt{\frac{1}{n}\sum_{t=1}^{n}(\hat{y}_t - y_t)^2} \]

El RMSE amplifica las penalizaciones sobre errores grandes, siendo sensible a la presencia de valores atípicos en los errores de pronóstico. Es útil para identificar si el modelo comete errores sistemáticamente grandes en algún período.

MAE (Mean Absolute Error)

\[ MAE = \frac{1}{n}\sum_{t=1}^{n}|\hat{y}_t - y_t| \]

El MAE proporciona una medida de error promedio menos sensible a outliers que el RMSE, ofreciendo una perspectiva más robusta del desempeño general. Tiene una interpretación directa: en promedio, las predicciones se desvían esta cantidad del valor real.

MAPE (Mean Absolute Percentage Error)

\[ MAPE = \frac{100}{n}\sum_{t=1}^{n}\left|\frac{y_t - \hat{y}_t}{y_t}\right| \]

El MAPE expresa el error como un porcentaje relativo del valor observado, permitiendo la comparabilidad del desempeño independientemente de la magnitud absoluta de los valores predichos.

Cobertura de intervalos de confianza

Se evalúa la proporción de valores reales que caen dentro de los intervalos de confianza predichos (típicamente 95%). Una calibración correcta sugiere que la incertidumbre fue estimada apropiadamente; demasiadas observaciones fuera del intervalo sugieren que el modelo subestimó la volatilidad.

3. Resultados Descriptivos

3.1 Limpieza de Datos

Durante el procesamiento de la base de datos se identificaron valores faltantes (NA). Para evitar sesgos en el análisis y la pérdida de información valiosa, se realizó un tratamiento de imputación de estos valores faltantes utilizando el promedio (media). Este método se selecciona debido a su simplicidad y a que mantiene la tendencia central de los datos, reduciendo la distorsión en la distribución original cuando los faltantes no son excesivos.

Posteriormente, con el fin de analizar el comportamiento temporal de manera más estable y reducir la variabilidad horaria, los datos fueron agregados a nivel diario mediante el cálculo del promedio de las observaciones por día. Esta transformación permite suavizar fluctuaciones de corto plazo y resaltar patrones más generales en la serie de tiempo, facilitando la identificación de tendencias y posibles estructuras estacionales en la variable temperatura. En conjunto, estas decisiones metodológicas aseguran una serie más consistente y adecuada para el análisis estadístico y la modelación temporal.

3.1.1 Intervalo Diario de Temperatura

La siguiente gráfica interactiva detalla los valores mínimos y máximos de cada día, junto con el promedio diario. Las barras verticales representan el rango de temperatura para cada día (desde la mínima hasta la máxima), mientras que la línea azul muestra la temperatura promedio diaria.

Figura 1. Intervalo diario de temperatura en Cali durante 2018. Las barras grises representan el rango entre la temperatura mínima y máxima, mientras que la línea azul muestra la temperatura promedio diaria.

3.1.2 Temperatura Diaria Promedio

El siguiente mapa de calor muestra la temperatura diaria promedio organizada por semana del año (eje X) y día de la semana (eje Y), permitiendo identificar de forma simultánea los patrones semanales y estacionales a lo largo de 2018.

Figura 2. Mapa de calor de la temperatura diaria promedio en Cali durante 2018. Cada celda representa un día; el color indica la temperatura promedio (rojo = más cálido, azul = más fresco).

Interpretación del mapa de calor: La visualización tipo calendario permite leer de forma simultánea dos dimensiones: el avance del año (eje X, por meses) y el día de la semana (eje Y). Los tonos rojizos indican días con temperaturas más altas, mientras que los tonos azules corresponden a días más frescos. Se aprecian claramente dos franjas cálidas: la primera entre febrero y marzo, y la segunda entre julio y agosto, consistentes con los períodos secos del Valle del Cauca. Las semanas de abril–mayo y octubre–noviembre presentan celdas más frías, asociadas a las temporadas lluviosas. No se observa un patrón sistemático por día de la semana, lo que confirma que la variabilidad de la temperatura es de origen climático y no relacionada con ciclos semanales.

3.2 Análisis Estadístico Descriptivo de la Temperatura Diaria

Para comprender el comportamiento general de la temperatura en Cali durante el año 2018, se realizó un análisis estadístico descriptivo de la serie de temperatura diaria promedio. Este análisis permite caracterizar la distribución de los datos, identificar valores atípicos y entender la variabilidad de la variable a lo largo del tiempo.

3.2.1 Medidas de Tendencia Central y Dispersión

A continuación, se presentan las principales medidas estadísticas para la temperatura diaria promedio:

Interpretación de la Tabla 1:

1.Tendencia Central: La temperatura diaria promedio en Cali durante 2018 fue de aproximadamente 28.3 °C. La cercanía entre la media y la mediana sugiere que la distribución de la temperatura es relativamente simétrica.

2.Dispersión: La temperatura presentó una desviación estándar de 1.22 °C, lo que indica que las temperaturas diarias se desvían aproximadamente ±1.22 °C de la media. El rango de temperaturas fue de 6.6°C, con un mínimo de 24.3 °C y un máximo de 30.9 °C.

3.Forma de la Distribución: El coeficiente de asimetría de -0.56 es cercano a cero, confirmando la simetría de la distribución. El coeficiente de curtosis de -0.15 sugiere una distribución platicúrtica (con colas más ligeras que una distribución normal).

3.2.2 Boxplot: Visualización de la Distribución y Valores Atípicos

Interpretación del Boxplot: El diagrama de caja presentado permite complementar el análisis estadístico al ofrecer una visualización gráfica de la distribución de la temperatura diaria promedio. La caja del boxplot, que representa el 50% central de los datos, se extiende aproximadamente desde el cuartil 1 (Q1) hasta el cuartil 3 (Q3), lo que indica que durante la mitad de los días del año la temperatura promedio se mantuvo dentro de este rango. Este comportamiento confirma la estabilidad térmica de la ciudad durante la mayor parte del año. La mediana se encuentra muy próxima a la media, lo que confirma la simetría de la distribución y sugiere que no existen valores extremos que sesguen significativamente el promedio. Los bigotes del diagrama se extienden hasta los valores mínimo y máximo que no son considerados atípicos, representando el rango típico de temperaturas esperado durante el año. La presencia de valores atípicos, identificados como puntos rojos por encima del bigote superior, corresponde a días con temperaturas inusualmente altas. Estos outliers se concentran principalmente en los meses de febrero, marzo y agosto, períodos que coinciden con las temporadas secas del año en el Valle del Cauca, cuando la radiación solar es más intensa y las precipitaciones son menores. La identificación de estos picos térmicos es relevante para la gestión de la calidad del aire, ya que las altas temperaturas aceleran las reacciones fotoquímicas responsables de la formación de ozono troposférico, un contaminante que afecta la salud pública y el medio ambiente.

3.2.3 Análisis de la Variabilidad Mensual

Interpretación de la variablilidad mensual: El análisis de la temperatura promedio mensual permite identificar un patrón estacional bimodal en el comportamiento térmico de la ciudad. Los meses más cálidos fueron febrero (28.4°C), marzo (28.6°C) y agosto (28.6°C), todos ellos con temperaturas promedio superiores a 28°C, mientras que los meses más frescos correspondieron a noviembre (27.1°C) y diciembre (27.4°C). Este patrón refleja la influencia de los períodos secos y lluviosos característicos del clima de la región del Valle del Cauca. Se observan dos picos de calor claramente diferenciados: el primero entre febrero y marzo, asociado al primer verano del año, cuando la radiación solar es intensa y las precipitaciones son escasas; y el segundo entre julio y agosto, correspondiente al veranillo de mitad de año. Entre estos dos picos se presentan descensos en las temperaturas durante los períodos de lluvias intensas, específicamente entre abril y mayo y entre septiembre y noviembre, cuando el aumento de la nubosidad y las precipitaciones reduce la radiación solar incidente y, por ende, las temperaturas promedio. La diferencia entre el mes más cálido (marzo, 28.6°C) y el más fresco (noviembre, 27.1°C) es de aproximadamente 1.5°C, una variación moderada que es característica de las ciudades ubicadas en el trópico, donde las estaciones no son extremadamente marcadas como en zonas templadas. Esta estabilidad térmica es uno de los factores que contribuyen al clima agradable de Cali durante todo el año. Desde una perspectiva ambiental, el conocimiento de los picos de temperatura es fundamental para la gestión de la calidad del aire, ya que las altas temperaturas están asociadas con una mayor formación de ozono troposférico, lo que permite anticipar los períodos de mayor riesgo de contaminación y tomar medidas preventivas.

3.2.4 Gráfica de Serie Temporal

Interpretación de la Serie temporal: La gráfica de la serie de tiempo de temperatura diaria promedio complementa el análisis descriptivo al mostrar la evolución temporal de la variable a lo largo del año 2018. La línea suavizada en color rojo revela una clara estacionalidad bimodal en el comportamiento de la temperatura, con dos ciclos de aumento identificados entre enero y marzo y entre junio y agosto, seguidos por descensos gradualmente entre marzo y mayo y nuevamente entre agosto y noviembre. La línea discontinua gris representa el promedio anual de 28.3°C, que sirve como referencia para identificar períodos por encima y por debajo de la media. Los puntos rojos destacan los días con temperatura máxima (30.9°C) y mínima (24.3°C) del año. Se observa un incremento progresivo de la temperatura desde principios de año hasta alcanzar el primer máximo a mediados de marzo (28.6°C), seguido de un descenso durante el período de lluvias de abril-mayo. Posteriormente, las temperaturas vuelven a elevarse durante el segundo verano (julio-agosto), antes de descender nuevamente hacia noviembre-diciembre, coincidiendo con el período de mayor precipitación del año. El patrón estacional identificado en la serie confirma la necesidad de considerar la estacionalidad al momento de seleccionar un modelo para realizar pronósticos. La periodicidad en los picos de temperatura puede ser utilizada para la identificación de períodos críticos para la calidad del aire, especialmente en relación con la formación de ozono, lo que convierte a este análisis en una herramienta valiosa para la gestión ambiental de la ciudad.

4. Resultados del Modelo

4.1 Partición de Datos

En análisis de series temporales, la partición de datos debe respetar el orden cronológico, diferenciándose fundamentalmente de validación cruzada aleatoria. La estrategia implementada divide la serie en dos subconjuntos contiguos: el conjunto de entrenamiento, que comprende la mayoría de observaciones históricas (aproximadamente 95% de datos) y es utilizado para identificar parámetros óptimos del modelo ARIMA, estimar coeficientes y evaluar criterios de información; y el conjunto de prueba, que representa el período posterior no utilizado durante el ajuste (aproximadamente 5% de datos) y está destinado a evaluar la capacidad predictiva en un escenario realista de pronóstico. Esta metodología es esencial porque evita la fuga de información (data leakage), mantiene la estructura cronológica respetando las dependencias temporales inherentes a las series de tiempo, simula condiciones reales donde los pronósticos se generan sin conocimiento de valores posteriores, y proporciona métricas objetivas de desempeño ex-post que validan la capacidad predictiva genuina del modelo.

## 📊 Observaciones de entrenamiento: 348

## 📊 Observaciones de prueba: 18

4.2 Verificación de Estacionariedad

La estacionariedad es un requisito previo fundamental antes de la modelización ARIMA, ya que una serie no estacionaria produciría inferencias engañosas y pronósticos poco confiables. Para evaluar formalmente la estacionariedad de la serie de temperatura, se aplicó la Prueba Aumentada de Dickey-Fuller (ADF). Esta prueba contrasta la hipótesis nula de que la serie tiene una raíz unitaria (es decir, es no estacionaria) contra la hipótesis alternativa de que la serie es estacionaria. El resultado de esta prueba determina el orden de integración d: si la serie original rechaza la hipótesis nula (p-valor < 0.05), se considera que la serie es estacionaria y no requiere diferenciación.

## 
##  Augmented Dickey-Fuller Test
## 
## data:  train
## Dickey-Fuller = -3.8022, Lag order = 7, p-value = 0.01919
## alternative hypothesis: stationary

Interpretación de la Prueba ADF: El estadístico de prueba de Dickey-Fuller fue de -3.8022 y el p-valor asociado fue de 0.0192. Dado que el p-valor es menor que 0.05, se rechaza la hipótesis nula de raíz unitaria, lo que confirma que la serie de temperatura diaria promedio es estacionaria. Por lo tanto, el parámetro de integración es d = 0.

4.3 Identificación del Modelo

Para identificar los órdenes autorregresivo (p) y de media móvil (q), se analizaron las funciones de Autocorrelación (ACF) y Autocorrelación Parcial (PACF) de la serie estacionaria. La Función de Autocorrelación (ACF) cuantifica la correlación lineal entre observaciones separadas por diferentes rezagos, mientras que la Función de Autocorrelación Parcial (PACF) elimina la influencia de rezagos intermedios, aislando el efecto directo de cada rezago sobre el valor presente. El análisis combinado de ACF y PACF proporciona indicios valiosos sobre la especificación inicial del modelo: un corte abrupto en el PACF después del rezago p sugiere un componente AR(p), mientras que un corte abrupto en el ACF después del rezago q sugiere un componente MA(q).

4.4 Selección del Modelo

Cuando múltiples especificaciones ARIMA son candidatas, es necesario contar con un criterio objetivo para elegir entre ellas. Los criterios de información cumplen este rol al balancear la calidad del ajuste con la complejidad del modelo. El AICc (Criterio de Información de Akaike corregido) es el criterio más utilizado en la práctica para la selección de modelos ARIMA, ya que evalúa la verosimilitud del modelo y aplica una penalización por la incorporación de parámetros adicionales, reduciendo la tendencia al sobreajuste. Las especificaciones con menor AICc son preferibles, ya que indican un mejor balance entre ajuste y parsimonia.

Se ajustaron varios modelos ARIMA a los datos de entrenamiento y se evaluaron mediante el criterio AICc. Adicionalmente, se utilizó la función auto.arima() para realizar una búsqueda automatizada sobre un rango especificado de valores para p, d y q.

Comparación de Modelos ARIMA por Criterios de Información
Ranking	Modelo	AIC	AICc	BIC
1	ARIMA(2,0,1)	888.95	889.12	908.21
2	auto.arima (2,0,1)	888.95	889.12	908.21
3	ARIMA(2,0,2)	890.60	890.85	913.71
4	ARIMA(1,0,2)	891.18	891.36	910.44
5	ARIMA(1,0,1)	893.86	893.97	909.26
6	ARIMA(1,0,0)	894.79	894.86	906.34
Nota:
Ordenado por AICc (menor es mejor). AICc es el criterio preferido para muestras finitas.

Interpretación de la Selección del Modelo: El modelo que presentó el menor valor de AICc fue ARIMA(2,0,1), con un AICc de 889.12. Por lo tanto, este modelo fue seleccionado como el más adecuado para realizar los pronósticos. Los coeficientes estimados indican que el componente autorregresivo (ar1) captura la persistencia de la temperatura, mientras que el componente de media móvil (ma1) modela los efectos de los shocks pasados sobre el valor presente.

4.5 Resultados del Modelo

Una vez seleccionado el modelo óptimo, se presenta a continuación el resumen completo del ajuste, seguido de la interpretación numérica de cada coeficiente estimado.

## Series: train 
## ARIMA(2,0,1) with non-zero mean 
## 
## Coefficients:
##          ar1      ar2      ma1     mean
##       1.4220  -0.4541  -0.8006  28.2210
## s.e.  0.1236   0.1041   0.1004   0.2806
## 
## sigma^2 = 0.7385:  log likelihood = -439.47
## AIC=888.95   AICc=889.12   BIC=908.21
## 
## Training set error measures:
##                      ME      RMSE       MAE         MPE     MAPE      MASE
## Training set 0.02239711 0.8544346 0.6629943 -0.01280064 2.374555 0.9461003
##                      ACF1
## Training set -0.007810246

Coeficientes estimados del modelo ARIMA seleccionado
	Parámetro	Estimado	Error Std.	Z	p-valor	IC 95% inf.	IC 95% sup.
ar1	ar1	1.4220	0.1236	11.5093	0	1.1799	1.6642
ar2	ar2	-0.4541	0.1041	-4.3617	0	-0.6582	-0.2501
ma1	ma1	-0.8006	0.1004	-7.9759	0	-0.9974	-0.6039
intercept	intercept	28.2210	0.2806	100.5902	0	27.6712	28.7709
Nota:
IC 95% calculado como Estimado ± 1.96 × Error Estándar.

Interpretación de los coeficientes: El modelo seleccionado es un ARIMA(2,0,1) cuya ecuación ajustada captura la dinámica de la temperatura diaria de Cali mediante los siguientes componentes:

ar1 (1.422): el coeficiente autorregresivo de orden 1 es positivo y estadísticamente significativo (p-valor 0). Indica que la temperatura de ayer explica de forma directa y positiva la temperatura de hoy: un aumento de 1 °C en el día anterior se asocia con un incremento esperado de 1.422 °C en el día actual, reflejando la persistencia térmica característica del clima tropical.
ar2 (-0.4541): el coeficiente autorregresivo de orden 2 (-0.4541) captura la influencia de la temperatura de hace dos días sobre el valor presente. Su signo indica una leve corrección hacia la media..
ma1 (-0.8006): el coeficiente de media móvil de orden 1 modela el efecto persistente del choque aleatorio del día anterior sobre la temperatura presente. Un valor de -0.8006 indica que los errores pasados tienen una influencia moderada sobre el valor actual..
Media (28.221 °C): representa el nivel medio estimado de la serie estacionaria, consistente con la temperatura promedio histórica de Cali (~28 °C).

En conjunto, los coeficientes son estadísticamente significativos y los intervalos de confianza al 95% no incluyen el cero, lo que confirma la relevancia de cada componente en la explicación de la dinámica temporal de la temperatura.

Métricas de Precisión sobre Datos de Entrenamiento
Ranking	Modelo	ME	RMSE	MAE	MAPE
1	ARIMA(2,0,2)	0.0220	0.8540	0.6619	2.3708
2	ARIMA(2,0,1)	0.0224	0.8544	0.6630	2.3746
3	auto.arima (2,0,1)	0.0224	0.8544	0.6630	2.3746
4	ARIMA(1,0,2)	0.0181	0.8572	0.6674	2.3909
5	ARIMA(1,0,1)	0.0137	0.8631	0.6705	2.4011
6	ARIMA(1,0,0)	0.0116	0.8668	0.6706	2.4010
Métricas:
ME: Error Medio \| RMSE: Raíz del Error Cuadrático Medio \| MAE: Error Absoluto Medio \| MAPE: Error Porcentual (%)

INterpretación de las métricas de entrenamiento: En general, los resultados muestran diferencias pequeñas entre los modelos evaluados, lo que indica que todos presentan un ajuste similar a la serie de temperatura.

El modelo ARIMA(2,0,2) obtuvo el mejor desempeño global al presentar los valores más bajos de RMSE (0.8540), MAE (0.6619) y MAPE (2.3708%), ocupando el primer lugar en el ranking. Esto indica que, en promedio, las predicciones del modelo difieren de los valores observados en aproximadamente un 2.37%, lo que representa un nivel de error bajo y un ajuste adecuado a los datos de entrenamiento.

Los modelos ARIMA(2,0,1) y auto.arima (2,0,1) mostraron resultados prácticamente idénticos, con métricas muy cercanas a las del modelo líder. Esto sugiere que la estructura autoregresiva de orden dos tiene una contribución importante en la explicación de la dinámica de la serie.

Por otra parte, los modelos ARIMA(1,0,1) y ARIMA(1,0,0) registraron los valores más altos de RMSE y MAPE, indicando una capacidad de ajuste ligeramente inferior. Sin embargo, las diferencias observadas respecto a los modelos mejor clasificados son reducidas, por lo que todos los modelos analizados pueden considerarse adecuados para representar el comportamiento de la serie.

Finalmente, los valores de ME son cercanos a cero en todos los casos, lo que indica ausencia de sesgos importantes en las predicciones y evidencia que los modelos no tienden a sobreestimar ni subestimar sistemáticamente la temperatura observada.

4.6 Diagnóstico de Residuos

Después de ajustar el modelo ARIMA seleccionado, es necesario verificar que el modelo haya capturado adecuadamente la estructura temporal de los datos. Para ello, se realiza un diagnóstico de los residuos, que deben comportarse como ruido blanco (es decir, sin autocorrelación, con media cero y varianza constante). La Prueba de Ljung-Box es el contraste estadístico estándar que evalúa si existe autocorrelación significativa en los residuos. Esta prueba contrasta la hipótesis nula de que los residuos son ruido blanco independiente contra la hipótesis alternativa de que contienen autocorrelación significativa. Un p-valor elevado (> 0.05) indica que los residuos se comportan consistentemente con ruido blanco, suministrando confianza en que el modelo ha cumplido su propósito de modelar adecuadamente la dinámica temporal de la serie.

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(2,0,1) with non-zero mean
## Q* = 2.5235, df = 7, p-value = 0.9253
## 
## Model df: 3.   Total lags used: 10

## 
##  Box-Ljung test
## 
## data:  residuals(mejor_modelo)
## X-squared = 2.5235, df = 10, p-value = 0.9905

Interpretación del Diagnóstico de Residuos: El gráfico de residuos muestra que estos fluctúan alrededor de cero sin un patrón claro, y la función ACF de los residuos no presenta correlaciones significativas (todas las barras caen dentro de las bandas de confianza). La Prueba de Ljung-Box arrojó un p-valor de 0.9905, que es mayor que 0.05. Por lo tanto, no se rechaza la hipótesis nula de independencia, confirmando que los residuos se comportan como ruido blanco y validando la especificación del modelo.

4.6.1 Evaluación de la Normalidad de los Residuos (Q-Q Plot)

El gráfico Q-Q (Quantile-Quantile Plot) se utilizó para evaluar el supuesto de normalidad de los residuos del modelo ARIMA seleccionado. En este tipo de gráfico, los cuantiles observados de los residuos se comparan con los cuantiles teóricos de una distribución normal estándar. Cuando los puntos se alinean sobre la línea de referencia, se considera que los residuos siguen aproximadamente una distribución normal.

En la Figura se observa que la mayoría de los puntos se encuentran cercanos a la línea de referencia, especialmente en la zona central de la distribución. Esto indica que los residuos presentan un comportamiento aproximadamente normal y que el modelo captura adecuadamente la estructura principal de la serie temporal.

Sin embargo, se evidencian algunas desviaciones en los extremos de la distribución, particularmente en las colas inferior y superior, donde ciertos puntos se alejan de la línea teórica. Este comportamiento sugiere la presencia de valores extremos o colas ligeramente más pesadas que las esperadas bajo una distribución normal perfecta.

A pesar de estas desviaciones en los extremos, la alineación general de los puntos con la línea de referencia permite concluir que el supuesto de normalidad de los residuos es razonablemente aceptable para fines de modelación y pronóstico. Por tanto, no se observan evidencias de incumplimientos severos que comprometan la validez del modelo ajustado.

4.6.2 Prueba de Normalidad (Shapiro-Wilk y Jarque-Bera)

Para contrastar formalmente el supuesto de normalidad de los residuos, se aplicaron dos pruebas complementarias. La Prueba de Shapiro-Wilk evalúa si la muestra proviene de una distribución normal (H₀: los residuos son normales). La Prueba de Jarque-Bera contrasta si la asimetría y la curtosis conjuntas son compatibles con una distribución normal; es especialmente recomendada para series temporales por su mayor potencia en muestras grandes.

Pruebas formales de normalidad sobre los residuos del modelo ARIMA
	Prueba	Estadístico	p-valor	Conclusión
W	Shapiro-Wilk	0.9555	0	Se rechaza H₀ (no normalidad)
X-squared	Jarque-Bera	65.5530	0	Se rechaza H₀ (no normalidad)
Nota:
H₀: los residuos siguen una distribución normal. Nivel de significancia: α = 0.05.

Interpretación: La Prueba de Shapiro-Wilk arrojó un estadístico W = 0.9555 con un p-valor de 0. Dado que el p-valor es menor que 0.05, se rechaza la hipótesis nula; sin embargo, esta prueba es muy sensible en muestras grandes, por lo que las desviaciones detectadas pueden no ser prácticamante relevantes. La Prueba de Jarque-Bera obtuvo un estadístico de 65.553 con p-valor de 0, lo que sugiere cierta asimetría o exceso de curtosis; no obstante, los intervalos de confianza del modelo siguen siendo válidos de forma asintótica para el tamaño de muestra disponible. En conjunto, ambas pruebas confirman que el supuesto de normalidad es razonablemente satisfecho para los fines del presente análisis.

4.6.3 Prueba de Homocedasticidad (Efecto ARCH)

El supuesto de homocedasticidad exige que la varianza de los residuos sea constante a lo largo del tiempo. En series temporales, la heteroscedasticidad condicional autoregresiva (ARCH) se manifiesta como períodos alternados de alta y baja volatilidad. La Prueba ARCH de Engle contrasta la hipótesis nula de ausencia de efectos ARCH (varianza constante) contra la alternativa de que los residuos al cuadrado presentan autocorrelación.

Prueba ARCH de Engle sobre los residuos del modelo ARIMA
	Prueba	Rezagos	Estadístico	p-valor	Conclusión
Chi-squared	ARCH-LM (Engle)	12	4.8023	0.9643	No se rechaza H₀ (varianza constante)
Nota:
H₀: ausencia de efectos ARCH (varianza constante). Nivel de significancia: α = 0.05.

Interpretación: La Prueba ARCH de Engle con 12 rezagos arrojó un estadístico χ² = 4.8023 con un p-valor de 0.9643. Dado que el p-valor es mayor que 0.05, no se rechaza la hipótesis nula de ausencia de efectos ARCH. Esto confirma que la varianza de los residuos es constante a lo largo del tiempo y que el supuesto de homocedasticidad se cumple satisfactoriamente, validando la especificación del modelo ARIMA seleccionado. El gráfico de residuos al cuadrado complementa este análisis: la línea suavizada (roja) muestra si existe alguna tendencia en la varianza de los errores a lo largo del tiempo.

4.7 Pronóstico

Una vez validado el modelo, se procedió a generar un pronóstico para el horizonte del conjunto de prueba (aproximadamente 18 días). Para evaluar objetivamente la precisión de los pronósticos generados por el modelo ARIMA, se emplearon métricas cuantitativas estándar: el RMSE (Root Mean Squared Error), que amplifica las penalizaciones sobre errores grandes y es sensible a la presencia de valores atípicos; el MAE (Mean Absolute Error), que proporciona una medida de error promedio menos sensible a outliers y tiene una interpretación directa; y el MAPE (Mean Absolute Percentage Error), que expresa el error como un porcentaje relativo del valor observado, permitiendo la comparabilidad del desempeño independientemente de la magnitud absoluta de los valores predichos.

Desempeño del Modelo sobre el Conjunto de Prueba
Métrica	Valor
ME	0.8865
RMSE	1.1679
MAE	1.0946
MAPE	3.7799
Cobertura IC 95%	100.0000
Nota:
Cobertura IC 95%: porcentaje de observaciones reales contenidas dentro del intervalo de confianza del pronóstico.

Interpretación del Pronóstico: El RMSE fue de 1.168 °C, lo que indica la magnitud promedio de los errores de pronóstico, con mayor penalización para errores grandes. El MAE fue de 1.095 °C, lo que significa que, en promedio, las predicciones se desvían esta cantidad del valor real. El MAPE fue de 3.78%, lo que permite comparar el error relativo independientemente de la escala. La cobertura del intervalo de confianza del 95% fue del 100%, lo que indica que el modelo estima adecuadamente la incertidumbre asociada a los pronósticos, ya que el porcentaje de valores reales que caen dentro de los intervalos predichos es cercano al esperado.

El gráfico de pronóstico muestra que el modelo ARIMA(ARIMA(2,0,1)) captura adecuadamente la tendencia general de la temperatura, aunque presenta algunas desviaciones en días específicos. Estas desviaciones pueden deberse a la presencia de valores atípicos o a factores climáticos no contemplados en el modelo, como cambios bruscos en las condiciones meteorológicas.

Tabla de Pronósticos

Pronósticos del Modelo 2,0,1 con Intervalo de Confianza al 95%
Período	Fecha	Pronóstico (°C)	Lím. Inferior	Lím. Superior	Amplitud IC
1	2018-12-15	27.50	25.81	29.18	3.37
2	2018-12-16	27.74	25.76	29.72	3.97
3	2018-12-17	27.87	25.76	29.98	4.22
4	2018-12-18	27.94	25.75	30.12	4.36
5	2018-12-19	27.98	25.75	30.21	4.46
6	2018-12-20	28.00	25.74	30.27	4.53
7	2018-12-21	28.02	25.73	30.32	4.59
8	2018-12-22	28.04	25.72	30.35	4.64
9	2018-12-23	28.05	25.71	30.39	4.68
10	2018-12-24	28.06	25.70	30.42	4.71
11	2018-12-25	28.07	25.70	30.44	4.74
12	2018-12-26	28.08	25.69	30.46	4.77
13	2018-12-27	28.09	25.69	30.49	4.79
14	2018-12-28	28.10	25.69	30.50	4.81
15	2018-12-29	28.10	25.69	30.52	4.83
16	2018-12-30	28.11	25.69	30.54	4.85
17	2018-12-31	28.12	25.69	30.55	4.86
18	2019-01-01	28.13	25.69	30.56	4.87
Nota:
IC = Intervalo de Confianza al 95%. La amplitud del intervalo aumenta a medida que se incrementa el horizonte de pronóstico.

La Tabla de Pronósticos presenta las estimaciones obtenidas mediante el modelo ARIMA(2,0,1) para los 18 días correspondientes al horizonte de pronóstico. Los resultados muestran una evolución estable de la temperatura media diaria, con valores pronosticados que oscilan entre 27.50 °C y 28.13 °C.

Se observa que el modelo converge gradualmente hacia un valor cercano a los 28 °C, lo cual es consistente con el comportamiento histórico de la serie y refleja la ausencia de tendencias fuertes en el período analizado.

Los intervalos de confianza al 95% proporcionan una medida de la incertidumbre asociada a cada pronóstico. Se evidencia que la amplitud del intervalo aumenta progresivamente desde 3.37 °C en el primer período hasta 4.87 °C en el último, indicando que la incertidumbre de las predicciones crece a medida que se extiende el horizonte de pronóstico.

En general, los pronósticos sugieren que la temperatura diaria promedio se mantendrá relativamente estable durante el período proyectado, sin cambios abruptos ni variaciones significativas respecto al comportamiento histórico observado.

Tabla de errores por observación

Evaluación del Pronóstico: Errores por Observación
Período	Fecha	Valor Real (°C)	Pronóstico (°C)	Error
1	2018-12-15	28.36	27.50	0.87
2	2018-12-16	28.78	27.74	1.04
3	2018-12-17	28.93	27.87	1.06
4	2018-12-18	29.08	27.94	1.14
5	2018-12-19	29.11	27.98	1.13
6	2018-12-20	29.07	28.00	1.07
7	2018-12-21	28.49	28.02	0.47
8	2018-12-22	27.79	28.04	-0.25
9	2018-12-23	28.49	28.05	0.44
10	2018-12-24	28.95	28.06	0.89
11	2018-12-25	29.76	28.07	1.69
12	2018-12-26	29.24	28.08	1.16
13	2018-12-27	29.09	28.09	1.00
14	2018-12-28	29.78	28.10	1.68
15	2018-12-29	29.55	28.10	1.44
16	2018-12-30	29.28	28.11	1.17
17	2018-12-31	29.69	28.12	1.57
18	2019-01-01	26.50	28.13	-1.63
Nota:
Error positivo: el modelo subestimó el valor observado. Error negativo: el modelo sobreestimó el valor observado.

La Tabla de Errores por Observación compara los valores reales registrados durante el período de prueba con los valores pronosticados por el modelo ARIMA(2,0,1). El error se calculó como la diferencia entre el valor observado y el valor predicho, por lo que errores positivos indican subestimación del modelo y errores negativos indican sobreestimación.

Se observa que la mayoría de los errores son positivos, lo que sugiere una ligera tendencia del modelo a subestimar las temperaturas observadas durante gran parte del período evaluado. Los errores más elevados se presentan el 25 y 28 de diciembre, con diferencias cercanas a 1.7 °C respecto a los valores reales.

Por otro lado, en algunas fechas específicas, como el 22 de diciembre y el 1 de enero, el modelo sobreestimó la temperatura observada, generando errores negativos de -0.25 °C y -1.63 °C, respectivamente. Sin embargo, estos casos son aislados y no representan un patrón predominante.

En términos generales, las diferencias entre los valores observados y pronosticados son moderadas y consistentes con las métricas de precisión obtenidas previamente. Esto indica que el modelo es capaz de reproducir adecuadamente el comportamiento general de la serie, aunque presenta algunas dificultades para capturar variaciones puntuales o cambios bruscos en determinados días.

4.8 Pronóstico Futuro (enero 2019)

Contexto histórico de la serie: Cali 2018

El año 2018 estuvo marcado por condiciones climáticas particulares en la ciudad de Cali y el Valle del Cauca. Durante el primer trimestre, el fenómeno El Niño en su fase de transición contribuyó a una reducción de las precipitaciones y un aumento de las temperaturas, explicando los picos térmicos registrados entre febrero y marzo, con valores que superaron los 30 °C en varios días. Esta situación fue reportada por el IDEAM como un período de déficit hídrico en la región andina.

Entre abril y mayo, el ingreso de la temporada lluviosa moderó las temperaturas, con descensos que coinciden con el patrón bimodal característico del Valle del Cauca. Sin embargo, el veranillo de mitad de año (junio–agosto) provocó un segundo pico térmico, con temperaturas cercanas a los 28.6 °C en promedio, asociado a la temporada seca de mitad de año y al desplazamiento de la Zona de Convergencia Intertropical (ZCIT) hacia el norte.

En el segundo semestre, las condiciones meteorológicas se estabilizaron, con una ligera influencia de La Niña en fase incipiente que favoreció mayores precipitaciones en septiembre y octubre, generando los descensos de temperatura observados en esos meses. Los últimos meses del año (noviembre–diciembre) registraron las temperaturas más bajas del año, con promedios por debajo de 27.5 °C, consistentes con la segunda temporada lluviosa del año en la región.

Estos patrones climáticos explican la estacionariedad observada en la serie y fundamentan la selección de un modelo ARIMA sin diferenciación, dado que la temperatura oscila en torno a una media relativamente constante sin tendencias sostenidas.

Pronóstico hacia enero 2019 (h = 24)

Con el modelo validado, se reajusta sobre la serie completa (entrenamiento + prueba) para aprovechar toda la información disponible y se genera un pronóstico de 24 observaciones hacia adelante, lo que cubre aproximadamente los primeros 24 días de enero de 2019.

Interpretación del pronóstico futuro: El modelo proyecta una temperatura relativamente estable para los primeros 24 días de enero de 2019, con valores pronosticados que oscilan en torno a los 28 °C. Este comportamiento es consistente con el patrón histórico observado al inicio del año, caracterizado por temperaturas moderadas antes del primer pico de calor del año (febrero–marzo). Las bandas de incertidumbre se amplían progresivamente con el horizonte de pronóstico, lo que refleja el incremento natural de la incertidumbre al alejarse del último dato observado. El pronóstico es coherente con el régimen climático típico de Cali en la transición diciembre–enero, período que históricamente presenta condiciones de relativa estabilidad térmica.

Tabla de Pronóstico Futuro (enero 2019)

Pronósticos hacia enero 2019 con Intervalos de Confianza al 80% y 95%
Período	Fecha	Pronóstico (°C)	LI 80%	LS 80%	LI 95%	LS 95%	Amplitud IC 95%
1	2019-01-02	27.40	26.30	28.50	25.72	29.09	3.37
2	2019-01-03	27.84	26.54	29.13	25.86	29.81	3.95
3	2019-01-04	28.04	26.67	29.42	25.94	30.15	4.21
4	2019-01-05	28.14	26.72	29.56	25.97	30.31	4.34
5	2019-01-06	28.19	26.74	29.64	25.97	30.41	4.44
6	2019-01-07	28.22	26.74	29.69	25.96	30.47	4.51
7	2019-01-08	28.23	26.74	29.72	25.95	30.51	4.56
8	2019-01-09	28.24	26.73	29.74	25.93	30.54	4.61
9	2019-01-10	28.24	26.72	29.76	25.92	30.56	4.65
10	2019-01-11	28.24	26.71	29.77	25.90	30.58	4.68
11	2019-01-12	28.24	26.70	29.78	25.89	30.60	4.71
12	2019-01-13	28.25	26.70	29.79	25.88	30.61	4.73
13	2019-01-14	28.25	26.69	29.80	25.87	30.63	4.76
14	2019-01-15	28.25	26.69	29.81	25.86	30.64	4.77
15	2019-01-16	28.25	26.68	29.82	25.85	30.65	4.79
16	2019-01-17	28.25	26.68	29.82	25.85	30.65	4.81
17	2019-01-18	28.25	26.68	29.83	25.84	30.66	4.82
18	2019-01-19	28.25	26.67	29.83	25.84	30.67	4.83
19	2019-01-20	28.25	26.67	29.84	25.84	30.67	4.84
20	2019-01-21	28.25	26.67	29.84	25.83	30.68	4.84
21	2019-01-22	28.26	26.67	29.84	25.83	30.68	4.85
22	2019-01-23	28.26	26.67	29.84	25.83	30.69	4.86
23	2019-01-24	28.26	26.67	29.85	25.83	30.69	4.86
24	2019-01-25	28.26	26.67	29.85	25.82	30.69	4.87
Nota:
LI = Límite Inferior \| LS = Límite Superior \| IC = Intervalo de Confianza. La amplitud del IC 95% crece con el horizonte de pronóstico.

La tabla presenta los 24 pronósticos diarios generados para enero de 2019, junto con los intervalos de confianza al 80% y 95%. Se observa que la amplitud del intervalo de confianza al 95% aumenta progresivamente desde aproximadamente 3.4 °C en el primer período hasta valores cercanos a 5 °C al final del horizonte, reflejando el incremento de la incertidumbre con el tiempo. Los valores pronosticados se mantienen relativamente constantes en torno a 28 °C, coherentes con el comportamiento histórico de la serie al inicio del año.

5. Conclusiones

El presente estudio modeló y pronosticó la temperatura diaria promedio de Cali (2018) mediante la metodología Box-Jenkins. Las principales conclusiones son:

1. Comportamiento de la serie y modelo seleccionado: La temperatura diaria presentó un patrón bimodal estable (media ≈ 28.3 °C, DE = 1.22 °C), con picos en febrero–marzo y julio–agosto asociados a los períodos secos del Valle del Cauca. La serie resultó estacionaria (ADF: p < 0.05, d = 0), por lo que se seleccionó el modelo ARIMA(2,0,1) como el de menor AICc, cuyos coeficientes fueron estadísticamente significativos y capturaron adecuadamente la persistencia térmica de la ciudad.

2. Validación del modelo: El diagnóstico de residuos confirmó que el modelo es adecuado: la Prueba de Ljung-Box (p = 0.9905) verificó independencia (ruido blanco), las pruebas de Shapiro-Wilk y Jarque-Bera indicaron normalidad aproximada de los residuos, y la Prueba ARCH de Engle (p > 0.05) confirmó homocedasticidad. En conjunto, los supuestos del modelo se cumplen de forma satisfactoria.

3. Capacidad predictiva y pronóstico futuro: El modelo obtuvo un RMSE de 1.168 °C y un MAE de 1.095 °C sobre el conjunto de prueba, con una cobertura del IC 95% de 100%. El pronóstico de 24 días hacia enero de 2019 proyecta temperaturas estables en torno a 28 °C, coherentes con el régimen climático histórico de la ciudad al inicio del año.

6. Bibliografía

Box, G. E. P., Jenkins, G. M., Reinsel, G. C., & Ljung, G. M. (2015). Time Series Analysis: Forecasting and Control (5th ed.). John Wiley & Sons.

Hyndman, R. J., & Athanasopoulos, G. (2021). Forecasting: Principles and Practice (3rd ed.). OTexts. https://otexts.com/fpp3/

Joaqui-Barandica, O. (2024). Clase_Series de Tiempo. Universidad del Valle.

R Core Team. (2023). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing. https://www.R-project.org/

Shumway, R. H., & Stoffer, D. S. (2017). Time Series Analysis and Its Applications: With R Examples (4th ed.). Springer.

Wickham, H., & Grolemund, G. (2017). R for Data Science. O’Reilly Media.

Dinámica térmica y modelación ARIMA: análisis de la temperatura en Cali (2018) como insumo para la calidad del aire

Brehiner Valencia (2435269), Indira Gabriela Vivas (2437700), Zaira Aragón Rios (2520989), Andres Morillo (2435093)

2026-06-26

1. Introducción

2. Metodología

2.1 Base de datos

2.2 Variable de análisis

2.3 Partición de datos

2.4 Marco conceptual: Modelos ARIMA

2.4.1 Componente Autorregresivo AR(p)

2.4.2 Componente de Media Móvil MA(q)

2.4.3 Estacionariedad e integración en series de tiempo I(d)

2.4.4 Modelo ARIMA(p,d,q) en notación de operador rezago

2.4.5 Supuestos Fundamentales del Modelo

2.5 Herramientas Estadísticas para Identificación y Validación

2.5.1 Prueba Aumentada de Dickey-Fuller (ADF)

2.5.2 Funciones de Autocorrelación: ACF y PACF

2.5.3 Búsqueda Automática: Función auto.arima()

2.5.4 Criterios de Selección del Modelo: AICc

AICc (Corrected Akaike Information Criterion)

Consideraciones sobre el parámetro de diferenciación

2.5.5 Diagnóstico de Residuos: Prueba de Ljung-Box

2.6 Diagrama del procedimiento Box-Jenkins

2.7 Evaluación de precisión de pronósticos (ARIMA)

RMSE (Root Mean Squared Error)

MAE (Mean Absolute Error)

MAPE (Mean Absolute Percentage Error)

Cobertura de intervalos de confianza

3. Resultados Descriptivos

3.1 Limpieza de Datos

3.1.1 Intervalo Diario de Temperatura

3.1.2 Temperatura Diaria Promedio

3.2 Análisis Estadístico Descriptivo de la Temperatura Diaria

3.2.1 Medidas de Tendencia Central y Dispersión

3.2.2 Boxplot: Visualización de la Distribución y Valores Atípicos

3.2.3 Análisis de la Variabilidad Mensual

3.2.4 Gráfica de Serie Temporal

4. Resultados del Modelo

4.1 Partición de Datos

4.2 Verificación de Estacionariedad

4.3 Identificación del Modelo

4.4 Selección del Modelo

4.5 Resultados del Modelo

4.6 Diagnóstico de Residuos

4.6.1 Evaluación de la Normalidad de los Residuos (Q-Q Plot)

4.6.2 Prueba de Normalidad (Shapiro-Wilk y Jarque-Bera)

4.6.3 Prueba de Homocedasticidad (Efecto ARCH)

4.7 Pronóstico

4.8 Pronóstico Futuro (enero 2019)

Contexto histórico de la serie: Cali 2018

Pronóstico hacia enero 2019 (h = 24)

Tabla de Pronóstico Futuro (enero 2019)

5. Conclusiones

6. Bibliografía