La base de datos es accesible en Historical weather Medellín y cuenta con 2158 registros asociados al periodo 2019-2024, en donde se consideran 6 variables: fecha, temperatura máxima, temperatura mínima, lluvia, viento y descripción climática.
| Variable | Descripción | Tipo | Escala | Unidad |
|---|---|---|---|---|
| Date | Fecha de observación | Cualitativa* | Ordinal | |
| Max_temperature | Temperatura máxima registrada | Cuantitativa | Continua | Grados Celsius [°C] |
| Min_temperature | Temperatura mínima registrada | Cuantitativa | Continua | Grados Celsius [°C] |
| Rain | Cantidad de precipitación | Cuantitativa | Continua | Milímetros [mm] |
| Wind | Velocidad del viento | Cuantitativa | Continua | Kilómetros por hora [km/h] |
| Description | Descripción del clima | Cualitativa | Nominal |
A continuación, se presentan los indicadores descriptivos para las variables cuantitativas.
| Estadístico | Max_temperature | Min_temperature | Rain | Wind |
|---|---|---|---|---|
| Asimetría | 0.27 | 0.66 | 1.58 | 0.63 |
| Coef. Variación | 12.64 | 17.30 | 98.55 | 36.89 |
| Curtosis | 2.80 | 3.06 | 6.15 | 3.81 |
| Desviación Estándar | 2.84 | 1.88 | 13.74 | 1.55 |
| Máximo | 32.00 | 17.00 | 107.70 | 11.00 |
| Media | 22.48 | 10.89 | 13.95 | 4.21 |
| Mediana | 22.00 | 11.00 | 9.30 | 4.00 |
| Mínimo | 15.00 | 5.00 | 0.00 | 1.00 |
| Q1 | 21.00 | 10.00 | 3.60 | 3.00 |
| Q3 | 24.00 | 12.00 | 20.70 | 5.00 |
| Descripción | Frecuencia | Porcentaje |
|---|---|---|
| Despejado | 6 | 0.28 |
| Fuertes lluvias | 18 | 0.83 |
| Intervalos de lluvias ligeras con tomenta | 247 | 11.45 |
| Ligeras lluvias | 13 | 0.60 |
| Ligeras precipitaciones | 675 | 31.28 |
| Llovizna | 12 | 0.56 |
| Llovizna a intervalos | 16 | 0.74 |
| Lluvia moderada | 12 | 0.56 |
| Lluvia moderada a intervalos | 268 | 12.42 |
| Lluvias fuertes o moderadas | 594 | 27.53 |
| Lluvias torrenciales | 110 | 5.10 |
| Neblina | 22 | 1.02 |
| Niebla moderada | 118 | 5.47 |
| Parcialmente nublado | 25 | 1.16 |
| Periodos de lluvia moderada | 22 | 1.02 |
| Variable | Modelo | RMSE | MAE |
|---|---|---|---|
| Max_temperature | Holt-Winters | 6.129 | 5.134 |
| Max_temperature | ARIMA | 3.091 | 2.501 |
| Min_temperature | Holt-Winters | 2.387 | 1.920 |
| Min_temperature | ARIMA | 2.110 | 1.739 |
| Rain | Holt-Winters | 26.330 | 23.303 |
| Rain | ARIMA | 21.901 | 19.282 |
| Wind | Holt-Winters | 5.007 | 4.535 |
| Wind | ARIMA | 1.803 | 1.376 |
En la comparación entre los modelos Holt-Winters y ARIMA para las variables climáticas de Medellín, se observa que ARIMA ofrece un desempeño general superior. Por ejemplo, para la temperatura máxima, ARIMA logra errores considerablemente menores, reflejados en un RMSE y MAE más bajos que los del modelo Holt-Winters. Esta misma tendencia se repite en la temperatura mínima, donde ARIMA también proporciona predicciones más precisas. Estos resultados sugieren que ARIMA es más eficaz para capturar las dependencias temporales y estacionales presentes en las series de temperatura, lo que se traduce en una mejor modelación de sus fluctuaciones.
En cuanto a la variable viento, ambos modelos presentan errores relativamente similares, aunque ARIMA mantiene una ligera ventaja, indicando que ambos enfoques pueden ser útiles para su pronóstico. Sin embargo, la diferencia no es tan significativa como en las temperaturas, posiblemente porque la dinámica del viento es menos compleja o más ruidosa. Por otro lado, en la variable lluvia, ambos modelos muestran errores mucho mayores y enfrentan limitaciones importantes. Aunque ARIMA reduce algo el error respecto a Holt-Winters, persisten valores negativos en las predicciones, lo cual no es físicamente plausible para la precipitación. Esto señala la necesidad de explorar métodos alternativos que manejen mejor la naturaleza no negativa y discreta de la lluvia, tales como modelos específicos para conteos, transformaciones o técnicas de aprendizaje automático que eviten generar predicciones inviables.