Análisis Descriptivo

Columns

Descripción de la base de datos

La base de datos es accesible en Historical weather Medellín y cuenta con 2158 registros asociados al periodo 2019-2024, en donde se consideran 6 variables: fecha, temperatura máxima, temperatura mínima, lluvia, viento y descripción climática.

Variable Descripción Tipo Escala Unidad
Date Fecha de observación Cualitativa* Ordinal
Max_temperature Temperatura máxima registrada Cuantitativa Continua Grados Celsius [°C]
Min_temperature Temperatura mínima registrada Cuantitativa Continua Grados Celsius [°C]
Rain Cantidad de precipitación Cuantitativa Continua Milímetros [mm]
Wind Velocidad del viento Cuantitativa Continua Kilómetros por hora [km/h]
Description Descripción del clima Cualitativa Nominal

Estadísticas descriptivas

A continuación, se presentan los indicadores descriptivos para las variables cuantitativas.

Estadístico Max_temperature Min_temperature Rain Wind
Asimetría 0.27 0.66 1.58 0.63
Coef. Variación 12.64 17.30 98.55 36.89
Curtosis 2.80 3.06 6.15 3.81
Desviación Estándar 2.84 1.88 13.74 1.55
Máximo 32.00 17.00 107.70 11.00
Media 22.48 10.89 13.95 4.21
Mediana 22.00 11.00 9.30 4.00
Mínimo 15.00 5.00 0.00 1.00
Q1 21.00 10.00 3.60 3.00
Q3 24.00 12.00 20.70 5.00

Columns

Boxplot Temperatura Máxima y Mínima (°C)

Boxplot Lluvia (mm) y Viento (km/h)

Columns

Frecuencias de la descripción climática

Descripción Frecuencia Porcentaje
Despejado 6 0.28
Fuertes lluvias 18 0.83
Intervalos de lluvias ligeras con tomenta 247 11.45
Ligeras lluvias 13 0.60
Ligeras precipitaciones 675 31.28
Llovizna 12 0.56
Llovizna a intervalos 16 0.74
Lluvia moderada 12 0.56
Lluvia moderada a intervalos 268 12.42
Lluvias fuertes o moderadas 594 27.53
Lluvias torrenciales 110 5.10
Neblina 22 1.02
Niebla moderada 118 5.47
Parcialmente nublado 25 1.16
Periodos de lluvia moderada 22 1.02

Frecuencias de la descripción climática

Análisis Bivariado

Columns

Matriz de Correlación de Pearson

Diagramas de dispersión y correlación

Columns

Boxplot Min_Temperature (°C) | Descripción climática

Boxplot Max_Temperature (°C) | Descripción climática

Columns

Boxplot Rain (mm) | Descripción climática

Boxplot Wind (mm) | Descripción climática

Pronósticos

Columns

Pronóstico de Temperatura Máxima (°C)

Pronóstico de Temperatura Mínima (°C)

Columns

Pronóstico de Lluvia (mm)

Pronóstico de Viento (km/h)

Columns

Análisis de modelos mediante métricas

Variable Modelo RMSE MAE
Max_temperature Holt-Winters 6.129 5.134
Max_temperature ARIMA 3.091 2.501
Min_temperature Holt-Winters 2.387 1.920
Min_temperature ARIMA 2.110 1.739
Rain Holt-Winters 26.330 23.303
Rain ARIMA 21.901 19.282
Wind Holt-Winters 5.007 4.535
Wind ARIMA 1.803 1.376

Interpretación de los modelos

En la comparación entre los modelos Holt-Winters y ARIMA para las variables climáticas de Medellín, se observa que ARIMA ofrece un desempeño general superior. Por ejemplo, para la temperatura máxima, ARIMA logra errores considerablemente menores, reflejados en un RMSE y MAE más bajos que los del modelo Holt-Winters. Esta misma tendencia se repite en la temperatura mínima, donde ARIMA también proporciona predicciones más precisas. Estos resultados sugieren que ARIMA es más eficaz para capturar las dependencias temporales y estacionales presentes en las series de temperatura, lo que se traduce en una mejor modelación de sus fluctuaciones.

En cuanto a la variable viento, ambos modelos presentan errores relativamente similares, aunque ARIMA mantiene una ligera ventaja, indicando que ambos enfoques pueden ser útiles para su pronóstico. Sin embargo, la diferencia no es tan significativa como en las temperaturas, posiblemente porque la dinámica del viento es menos compleja o más ruidosa. Por otro lado, en la variable lluvia, ambos modelos muestran errores mucho mayores y enfrentan limitaciones importantes. Aunque ARIMA reduce algo el error respecto a Holt-Winters, persisten valores negativos en las predicciones, lo cual no es físicamente plausible para la precipitación. Esto señala la necesidad de explorar métodos alternativos que manejen mejor la naturaleza no negativa y discreta de la lluvia, tales como modelos específicos para conteos, transformaciones o técnicas de aprendizaje automático que eviten generar predicciones inviables.