Lograr pronósticos de velocidad del viento altamente precisos y confiables representa un desafío significativo para los meteorólogos, dado que los vientos intensos originados por tormentas convectivas pueden provocar daños extensos, incluyendo la destrucción de bosques, cortes de electricidad y daños estructurales a edificaciones. Fenómenos convectivos tales como tormentas eléctricas, tornados, granizo grande y vientos potentes constituyen riesgos naturales capaces de perturbar la cotidianidad, particularmente en regiones de geografía compleja propensas a la convección. Incluso los eventos convectivos menos intensos pueden generar vientos severos con consecuencias devastadoras y costosas. Por ello, pronosticar la velocidad del viento es vital para emitir alertas tempranas de condiciones meteorológicas adversas. Este conjunto de datos incluye lecturas de un sensor meteorológico que registró diversas variables, incluyendo temperatura y precipitación.
Para el desarrollo de este trabajo, se tomaros los datos historicos del siguiente link:
https://www.kaggle.com/code/hishaamarmghan/wind-speed-prediction-model/input.
El conjunto de datos abarca 6574 registros diarios promediados, provenientes de un conjunto de 5 sensores para variables meteorológicas, todos integrados en una estación meteorológica. Dicha estación se situó en un área extensa y despejada, a una altura de 21 metros. La recolección de datos se extendió desde enero de 1961 hasta diciembre de 1978, abarcando un total de 17 años. Dentro de la información recopilada se incluyen las precipitaciones medias diarias, así como las temperaturas máxima y mínima y la temperatura mínima sobre la superficie del césped.
El dataset contiene 6574 filas y 9 Columnas del DATASET:
Mostramos los 10 primeros datos del dataset wind_dataset.csv:
datos <- read.csv("C:\\Users\\user\\OneDrive\\Documents\\Maestria Analitica De Datos\\Visualizacion Cientifica\\Trabajo Final\\data\\wind_dataset.csv")
datos_numericos <- datos[sapply(datos, is.numeric)]
head(datos, 10)
## DATE WIND IND RAIN IND.1 T.MAX IND.2 T.MIN T.MIN.G
## 1 1961-01-01 13.67 0 0.2 0 9.5 0 3.7 -1.0
## 2 1961-01-02 11.50 0 5.1 0 7.2 0 4.2 1.1
## 3 1961-01-03 11.25 0 0.4 0 5.5 0 0.5 -0.5
## 4 1961-01-04 8.63 0 0.2 0 5.6 0 0.4 -3.2
## 5 1961-01-05 11.92 0 10.4 0 7.2 1 -1.5 -7.5
## 6 1961-01-06 10.67 0 0.0 0 6.5 0 1.2 -2.0
## 7 1961-01-07 9.17 0 1.9 0 9.2 1 -2.4 -7.1
## 8 1961-01-08 14.29 0 0.0 0 6.6 0 3.1 0.0
## 9 1961-01-09 8.04 0 8.3 0 6.8 0 2.4 -0.8
## 10 1961-01-10 11.42 0 0.0 0 6.5 0 3.0 0.5
Obtenemos una vision general de los datos:
## DATE WIND IND RAIN
## Length:6574 Min. : 0.000 Min. :0.0000 Min. : 0.000
## Class :character 1st Qu.: 6.000 1st Qu.:0.0000 1st Qu.: 0.000
## Mode :character Median : 9.210 Median :0.0000 Median : 0.200
## Mean : 9.797 Mean :0.3915 Mean : 1.885
## 3rd Qu.:12.960 3rd Qu.:0.0000 3rd Qu.: 2.000
## Max. :30.370 Max. :4.0000 Max. :67.000
##
## IND.1 T.MAX IND.2 T.MIN
## Min. :0.0000 Min. :-0.10 Min. :0.0000 Min. :-11.500
## 1st Qu.:0.0000 1st Qu.: 9.60 1st Qu.:0.0000 1st Qu.: 3.000
## Median :0.0000 Median :13.30 Median :0.0000 Median : 6.500
## Mean :0.3564 Mean :13.34 Mean :0.4645 Mean : 6.412
## 3rd Qu.:0.0000 3rd Qu.:17.20 3rd Qu.:0.0000 3rd Qu.: 10.000
## Max. :4.0000 Max. :26.80 Max. :4.0000 Max. : 18.000
## NA's :61 NA's :621 NA's :61 NA's :674
## T.MIN.G
## Min. :-14.400
## 1st Qu.: -1.000
## Median : 3.000
## Mean : 2.736
## 3rd Qu.: 7.000
## Max. : 15.800
## NA's :360
## Warning: package 'ggplot2' was built under R version 4.3.3
Vemos que hay una relación entre el viento y la lluvia