Modelo Análitico para la predicción de la velocidad viento

Lograr pronósticos de velocidad del viento altamente precisos y confiables representa un desafío significativo para los meteorólogos, dado que los vientos intensos originados por tormentas convectivas pueden provocar daños extensos, incluyendo la destrucción de bosques, cortes de electricidad y daños estructurales a edificaciones. Fenómenos convectivos tales como tormentas eléctricas, tornados, granizo grande y vientos potentes constituyen riesgos naturales capaces de perturbar la cotidianidad, particularmente en regiones de geografía compleja propensas a la convección. Incluso los eventos convectivos menos intensos pueden generar vientos severos con consecuencias devastadoras y costosas. Por ello, pronosticar la velocidad del viento es vital para emitir alertas tempranas de condiciones meteorológicas adversas. Este conjunto de datos incluye lecturas de un sensor meteorológico que registró diversas variables, incluyendo temperatura y precipitación.

Para el desarrollo de este trabajo, se tomaros los datos historicos del siguiente link:

https://www.kaggle.com/code/hishaamarmghan/wind-speed-prediction-model/input.

El conjunto de datos abarca 6574 registros diarios promediados, provenientes de un conjunto de 5 sensores para variables meteorológicas, todos integrados en una estación meteorológica. Dicha estación se situó en un área extensa y despejada, a una altura de 21 metros. La recolección de datos se extendió desde enero de 1961 hasta diciembre de 1978, abarcando un total de 17 años. Dentro de la información recopilada se incluyen las precipitaciones medias diarias, así como las temperaturas máxima y mínima y la temperatura mínima sobre la superficie del césped.

El dataset contiene 6574 filas y 9 Columnas del DATASET:

  1. DATE (YYYY-MM-DD)
  2. WIND: Average wind speed [knots]
  3. IND: First indicator value
  4. RAIN: Precipitation Amount (mm)
  5. IND.1: Second indicator value
  6. T.MAX: Maximum Temperature (°C)
  7. IND.2: Third indicator value
  8. T.MIN: Minimum Temperature (°C)
  9. T.MIN.G: 09utc Grass Minimum Temperature (°C)

Mostramos los 10 primeros datos del dataset wind_dataset.csv:

datos <- read.csv("C:\\Users\\user\\OneDrive\\Documents\\Maestria Analitica De Datos\\Visualizacion Cientifica\\Trabajo Final\\data\\wind_dataset.csv")
datos_numericos <- datos[sapply(datos, is.numeric)]

head(datos, 10)
##          DATE  WIND IND RAIN IND.1 T.MAX IND.2 T.MIN T.MIN.G
## 1  1961-01-01 13.67   0  0.2     0   9.5     0   3.7    -1.0
## 2  1961-01-02 11.50   0  5.1     0   7.2     0   4.2     1.1
## 3  1961-01-03 11.25   0  0.4     0   5.5     0   0.5    -0.5
## 4  1961-01-04  8.63   0  0.2     0   5.6     0   0.4    -3.2
## 5  1961-01-05 11.92   0 10.4     0   7.2     1  -1.5    -7.5
## 6  1961-01-06 10.67   0  0.0     0   6.5     0   1.2    -2.0
## 7  1961-01-07  9.17   0  1.9     0   9.2     1  -2.4    -7.1
## 8  1961-01-08 14.29   0  0.0     0   6.6     0   3.1     0.0
## 9  1961-01-09  8.04   0  8.3     0   6.8     0   2.4    -0.8
## 10 1961-01-10 11.42   0  0.0     0   6.5     0   3.0     0.5

Resumen estadístico básico

Obtenemos una vision general de los datos:

##      DATE                WIND             IND              RAIN       
##  Length:6574        Min.   : 0.000   Min.   :0.0000   Min.   : 0.000  
##  Class :character   1st Qu.: 6.000   1st Qu.:0.0000   1st Qu.: 0.000  
##  Mode  :character   Median : 9.210   Median :0.0000   Median : 0.200  
##                     Mean   : 9.797   Mean   :0.3915   Mean   : 1.885  
##                     3rd Qu.:12.960   3rd Qu.:0.0000   3rd Qu.: 2.000  
##                     Max.   :30.370   Max.   :4.0000   Max.   :67.000  
##                                                                       
##      IND.1            T.MAX           IND.2            T.MIN        
##  Min.   :0.0000   Min.   :-0.10   Min.   :0.0000   Min.   :-11.500  
##  1st Qu.:0.0000   1st Qu.: 9.60   1st Qu.:0.0000   1st Qu.:  3.000  
##  Median :0.0000   Median :13.30   Median :0.0000   Median :  6.500  
##  Mean   :0.3564   Mean   :13.34   Mean   :0.4645   Mean   :  6.412  
##  3rd Qu.:0.0000   3rd Qu.:17.20   3rd Qu.:0.0000   3rd Qu.: 10.000  
##  Max.   :4.0000   Max.   :26.80   Max.   :4.0000   Max.   : 18.000  
##  NA's   :61       NA's   :621     NA's   :61       NA's   :674      
##     T.MIN.G       
##  Min.   :-14.400  
##  1st Qu.: -1.000  
##  Median :  3.000  
##  Mean   :  2.736  
##  3rd Qu.:  7.000  
##  Max.   : 15.800  
##  NA's   :360

Histograma

## Warning: package 'ggplot2' was built under R version 4.3.3

Correlación

Vemos que hay una relación entre el viento y la lluvia