Introducción

Existen y se recopilan miles de datos diariamente sobre los cambios climatológicos que ocurren en el mundo, desde fuertes lluvias hasta días soleados. Son muchas las variables que intervienen en este sistema, pero las más utilizadas para poder predecir condiciones climáticas y que son mucho más relevantes para los climatólogos son:

  • La temperatura
  • El aire y sus componentes
  • La humedad
  • El viento y su dirección

Cada una de ellas es rigurosamente medida y analizada, bien sea en largos o cortos periodos de tiempo. Esto lo realizan con la finalidad de lograr identificar patrones, aprender de los datos con los estudios y poder predecir con cierta exactitud eventos posibles frente al desarrollo de los factores.

Metodología

Las series de tiempo son un recurso muy utilizado hoy en día en muchos campos de estudio. Se trata de un conjunto de observaciones realizadas sobre ciertas variables cuantitativas durante un tiempo determinado.

Es una forma de representación gráfica de datos que permite predecir comportamientos futuros, etapas y periodos de la o las variables que se midan. Estas pueden tener diferentes periodicidades, como por ejemplo diaria, mensual, anual, etc. La mayoría de estas provienen de datos económicos, demográficos o meteorológicos.

En este informe, se plasmaron pruebas de correlación serial, entre las variables junto con la prueba de Breusch-Godfrey; la cual funciona bajo los siguientes supuestos:

  • H0: No existe correlación serial.
  • H1: Si existe correlación serial.

Lo anterior se verifica utilizando el p valor de salida del test. Si existe una correlación serial, significará que los datos futuros dependen y están correlacionados con los ya sucedidos.

Procedimiento

Para iniciar con el proceso, se cargaron las librerías necesarias para manejar la base de datos, gráficos, modelo y procedimientos imprescindibles para el desarrollo del análisis de Series de Tiempo. Las librerías mencionadas son: ggplot2, tidyverse, readr, readxl, fpp2, dplyr, zoo, xts, lubridate y plotly.

Una vez realizado lo mencionado anteriormente, se procedió a cargar la base de datos suministrada por el docente, la cual contiene datos de diferentes variables climáticas tomadas en cada hora del día durante el año 2018. El modelo que se realizará no tendrá en cuenta todos esos datos para el desarrollo de este análisis y por ello es necesario efectuar la depuración de los datos que se detalla a continuación.

Depuración de datos

Inicialmente se omitieron los datos faltantes en la base de datos puesto que solo se utilizaran los días que tengan la suficiente información. Después, fue necesario realizar una separación de las fechas por días dado que en la base de datos vienen dispuestos con las horas también; esto se hizo con la intención de calcular el promedio de todas las variables para cada día de los seleccionados y de esta forma quedar con un solo valor en las variables correspondientes a cada uno de los días.

Una vez realizado esto, se filtraron los datos con los que se van a trabajar, los cuales corresponden al período de tiempo comprendido entre 2/03/2018 al 18/09/2018. De esta manera, la base de datos ya se encuentra limpia y cuenta con 199 datos.

Continuando con la depuración de datos, se realizó el renombramiento de las variables con la intención de que sean más fáciles de manejar. Estas quedaron de la siguiente manera:

  • Group.1Dias
  • O3 (ug/m3) → O3
  • Vel Viento (m/s) → VelViento
  • Dir Viento (Grados) → DirViento
  • Temperatura (C°) → Temp
  • Humedad (%) → Hum
  • Radiación Solar (Watt/M2) → RadSol
  • Lluvia (mm) → Lluvia

Descripción de las Variables

Con base a las variables que presenta nuestra base datos, se presenta una breve descripción para cada una de ellas, además, se hace una explicación inicial de la relación que existe entre estas.

  • Ozono (O3): Es un gas que se encuentra presente en el aire que respiramos. Conforma la capa de ozono que se encuentra de entre 10 a 30 millas de distancia sobre la tierra y cumple la función de proteger de los rayos ultravioletas provenientes del sol. Por otro lado, el ozono que se forma a partir de la reacción química entre la luz del sol y los contaminantes generados por el hombre, representa un riesgo a la salud de los seres vivos que inhalan este gas.

  • Velocidad del Viento (VelViento): Se conoce como viento al aire en movimiento. La velocidad de este hace referencia a la distancia que recorre una partícula de aire por unidad de tiempo, anemómetro, y la unidad de medida es habitualmente metros por segundo (m/s).

  • Dirección del Viento (DirViento): Define el punto de procedencia del viento, teniendo como referencia los puntos cardinales y se mide en grados sexagesimales girando en el sentido de las agujas del reloj en el plano horizontal visto desde arriba (el norte geográfico).

  • Temperatura (Temp): Se define como la cantidad de energía cinética de las partículas de una masa, esta se percibe como ‘frío’ cuando se presentan bajas temperaturas y como ‘calor’ cuando la temperatura es alta. Existen diferentes escalas para medir la temperatura, las más utilizadas son Celsius, Fahrenheit y Kelvin; en este caso, se utiliza la escala Celsius o escala centígrada, en la cual se cuenta con un rango para la temperatura del clima de 25°C a 33°C.

  • Humedad (Hum): La humedad hace referencia a la cantidad de vapor de agua presente en el aire, este se crea por medio de la evaporación y se elimina tras la condensación del agua (lluvia). Cuanto mayor es la temperatura, mayor es la cantidad de vapor de agua que el aire puede contener.

  • Lluvia (Lluvia): Se genera a partir de la condensación y enfriamiento del vapor de agua presente en la atmósfera, generando la caída de partículas de agua en forma de gotas. Depende de factores como la temperatura, la presión y la humedad atmosférica.

Correlación

En el siguiente gráfico se pudo analizar la relación existente entre cada una de las variables de la base de datos.

De este gráfico fue posible sacar las siguientes deducciones:

  • Las variables que tienen mayor correlación positiva son: Ozono-Temperatura, Ozono-Radiación Solar, Radiación Solar-Temperatura.
  • Las variables que tienen mayor correlación negativa son: Temperatura-Humedad, Humedad-Ozono, Velocidad Viento-Humedad.

Serie de tiempo

Para dar con el modelo que se trabajará, se partió de la base de datos ya depurada y se transformó como una serie de tiempo comprendida por las fechas que se mencionaron anteriormente en la depuración de los datos.

Una vez con la base transformada a una serie de tiempo se procedió a realizar el modelo, en el cual se utilizó como variable de respuesta O3 (Ozono), respecto con las demás variables. El resultado fue el siguiente:

## 
## Call:
## tslm(formula = O3 ~ VelViento + DirViento + Temp + Hum + RadSol + 
##     Lluvia, data = TimeSerie)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -11.6108  -3.1502  -0.1971   2.6612  14.9225 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 171.113421  27.403624   6.244 2.68e-09 ***
## VelViento    -0.298215   1.286698  -0.232 0.816965    
## DirViento    -0.009885   0.011071  -0.893 0.373031    
## Temp         -2.348452   0.656005  -3.580 0.000435 ***
## Hum          -1.362181   0.147461  -9.238  < 2e-16 ***
## RadSol        0.070957   0.014611   4.856 2.47e-06 ***
## Lluvia        0.712986   0.531223   1.342 0.181129    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.466 on 192 degrees of freedom
## Multiple R-squared:  0.6655, Adjusted R-squared:  0.655 
## F-statistic: 63.66 on 6 and 192 DF,  p-value: < 2.2e-16

En este caso se infiere que el intercepto O3 (Ozono) es un valor de ajuste, ya que no tendría sentido decir que ante la ausencia de valores en todas las variables esta tienda a ser tan grande, es un valor exagerado. Además, es posible ver que únicamente 3 variables son significativas para explicar el comportamiento de O3, estas son la temperatura, humedad y la radiación solar.

Al ver el R2 ajustado, se observa que el modelo explica con una precisión del 65.5%. El p-valor (2.2e-16) es suficientemente significativo para indicar que el modelo no es por azar e indica que al menos una de todas las variables inciden en el modelo de forma diferente de 0.

Prueba linealidad, modelo

Para probar la linealidad de los datos se procedió a graficar los valores ajustados del modelo, es decir los de la variable independiente, versus los valores reales de la base de datos.

Se pudo evidenciar viendo en la gráfica anterior que existe una relación lineal.

Prueba linealidad y normalidad, residuales

En el siguiente gráfico se puede observar la relación existente entre los residuos y los valores resultantes del modelo. Se nota una dispersión alejada del 0 en algunos valores; sin embargo, la nube de puntos se mantiene cercana y oscilando entre el eje.

Por otro lado, en la siguiente gráfica se puede apreciar la distribución normal que tienen los residuales del modelo junto con el shapiro.test que verifique este supuesto.

## 
##  Shapiro-Wilk normality test
## 
## data:  Modelo$residuals
## W = 0.99011, p-value = 0.1883

El p-valor (0.1883) del shapiro.test junto con el análisis del gráfico son suficiente prueba para confirmar la normalidad y variabilidad constante de los residuos, es decir, que hay homocedasticidad.

Prueba de linealidad, residuos de variables

Debe existir una relación lineal entre los residuos del modelo y los valores originarios de la base de datos. Esto con la intención de garantizar una alta precisión en la predicción del modelo.

En el gráfico se puede observar que en la mayoría de variables se encuentran datos atípicos frente a los residuos que reflejan poca linealidad en las variables, lo cual es consecuencia de que el modelo tenga una precisión medianamente alta.

Prueba de correlación serial

Se evaluó la correlación serial de los datos de la variable O3 (Ozono), mediante el test de Breusch-Godfrey explicado anteriormente en la metodología. La idea principal es verificar si existen patrones establecidos en los gráficos de los residuales y lograr que estos se distribuyan de forma normal.

## 
##  Breusch-Godfrey test for serial correlation of order up to 40
## 
## data:  Residuals from Linear regression model
## LM test = 54.66, df = 40, p-value = 0.06109

Con la gráfica de ACF se puede observar cierta tendencia que refleje correlación; sin embargo, al ver el p valor obtenido (0.06109) es posible aceptar la hipótesis nula por una décima, es decir, no existe correlación serial en el modelo. Además de lo mencionado, los residuos parecen distribuirse de forma normal.

Predicciones

Con el modelo desarrollado y evaluadas sus cualidades, se dispusieron diferentes escenarios para ver cómo fluctúa la variable de Ozono cuando las demás variables toman diferentes valores que simulan sucesos climatológicos. Con ellos se podrán sacar conclusiones…

1er Escenario

En este primer escenario se evaluó un cambio drástico en lo que sería un día normal con temperaturas medias y algo de lluvia, a un día en temporada del fenómeno del niño. Provocando que las temperaturas aumenten considerablemente y la lluvia se reduzca a 0.

Como se visualiza en el cuadro anterior, al entrar en época de fenómeno del niño se genera un aumento realmente significativo en el ozono. Esto es lógico e intuitivo ya que como nos lo advierten los datos del ciclo del Ozono, al aumentar la actividad solar los elementos como el NO (Nobelio), CH4 (Metano) y demás metales pesados son transformados a O3 (Ozono); esto impide que el NO2 (Dióxido de nitroso) pueda contener el aumento.

2do Escenario

En este segundo escenario se evaluó un caso contrario al primero, un día normal soleado sin lluvia y comienza la temporada del fenómeno de la niña, aumentando la velocidad del viento, cambiando su dirección, reduciendo la temperatura y radiación solar, y aumentando las precipitaciones.

Como se observa, estos cambios generan un desplome en el ozono ya que entra una época de lluvia que opaca la radiación solar con las nubes.

3er Escenario

Cuando se presentan cambios en la dirección del viento con una temperatura cálida, hay mucha humedad en la atmósfera y se incrementa la velocidad de esos vientos, se da como resultado la formación de huracanes, lo que se ve representado en este tercer escenario.

4to Escenario

En este penúltimo escenario se plantea un día en el que la temperatura se encuentra un poco más alta de lo usual, pues se han venido presentando en registros de días anteriores el incremento de esta. Estas temperaturas causan un incendio forestal, el cual hace que la temperatura aumente mucho más debido al fuego, que la humedad disminuya bastantemente, que se presente la ausencia de lluvia y que las variables relacionadas con el viento (dirección y velocidad) no se vean drásticamente afectadas por este fenómeno a comparación de las ya mencionadas. La radiación solar aumentaría a largo plazo pues dicho incendio genera perturbaciones en la cubierta vegetal del Planeta, haciendo que hayan menos árboles que puedan absorber el CO2, lo cual aumentaría la cantidad de este gas, y este provocando a su vez el incremento de los gases de efecto invernadero y por consiguiente, el aumento del calentamiento global y en consecuencia, el incremento del ozono.

5to Escenario

Para este último escenario se presenta un día nublado, en el cual hay presencia de una leve llovizna. A lo largo de este día se incrementa considerablemente la lluvia, generando que tanto la temperatura como la radiación solar disminuyan, que la humedad y la velocidad del viento incrementen un poco debido a esta y que la dirección del viento permanezca constante.

Conclusiones

A partir del modelo desarrollado, de los datos y gráficos obtenidos, se concluye lo siguiente:

  • El modelo cuenta con una buena capacidad de predicción dado a que las diferentes variables tomadas, logran ser significativas para fluctuar las variables del Ozono como se vió en los diferentes escenarios propuestos.

  • Se identificaron las variables influyentes que son temperatura, humedad y radiación solar. Esto debido a que demostraron una gran correlación entre sí.

  • Se podría lograr una mayor precisión al contar con un mayor número de datos o de variables, ya que existen diversos factores que afectan directamente a que las cantidades de Ozono en el ambiente.

Bibliografía

/ /. (n.d.). / / - Wiktionary. Extraido el June 19, 2023, de https://elpais.com/elpais/2018/02/22/ciencia/1519277366_574125.html?event=go&event_log=go&prod=REGCRARTCIENCIA&o=cerrciencia

Coluccio, E. (n.d.). Temperatura. Concepto. Extraido el June 19, 2023, de https://concepto.de/temperatura/

Lluvia: qué es, cómo se origina y sus características. (n.d.). Enciclopedia Humanidades. Extraido el June 19, 2023, de https://humanidades.com/lluvia/

Ozono. (2021, December 22). MedlinePlus. Extraido el June 19, 2023, de https://medlineplus.gov/spanish/ozone.html

¿Qué es la humedad? (n.d.). Airthings. Retrieved Extraido el June 19, 2023, de https://www.airthings.com/es/what-is-humidity

VELOCIDAD DEL VIENTO. (n.d.). Atlas Interactivo - IDEAM. Extraido el June 19, 2023, de http://atlas.ideam.gov.co/basefiles/VelocidaddelViento_texto.pdf

Viento. (n.d.). Meteo Navarra. Extraido el June 19, 2023, de http://meteo.navarra.es/definiciones/viento.cfm