INTRODUCCION

En el siguiente informe abordaremos el tema del cambio climático enfocandonos en un estudio de la calidad del aire específicamente en la estacion compartir en el año 2018:

El efecto invernadero es una fenómeno natural que permite a la tierra retener el calor del sol en el interior de la atmósfera esta está compuesta de diferentes gases que le permiten este efecto alejando a la tierra del frío del espacio y permitiendo las condiciones necesarias para albergar vida , sin este la temperatura media del planeta sería muy baja.

Este efecto invernadero produce una serie de gases que son:

  • Dióxido de carbono (CO₂)

  • Metano (CH4)

  • Compuestos halogenados

  • Ozono troposférico

  • Óxido de nitrógeno

El llamado cambio climático se refiere a una variación global del clima en la Tierra debido a causas naturales, y principalmente a causas de la acción humana siendo la quema de combustibles fósiles , la tala de bosques, actividades industriales , agrícolas y de transporte entre otras las principales ; estas actividades aumentan la emisión de gases de efecto invernadero a la atmósfera que empieza a retener más calor del necesario provocando el calentamiento global.

La calidad del aire en general está estrechamente relacionada con este fenómeno de contaminación atmosférica lo que se refiere a presencia en el aire de sustancias que impliquen riesgo, daño o molestias en el bienestar de las personas o para la naturaleza : partículas, óxidos de azufre (SOx), óxidos de nitrógeno (NOx), ozono troposférico (O3) y monóxido de carbono (CO), entre otros).

Para el estudio del cual tenemos los datos se registraron las siguientes variables para la medición de la calidad del aire:

  • O3(ug/m3): El ozono el cual es una molécula compuesta por tres átomos de oxígeno, este desempeña un papel importante en cuanto a la protección de la vida en la Tierra al absorber gran parte de la radiación ultravioleta perjudicial del sol, actúando como una capa protectora que filtra la mayor parte de aquellos rayos.

  • Velocidad del Viento(m/s): Es la medida de la rapidez con la que el aire se mueve en un lugar determinado esta se mide generalmente en metros por segundo (m/s), esta puede variar ampliamente, desde brisas suaves hasta ráfagas turbulentas.

  • Direccion del Viento(Grados): Es la indicación de dónde viene el viento en relación a un punto de partida y es importante para entender y predecir los fenómenos atmosféricos.

  • Temperatura(C°): Es una medida cuantitativa del calor o la energía térmica de un objeto o sustancia, esta influye en diversas propiedades y fenómenos físicos, como la dilatación térmica de los materiales, la velocidad de las reacciones químicas y la conductividad térmica

  • Humedad(%): Se refiere a la cantidad de vapor de agua en el aire en relación con la cantidad máxima que el aire puede retener a una temperatura dada, expresada como un porcentaje, tiene un impacto en el clima, la vida humana y la formación de nubes y precipitaciones.

  • Radiacion Solar(Watt/M2): Es la energía emitida por el Sol en forma de radiación electromagnética, incluyendo luz visible, calor y radiación ultravioleta. La radiacion solar es esencial para la vida en la Tierra, ya que influye en el clima y puede ser usada como fuente de energía renovable.

  • Lluvia(mm): Es la caída de agua proveniente de las nubes hacia la superficie de la Tierra, es un componente crucial en el ciclo del agua, proporciona la humedad necesaria para el crecimiento de las plantas y el mantenimiento de los recursos hídricos.

METODOLOGIA

SERIE DE TIEMPO

Una serie de tiempo es una secuencia de datos recolectados y convertidos en intervalos regulares a lo largo de como su nombre lo dice el tiempo.

Estos datos pueden ser recopilados en diferentes contextos, tales como, registros financieros mensuales, ventas semanales de un producto o como en nuestro caso los datos diarios de la calidad del aire.

El análisis de series de tiempo implica examinar la estructura temporal de los datos, identificar patrones, tendencias, estacionalidad y otros componentes que puedan influir en el comportamiento del modelo a lo largo del tiempo, este se basa en la suposición de que los datos observados en el pasado pueden usarse para predecir futuros valores y comportamientos.

Es importante recordar que las series de tiempo no pueden tener en cuenta todos los factores externos que pueden afectar el modelo. Por lo tanto, es importante interpretar los resultados con precaución y considerar otros factores que pueden afectar nuestros datos o como tal nuestro modelo.

SUPUESTOS

En cuanto a los supuestos necesarios para la modelación lineal en datos temporales son:

  • Homocedasticidad: Aqui nos dice que la dispersión de los errores no debe depender del tiempo por ende estos errores son constantes.

  • Independencia: Debemos asumir que las variables de la serie de tiempo son independientes entre sí. Esto nos da a entender que el valor de una variable no está correlacionado con el de otras variables ya sean pasadas o futuras.

  • Normalidad: Refiriendose a la distribución de los datos en la serie de tiempo, hay normalidad si se distribuyen alrededor de su media, siguiendo la forma de la campana de Gauss.

  • Linealidad: Se asume que hay linealidad porque esta implica que los cambios realizados en una variable están relacionados directamente con los cambios en otra de forma proporcional.

ESTADISTICAS DESCRIPTIVAS

En este apartado se describiran cada una de las variables usadas en nuestra serie de tiempo:

  • O3: El ozono se considera un contaminante ambiental, ya que a elevadas concentraciones puede provocar daños en la salud como irritar el sistema respiratorio, agravar el asma y las enfermedades pulmonares crónicas, reducir la función pulmonar y disminuir la esperanza de vida. En nuestro intervalo de tiempo el ozono tiene a 49 ug/m3 como el valor máximo y a 12.1 ug/m3 como el mínimo, dándonos un promedio de 29.23 ug/m3 y una mediana de 28.90 ug/m3, esto nos indica que la concentración de ozono tiende a ser moderada , con algunos valores más altos.

  • Velo_Viento: Cuando los contaminantes permanecen sobre una región, el viento puede dispersar los contaminantes fuera de la región y reducir las concentraciones de contaminantes más intensos en cualquier región.En nuestro intervalo de tiempo el valor máximo alcanzado es de 3.82 m/s y con un valor mínimo de 1.84 m/s, dándonos un promedio de 2.48 m/s y una mediana de 2.43 m/s, esto nos indica que la velocidad del viento entra en un rango que puede determinarse como moderado debido a sus maximos y minimos.

  • Direc_Viento: La dirección del viento puede contribuir a que los contaminantes pueden acumularse en concentraciones más altas dependiendo su geografía por ej: en lugares como valles , donde se acumulan.En nuestro intervalo de tiempo el valor máximo alcanzado es de 279.9 grados y con un valor mínimo de 94.28 grados, dándonos un promedio de 194.37 grados y una mediana de 201.7 grados , esto nos quiere decir que la dirección del viento tiene una amplia variación y esto nos lleva a diferentes patrones de viento en el área

  • Temperatura: La temperatura alta y el aumento de esta está asociada a menor calidad en el aire.En nuestro intervalo de tiempo el valor máximo alcanzado es de 31.67 C° y con un valor mínimo de 24.34 C°, dándonos un promedio de 28.22 C° y una mediana de 28.24 C°, esto nos sugiere que la temperatura está dentro de un rango no muy variado ya que no tiene mucha variabilidad.

  • Humedad: En general, la humedad alta tiende a aumentar la dispersión de los contaminantes, lo que puede ayudar a reducir su concentración y mejorar la calidad del aire.En nuestro intervalo de tiempo el valor máximo alcanzado es del 73.2% y con un valor mínimo del 42.5%, un promedio de 58.3% y una mediana de 58.3% , diciéndonos que la humedad mantiene un nivel sin mucha variabilidad y que es moderado ya que su promedio no sobrepasa el 60%.

  • Radi_Solar: En áreas con altos niveles de radiación solar, es más probable que se forme ozono y otros contaminantes fotoquímicos.En nuestro intervalo de tiempo el valor máximo alcanzado es de 232.82 Watt/M2 y con un valor mínimo del 30.32 Watt/M2, un promedio de 101.58 Watt/M2 y una mediana de 102.31 Watt/M2, observamos que la radiación solar se encuentra en una zona variable con un promedio un poco mayor a 100 lo cual es una radiacion un poco alta.

  • Lluvia: La lluvia tiene una relación directa con la calidad del aire al actuar como un mecanismo de limpieza y dispersión de contaminantes, y contribuye a una mejora temporal de la calidad del aire.En nuestro intervalo de tiempo el valor máximo alcanzado es de 5.29 mm y con un valor mínimo de 0 mm, un promedio de 0.28 mm y una mediana de 0 mm, teniendo como resultado que en promedio es muy poco probable que llueva.

En la siguiente grafica podemos observar como se comportan cada una de las variables en nuestro intervalo de tiempo:

RESULTADOS PRINCIPALES

COMPORTAMIENTO DE LAS VARIABLES

OZONO

Como primera instancia tenemos un grafico que nos muestra la variacion del ozono en nuestro intervalo de tiempo ya que, nuestro modelo debe ser en respuesta de esta variables.

OTRAS VARIABLES

Tambien tenemos un grafico donde nos muestra la variacion de cada una de las variables en nuestro intervalo de tiempo.

CORRELACION

La correlacion hace referencia a la variable dependiente y las variables independientes las cuales son componentes de una serie de tiempo utilizado para analizar y predecir valores en esta.

VARIABLE DEPENDIENTE

Es aquella que queremos predecir o analizar, la cual tambien se conoce como variable objetivo o de respuesta.En este caso nuestra variable objetivo es el O3 o mejor conocido como el ozono.

VARIABLES INDEPENDIENTES

Son los predictores o variables explicativas que se utilizan para predecir o analizar la variable dependiente. En este caso nuestras variables independientes son

  • Velocidad del Viento(m/s)

  • Direccion del Viento(Grados)

  • Temperatura(C°)

  • Humedad(%)

  • Radiacion Solar(Watt/M2)

  • Lluvia (mm)

MATRIZ DE CORRELACION

En este apartado encontramos la relacion de las variables independientes con el O3 o Ozono todo ello en una matriz de correlacion, donde vamos a poder observar si su correlación es positiva o negativa, donde la positiva muestra que a medida que las variables independientes aumentan, también lo hace la variable dependiente y la negativa muestra que a medida que las variables independientes aumentan, la variable dependiente disminuyen.

  • Correlaciones negativas: Humedad y lluvia

  • Correlaciones positivas: Velocidad y direccion del viento, temperatura y radiacion solar

SERIE DE TIEMPO

Teniendo el Ozono como variable dependiente y las variables que sobran como independientes, podemos ver que las variables que tienen significancia son la humedad y la radiacion solar, tambien podemos ver que nuestro modelo predice un 63.9% la variable O3 o mejor llamada Ozono

INDEPENDENCIA

Para determinar si hay o no independencia checamos el grafico de las residuales, en el cual podemos observar que estos no estan autocorrelacionados ya que la grafica nos muestra valores por asi decirlo aleatorios, tambien que en el grafico del ACF nuestras correlaciones estan dentro de nuestras bandas de confianza y solo una correlacion la sobrepasa pero esta dentro del rango que se puede permitir y en el histograma no se ve ningun valor fuera de lo normal, por lo tanto decimos que los residuos son independientes.

HOMOCEDASTICIDAD

SLa prueba de Breusch-Pagan se utiliza para verificar la homocedasticidad en un modelo de regresión. El supuesto de homocedasticidad implica que la varianza de los errores del modelo es constante en todos los niveles de las variables predictoras.

En este caso, el valor p obtenido de la prueba de Breusch-Pagan es de 0.003293, que es menor al nivel de significancia establecido. En general, si el valor p es menor que el nivel de significancia (generalmente establecido en 0.05), se rechaza la hipótesis nula y se concluye que hay evidencia suficiente para afirmar que no se cumple el supuesto de homocedasticidad.

NORMALIDAD

En la prueba de Shapiro-Wilk, la hipótesis nula (H0) establece que los datos siguen una distribución normal, mientras que la hipótesis alternativa (H1) indica que los datos no siguen una distribución normal.

En este caso, el valor p obtenido de la prueba de Shapiro-Wilk es de < 2.2e-16, lo cual indica un valor extremadamente pequeño. Cuando el valor p es menor que cualquier nivel de significancia comúnmente utilizado (como 0.05 o 0.01), se rechaza la hipótesis nula y se concluye que los datos no siguen una distribución normal.

Por lo tanto, en base al valor p obtenido en la prueba de Shapiro-Wilk, se puede concluir que los datos no siguen una distribución normal.

LINEALIDAD

El gráfico de dispersión de valores ajustados puede ser útil para evaluar la linealidad de un modelo de regresión. Idealmente, si el modelo es lineal y se cumplen los supuestos, los puntos en el gráfico de dispersión deberían estar distribuidos alrededor de una línea diagonal de 45 grados, lo que indica una correspondencia cercana entre los valores reales y los valores previstos.

Al observar el gráfico de dispersión de valores ajustados, los puntos se distribuyen de manera relativamente uniforme alrededor de la línea diagonal y no hay patrones sistemáticos, eso respalda la suposición de linealidad del modelo.

PREDICCIONES

En este apartado debemos mostrar 10 posibles escenarios en torno la calidad del aire, ya sea en epocas de mucho calor o muy lluviosas

Escenario 1: Usamos datos al azar para que en futuros escenarios podamos ir cambiandolos, en este caso usamos los valores minimos de cada variable Dandonos nuestra prediccion sobre el ozono un valor de 43.76854 ug/m3 lo cual es u valor un tanto alto del ozono ya que se encuentra alcanzando casi el valor maximo de este.

Escenario 2: En este escenario tomaremos al fenomeno de la niña como punto de referancia donde los valores de estas variables cambian, la temperatura baja junto con la radiacion solar, mientras que la humedad, la lluvia, la velocidad y la direccion del viento aumentan. Dandonos esta prediccion sobre el ozono un valor de 19.42427 ug/m3, lo cual nos muestra que no representa un riesgo significativo para la salud humana, ya que es un valor bajo.

Escenario 3: En este caso tomaremos el fenomeno del niño donde los valores de estas variables alcanzan su maximo punto en cuanto a temperatura y radiacion solar, la velocidad y direccion del tiempo estan en su promedio y no hay lluvia. Dandonos nuestra prediccion sobre el ozono un valor de 88.60076 ug/m3 es relativamente alta y puede indicar una calidad del aire preocupante en términos de ozono. A niveles elevados, el ozono puede tener efectos negativos en la salud humana y el medio ambiente.

Escenarios 4: En este caso tomaremos un incendio forestal donde los valores de las variables, solo es baja en cuanto a humedad y llvia. Dandonos una prediccion sobre el ozono con un valor de 49.4551 ug/m3 aqui podemos considerar que es una cantidad un poco alta permitiendo asi que los rayos ultravioletas dañinos entren con mas facilidad.

Escenario 5: En este caso tomamos como referencia los dias donde el viento alcanza puntos elevados, en otras palabras los dias frescos. Dandonos una prediccion sobre el ozono con un valor de 22.01284 ug/m3, valor que esta por debajo de la media, lo cual no representa un riesgo.

Escenario 6: En este caso tomamos como referencia los dias caluroso o mejor conocidos como dias de bochorno, donde las variables que menos peso tienen es la humedad,la lluvia y el viento. Dandonos una prediccion sobre el ozono con un valor de 54.25182 ug/m3, lo cual es un valor que esta muy por encima del promedio, a estos niveles altos, el ozono puede tener efectos negativos en todo ser vivo.

Escenario 7: En este caso tomamos en como se comportaria el ozono en una tormenta electrica, donde todas las variables se encontrarian en un punto maximo, menos la temperatura ya que esta estaria en punto mas abajo. Dandonos una prediccion sobre el ozono con un valor de 28.54036 ug/m3, lo cual es un valor que a pesar de que la radiacion sea alta se encuentra por debajo de la media y es un valor casi igual a la mediana, por lo tanto significa, que no es riesgoso en cuanto a este.

Escenario 8: En este caso tomamos como punto de partida los vendavales donde el viento alcanza valores demasiados altos. Dandonos una prediccion de que el valor del ozono en cuanto a esta situacion es de 11.91638 ug/m3 lo cual es un valor bajo, siendo este no riesgoso para el planeta, ya que al no haber mucha radiacion no influye en que su ozono sea elevado.

Escenario 9: En este caso tomamos los dias frios sin lluvia, para analizar su nivel de ozono. Dandonos una prediccion de que el valor del ozono es de 26.15044 ug/m3, este valor casi alcanza el promedio del ozono, lo cual no es ni muy alto, ni muy bajo, la cantidad es moderada y causaria daño ya en un tiempo muy lejano.

Escenario 10: En este caso tomamos las inundaciones como referencia. Dandonos una prediccion del valor del ozono de 12.73535 ug/m3, volviendo a ser este un valor bajo en ozono que no representa algun riesgo.

CONCLUSIONES

Para concluir tenemos que el modelo de series de tiempo que hemos creado cumple con todos los supuestos necesarios por ende, podemos afirmar que el modelo es competente, tambien que en nuestro intervalo de tiempo las variables que mas influyen en el son la humedad y la radiación solar, ya que ellos influyen mucho en cuanto a la dispercion del ozono y demas.

Tambien podemos observar gracias a los valores que arrojan las predicciones del modelo que en en los dias y ocasiones donde el clima es frio, lluvioso, cuenta con un porcentaje moderado de humedad y su radiacion es baja, el ozono tiende a ser bajo y en dias donde la radiacion alcanza puntos altos el ozono tiende a ser alto, mostrandonos asi el porque en nuestro modelo esta variable tiene significancia.

Para culminar, tenemos el siguiente grafico donde podemos observar los datos reales (linea roja) y los datos de nuestro modelo (linea azul), mostrandonos asi la efetividad de nuestro modelo.