Proyecto Series de Tiempo

Corlay Ramírez Carlos Alberto

Cynthia Karen Gómez León

Mera López Ilse

Meza Navarrete Josué Asael

Morales Corona Diego Armando

Sevilla Sánchez Elias Andrés

Noviembre de 2019

Proyecto 2: Series de Tiempo

Dirección de Monitoreo Atmosférico

Introducción

Entre los procesos que originan la contaminación del aire en nuestra ciudad se encuentran las partículas suspendidas, que son cualquier tipo de material sólido o líquido que se encuentra en suspensión en el aire. En la Ciudad de México una fracción importante se forma de reacciones químicas en la atmósfera contaminada aunque entre otras fuentes de emisión de este contaminante se encuentran las industrias, los incendios, las emisiones de camiones y automóviles. Su tamaño varía y va desde unas cuantas millonésimas de milímetros hasta llegar a alcanzar el tamaño de un grano de arena.

Para el presente proyecto se tendrán en cuenta solo dos de las partículas suspendidas, PM10 y PM2.5, la diferencia entre ellas radica en que el diámetro de las PM10 es inferior a 0.01 milímetros y las PM2.5 tienen un diámetro inferior a 0.0025 milímetros, son tan finas que no es posible verlas a simple vista.

Las partículas suspendidas representan el principal problema de salud pública, ya que agravan enfermedades cardiovasculares y respiratorias como el asma. Además de que la exposición crónica a altas concentraciones puede provocar un incremento en el riesgo de morbilidad y mortalidad.

Sabemos que la población esta creciendo cada vez más y así como más personas estan expuestas a los riesgos de salud que estas partículas representan, tambíen participan en la contaminación de las mismas, por lo que es necesario realizar un análisis a través del tiempo de la cantidad de partículas suspendidas en la ciudad para tener bases con las que se pueda trabajar una propuesta a partir de un pronóstico dado.

El objetivo será analizar si las políticas de cuidado del medio ambiente por parte del gobierno de la CDMX tiene efectos positivos (niveles bajos de las partículas PM2.5 y PM10) a través de las predicciones sobre siguientes años de dichas partículas.

Descripción de la base de datos

Los datos con los que se trabajarán son estadísticas registradas para la Ciudad de México y área metropolitana desde enero del 2004 a octubre del 2019, debido a que apartir del 2004 se consideraron las mediciones de las particulas PM2.5.

Nuestra base de datos cuenta con 5 variables: date, id_station, id_parameter, value y unit, de las cuales las primeras tres son cualitativas y las ultimas dos numéricas. El número de registros presentes en esta base es de 143,542.

Cabe recalcar que de las 5 variables solo utilizamos 3 ya que al colapsar las mediciones diarias a mensuales no nos importa el lugar exacto de la medición de cada día. Tampoco consideramos para el análisis la columna unit porque esta tiene la misma medición para todas las particulas, es decir de microgramos por metro cúbico.

Entonces las variables usadas son las siguientes:

  • date: el día en que se tomó la medición.

  • id_parameter: el tipo de partícula que se midió, ya sea PM10 o PM2.5.

  • value: el promedio de partículas medidas en ese mes.

Análisis exploratorio de datos

Gráficas de dispersión y relación de los datos, mostrando tambien la correlación

Se observa que las partículas PM2.5 no presentan una tendencia a través del tiempo ni alguna concentración, es decir, se encuentran dispersos por toda la gráfica, también podemos diferenciar el caso del día 16 de mayo donde la concentración de las partículas PM2.5 fue muy alta. Hablando de la dispersión de los datos, es similar el caso de las partículas PM10 por lo que no se incluye su gráfico. En la gráfica de Relación entre partículas se observa una tendencia lineal creciente por lo que se considerará una regresión lineal y también se calculará la correlación entre ellas.

[1] 0.9121002

Vemos que la correlación entre las partículas es muy alta; ajustando un modelo de regresión lineal tenemos que por cada unidad de PM2.5 que se aumente en la CDMx y área metropolitana, las particulas PM10 aumentarán en 2.027 unidades y la variable PM2.5 describe significativamente a la variable PM10.

Los histogramas y densidades son:

Es claro que los datos se concentran en menor cantidad para valores altos ya que el gobierno implementa medidas para controlar el aumento de las partículas PM2.5 y PM10 con programas como “No circula”.
Las series de tiempo de ambas particulas son:

Vemos que la serie de tiempo para PM2.5 parece ser una serie constante ya que no sigue una tendencia clara. Tiene mucho ruido pero no afecta mucho.

Para las partículas PM10 se observa que en el año 2011 la varianza se incrementa pero los valores máximos para las siguientes fechas disminuyen cada vez más.

Se cree que para futuros años, los valores para ambas partículas se mantendrá ya que la población aumentará pero el gobierno continuará restringiendo el aumento de dichas partículas a través de políticas del cuidado del aire ambiente.