Introducción

En este trabajo abordaremos el tema de la contaminación ambiental en el área metropolitana, en especial la contaminación que es ocasionada por material particulado (PM 2.5 y PM 10). Las partículas PM 2.5 son partículas con un diámetro igual o menor a 2.5 micrómetros, son tan pequeñas que solo pueden ser detectadas con un microscopio electrónico, las causantes de estas incluyen todo tipo de combustiones (provocados por vehículos automóviles, plantas de energía, la quema residencial de madera, incendios forestales, quemas agrícolas y algunos procesos industriales.); las partículas PM 10 (pequeñas partículas solidas o liquidas de polvo, cenizas, hollín, partículas metálicas, cemento o polen, dispersas en la atmosfera) tienen un diámetro menor que 1 micrómetro y están formadas principalmente por compuestos inorgánicos como silicatos y aluminatos, metales pesados y material orgánico asociado a partículas de carbono. Para hacernos una idea de que tan pequeñas son estas partículas, 1 micrómetro equivale a la milésima parte de un milímetro) Teniendo esto en cuenta, trabajaremos con datos obtenidos de estaciones de monitoreo (localizadas en toda el área metropolitana) tomados desde el año 2010 al 2019, estos datos miden el nivel de partículas PM 2.5 y PM 10 en el aire por día. Para reducir el numero de mediciones, localizamos (según como se divide el área metropolitana en cuadrantes basándonos en la que actualmente utiliza la Policía Federal) las estaciones de monitoreo en el mapa y este ultimo los dividimos en los cuadrantes ya mencionados, cada cuadrante tenia por lo menos cuatro estaciones de monitoreo por lo que decidimos hacer un promedio por día de cada estación para poder obtener una sola medición de partículas por año. Una vez teniendo estos promedios (uno por año) realizamos nuestras series de tiempo para así poder predecir lo mejor posible la cantidad de partículas suspendidas en el aire que podemos llegar a alcanzar al final del año y en los próximos. Mediante un estudio estadístico queremos ayudar al gobierno a tomar las medidas preventivas correctas para que los niveles de estas partículas se mantengan en el rango normal y así prevenir contingencias ambientales o en su defecto, saber que medidas tomar cuando nos encontramos en contingencia ambiental.

Proyecto Contaminación en la ciudad de México y área metropolitana

Problema

La contaminación en la ciudad de México no es un secreto para la mayoría de la población que reside aquí, sin embargo, las medidas que toma el gobierno pueden ser menudo no tan claras para todos. De esta forma nos convencimos de analizar el problema de la contaminación en la ciudad de México, específicamente en las contingencias, buscamos esclarecer como el problema de la contaminación en la ciudad y áreas aledañas ha incrementado en los últimos 10 años, ¿cómo es que ha incrementado?,¿realmente ha incrementado? ¿Existen estrategias para mitigar las contingencias? Con el propósito de pronosticar la cantidad de partículas suspendidas utilizaremos herramientas de as series de tiempo y la estadística descriptiva para crear un modelo apropiado a nuestro problema y responder nuestras preguntas. Asimismo, predeciremos contingencias ambientales y propondremos estrategias para su mitigación. Apoyándonos siempre en la institución de gobierno encargada de esta temática, la dirección de monitoreo atmosférico. Análisis de los datos

La investigación comenzó con 10 bases de datos en archivos csv que contenían las mediciones anuales de partículas en el aire de aproximadamente 21 estaciones distribuidas en el valle de México, donde se registraban hasta 21 mediciones por día. Cabe mencionar que las mediciones no fueron constantes a través de los diez años para todas las estaciones debido a que se apagaban algunas estaciones ya sea por reparación o por otros motivos que desconocemos logrando así periodos donde no se obtuvieron mediciones, periodos incluso de más de medio año. Dentro de la misma temática nos encontramos con que nuevas estaciones fueron surgiendo con el pasar de los años por lo que teníamos datos de estaciones nuevas, pero solo de algunos años hacia adelante. Los 10 archivos contenían las 5 mismas variables, siendo constantes todas excepto en las estaciones Las cuales llegaban a cambiar de un año a otro. Abajo podemos ver un listado de las estaciones

Las variables eran: date: del tipo string día/mes/año id_station: clave de la estación

value: valor registrado

unit: tipo de unidad

id_parameter: representa las partículas suspendías de menos de 2.5 y 10 micras

Debido a que nuestros datos están particionados en 10 bases distintas procederemos unirlas en una además de las distintas mediciones de cada estación.

Primeramente, hicimos un análisis exploratorio del primer año, obteniendo las series de tiempo de cada estación de un año como se presentan a continuación. Para ver si el comportamiento era similar en las distintas estaciones a lo largo de valle

Nos encontramos con que las estaciones tenían mediciones entre 214 y 360 para el primer año, posteriormente analizamos algunos de los años para ver cuanto variaba y nos dimos cuentea que seguían el mismo comportamiento en la falta de datos. A continuación veremos 3 series de tiempo que ejemplifican el comportamiento de las estaciones.

Donde pudimos observar que las mediciones en los distintos puntos de la ciudad eran congruentes es decir seguían el mismo comportamiento, sin embargo las series de tiempo de las mediciones por de bajo de 2.5pm y 10 pm eran considerablemente distintas por lo que nos dimos a la tarea de revisar todas la bases y encontramos que el 60% aproximadamente correspondía a mediciones por debajo de 10pm y el 40% restante partencia por debajo de las 2.5pm siendo estos datos así nos dimos la libertad de jugar un poco con los datos y obtener promedios y varianzas, obteniendo así que los promedios de cada estación no variaba tan significativamente lo que nos llevo a la conclusión que en lugar de investigar 21 series de tiempo era equivalente a investigar las series de tiempo representativas de sectores de la ciudad. Revisando la página de la dirección de monitoreo atmosférico revisamos todas las estaciones que habían operado a través de todos los años, a pesar de que tuvieran datos faltantes y en conjunto a las localizaciones de estas desarrollamos una división por cuadrantes: Norte, Sur, Oeste, Este y Centro. Así con las estaciones que habían operado en todo el intervalo de tiempo desde el 2010 hasta marzo de 2019 y ubicadas en el siguiente mapa.

Mapa de las estaciones atmosféricas del valle de México

Mapa de los cuadrantes del valle de México

Descubrimos también que además del comportamiento típico que en todas las series podamos encontrar dos picos muy pronunciados en los meses de abril y diciembre.

De esta manera reducíamos nuestro trabajo a modelar las series de tiempo representativas de cada cuadrante tanto para 10pm como para 2.5pm. Al reducir el valle de México en cuadrantes tomamos el promedio de las estaciones que siempre estuvieron activas, es decir en el cuadrante centro tomamos 4 estaciones y promediamos las mediciones basándonos en que las mediciones no son significativamente diferentes por la cercanía entre ellas, además de que los promedios entre ellas eran más cercanos que del global, y así se realizado para cada cuadrante. Para estar seguros de que lo que hacíamos era válido comparamos la serie de tiempo de un cuadrante con una serie de tiempo de dicho cuadrante y resulto ser realmente similares en el comportamiento, como podemos ver aquí.

Modelo

Nuestro modelo intenta ajustar primeramente la serie del cuadrante centro, la cual sospechábamos desde un inicio que podía ser una serie estacionaria debido a que la varianza y la media permanecen constantes a través de tiempo. Lo cual intentaremos modelar con un arima

Asi posteriormente porcederemos a analizar las diez series de tiempo que encontramos, siendo dos por cada cuadrante.

Primeramente suavizamos todas las series mediante las medias moviles ajustando para cada caso el orden de la media movil, en funcion de los datos faltantes que se observaban y para un mejor y mas sencillo análisis de la información.

Continuaremos con el análisis de las funciones de autocorrelació simple y parciales de los cuadrantes tanto con mediciones de 10PM y 2.5PM.Comenzaremos con el cuadrante central

Podemos notar que las series siguen un comportamieno similar con respecto sus anteriores.De esta forma conjeturamos que los ajustes de las series de tiempo de los cuadrantes no seran tan diferentes, es decir, podran ser ajustados bajo modelos parecidos, debido en parte que la canatidad de particulas en el aire podria ser razonablemente similar en todo el valle de México.

Ajustes

A continuación mostramos el pronóstico con las bandas de confianza,asi como el ajuste arima(p,d,q) de todos los cuadrantes.

Cuadrante centro 2.5pm

Pronóstico centro 2.5pm

Cuadrante Este 10PM

Pronóstico Este 10PM

Cudrante Este 2.5PM

Pronóstico Este 2.5PM

Cuadrante Sur 10PM

Pronóstico Sur 10PM

Cuadrante sur 2.5

Pronóstico Sur 2.5

Cuadrante Oeste 10PM

Pronóstico Oeste 10PM

Cuadrante Oeste 2.5PM

Pronóstico Oeste 2.5PM

Cuadrante norte 10pm

Ajuste

Pronóstico Norte 10PM

Cuadrante norte 2.5pm

Ajuste

Pronóstico Norte 2.5PM

Dentro del pronostico es necesario utilizar la escala que se maneja en la ciudad de México para determinar o no una contingencia, la cual se muestra a continuación:

Niveles de contaminación

Esperamos que para finales de noviembre y principios de diciembre del año haya un incremento en los niveles de partículas en el aire del valle de México como los años anteriores, por lo que se prevé contingencias, y basándonos en los valores de predicción del modelo mostrados a continuación

Dónde nuestra peor predicción es de 144 un valor que entra en la categoría de mala calidad y en precontingencia ambiental de acuerdo con la siguiente tabla sin embargo sostenemos que alcanzará los 150 y habrá contingencia en la última semana del año.

Diagrama de medición

Conclusiones

Conlcusion1

De manera general la contaminación en el valle de México presenta un comportamiento moderado sin embargo en dos periodos al año la contaminación se dispara y ocasiona problemas a la sociedad en general, con el análisis que hemos realizado sugerimos crear programas durante los meses de febrero, marzo, así como en octubre y noviembre para prevenir la contaminación. Sin embargo, estos dos fenómenos ocurren también debido a las estaciones del año, mas entendible en diciembre y por el efecto invernadero y en abril por la época de escases de lluvia.

Asimismo los ajustes y pronosticos de las 10 series de tiempo presentan el mismo comportamiento con diferencias no significativas en general, es decir que se puede tomar el promedio de algun cuadrante y tener la suficiente certeza de que es un representante de la contaminacion en las demas partes del valle de México.

Conclusion2

En conclusión, para evitar que la contaminación del aire siga en aumento hay que realizar algunas actividades que ayuden al ambiente, entre ellas está el dar mantenimiento a los automóviles, manejar menos para reducir las emisiones contaminantes, andar en bicicleta, caminar, usar el transporte público, evita quema de basura y llantas, así como el uso de cohetes artificiales, no compres artículos desechables y plásticos que no son biodegradables, recicla la basura, reutilizar o abonar todo lo que se pueda, evitar el consumo de tabaco, cuidar los bosques evitando su tala o provocando incendios, deshacer de los desechos peligrosos y de los químicos de la forma adecuada. Algunos de ellos son baterías, aceite de motor, puntura, solventes. Hay que buscar los lugares donde se depositan este tipo de desperdicios.