Introducción

Problemática para analizar

A lo largo de los años, con el aumento de la producción industrial y el uso de combustibles fósiles se ha presentado un gran incremento en la contaminación, afectando el desarrollo de los ecosistemas. La contaminación del aire se vuelve muy importante de considerar ya que puede tener efectos adversos en el clima, en la salud pública y en la destrucción de los ecosistemas. Por lo cual se estará analizando los índices de diferentes contaminantes presentes en el aire, partículas según su diámetro y variables del clima al momento de ser recolectados los datos. Es importante mencionar que debido a que es una problemática mundial, los datos son a nivel global, en diferentes fechas con el fin de comprender cómo la contaminación varía en el tiempo.

¿Cuál es la importancia?

La importancia del alto índice de contaminación del aire en el mundo radica en las graves consecuencias que tiene hacia los ecosistemas, salud pública, presión sobre los recursos naturales, haciendo de este un problema global prioritario que requiere una acción inmediata y sostenida. Los países por medio de los tratados ambientales requieren un análisis de datos sobre las cantidades de emisiones contaminantes del aire para hacer un balance y contrarrestarlas. Estas emisiones producidas por las diversas industrias causan un deterioramiento en la capa de ozono produciendo el efecto invernadero que genera un incremento descontrolado de temperatura en varias partes del mundo afectando en la agricultura debido a grandes sequías, dando consigo grandes hambrunas y escasez de alimentos.

Objetivos

Objetivo general:

Analizar la variabilidad temporal y espacial de contaminantes atmosféricos (PM10, PM2.5, NO2, CO, O3, SO2) y su relación con variables climáticas como temperatura, humedad y velocidad del viento en el año 2023

Objetivos específicos:

1. Evaluar la distribucion de los contaminantes atmosfericos(PM10,PM2.5, NO2,CO,O3 y SO2) en las princupales cuidades durante el año 2023, empleando medidas de tendencia central y dispersion con el fin de identificar periodos de alta y baja concentracion.

2.Elaborar un analisis de las relaciones entre las concentraciones de contaminantes y las variables climaticas(temperatura, humedad,velocidad del viento) mediante graficos de dispersion y coeficientes de correlacion, para asi identificar tendencias y posibles asociaciones entre las variables.

3.Analizar y comparar las concentración de contaminantes atmosféricos y su relación con las variables climáticas, para identificar posibles correlaciones entre estas variables en diferentes países durante el año 2023, y evaluar su impacto en la atmósfera.

Variables

Las variables a analizar hacen referencia a Ciudad, País, Fecha de recolección de datos las cuales son variables de tipo cualitativo nominal y cualitativo ordinal respectivamente.

De igual forma se tomaron datos de condiciones climáticas como Temperatura, Humedad y Velocidad del viento.Estas variables son caracterizadas como cuantitativas continuas, dado que se pueden medir y expresarse numéricamente y pueden ser comparadas de manera numérica.

Por otro lado, se registraron los valores de PM2.5 y PM10, que son variables cuantitativas continuas y corresponden a la concentración de partículas con diámetro menor a 2.5 y 10 micrómetros respectivamente. Igualmente, se registró la concentración de diferentes gases como lo son NO2,SO2, O3, CO, que son caracterizadas como variables cuantitativas continuas.

Gráficos:

Para el diagrama de cajas y alambres de la variable PM2.5 fue posible observar que el valor mínimo de concentración es de 5.02 µg/m³ y el máximo de concentración es de 149.98µg/m³, presentado así un coeficiente de variación del 55% siendo los datos altamente heterogéneos. Igualmente se interpreta que al ser 41.18 el valor del cuartil 1, el 25% del total de los valores están por debajo de 41.18µg/m³ de concentración, mientras que el valor del cuartil 3 es de 113.14, representando que el 75% de los datos de concentración de partículas con un diámetro menor a 2.5µg/m³ están por debajo de este valor. Por otro lado,el valor correspondiente a la media es de 77.72,representando que la mayoría de datos se encuentran en ese valor.

Para el diagrama de la variable PM10 es posible calcular que los valores llegan a un mínimo de 10µg/m³ y un máximo de 200µg/m³, presentando un coeficiente de variación de 53% siendo los datos altamente heterogéneos. Igualmente se presenta el valor de 57.14 como correspondiente al cuartil 1, por lo que se afirma que el 25% de los datos están por debajo de 57.14µg/m³ de concentración y el 75% de los datos están por debajo del valor 152.27µg/m³.Por otro lado, se obtuvo un valor de media de 103.69 lo que representa que la mayoría de datos se agrupan en este valor.

Para el diagrama de cajas y alambres de la variable temperatura fue posible calcular un valor mínimo de -10 °C mientras que se presenta un valor máximo de 40°C, presentando así un coeficiente de variación del 97% lo que representa que los datos son altamente heterogéneos. Por otro lado, se obtuvieron que los valores de los cuartiles Q1 y Q3 corresponden a 2.26°C y 27.38°C respectivamente, dando a entender que el 25% de los datos estan por debajo de 2.26°C y el 75% de los datos por debajo de 27.38°C. Igualmente se obtuvo un valor de 14.75 que corresponde a la media, la cual representa el valor en donde se acumula la mayor cantidad de datos.

Para el diagrama de cajas y alambres de la variable humedad fue posible calcular un valor mínimo de 10.01%, a diferencia del valor máximo de 99.99% de humedad, por lo cuál se presenta un coeficiente de variación del 47% dando a entender que los datos son altamente heterogéneos. Por otro lado, se obtuvieron valores de cuartiles Q1 y Q3, los cuales corresponden a 32.53 y 77.44 respectivamente, representando que el 25% de los datos están por debajo de 32.53 y el 75% de los datos está por debajo de 77.44% de humedades. Igualmente se obtuvo un valor de 55.08, el cual corresponde a la media y representa el valor en donde se acumula la mayor cantidad de datos.

Para el diagrama de cajas y alambres de la variable velocidad del viento se calculó un valor mínimo de 0.50m/s, mientras que se obtuvo un valor máximo de 20m/s por lo cuál se presenta un coeficiente de variación de 55% dando a entender que los datos altamente heterogéneos Así mismo se obtuvieron valor de cuartiles Q1 y Q3 lo cuáles corresponden a 5.29 y 15.07m/s respectivamente, lo cuál representa que el 25% de los datos están por debajo de 5.29 y el 75% de los datos están por debajo de 15.07m/s.

## Promedio en españa de C0 es: 5.077556
## Promedio en USA de CO es: 5.077556
## Promedio en China de CO es: 5.077556
## Promedio en India de CO es: 5.077556
##     Pais       CO
## 1  China 5.093443
## 2  India 5.077556
## 3    USA 5.121549
## 4 España 4.885888
Niveles de CO por País
Pais CO
China 5.093443
India 5.077556
USA 5.121549
España 4.885888

El gráfico representa el promedio de las emisiones de monóxido de carbono (CO) en el año 2023. Es importante resaltar que los datos fueron tomados en diferentes fechas a lo largo del año en diferentes países, como lo son China, India, Estados Unidos y España.Es posible afirmar que Estados unidos es el país que más promedio emisiones de CO en al año 2023, obteniendo un promedio de 5.12mg/m³, mientras que españa fue el país con las menos emisiones con un promedio de 4.88mg/m³, con una diferencia de 0.24 entre ambos países.

## Promedio en españa de NO2 es: 53.34407
## Promedio en USA de NO2 es: 53.34407
## Promedio en China de NO2 es: 53.34407
## Promedio en India de NO2 es: 53.34407
##     Pais      NO2
## 1 España 52.14454
## 2    USA 52.30333
## 3  China 51.62105
## 4  India 53.34407
Niveles de NO2 por País
Pais NO2
España 52.14454
USA 52.30333
China 51.62105
India 53.34407

El gráfico representa el promedio de emisiones de dióxido de nitrógeno (NO2) en el año 2023. Es importante resaltar que los datos fueron tomados en diferentes fechas a lo largo del año en diferentes países como lo son China, India, Estados Unidos y España. Es posible afirmar que entre estos cuatro países India fue el que obtuve en promedio mayor presencia de NO2 con un valor de 53.34407µm/m³ mientras que el país con menor promedio fue China con 51.62105µm/m³, con un diferencia 1,72302µm/m³ entre ambos países.

## Promedio en españa de O3 es: 106.6436
## Promedio en USA de O3 es: 106.6436
## Promedio en China de O3 es: 106.6436
## Promedio en India de O3 es: 106.6436
##     Pais       O3
## 1 España 103.7758
## 2    USA 105.6856
## 3  China 105.7402
## 4  India 106.6436
Niveles de O3 por País
Pais O3
España 103.7758
USA 105.6856
China 105.7402
India 106.6436

En el gráfico se representa el promedio de emisiones de ozono (O3) en el año 2023. Es importante aclarar que los datos fueron tomados en diferentes fechas a lo largo del año en cuatro diferentes países como lo son España, China, India y Estados Unidos. Es posible decir que entre estos cuatro países India tiene el promedio más alto de O3 siendo este 106.6436µm/m³ mientras que el de menor promedio fue España con 103.7758µm/m³ de O3, con una diferencia de 2,8678µm/m³ entre ambos países.

## Promedio en españa de SO2 es: 25.02944
## Promedio en USA de SO2 es: 25.02944
## Promedio en China de SO2 es: 25.02944
## Promedio en India de SO2 es: 25.02944
##     Pais      SO2
## 1 España 25.14830
## 2    USA 25.67480
## 3  China 24.90326
## 4  India 25.02944
Niveles de SO2 por País
Pais SO2
España 25.14830
USA 25.67480
China 24.90326
India 25.02944

El gráfico representa el promedio de emisiones de dióxido de azufre (SO2) en el año 2023. Es importante destacar que los datos fueron tomados en diferentes fechas a lo largo de año y en cuatro diferentes países como lo son India, España, China y Estados Unidos. Es posible con los datos afirmar que entre estos cuatro países el que presenta un mayor promedio es Estados Unidos con 25.6748µm/m³ de SO2 mientras que el que presenta un menor promedio es China con 24.90326µm/m³ de SO2, presentando una diferencia de 0,77154µm/m³ entre ambos países.

## Promedio en españa de PM2.5 es: 78.90117
## Promedio en USA de PM2.5 es: 78.90117
## Promedio en China de PM2.5 es: 78.90117
## Promedio en India de PM2.5 es: 78.90117
##     Pais    PM2.5
## 1 España 75.43477
## 2    USA 77.11368
## 3  China 78.62785
## 4  India 78.90117
Niveles de PM2.5 por País
Pais PM2.5
España 75.43477
USA 77.11368
China 78.62785
India 78.90117

El gráfico representa el promedio de emisiones de materia particulada 2.5 (PM2.5) en el año 2023. Es importante distinguir que los datos fueron tomados en diferentes fechas a lo largo del año y en cuatro diferentes países como lo son Estados Unidos, India, China y España. Es posible afirmar que entre estos cuatro países India fue el que obtuve en promedio mayor presencia de PM2.5 con un valor de 78.90117µm/m³ mientras que el país con menor presencia de PM2.5 fue España con 75.43477µm/m³, con una diferencia de 3,4664µm/m³ entre ambos países.

## Promedio en españa de PM10 es: 105.8417
## Promedio en USA de PM10 es: 105.8417
## Promedio en China de PM10 es: 105.8417
## Promedio en India de PM10 es: 105.8417
##     Pais     PM10
## 1 España 105.8701
## 2    USA 104.2880
## 3  China 103.1899
## 4  India 105.8417
Niveles de PM10 por País
Pais PM10
España 105.8701
USA 104.2880
China 103.1899
India 105.8417

El gráfico representa el promedio de emisiones de materia particulada 10 (PM10) en el año 2023. Es importante resaltar que los datos fueron tomados en diferentes fechas a lo largo del año y en cuatro diferentes países como lo son España, Estados Unidos, China e India. Es posible decir que entre estos cuatro países España fue el que obtuvo el promedio más alto de PM10 con 105.8701µm/m³ mientras que el país con menor presencia de PM10 103.1899µm/m³, con una diferencia de 2,6802µm/m³ entre ambos países.

Análisis de relación entre variables

Relación entre variables

## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

En el diagrama de cajas y alambres correspondiente a la variable de nocividad del PM2.5, se puede observar la diferencia en los niveles de concentración de los dos subconjuntos analizados. Los datos clasificados como “nocivos” presentan concentraciones de PM2.5 significativamente superiores a 40, con un coeficiente de variación del 75% en el primer cuartil, lo que indica altos niveles de contaminación. Por otro lado, los datos clasificados como “no nocivos” muestran concentraciones de PM2.5 menores a 40, con un coeficiente del 25% en el segundo cuartil, lo que indicaría un ambiente con aire más limpio. Esta diferencia en la distribución de los datos podría sugerir una mejor calidad del aire en el grupo de datos clasificados como “no nocivos”, en comparación con aquellos que superan los niveles de contaminación que podrían afectar la salud pública y perjudicar a los ecosistemas.

índice de correlación de Pearson y diagrama de dispersión

## [1] -0.001769766
## `geom_smooth()` using formula = 'y ~ x'

## [1] -0.01194529
## `geom_smooth()` using formula = 'y ~ x'

## [1] -0.000946832
## `geom_smooth()` using formula = 'y ~ x'

Cómo es posible observar en las gráficas de dispersión interiores, en las cuales se expresa la relación entre la materia particulada con diámetros menores a 2.5µm/m³ y las variables climáticas como lo son la temperatura, la humedad y la velocidad del viento, es posible afirmar que no se presenta ningún tipo de relación, los datos en las gráficas 12,13 y 14 están dispersos en la totalidad del plano sin presentar una tendencia a ningún cuadrante, lo cual da a entender que las variables climáticas no tienen ningún efecto sobre la concentración de la materia particulada.

Intervalos de confianza

## [1] 53.30888
## [1] 53.25493
## [1] 53.36282
##   Limite_inf Limite_sup MediaNO2
## 1   52.40393   52.50831 52.19865
Intervalo de confianza para NO2
Limite_inf Limite_sup MediaNO2
52.40393 52.50831 52.19865
## [1] 5.047984
## [1] 4.909378
## [1] 4.903906
## [1] 4.914849
##   Limite_inf Limite_sup  MediaCO
## 1   4.988119   4.999151 5.047984
Intervalo de confianza para CO
Limite_inf Limite_sup MediaCO
4.988119 4.999151 5.047984

Al analizar las concentraciones de las variables CO y NO2, observamos que sus medias son notablemente diferentes. La media anual de NO2 es de 52.19865 , mientras que la de CO es de 5.047984, lo que indica una mayor cantidad de emisiones de NO2 en comparación con CO durante el año 2023.

Así mismo, aunque la media de CO es menor en comparación con NO2, con un valor de 5.047984 , este nivel se considera moderado. Sin embargo, es importante señalar que el CO sigue siendo un factor de riesgo para la salud.

Utilizando una distribución uniforme con una muestra de 1000 datos y usando como estadístico de prueba la media en la variable de NO2. Para nuestra muestra en un intervalo de (52.403-52.508) con una media de 52.198 se puede asegurar con un 95% de confianza que este valor no está en el intervalo deseado. Por lo que se tendrían que evaluar otras opciones para poder encontrar lo que se desea.

Utilizando una distribución uniforme con una muestra de 1000 datos y usando como estadístico de prueba la media en la variable de CO. Para nuestra muestra en un intervalo de (4.988-4.991) con una media de 5.047 se puede asegurar con un 95% de confianza que este valor no está en el intervalo deseado. Con un nivel de significancia del 0.05. Por lo que se tendrían que evaluar otras opciones para poder encontrar lo que se desea.

Prueba de hipótesis

Se busca conocer si la contaminación de NO2 en el mundo no supera el umbral de 53 µg/m³ para eso se tomaron datos y se obtuvo una media de 52.19865. Posteriormente se eligieron aleatoriamente 1000 datos y se obtuvo un promedio muestral de 51.96418 y a su vez se obtuvo una desviación estándar de 27.00384. ¿Realizando una prueba de hipótesis los datos cumplen con lo esperado?

X= concentración x̅ = 51.96418 μ= 52.19865 σ= 27.00384 n= 1000 𝐻0=53 𝐻1>53

Regla de decisión Rechazamos H0 si 𝑍𝑐 >1.96 𝑍𝑐 =(x¯−μ) /(σ/√n) 𝑍𝑐 = (51.96418-52.19865) / (27.00384/ √1000) 𝑍𝑐 =-0,274575483

De acuerdo con lo anterior 𝑍𝑐 =-0,274575483< 1.96 entonces no rechazamos H0 Entonces existe suficiente evidencia de que con un nivel de significancia del 0.05 para demostrar que la concentración de NO2 no supera los 53 µg/m³

## [1] 0.5221
##   Limite_inf Limite_sup proporcion
## 1 -0.8940642   1.938264     0.5221
Intervalo de confianza para PM10
Limite_inf Limite_sup proporcion
-0.8940642 1.938264 0.5221
## [1] 0.348
##   Limite_inf Limite_sup proporcion
## 1 -0.8081925   1.504193      0.348
Intervalo de confianza para PM2.5
Limite_inf Limite_sup proporcion
-0.8081925 1.504193 0.348

A partir de los datos, se obtuvo una concentración promedio de PM2.5 es de 77.44844 y de PM10 es de 104.4382, los cuales presentan proporción de 0.348 de la variable PM2.5 Y 0.5221 para la variable PM10, con un nivel de confianza de 95% para estimar el proporción de las emisiones generadas por las dos variables.

Utilizando una distribución uniforme con una muestra de 10000 datos y usando como estadístico de prueba la proporción para la variable PM 2.5. Para nuestra muestra en un intervalo de (-0.8081925-1.504193) con una proporción de 0.348 se puede asegurar con un 95% de confianza que este valor está en el intervalo deseado.

Con los datos realizados indica que la variable PM10 contiene mas índices de emisiones generadas durante el año, mientras que en la variable PM2.5 posee índices mas pequeños, esto no indica que no sea un problema dado que si agrandes proporciones podría afectar tanto a la salud publica como a los ecosistemas.

Conclusiones

1. Es posible afirmar que en el año 2023 Estados Unidos presentó los mayores promedios de emisiones de monóxido de carbono (5.12 mg/m³) y dióxido de azufre (25.6748 µm/m³) entre los países analizados. Lo cual sugieren que, a pesar de las regulaciones ambientales, Estados Unidos continúa presentando dificultades significativas en la reducción de estas emisiones. Según el informe de la Agencia de Protección Ambiental (EPA, 2022), el país ha logrado reducciones en ciertas áreas, pero el tráfico y la industria siguen siendo fuentes predominantes de contaminación del aire (EPA, 2022).

2. Igualmente se puede concluir que India reportó los niveles más altos de dióxido de nitrógeno(53.34407 µm/m³) y ozono(106.6436 µm/m³) entre los países analizados. Reflejando el impacto de la rápida urbanización y el crecimiento industrial en la calidad del aire del país. La Organización Mundial de la Salud (OMS) indica que la exposición prolongada a NO2 y O3 puede tener efectos adversos significativos en la salud respiratoria (WHO, 2021), lo que resalta la necesidad urgente de políticas efectivas para controlar estas emisiones.

3. Por otro lado,España presento los niveles más bajos de emisiones de CO (4.88 mg/m³) y O3 (103.7758 µm/m³), mientras que China presentó emisiones menores de SO2 (24.90326 µm/m³) en comparación con Estados Unidos. Esto sugiere que las políticas ambientales de España están siendo efectivas en la reducción de la contaminación del aire, mientras que China, a pesar de sus esfuerzos recientes, todavía enfrenta desafíos considerables. ya que de acuerdo con un estudio de la Universidad de Tsinghua, las políticas de control de contaminación en China están en curso, pero los resultados son lentos debido al alto consumo de carbón (Zhang et al., 2020).

Referencias

Agencia de Protección Ambiental (EPA). (2022). Air Quality and Emissions Trends. Recuperado de www.epa.gov Organización Mundial de la Salud (WHO). (2021). Air Quality Guidelines: Global Update 2021. Recuperado de www.who.int Zhang, Y., et al. (2020). Air Pollution Control Policies in China: A Review. Environmental Science & Technology, 54(7), 4347-4358. DOI:10.1021/acs.est.9b07985 Intergovernmental Panel on Climate Change (IPCC). (2021). Climate Change 2021: The Physical Science Basis. Cambridge University Press. World Health Organization (WHO). (2018). Air Pollution and Health. Recuperado de www.who.int United Nations Environment Programme (UNEP). (2019). Global Environment Outlook – GEO-6: Healthy Planet, Healthy People. Cambridge University Press. Pachauri, R. K., & Mayer, L. (Eds.). (2014). Climate Change 2014: Synthesis Report. IPCC.