La contaminación del aire es una mezcla de partículas sólidas y gases en el aire que se pueden dar por emisiones de los automóviles, compuestos químicos de las fábricas, el polvo, el polen y las esporas de moho ya que estas, pueden estar suspendidas como partículas.
Las siglas PM (material particulado o materia particulada) es un indicador comun de la contaminación del aire y hacen referencia a partículas de diferentes tamaños que están suspendidas en la atmósfera, en el aire que respiramos, disminuyendo la calidad de dicho aire y provocando problemas para la salud. Dentro de las PM podemos encontrar PM1, PM 2.5 y las PM10, cada una de ellas estan compuestas por diferentes materiales y pueden provenir de diferente fuentes.
Por ejemplo, las partículas con un diámetro de 10 micrones o menos (≤ PM10) pueden penetrar y alojarse profundamente en los pulmones, aunque las partículas que tienen un diámetro de 2,5 micrones o menos (≤ PM2.5) resultan aún más dañinas para la salud.
A continuación, se organiza la base de datos con la que vamos a trabajar.
library(readr)
contaminacion <- read_delim("C:/Users/Lenovo/Downloads/SEXTO SEMESTRE/ESTADISTICA AVANZADA/Contaminacion/contaminacion.csv",
";", escape_double = FALSE, col_types = cols(Latitude = col_integer(),
Longitude = col_integer()), trim_ws = TRUE)
names(contaminacion)[5:9]=c("temp","pm1","pm2_5","pm10","humedad")
contaminacion$temp=(contaminacion$temp-32)*(5/9)
canti=nchar(contaminacion$Latitude)-1
contaminacion$Latitude[canti==4]=contaminacion$Latitude[canti==4]/10000
contaminacion$Latitude[canti==5]=contaminacion$Latitude[canti==5]/100000
contaminacion$Latitude[canti==6]=contaminacion$Latitude[canti==6]/1000000
contaminacion$Latitude[canti==7]=contaminacion$Latitude[canti==7]/10000000
canti2=nchar(contaminacion$Longitude)-1
contaminacion$Longitude[canti2==7]=contaminacion$Longitude[canti2==7]/100000
contaminacion$Longitude[canti2==8]=contaminacion$Longitude[canti2==8]/1000000
contaminacion$Longitude[canti2==9]=contaminacion$Longitude[canti2==9]/10000000
En esta base de datos se tomó información sobre la cantidad de material particulado en dos zonas diferentes de la ciudad de Cali una de ellas, dentro de la universidad Javeriana Cali en Acacias y la otra zona, en la via cañasgordas.
Esta base de datos, contiene 5155 observaciones, 2503 datos de la zona de Acacias y 2652 datos de Vía Cañasgordas. Dentro de ella, se puede encontrar la latitud y longitud del lugar en el que se tomaron los datos, temperatura de la zona, humedad y tres medidas de diferentes tipos de material particulado (1, 2.5, 10) por medio de las cuales, se puede medir el grado de contaminación de la zona.
## # A tibble: 6 x 9
## Session_Name Timestamp Latitude Longitude temp pm1 pm2_5 pm10
## <chr> <dttm> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 acacias 2022-02-17 11:17:16 3.35 -76.5 23.3 NA NA NA
## 2 acacias 2022-02-17 11:17:16 3.35 -76.5 NA NA NA NA
## 3 acacias 2022-02-17 11:17:16 3.35 -76.5 NA 14 NA NA
## 4 acacias 2022-02-17 11:17:16 3.35 -76.5 NA NA NA 18
## 5 acacias 2022-02-17 11:17:16 3.35 -76.5 NA NA 25 NA
## 6 acacias 2022-02-17 11:17:17 3.35 -76.5 23.9 NA NA NA
## # ... with 1 more variable: humedad <dbl>
##
## acacias canasgordas
## 2503 2652
El objetivo de este informe es determinar si la contaminación con pm2.5 en el interior de la universidad Javeriana exactamente en Acacias, es menor que sobre la Vía Cañasgordas.
A continuación, se encuentra un mapa interactivo que permite ilustrar los recorridos que se hicieron en las dos zonas con el fin de capturar la contaminación del aire.
require(leaflet)
leaflet() %>% addCircleMarkers(lng = contaminacion$Longitude,lat = contaminacion$Latitude,radius = 0.2,label = contaminacion$Session_Name) %>% addTiles()
Inicialmente, tenemos un resumen general de todas las variables de la base de datos y como se puede evidenciar en promedio la temperatura mientras se realizaba la toma de datos fue de 27.68°C y la humedad fue de 84.44%.
La toma mas alta de pm2.5 fue de 153 µg/cm³, la media fue de 30.29µg/cm³ mientras que, la toma mas baja fue de 21 µg/cm³. Para pm1.0 el dato mas alto fue de 12µg/cm³ y el mas bajo de 103µg/cm³ mientras que el promedio fue de 16.89µg/cm³. Finalmente, para pm10 la toma mas baja fue de 15µg/cm³, las mas alta de 87 µg/cm³ y en promedio estuvo en 20.75µg/cm³.
De lo mencionado anteriormente, se puede concluir que hay gran variabilidad de las concetraciones con respecto a la media de cada una de ellas y esto puede ser, debido a una gran cantidad de datos atipicos.
summary(contaminacion)
## Session_Name Timestamp Latitude
## Length:5155 Min. :2022-02-17 11:17:16 Min. :3.347
## Class :character 1st Qu.:2022-02-17 11:21:51 1st Qu.:3.347
## Mode :character Median :2022-02-17 11:34:14 Median :3.348
## Mean :2022-02-17 11:30:26 Mean :3.348
## 3rd Qu.:2022-02-17 11:38:45 3rd Qu.:3.349
## Max. :2022-02-17 11:43:24 Max. :3.351
##
## Longitude temp pm1 pm2_5
## Min. :-76.53 Min. :23.33 Min. : 12.00 Min. : 21.00
## 1st Qu.:-76.53 1st Qu.:26.11 1st Qu.: 14.00 1st Qu.: 25.50
## Median :-76.53 Median :27.78 Median : 15.00 Median : 28.00
## Mean :-76.53 Mean :27.68 Mean : 16.89 Mean : 30.29
## 3rd Qu.:-76.53 3rd Qu.:29.44 3rd Qu.: 17.00 3rd Qu.: 31.00
## Max. :-76.53 Max. :30.56 Max. :103.00 Max. :153.00
## NA's :4055 NA's :4055 NA's :4056
## pm10 humedad
## Min. :15.00 Min. :74.00
## 1st Qu.:18.00 1st Qu.:78.00
## Median :19.00 Median :83.00
## Mean :20.75 Mean :84.44
## 3rd Qu.:21.00 3rd Qu.:90.00
## Max. :87.00 Max. :98.00
## NA's :4056 NA's :4055
En el gráfico de cajas se puede observar que la media de PM2.5 en la zona de Acacias (26µg/cm³) es menor que la media en la vía Cañasgordas (30µg/cm³).
También, se puede identificar que en la vía Cañagordas hay muchos datos atípicos. Esto puede ser debido a que mientras se tomaban los datos, las emisiones por fuentes móviles iban siendo cada vez más presentes; en vista de que esta vía es muy transitada, ya que además de ser una zona universitaria, también comunica a Cali con Jamundí, por esta razón, con regularidad pasan diferentes automóviles, el Mio y busetas de transporte publico las cuales emiten una gran cantidad de material particulado mientras que, la zona de Acacias cuenta con un gran espacio verde que permite regular la temperatura y humedad de la zona, produciendo así oxigeno, absorbiendo los contaminantes y amortiguando los ruidos.
require(ggplot2)
require(plotly)
g1=ggplot(contaminacion,aes(x = Session_Name,y=pm2_5,fill=Session_Name))+geom_boxplot()+theme_bw()
ggplotly(g1)
Por medio del diagrama de cajas se puede identificar que la temperatura en la zona de Acacias en promedio es menor al promedio de la temperatura de Cañasgordas por 4°C esto puede ser debido a que, la zona de Acacias cuenta con mayor cantidad de zonas verdes que permiten regular la temperatura y ademas, por esta zona no circula gran cantidad de automoviles.
g2=ggplot(contaminacion,aes(x = Session_Name,y=temp,fill=Session_Name))+geom_boxplot()+theme_bw()
ggplotly(g2)
## Warning: Removed 4055 rows containing non-finite values (stat_boxplot).
Por medio de un nivel de confianza del 95%, se puede establecer que la temperatura entre la zona de Acacias y la Via Cañasgordas esta entre 25.73° y 29.51°.
t.test( contaminacion$temp~contaminacion$Session_Name)
##
## Welch Two Sample t-test
##
## data: contaminacion$temp by contaminacion$Session_Name
## t = -67.256, df = 945.15, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group acacias and group canasgordas is not equal to 0
## 95 percent confidence interval:
## -3.889097 -3.668572
## sample estimates:
## mean in group acacias mean in group canasgordas
## 25.73936 29.51819
Con un nivel de confianza del 95% las concentraciones de PM 2.5 entre la zona de Acacias y Cañasgordas se encuentra en el rango de 26.36 µg/cm³ y 33.96 µg/cm³.
t.test( contaminacion$pm2_5~contaminacion$Session_Name)
##
## Welch Two Sample t-test
##
## data: contaminacion$pm2_5 by contaminacion$Session_Name
## t = -11.014, df = 597.9, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group acacias and group canasgordas is not equal to 0
## 95 percent confidence interval:
## -8.917027 -6.218169
## sample estimates:
## mean in group acacias mean in group canasgordas
## 26.3970 33.9646
Con un nivel de confianza del 95% las concentraciones de PM 1 entre la zona de Acacias y Cañasgordas se encuentra en el rango de 14.45 µg/cm³ y 19.19 µg/cm³.
t.test( contaminacion$pm1~contaminacion$Session_Name)
##
## Welch Two Sample t-test
##
## data: contaminacion$pm1 by contaminacion$Session_Name
## t = -10.211, df = 575.05, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group acacias and group canasgordas is not equal to 0
## 95 percent confidence interval:
## -5.656690 -3.831557
## sample estimates:
## mean in group acacias mean in group canasgordas
## 14.45234 19.19646
Con un nivel de confianza del 95% las concentraciones de PM 10 entre la zona de Acacias y Cañasgordas se encuentra en el rango de 18.46 µg/cm³ y 22.91 µg/cm³.
t.test( contaminacion$pm10~contaminacion$Session_Name)
##
## Welch Two Sample t-test
##
## data: contaminacion$pm10 by contaminacion$Session_Name
## t = -11.937, df = 593.37, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group acacias and group canasgordas is not equal to 0
## 95 percent confidence interval:
## -5.191335 -3.724485
## sample estimates:
## mean in group acacias mean in group canasgordas
## 18.46067 22.91858
En el siguiente histograma se puede observar que la mayor cantidad de datos de 2.5pm esta entre 20µg/cm³ y 30µg/cm³.
hist(contaminacion$pm2_5, freq=FALSE)
curve(dnorm(x,
mean=mean(contaminacion$pm2_5),
sd=sd(contaminacion$pm2_5)),
add=TRUE, col="red")
## Conclusiones
De este estudio se puede concluir que la zona de Acacias, al ser un área más verde y por la cual, no circulan carros se tiene menos cantidad de contaminación por material particulado en comparación con la Vía Cañasgordas. Por lo tanto, no es recomendable estar en la zona de la Cañasgordas durante mucho tiempo ya que la contaminación en esta zona es mayor y puede desencadenar enfermedades cardíacas y pulmonares.
Como recomendación para reducir esta contaminación en la Vía Cañasgordas, se aconseja realizar en los tiempos establecidos la revisión tecno mecánica y de emisiones contaminantes, para evitar que los vehículos transiten sin tener las condiciones adecuadas para hacerlo.