Análisis estadístico de calidad del aire del estado de Sonora

Importar

Importar paquetes

library(pacman) # Activamos un conjunto de paquetes
p_load("readr", "tidyverse", "DT", "prettydoc") #Extraemos los que vamos a necesitar

Importar datos

datos <- read.csv("CalidadAire.csv") #Capturamos los datos en una variable

datosEnero <- read.csv("CalidadAireHermosilloEnero2020.csv")

Transformar

#Convertimos los datos a valores numéricos AGOSTO 2020
NO2 <- as.numeric(datos$NO2)
O3 <- as.numeric(datos$O3)

Fecha = as.Date(datos$Fecha) #Creamos un vector fecha

calidad <- data.frame(Fecha, NO2, O3) #Creamos un marco de datos

no2o3 <- data.frame(NO2,O3)


#Convertimos los datos a valores numéricos ENERO 2020
eneNO2 <- as.numeric(datosEnero$NO2)
eneO3 <- as.numeric(datosEnero$O3)

eneFecha = as.Date(datosEnero$Fecha) #Creamos un vector fecha

enecalidad <- data.frame(eneFecha, eneNO2, eneO3) #Creamos un marco de datos

eneno2o3 <- data.frame(eneNO2,eneO3)

Visualizar

  • Agosto 2020
#Tabla
datatable(datos) #Generamos una tabla interactiva
#Gráfico
ggplot(data=calidad) + #Generamos un gráfico de puntos con nuestros datos numéricos
  geom_point(aes(Fecha, O3, colour ="O3")) + # y le damos un color respectivo a c/u
  geom_point(aes(Fecha, NO2, colour ="NO2")) +
  xlab("Tiempo") + #Se nombra el eje X
  ylab("Concentración de contaminantes") + #Se nombra el eje Y
  labs(colour="Gases") + #Se nombra la simbología de colores
  ggtitle("Calidad del aire para Agosto en Hermosillo (ERNO, UNAM)") #Título del gráfico

  • Enero 2020
#Tabla
datatable(datosEnero) #Generamos una tabla interactiva
#Gráfico
ggplot(data=enecalidad) + #Generamos un gráfico de puntos con nuestros datos numéricos
  geom_point(aes(eneFecha, eneO3, colour ="O3")) + # y le damos un color respectivo a c/u
  geom_point(aes(eneFecha, eneNO2, colour ="NO2")) +
  xlab("Tiempo") + #Se nombra el eje X
  ylab("Concentración de contaminantes") + #Se nombra el eje Y
  labs(colour="Gases") + #Se nombra la simbología de colores
  ggtitle("Calidad del aire para Enero en Hermosillo (ERNO, UNAM)") #Título del gráfico

Análisis de correlación

Gráfico de dispersión

  • Agosto 2020
names(no2o3)
## [1] "NO2" "O3"
#Gráfico de pares
pairs(no2o3)

  • Enero 2020
names(eneno2o3)
## [1] "eneNO2" "eneO3"
#Gráfico de pares
pairs(eneno2o3)

Gráfico de correlación lineal

Para cuantificar el grado de colerración lineas, calculamos la matriz de correlación

  • Agosto 2020
cor(no2o3)
##             NO2          O3
## NO2  1.00000000 -0.02779472
## O3  -0.02779472  1.00000000
  • Enero 2020
cor(eneno2o3)
##            eneNO2      eneO3
## eneNO2  1.0000000 -0.2675275
## eneO3  -0.2675275  1.0000000

Recta de mínimos cuadrados

  • Agosto 2020
regresion <- lm(O3 ~ NO2, data=datos)
summary(regresion)
## 
## Call:
## lm(formula = O3 ~ NO2, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -20.458  -7.333  -2.115   6.152  42.735 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  23.4710     0.5828  40.275   <2e-16 ***
## NO2          -3.0717     4.1934  -0.733    0.464    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 9.94 on 694 degrees of freedom
## Multiple R-squared:  0.0007725,  Adjusted R-squared:  -0.0006673 
## F-statistic: 0.5366 on 1 and 694 DF,  p-value: 0.4641
  • Enero 2020
eneregresion <- lm(eneO3 ~ eneNO2, data=datosEnero)
summary(eneregresion)
## 
## Call:
## lm(formula = eneO3 ~ eneNO2, data = datosEnero)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -18.843 -10.303  -3.936   9.253  32.670 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  15.5136     0.4747  32.679  < 2e-16 ***
## eneNO2      -10.2096     1.3499  -7.563 1.17e-13 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 12.81 on 742 degrees of freedom
## Multiple R-squared:  0.07157,    Adjusted R-squared:  0.07032 
## F-statistic:  57.2 on 1 and 742 DF,  p-value: 1.166e-13

Observatorio Atmosférico en Hermosillo

Conclusión

  • Se puede observar en los valores de la tabla, que en la noche la calidad del aire en Hermosillo es mejor pues hay menor concentración de ozono y dióxido de nitrógeno, gases contaminantes expulsados principalmente por los motores de los automóviles en circulación, cuyo afluente es mayor durante el día.
  • Se generó un gráfico de puntos con la misma información de la tabla. Y un análisis cuantitativo de la correlación de la variables de concentración de los gases contaminantes.
  • Téoricamente un aumento de NO2 debería representar un aumento de O3, por la reacción química: NO(g) + O2(g) → NO2(g) NO2(g) + luz → NO(g) + O(g) O(g) + O2(g) → O3(g). Pero parece haber un problema en las lecturas del Observatorio Atmosférico en Hermosillo.