U1A7

Marian Gutiérrez

18/9/2020

Análisis estadístico de calidad del aire del estado de Sonora

Importar

Importar paquetes

library(pacman)
p_load("readr", "tidyverse", "DT")

Importar datos

datos <- read.csv("calidadaire.csv")
datos1 <- read.csv("calidadjul.csv")

Transformar

  • Julio
Fechajul = as.Date(datos1$Fecha)
NO2jul <- as.numeric(datos1$NO2)
O3jul <- as.numeric(datos1$O3)
calidadjul <- data.frame(Fechajul, NO2jul, O3jul)
no2o3jul <- data.frame(NO2jul,O3jul)
  • Agosto
Fecha = as.Date(datos$Fecha)
NO2 <- as.numeric(datos$NO2)
O3 <- as.numeric(datos$O3)
calidad <- data.frame(Fecha, NO2, O3)
no2o3ago <- data.frame(NO2,O3)

Visualizar

  • Julio
datatable(datos1)
ggplot(data=calidadjul) +
  geom_point(aes(Fechajul, O3jul,  colour ="O3" )) +
  geom_point(aes(Fechajul, NO2jul, colour = "NO2")) +
  xlab("Tiempo") +
  ylab("Concentración") + 
  labs (colour = "Estados") +
  ggtitle("Calidad del aire para Julio en Hermosillo (ERNO, UNAM)")

  • Agosto
datatable(datos)
ggplot(data=calidad) +
  geom_point(aes(Fecha, O3,  colour ="O3" )) +
  geom_point(aes(Fecha, NO2, colour = "NO2")) +
  xlab("Tiempo") +
  ylab("Concentración") + 
  labs (colour = "Estados") +
  ggtitle("Calidad del aire para Agosto en Hermosillo (ERNO, UNAM)")

Análisis de correlación

Gráfico de dispersión

  • Julio
names(datos1)
## [1] "Fecha" "O3"    "NO2"
pairs(datos1)

  • Agosto
names(datos)
## [1] "Fecha" "O3"    "NO2"
pairs(datos)

Grado de correlación lineal

Para cuantificar el grado de correlación lineal calculamos la matriz de correlación

  • Julio
cor(no2o3jul)
##            NO2jul      O3jul
## NO2jul  1.0000000 -0.1832041
## O3jul  -0.1832041  1.0000000
  • Agosto
cor(no2o3ago)
##             NO2          O3
## NO2  1.00000000 -0.02779472
## O3  -0.02779472  1.00000000

Recta de mínimos cuadrados

  • Julio
regresion <- lm(O3jul ~ NO2jul, data=datos1)
summary(regresion)
## 
## Call:
## lm(formula = O3jul ~ NO2jul, data = datos1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -332.50 -149.65   -3.43  140.50  392.71 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 358.5392    11.3302  31.645  < 2e-16 ***
## NO2jul       -2.0040     0.4082  -4.909 1.14e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 178.6 on 694 degrees of freedom
## Multiple R-squared:  0.03356,    Adjusted R-squared:  0.03217 
## F-statistic:  24.1 on 1 and 694 DF,  p-value: 1.14e-06
  • Agosto
regresion1 <- lm(O3 ~ NO2, data=datos)
summary(regresion1)
## 
## Call:
## lm(formula = O3 ~ NO2, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -20.458  -7.333  -2.115   6.152  42.735 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  23.4710     0.5828  40.275   <2e-16 ***
## NO2          -3.0717     4.1934  -0.733    0.464    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 9.94 on 694 degrees of freedom
## Multiple R-squared:  0.0007725,  Adjusted R-squared:  -0.0006673 
## F-statistic: 0.5366 on 1 and 694 DF,  p-value: 0.4641

Conlusión

Mediante la ayuda de tablas y gráficas podemos observar que en ambos meses, la concentración de gases es mayor durante el día, ya que en estas horas es cuando más circulan carros, personas, etc. También podemos observar, que en el mes de julio las concentraciones de gases están más dispersas que las de agosto.