U2A2

Cristina Gpe. Arguelles Lema

25/4/2021

Correlación lineal: Calidad del aire

Descarga de este código:

  • Para fines de reproducibilidad inmediata se incluye todo el código para su descarga
xfun::embed_file("U2A2.Rmd")

Download U2A2.Rmd

Para la descarga de datos utilizados en este codigo:

xfun::embed_file("Aire.xlsx")

Download Aire.xlsx

¿Estan las relacionadas las variables de SO2 y NO2 con la calidad del aire?

Para saber si existe una relación entre la variable de SO2 y la variable de NO2 de manera gráfica, los cuales son contaminantes que afectan la calidad del aire, se realizará un diagrama de dispersión con los datos obtenidos por una red universitaria de observatorios atmosféricos (UNAM) en la temporada de Marzo - Junio de 2020 en Hermosillo, Sonora.

Hipótesis

Las concentraciones de los contaminantes SO2 y NO2 en el aire, influyen en la calidad del aire. Estos contaminantes se encuentran relacionadas por sus repercusiones en la salud, atacando directamente al sistema respiratorio, por lo que se llega a la hipótesis que estos contaminantes por ser concentraciones similares afectan de igual manera a la calidad del aire.

Regresión Lineal

Análisis de Correlación

library(MASS)
library(ggplot2)
library(readxl)
datos <- read_excel("Aire.xlsx")
## New names:
## * `` -> ...4
ggplot(data = datos, aes(x = SO2, y = NO2)) + 
  geom_point(colour = "darkmagenta") +
  ggtitle("Diagrama de dispersión") +
  theme_bw() +
  theme(plot.title = element_text(hjust = 0.5))

Análisis de normalidad

# Representación gráfica
par(mfrow = c(1, 2))
hist(datos$SO2, breaks = 10, main = "", xlab = "SO2", border = "deepskyblue3")
hist(datos$NO2, breaks = 10, main = "", xlab = "NO2", border = "deeppink3")

qqnorm(datos$SO2, main = "SO2", col = "goldenrod3")
qqline(datos$SO2)

qqnorm(datos$NO2, main = "NO2", col = "deeppink1")
qqline(datos$NO2)

par(mfrow = c(1,1))
# Test de hipótesis para el análisis de normalidad
shapiro.test(datos$SO2)
## 
##  Shapiro-Wilk normality test
## 
## data:  datos$SO2
## W = 0.98395, p-value = 0.254
shapiro.test(datos$NO2)
## 
##  Shapiro-Wilk normality test
## 
## data:  datos$NO2
## W = 0.98993, p-value = 0.6457

Cálculo de Correlación

cor(x = datos$NO2, y = datos$SO2, method = "pearson")
## [1] 0.9184734
cor(x = datos$NO2, y = datos$SO2, method = "spearman")
## [1] 0.9165372

Significancia de la correlación

cor.test(x = datos$NO2, 
         y = datos$SO2,alternative = "two.sided", 
         conf.level  = 0.95, 
         method      = "pearson")
## 
##  Pearson's product-moment correlation
## 
## data:  datos$NO2 and datos$SO2
## t = 23.224, df = 100, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.8814416 0.9442808
## sample estimates:
##       cor 
## 0.9184734
cor.test(x = datos$NO2, 
         y = datos$SO2, alternative = "two.sided", 
         conf.level  = 0.95, 
         method      = "spearman")
## Warning in cor.test.default(x = datos$NO2, y = datos$SO2, alternative =
## "two.sided", : Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  datos$NO2 and datos$SO2
## S = 14760, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.9165372

Coeficiente de determinación de R2 (tamaño del efecto)

R2_pearson <- cor(x = datos$NO2, y = datos$SO2, method = "pearson")
R2_pearson <- R2_pearson^2
R2_pearson
## [1] 0.8435934
R2_spearman <- cor(x = datos$NO2, y = datos$SO2, method = "spearman")
R2_spearman <- R2_spearman^2
R2_spearman
## [1] 0.8400405

Existe una correlación significativa entre SO2 y NO2 en la calidad del aire (r=0.8, p-value < 0.245), con un tamaño de efecto medio-alto (R2=0.84).

Se comprueba y se acepta la hipótesis nula, donde se puede decir que estos contaminantes se encuentran relacionadas por sus repercusiones en la salud, atacando directamente al sistema respiratorio, de igual manera, son los contaminantes precursores de las lluvias ácidas debido a la interacción con la radiación solar y la humedad atmosférica, por ser concentraciones similares afectan de igual manera a la calidad del aire y causando diferentes consecuencias en el medio ambiente.

Conclusión

  • En base a los datos observados, se puede deducir que las variables de los contaminantes SO2 y NO2 se relacionaron en la temporada de Marzo - Junio en 2020, esto puede ocurrir debido a la pandemia ocurrida durante dicho año, ya que los resultados fueron muy relevantes.

Bibliografía

  • Amat, Joaquín (2016). Correlación lineal y regresión lineal simple. Obtenido de Ciencia de datos, Link

  • UNAM (2020. Calidad del aire en Hermosillo, Sonora. Link