- Correlación lineal: Calidad del aire
- Descarga de este código:
- Para la descarga de datos utilizados en este codigo:
- ¿Estan las relacionadas las variables de SO2 y NO2 con la calidad del aire?
- Hipótesis
- Regresión Lineal
- Análisis de Correlación
- Análisis de normalidad
- Cálculo de Correlación
- Significancia de la correlación
- Coeficiente de determinación de R2 (tamaño del efecto)
- Conclusión
- Bibliografía
Correlación lineal: Calidad del aire
Descarga de este código:
- Para fines de reproducibilidad inmediata se incluye todo el código para su descarga
xfun::embed_file("U2A2.Rmd")Para la descarga de datos utilizados en este codigo:
xfun::embed_file("Aire.xlsx")¿Estan las relacionadas las variables de SO2 y NO2 con la calidad del aire?
Para saber si existe una relación entre la variable de SO2 y la variable de NO2 de manera gráfica, los cuales son contaminantes que afectan la calidad del aire, se realizará un diagrama de dispersión con los datos obtenidos por una red universitaria de observatorios atmosféricos (UNAM) en la temporada de Marzo - Junio de 2020 en Hermosillo, Sonora.
Hipótesis
Las concentraciones de los contaminantes SO2 y NO2 en el aire, influyen en la calidad del aire. Estos contaminantes se encuentran relacionadas por sus repercusiones en la salud, atacando directamente al sistema respiratorio, por lo que se llega a la hipótesis que estos contaminantes por ser concentraciones similares afectan de igual manera a la calidad del aire.
Regresión Lineal
Análisis de Correlación
library(MASS)
library(ggplot2)library(readxl)
datos <- read_excel("Aire.xlsx")## New names:
## * `` -> ...4
ggplot(data = datos, aes(x = SO2, y = NO2)) +
geom_point(colour = "darkmagenta") +
ggtitle("Diagrama de dispersión") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))Análisis de normalidad
# Representación gráfica
par(mfrow = c(1, 2))
hist(datos$SO2, breaks = 10, main = "", xlab = "SO2", border = "deepskyblue3")
hist(datos$NO2, breaks = 10, main = "", xlab = "NO2", border = "deeppink3")qqnorm(datos$SO2, main = "SO2", col = "goldenrod3")
qqline(datos$SO2)qqnorm(datos$NO2, main = "NO2", col = "deeppink1")
qqline(datos$NO2)par(mfrow = c(1,1))
# Test de hipótesis para el análisis de normalidad
shapiro.test(datos$SO2)##
## Shapiro-Wilk normality test
##
## data: datos$SO2
## W = 0.98395, p-value = 0.254
shapiro.test(datos$NO2)##
## Shapiro-Wilk normality test
##
## data: datos$NO2
## W = 0.98993, p-value = 0.6457
Cálculo de Correlación
cor(x = datos$NO2, y = datos$SO2, method = "pearson")## [1] 0.9184734
cor(x = datos$NO2, y = datos$SO2, method = "spearman")## [1] 0.9165372
Significancia de la correlación
cor.test(x = datos$NO2,
y = datos$SO2,alternative = "two.sided",
conf.level = 0.95,
method = "pearson")##
## Pearson's product-moment correlation
##
## data: datos$NO2 and datos$SO2
## t = 23.224, df = 100, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.8814416 0.9442808
## sample estimates:
## cor
## 0.9184734
cor.test(x = datos$NO2,
y = datos$SO2, alternative = "two.sided",
conf.level = 0.95,
method = "spearman")## Warning in cor.test.default(x = datos$NO2, y = datos$SO2, alternative =
## "two.sided", : Cannot compute exact p-value with ties
##
## Spearman's rank correlation rho
##
## data: datos$NO2 and datos$SO2
## S = 14760, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.9165372
Coeficiente de determinación de R2 (tamaño del efecto)
R2_pearson <- cor(x = datos$NO2, y = datos$SO2, method = "pearson")
R2_pearson <- R2_pearson^2
R2_pearson## [1] 0.8435934
R2_spearman <- cor(x = datos$NO2, y = datos$SO2, method = "spearman")
R2_spearman <- R2_spearman^2
R2_spearman## [1] 0.8400405
Existe una correlación significativa entre SO2 y NO2 en la calidad del aire (r=0.8, p-value < 0.245), con un tamaño de efecto medio-alto (R2=0.84).
Se comprueba y se acepta la hipótesis nula, donde se puede decir que estos contaminantes se encuentran relacionadas por sus repercusiones en la salud, atacando directamente al sistema respiratorio, de igual manera, son los contaminantes precursores de las lluvias ácidas debido a la interacción con la radiación solar y la humedad atmosférica, por ser concentraciones similares afectan de igual manera a la calidad del aire y causando diferentes consecuencias en el medio ambiente.
Conclusión
- En base a los datos observados, se puede deducir que las variables de los contaminantes SO2 y NO2 se relacionaron en la temporada de Marzo - Junio en 2020, esto puede ocurrir debido a la pandemia ocurrida durante dicho año, ya que los resultados fueron muy relevantes.
Bibliografía
Amat, Joaquín (2016). Correlación lineal y regresión lineal simple. Obtenido de Ciencia de datos, Link
UNAM (2020. Calidad del aire en Hermosillo, Sonora. Link