setwd("~/R")

El aire en hermosillo

Cielo contaminado de hermosillo

Respirar un aire limpio

La importancia de respirar un aire limpio está fuera de toda duda. Basta con aplicar el sentido común o, por supuesto, con sentir el bienestar que ello supone para el organismo, para entender el gran valor de respirar un aire puro, que resulte saludable y nos transmita sensación de confort.

La respiración juega un papel vital para nuestra salud. Al tiempo que nos provee de oxígeno, el mismo hecho de la inhalación puede ser la puerta de entrada de partículas nocivas que provoquen reacciones alérgicas y enfermedades de distinta gravedad. También juega un importante papel en el pH de la sangre, de tal modo que una respiración superficial (muy habitual en ambientes polucionados) nos genera estrés, así como sensación de angustia y ansiedad constante.

La importancia de respirar un aire limpio es crucial para todo ser humano gracias a que este soporta al organismo. Por lo cual es importante que este sea aire limpio.

Las actividades humanas tienen un efecto negativo sobre el ambiente y el cambio climático, ahora, si tomamos el caso de estudio de Hermosillo, y nos planteamos la siguiente pregunta:

¿Cómo varió la calidad del aire en Hermosillo durante los primeros días de la cuarentena por COVID-19? ¿Mejoró la calidad del aire? ¿Por qué mejoró la calidad del aire? ¿Qué es y que produce el NO2? -La importancia de estas preguntas radica en que a mayor concentración de NO2 en la troposfera, mayor concentración de ozono (O3)

Los datos siguientes fueron tomados del siguiente enlace

https://ruoa.unam.mx/index.php?page=estaciones&id=6

con la fecha del 01/04/2020

library(readr)
periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00 <- read_csv("periodo_-2020-04-01-12_00_00-a--2020-04-30-12_00_00.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   Fecha = col_datetime(format = ""),
##   O3 = col_double()
## )
View(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00)

Conociendo los datos

head(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00) #Para conocer los primero datos
## # A tibble: 6 x 2
##   Fecha                  O3
##   <dttm>              <dbl>
## 1 2020-04-01 12:00:00  47.1
## 2 2020-04-01 13:00:00  47.8
## 3 2020-04-01 14:00:00  46.7
## 4 2020-04-01 15:00:00  47.2
## 5 2020-04-01 16:00:00  45.0
## 6 2020-04-01 17:00:00  40.7

O3

El ozono es un gas incoloro y un componente natural de la atmosfera que se encuentra en concentraciones bajas y es vital para nosotros.

Se le llama el “ozono bueno” al que se encuentra en la ozonosfera que limita la radiación ultravioleta del sol, en el que nos concentraremos más es el denominado “ozono malo” el cual se encuentra al nivel del suelo y es producido por los automóviles, fábricas y otras reacciones químicas con el sol.

Los principales efectos negativos para el ser humano es que nos provocan efectos nocivos al sistema respiratorio.

Medidas de tendencia central

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda.

Media

median(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3)
## [1] 34.01

Mediana

median(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3)
## [1] 34.01

Para saber esto, ordenamos los datos de mayor a menor para una mejor apreciación

sort(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3)
##   [1]  2.35  4.35  4.77  5.56  5.75  7.45  7.60  7.98  8.58  8.80  9.38  9.79
##  [13]  9.82 10.26 10.36 10.53 10.74 11.37 11.37 11.80 12.08 12.09 12.14 12.48
##  [25] 12.82 12.87 13.14 13.31 13.34 13.39 13.46 13.54 13.60 13.82 13.92 13.93
##  [37] 13.98 14.00 14.09 14.31 14.35 14.42 14.62 14.82 14.88 14.88 14.96 14.97
##  [49] 15.02 15.13 15.15 15.18 15.23 15.24 15.25 15.26 15.35 15.59 15.66 15.67
##  [61] 15.77 15.81 15.88 15.89 15.90 15.91 15.93 16.05 16.10 16.15 16.21 16.31
##  [73] 16.49 16.64 16.71 16.73 16.77 16.78 16.83 16.85 16.92 16.96 17.00 17.07
##  [85] 17.08 17.16 17.25 17.39 17.41 17.55 17.66 17.66 17.72 17.78 17.83 17.86
##  [97] 17.94 17.97 18.06 18.14 18.16 18.32 18.66 18.79 18.79 18.95 19.03 19.04
## [109] 19.05 19.13 19.13 19.14 19.15 19.19 19.24 19.33 19.33 19.36 19.52 19.57
## [121] 19.60 19.61 19.64 19.88 20.30 20.35 20.43 20.45 20.46 20.46 20.50 20.51
## [133] 20.63 20.80 20.80 20.82 20.90 21.03 21.09 21.10 21.16 21.19 21.20 21.26
## [145] 21.28 21.36 21.43 21.48 21.48 21.49 21.52 21.70 21.92 22.04 22.05 22.10
## [157] 22.16 22.17 22.18 22.22 22.25 22.31 22.34 22.37 22.40 22.55 22.66 22.67
## [169] 22.78 22.83 22.85 23.04 23.13 23.21 23.24 23.24 23.34 23.35 23.41 23.51
## [181] 23.69 24.19 24.26 24.38 24.48 24.49 24.51 24.58 24.71 24.82 25.02 25.02
## [193] 25.05 25.09 25.15 25.19 25.21 25.31 25.31 25.34 25.48 25.64 25.65 25.71
## [205] 25.78 25.79 25.81 25.84 25.85 25.90 25.98 26.03 26.06 26.15 26.15 26.26
## [217] 26.39 26.56 26.57 26.62 26.71 26.89 26.91 26.91 26.95 26.99 27.06 27.16
## [229] 27.16 27.25 27.43 27.46 27.57 27.58 27.59 27.62 27.64 27.67 27.71 27.93
## [241] 27.97 28.06 28.12 28.15 28.15 28.16 28.17 28.20 28.23 28.27 28.31 28.32
## [253] 28.40 28.41 28.42 28.45 28.61 28.62 28.64 28.68 28.68 28.70 28.74 28.76
## [265] 28.80 28.89 28.90 29.02 29.10 29.12 29.17 29.40 29.43 29.44 29.46 29.50
## [277] 29.61 29.74 29.77 29.80 29.87 29.87 29.92 30.04 30.10 30.15 30.25 30.28
## [289] 30.33 30.42 30.46 30.54 30.71 30.72 30.79 30.90 30.93 30.98 31.12 31.19
## [301] 31.26 31.31 31.40 31.53 31.53 31.60 31.70 31.79 31.89 31.90 31.92 31.93
## [313] 32.01 32.04 32.06 32.13 32.20 32.31 32.36 32.44 32.45 32.46 32.49 32.59
## [325] 32.68 32.74 32.74 32.77 32.78 32.80 33.11 33.17 33.17 33.20 33.27 33.31
## [337] 33.42 33.45 33.56 33.57 33.59 33.76 33.80 33.85 33.86 33.87 33.94 33.98
## [349] 34.04 34.08 34.18 34.20 34.27 34.35 34.45 34.46 34.59 34.62 34.63 34.69
## [361] 34.69 34.71 34.75 34.78 34.89 34.95 34.95 34.96 35.00 35.08 35.09 35.15
## [373] 35.17 35.38 35.40 35.51 35.53 35.54 35.54 35.55 35.59 35.60 35.60 35.62
## [385] 35.65 35.74 35.77 35.78 35.79 35.88 35.94 35.97 36.20 36.21 36.23 36.36
## [397] 36.43 36.49 36.52 36.52 36.54 36.56 36.62 36.67 36.70 36.71 36.74 36.76
## [409] 36.86 36.87 36.90 36.91 37.09 37.23 37.24 37.30 37.33 37.41 37.55 37.57
## [421] 37.58 37.60 37.67 37.72 37.75 37.77 37.79 37.86 37.90 37.97 38.03 38.05
## [433] 38.06 38.06 38.12 38.23 38.47 38.47 38.55 38.59 38.63 38.70 38.72 38.72
## [445] 38.83 38.97 38.98 39.01 39.05 39.14 39.19 39.25 39.26 39.27 39.50 39.61
## [457] 39.65 39.74 39.74 39.84 39.90 39.94 39.96 39.99 40.04 40.16 40.16 40.26
## [469] 40.30 40.40 40.40 40.57 40.64 40.64 40.66 40.66 40.68 40.71 40.72 40.72
## [481] 40.74 40.81 40.94 40.95 41.07 41.08 41.21 41.24 41.25 41.26 41.41 41.48
## [493] 41.60 41.65 41.69 41.80 41.89 41.93 41.96 42.00 42.08 42.09 42.09 42.11
## [505] 42.23 42.29 42.29 42.38 42.47 42.51 42.51 42.55 42.63 42.69 42.82 42.89
## [517] 43.08 43.12 43.13 43.13 43.19 43.35 43.36 43.36 43.37 43.38 43.43 43.45
## [529] 43.48 43.48 43.51 43.79 44.21 44.26 44.27 44.43 44.44 44.45 44.51 44.52
## [541] 44.57 44.64 44.64 44.65 44.70 44.79 44.90 44.90 44.93 45.04 45.05 45.06
## [553] 45.25 45.26 45.30 45.34 45.41 45.47 45.56 45.66 45.66 45.75 45.79 45.88
## [565] 45.88 45.90 45.93 45.99 46.00 46.05 46.07 46.14 46.15 46.16 46.23 46.23
## [577] 46.28 46.38 46.49 46.73 46.84 46.88 46.89 46.89 46.94 46.95 47.02 47.06
## [589] 47.16 47.18 47.25 47.26 47.34 47.39 47.42 47.44 47.45 47.56 47.63 47.64
## [601] 47.70 47.71 47.72 47.74 47.75 47.76 47.77 47.79 47.81 47.84 47.85 47.90
## [613] 47.96 48.01 48.05 48.09 48.12 48.35 48.36 48.40 48.41 48.56 48.59 48.75
## [625] 48.77 48.80 48.82 48.89 48.97 49.17 49.29 49.33 49.70 49.74 49.84 49.96
## [637] 49.99 50.06 50.10 50.24 50.26 50.39 50.72 51.23 51.26 51.30 51.35 51.37
## [649] 51.63 51.72 51.75 51.79 52.02 52.05 52.17 52.28 52.36 52.55 52.58 52.60
## [661] 52.74 52.89 53.29 53.35 53.49 53.56 53.56 53.68 53.83 54.01 54.03 54.17
## [673] 54.25 54.46 54.48 54.50 54.69 54.77 54.89 55.06 55.12 56.07 56.57 57.07
## [685] 57.61 57.71 58.13 58.21 58.49 58.54 58.90 59.64 60.06 61.92 63.34 64.34

Moda

library(modeest)
mlv(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3, method = "mfv")
##  [1] 11.37 14.88 17.66 18.79 19.13 19.33 20.46 20.80 21.48 23.24 25.02 25.31
## [13] 26.15 26.91 27.16 28.15 28.68 29.87 31.53 32.74 33.17 34.69 34.95 35.54
## [25] 35.60 36.52 38.06 38.47 38.72 39.74 40.16 40.40 40.64 40.66 40.72 42.09
## [37] 42.29 42.51 43.13 43.36 43.48 44.64 44.90 45.66 45.88 46.23 46.89 53.56

Rango o amplitud

maximo <- max(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3) #valor más grande
maximo
## [1] 64.34
minimo <- min(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3) #valor más chico
minimo
## [1] 2.35
rango <- (maximo-minimo) #amplitud
rango
## [1] 61.99

cuartiles y tendencia central

Los cuartiles son valores que dividen una muestra de datos en cuatro partes iguales. Utilizando cuartiles puede evaluar rápidamente la dispersión y la tendencia central de un conjunto de datos, que son los pasos iniciales importantes para comprender sus datos.

summary(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.35   23.23   34.01   33.38   43.35   64.34

Grafico de caja y bigote

boxplot(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3)

Se puede detectar rápidamente los siguientes valores:

Primer cuartil: el 25% de los valores son menores o igual a este valor (punto 2 en el gráfico anterior).

Mediana o Segundo Cuartil: Divide en dos partes iguales la distribución. De forma que el 50% de los valores son menores o igual a este valor (punto 3 en el gráfico siguiente).

Tercer cuartil: el 75% de los valores son menores o igual a este valor (punto 4 en el gráfico siguiente). Rango Intercuartílico (RIC): Diferencia entre el valor del tercer cuartil y el primer cuartil.

Rango intercuartil

El rango intercuartílico IQR (o rango intercuartil) es una estimación estadística de la dispersión de una distribución de datos. Consiste en la diferencia entre el tercer y el primer cuartil. Mediante esta medida se eliminan los valores extremadamente alejados. El rango intercuartílico es altamente recomendable cuando la medida de tendencia central utilizada es la mediana (ya que este estadístico es insensible a posibles irregularidades en los extremos).

# IQR (Inter Quartil Range) = Q3-Q1
RIC = IQR(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3)
RIC
## [1] 20.12
# Límite superior (Maximun)
Q3 <-  43.35
limitesuperior <- (Q3+1.5*RIC)
limitesuperior
## [1] 73.53
#Límite Inferior (Mínimo)
Q1 <- 23.23
limiteinferior <- (Q1+1.5*RIC)
limiteinferior
## [1] 53.41

Analisis de frecuencia

library(fdth)
## 
## Attaching package: 'fdth'
## The following object is masked from 'package:modeest':
## 
##     mfv
## The following objects are masked from 'package:stats':
## 
##     sd, var

Frecuencias absolutas, relativas y acumuladas

dist <- fdt(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3, breaks="Sturges")
dist
##     Class limits   f   rf rf(%)  cf  cf(%)
##  [2.3265,8.0226)   8 0.01  1.15   8   1.15
##  [8.0226,13.719)  25 0.04  3.59  33   4.74
##  [13.719,19.415)  85 0.12 12.21 118  16.95
##  [19.415,25.111)  76 0.11 10.92 194  27.87
##  [25.111,30.807) 101 0.15 14.51 295  42.39
##  [30.807,36.503) 103 0.15 14.80 398  57.18
##  [36.503,42.199) 106 0.15 15.23 504  72.41
##  [42.199,47.895) 107 0.15 15.37 611  87.79
##  [47.895,53.591)  56 0.08  8.05 667  95.83
##  [53.591,59.287)  24 0.03  3.45 691  99.28
##  [59.287,64.983)   5 0.01  0.72 696 100.00

Dist nos brinda una tabla con los cálculos de la distribución de frecuencias

Poligonos e histogramas

#Absolutos
plot(dist, type="fh")

plot(dist, type="fp")

#Acumulados
plot(dist, type="cfh")

plot(dist, type="cfp")

#Relativos

plot(dist, type="rfh")

plot(dist, type="rfp")

Medidas de dispersión: rango, varianza, desviación, estándar y coeficiente de variación

range(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3, na.rm = TRUE)
## [1]  2.35 64.34
min(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3, na.rm = TRUE)
## [1] 2.35
max(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3, na.rm = TRUE)
## [1] 64.34
max(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3, na.rm = TRUE) - min(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3, na.rm = TRUE)
## [1] 61.99

Luego, para conocer el rango de los valores se debe restar el valor máximo al mínimo

var(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3, na.rm = TRUE)
## [1] 154.7211
sd(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3, na.rm = TRUE)
## [1] 12.43869

Coeficiente de variación

sd(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3)/mean(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3)
## [1] 0.372654
library(FinCal)
## Warning: package 'FinCal' was built under R version 4.0.4
coefficient.variation(sd=sd(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3), avg = mean(periodo_2020_04_01_12_00_00_a_2020_04_30_12_00_00$O3))
## [1] 0.372654