##Reporte de comtaminantes en el aire de 2020

library(ggplot2)
datos_2020 = read.csv("C:/Users/gilbe/Downloads/datos_2020_atm_mod.csv")

Dimension y nombres de las variables de la base de datos sobre el aire

dim(datos_2020)
## [1] 8785   14
names(datos_2020)
##  [1] "date"       "ws"         "wd"         "O3"         "NO"        
##  [6] "NO2"        "NOX"        "SO2"        "PM10"       "TMP"       
## [11] "RH"         "Trimestre"  "HORA"       "Dias.enero"

#Introduccion En este trabajo se presentaran diversas gráficas sobre distintos contaminantes encontrados en el aire, también se aplicarán los conocimientos aprendidos en la clase de programación aplicada.

Las primeras dos graficas es sobre geometrías para mostrar distribución y estan son sobre los contaminantes NO2 y PM10.

ggplot(datos_2020, aes(x=NO2)) +
  geom_histogram(fill = "blue",
                 col="black") + 
    labs(title="Histograma",
         subtitle="Frecuencia del NO2", 
         y="Frecuencia",
         x="NO2") +
  theme_minimal() + 
  facet_grid(~Trimestre)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## Warning: Removed 3445 rows containing non-finite values (`stat_bin()`).

En esta grafica se puede observar la frecuencia de la cantidad encontrada de NO2 en cada trimestre de año 2020.

ggplot(datos_2020, aes(x = Trimestre, y = PM10)) +
    geom_boxplot(fill = "pink",
                 col = "red" ) +
    labs( title="Boxplot",
          subtitle="Frecuencia del PM10",
          y="PM10",
          x="Trimestre") +
    theme_minimal() 
## Warning: Removed 3771 rows containing non-finite values (`stat_boxplot()`).

Esta grafica llamada boxplot o caja de bigotes, nos muestra un promedio de la cantidad de PM10 encontrada en cada trimestre del año.

Ahora observemos otras dos graficas, pero ahora de la unidad geometrías para mostrar evolución, en las siguientes graficas podremos observar la cantidad del NOX y el RH

ggplot(datos_2020, aes(x = as.character(HORA),
               y = NOX, fill = Trimestre))+
  geom_bar(position = "dodge", stat="identity")+
  labs( title = "En que horario se acumula mas NOX",
       y = "Cantidad de NOX",
       x = "Hora", fill = "Trimestre")+
  theme_minimal()
## Warning: Removed 3445 rows containing missing values (`geom_bar()`).

En la gráfica podemos observar que en cada línea es una hora del día, cada color representa el trimestre y también nos indica en que cantidad de concentración de NOX promedio hay en cada Hora del día.

ggplot(datos_2020, aes(x = Dias.enero, y = RH)) +
  geom_line() +
  labs( title = "Mes de enero",
    y="RH",
        x="Dias") +
  theme_minimal()
## Warning: Removed 8041 rows containing missing values (`geom_line()`).

En esta grafica nos muestra la cantidad de RH que hay al paso de los dias.

En la ultima unidad geometrías para mostrar relación entre variables, podemos observar gráficas de dispersión y este nos ayuda para observar cada dato y su posición.

ggplot( datos_2020,aes(x = ws, y = wd)) +
  geom_point() +
  labs( x="ws", y="wd") +
  theme_minimal()
## Warning: Removed 1951 rows containing missing values (`geom_point()`).

En este gráfico, veremos la velocidad del viento y también que velocidades o rachas de viento son mas comunes en la zona que se evaluó el aire.

ggplot( datos_2020,aes(x = Trimestre, y = SO2)) +
  geom_point() +
  labs( x="Trimestres", y="SO2") +
  theme_minimal()
## Warning: Removed 2854 rows containing missing values (`geom_point()`).

Por ultimo podemos observar los datos o cantidades alcanzadas mas grandes de los trimestres.

#Conclusion Este informe es realizado para observar los distintos cambios de la cantidad de contaminantes en la zona y de esta forma encontrar la razon por la que se genero tal cantidad de contaminantes.