Complete el código en cada espacio (chunk) según se le solicita en el texto:

Incluya en el primer chunk las instrucciones para cargar los paquetes ggplot2 y dplyr.

1. Conformar data frame para análisis

En el siguiente chunk, utilice la sintáxis tipo pipe del paquete dplyr para: (a) seleccionar las variables Ozone, SolarR, Temp y Month, (b) seleccionar solo las filas para las cuales la velocidad del viento Wind es menor a 16.0. Almacene el resultado con el nombre airquality_samp.

data("airquality")
airquality_samp <- airquality  %>% 
  filter(Wind < 16.0) %>%
  select(Ozone, SolarR = Solar.R, Temp, Month)   

2. Conformar base de datos

Examine los datos de airquality_samp mediante la función summary() y head().

summary(airquality_samp)
##      Ozone            SolarR           Temp           Month      
##  Min.   :  1.00   Min.   :  7.0   Min.   :56.00   Min.   :5.000  
##  1st Qu.: 18.50   1st Qu.:123.5   1st Qu.:73.25   1st Qu.:6.000  
##  Median : 32.00   Median :207.0   Median :79.50   Median :7.000  
##  Mean   : 43.34   Mean   :187.9   Mean   :78.53   Mean   :7.048  
##  3rd Qu.: 64.00   3rd Qu.:258.5   3rd Qu.:85.00   3rd Qu.:8.000  
##  Max.   :168.00   Max.   :334.0   Max.   :97.00   Max.   :9.000  
##  NA's   :35       NA's   :7
head(airquality_samp)
##   Ozone SolarR Temp Month
## 1    41    190   67     5
## 2    36    118   72     5
## 3    12    149   74     5
## 4    18    313   62     5
## 5    NA     NA   56     5
## 6    28     NA   66     5
#ESPACIO PARA FUNCIONES DE EXPLORACION DE DATOS

A partir del resultado del chunk anterior, liste las variables continuas de este data frame:

3. Histogramas

Construya histogramas para las variables continuas del punto anterior: (a) para la variable Ozone, aplique una transformación logarítmica a los datos; (b) seleccione un color claro (celeste, rojo o amarillo) para las barras y no utilice color para el borde de las barras; (c) modifique los nombres de los ejes para que muestren correctamente (en castellano) los nombres de las variables que muestra. Aplique el theme_bw() para simplificar el formato del gráfico.

plot1 <- ggplot(airquality_samp, aes(x = log(Ozone))) +
  geom_histogram(fill = "lightblue", color = NA) +
  labs(x = "Ozono (escala logarítmica)", 
       y = "Frecuencia",
       title = "Distribución del Ozono (log transformado)") +
  theme_bw()

plot2 <- ggplot(airquality_samp, aes(x = SolarR)) +
  geom_histogram(fill = "yellow", color = NA, bins = 15) +
  labs(x = "Radiación Solar", y = "Frecuencia") +
  theme_bw()
plot3 <- ggplot(airquality_samp, aes(x = Temp)) +
  geom_histogram(fill = "red", color = NA, bins = 15) +
  labs(x = "Temperatura", y = "Frecuencia") +
  theme_bw()

 
print(plot1)
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
## Warning: Removed 35 rows containing non-finite outside the scale range
## (`stat_bin()`).

print(plot2)
## Warning: Removed 7 rows containing non-finite outside the scale range
## (`stat_bin()`).

print(plot3)

4. Resumir datos

Construya un gráfico de dispersión con Ozone en el eje vertical, Solar.R en el horizontal, el tamaño asociado a Temp y el color definido por Month. Modifique los nombres de ejes y simbología para que correctamente muestren los nombres de cada variable (en castellano). Aplique el theme_bw() para simplificar el formato del gráfico. Reduzca el tamaño de los elementos de texto a 8.

ggplot(airquality_samp, aes(x = SolarR, y = Ozone, size = Temp, color = factor(Month))) +
  geom_point(alpha = 0.7) +
  scale_color_manual(values = c("red", "blue", "green", "purple", "orange"),
                     labels = c("Mayo", "Junio", "Julio", "Agosto", "Septiembre")) +
  labs(x = "Radiación Solar", 
       y = "Ozono",
       size = "Temperatura (°F)",
       color = "Mes",
       title = "Relación entre Ozono, Radiación Solar, Temperatura y Mes") +
  theme_bw() +
  theme(text = element_text(size = 8))
## Warning: Removed 40 rows containing missing values or values outside the scale range
## (`geom_point()`).