Complete el código en cada espacio (chunk) según se le solicita en el texto:
Incluya en el primer chunk las instrucciones para cargar los paquetes ggplot2 y dplyr.
En el siguiente chunk, utilice la sintáxis tipo pipe del paquete dplyr para: (a) seleccionar las variables Ozone, SolarR, Temp y Month, (b) seleccionar solo las filas para las cuales la velocidad del viento Wind es menor a 16.0. Almacene el resultado con el nombre airquality_samp.
data("airquality")
airquality_samp <- airquality %>%
filter(Wind < 16.0) %>%
select(Ozone, SolarR = Solar.R, Temp, Month)
Examine los datos de airquality_samp mediante la función
summary() y head().
summary(airquality_samp)
## Ozone SolarR Temp Month
## Min. : 1.00 Min. : 7.0 Min. :56.00 Min. :5.000
## 1st Qu.: 18.50 1st Qu.:123.5 1st Qu.:73.25 1st Qu.:6.000
## Median : 32.00 Median :207.0 Median :79.50 Median :7.000
## Mean : 43.34 Mean :187.9 Mean :78.53 Mean :7.048
## 3rd Qu.: 64.00 3rd Qu.:258.5 3rd Qu.:85.00 3rd Qu.:8.000
## Max. :168.00 Max. :334.0 Max. :97.00 Max. :9.000
## NA's :35 NA's :7
head(airquality_samp)
## Ozone SolarR Temp Month
## 1 41 190 67 5
## 2 36 118 72 5
## 3 12 149 74 5
## 4 18 313 62 5
## 5 NA NA 56 5
## 6 28 NA 66 5
#ESPACIO PARA FUNCIONES DE EXPLORACION DE DATOS
A partir del resultado del chunk anterior, liste las variables continuas de este data frame:
Construya histogramas para las variables continuas del punto
anterior: (a) para la variable Ozone, aplique una
transformación logarítmica a los datos; (b) seleccione un color claro
(celeste, rojo o amarillo) para las barras y no utilice color para el
borde de las barras; (c) modifique los nombres de los ejes para que
muestren correctamente (en castellano) los nombres de las variables que
muestra. Aplique el theme_bw() para simplificar el formato
del gráfico.
plot1 <- ggplot(airquality_samp, aes(x = log(Ozone))) +
geom_histogram(fill = "lightblue", color = NA) +
labs(x = "Ozono (escala logarítmica)",
y = "Frecuencia",
title = "Distribución del Ozono (log transformado)") +
theme_bw()
plot2 <- ggplot(airquality_samp, aes(x = SolarR)) +
geom_histogram(fill = "yellow", color = NA, bins = 15) +
labs(x = "Radiación Solar", y = "Frecuencia") +
theme_bw()
plot3 <- ggplot(airquality_samp, aes(x = Temp)) +
geom_histogram(fill = "red", color = NA, bins = 15) +
labs(x = "Temperatura", y = "Frecuencia") +
theme_bw()
print(plot1)
## `stat_bin()` using `bins = 30`. Pick better value `binwidth`.
## Warning: Removed 35 rows containing non-finite outside the scale range
## (`stat_bin()`).
print(plot2)
## Warning: Removed 7 rows containing non-finite outside the scale range
## (`stat_bin()`).
print(plot3)
Construya un gráfico de dispersión con Ozone en el eje
vertical, Solar.R en el horizontal, el tamaño asociado a
Temp y el color definido por Month. Modifique los
nombres de ejes y simbología para que correctamente muestren los nombres
de cada variable (en castellano). Aplique el theme_bw()
para simplificar el formato del gráfico. Reduzca el tamaño de los
elementos de texto a 8.
ggplot(airquality_samp, aes(x = SolarR, y = Ozone, size = Temp, color = factor(Month))) +
geom_point(alpha = 0.7) +
scale_color_manual(values = c("red", "blue", "green", "purple", "orange"),
labels = c("Mayo", "Junio", "Julio", "Agosto", "Septiembre")) +
labs(x = "Radiación Solar",
y = "Ozono",
size = "Temperatura (°F)",
color = "Mes",
title = "Relación entre Ozono, Radiación Solar, Temperatura y Mes") +
theme_bw() +
theme(text = element_text(size = 8))
## Warning: Removed 40 rows containing missing values or values outside the scale range
## (`geom_point()`).