Considerando la metodología del curso, haciendo uso del paquete Ggplot2, se realizarán los siguiente ejercicios, a partir de la base de datos “iris” que el programa tiene por defecto.
library(ggplot2)
library(datasets)
library(knitr)
data(iris)
iris_head <- head(iris, 20)
kable(iris_head, format = "html", caption = "Base de datos iris")
| Sepal.Length | Sepal.Width | Petal.Length | Petal.Width | Species |
|---|---|---|---|---|
| 5.1 | 3.5 | 1.4 | 0.2 | setosa |
| 4.9 | 3.0 | 1.4 | 0.2 | setosa |
| 4.7 | 3.2 | 1.3 | 0.2 | setosa |
| 4.6 | 3.1 | 1.5 | 0.2 | setosa |
| 5.0 | 3.6 | 1.4 | 0.2 | setosa |
| 5.4 | 3.9 | 1.7 | 0.4 | setosa |
| 4.6 | 3.4 | 1.4 | 0.3 | setosa |
| 5.0 | 3.4 | 1.5 | 0.2 | setosa |
| 4.4 | 2.9 | 1.4 | 0.2 | setosa |
| 4.9 | 3.1 | 1.5 | 0.1 | setosa |
| 5.4 | 3.7 | 1.5 | 0.2 | setosa |
| 4.8 | 3.4 | 1.6 | 0.2 | setosa |
| 4.8 | 3.0 | 1.4 | 0.1 | setosa |
| 4.3 | 3.0 | 1.1 | 0.1 | setosa |
| 5.8 | 4.0 | 1.2 | 0.2 | setosa |
| 5.7 | 4.4 | 1.5 | 0.4 | setosa |
| 5.4 | 3.9 | 1.3 | 0.4 | setosa |
| 5.1 | 3.5 | 1.4 | 0.3 | setosa |
| 5.7 | 3.8 | 1.7 | 0.3 | setosa |
| 5.1 | 3.8 | 1.5 | 0.3 | setosa |
ggplot(iris, aes(x = "", y = Sepal.Length)) +
geom_boxplot() +
labs(x = "", y = "Sepal.Length") +
ggtitle("Gráfico de caja y bigotes de Sepal.Length")
El gráfico de caja y bigotes muestra la distribución de la variable Sepal.Length. La caja representa el rango intercuartil (el 50% central de los datos) y la línea mediana indica el valor medio. Los bigotes muestran el rango completo de los datos, excluyendo los valores atípicos.
ggplot(iris, aes(x = Species, y = Sepal.Length, fill = Species)) +
geom_boxplot() +
labs(x = "Species", y = "Sepal.Length") +
ggtitle("Gráfico de caja y bigotes de Sepal.Length por especie")
Este gráfico muestra la distribución de la variable Sepal.Length para cada especie de iris. Las cajas y los bigotes se agrupan por especie y se les asigna un color diferente. Esto nos permite comparar la distribución de Sepal.Length entre las diferentes especies de iris.
ggplot(iris, aes(x = Sepal.Width, y = Sepal.Length)) +
geom_point() +
labs(x = "Sepal.Width", y = "Sepal.Length") +
ggtitle("Gráfico de puntos de Sepal.Length vs Sepal.Width")
Este gráfico de puntos muestra la relación entre las variables Sepal.Length y Sepal.Width. Cada punto representa una flor de iris y su posición en el gráfico muestra los valores correspondientes de Sepal.Length y Sepal.Width. Podemos observar si hay alguna relación o patrón entre estas dos variables.
ggplot(iris, aes(x = Sepal.Width, y = Sepal.Length, color = Species)) +
geom_point() +
labs(x = "Sepal.Width", y = "Sepal.Length") +
ggtitle("Gráfico de puntos de Sepal.Length vs Sepal.Width por especie")
En este gráfico de puntos, se muestra la relación entre la longitud del sépalo (Sepal.Length) y el ancho del sépalo (Sepal.Width) en las flores de iris, diferenciando por color las especies de iris. Cada punto representa una flor y se colorea según la especie a la que pertenece. Este gráfico nos permite observar si hay una relación diferente entre la longitud y el ancho del sépalo para cada especie de iris. Si los puntos de diferentes especies se agrupan o se separan en áreas distintas, indicaría que hay una relación específica entre estas dos variables según la especie.