ACTIVIDAD 2

PRIMER EJERCICIO

Considerando la metodología del curso, haciendo uso del paquete Ggplot2, se realizarán los siguiente ejercicios, a partir de la base de datos “iris” que el programa tiene por defecto.

library(ggplot2)
library(datasets)
library(knitr)

data(iris)
iris_head <- head(iris, 20)
kable(iris_head, format = "html", caption = "Base de datos iris")
Base de datos iris
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
5.1 3.5 1.4 0.2 setosa
4.9 3.0 1.4 0.2 setosa
4.7 3.2 1.3 0.2 setosa
4.6 3.1 1.5 0.2 setosa
5.0 3.6 1.4 0.2 setosa
5.4 3.9 1.7 0.4 setosa
4.6 3.4 1.4 0.3 setosa
5.0 3.4 1.5 0.2 setosa
4.4 2.9 1.4 0.2 setosa
4.9 3.1 1.5 0.1 setosa
5.4 3.7 1.5 0.2 setosa
4.8 3.4 1.6 0.2 setosa
4.8 3.0 1.4 0.1 setosa
4.3 3.0 1.1 0.1 setosa
5.8 4.0 1.2 0.2 setosa
5.7 4.4 1.5 0.4 setosa
5.4 3.9 1.3 0.4 setosa
5.1 3.5 1.4 0.3 setosa
5.7 3.8 1.7 0.3 setosa
5.1 3.8 1.5 0.3 setosa

A. Gráfico de caja y bigotes de la variable “Sepal.Length”:

ggplot(iris, aes(x = "", y = Sepal.Length)) +
  geom_boxplot() +
  labs(x = "", y = "Sepal.Length") +
  ggtitle("Gráfico de caja y bigotes de Sepal.Length")

El gráfico de caja y bigotes muestra la distribución de la variable Sepal.Length. La caja representa el rango intercuartil (el 50% central de los datos) y la línea mediana indica el valor medio. Los bigotes muestran el rango completo de los datos, excluyendo los valores atípicos.

B. Gráfico de caja y bigotes de la variable Sepal.Length diferenciando por color la variable Species:

ggplot(iris, aes(x = Species, y = Sepal.Length, fill = Species)) +
  geom_boxplot() +
  labs(x = "Species", y = "Sepal.Length") +
  ggtitle("Gráfico de caja y bigotes de Sepal.Length por especie")

Este gráfico muestra la distribución de la variable Sepal.Length para cada especie de iris. Las cajas y los bigotes se agrupan por especie y se les asigna un color diferente. Esto nos permite comparar la distribución de Sepal.Length entre las diferentes especies de iris.

C. Gráfico de puntos de la variable Sepal.Length vs Sepal.Width:

  ggplot(iris, aes(x = Sepal.Width, y = Sepal.Length)) +
  geom_point() +
  labs(x = "Sepal.Width", y = "Sepal.Length") +
  ggtitle("Gráfico de puntos de Sepal.Length vs Sepal.Width")

Este gráfico de puntos muestra la relación entre las variables Sepal.Length y Sepal.Width. Cada punto representa una flor de iris y su posición en el gráfico muestra los valores correspondientes de Sepal.Length y Sepal.Width. Podemos observar si hay alguna relación o patrón entre estas dos variables.

D. Gráfico de puntos de la variable Sepal.Length vs Sepal.Width diferenciando por color:

ggplot(iris, aes(x = Sepal.Width, y = Sepal.Length, color = Species)) +
  geom_point() +
  labs(x = "Sepal.Width", y = "Sepal.Length") +
  ggtitle("Gráfico de puntos de Sepal.Length vs Sepal.Width por especie")

En este gráfico de puntos, se muestra la relación entre la longitud del sépalo (Sepal.Length) y el ancho del sépalo (Sepal.Width) en las flores de iris, diferenciando por color las especies de iris. Cada punto representa una flor y se colorea según la especie a la que pertenece. Este gráfico nos permite observar si hay una relación diferente entre la longitud y el ancho del sépalo para cada especie de iris. Si los puntos de diferentes especies se agrupan o se separan en áreas distintas, indicaría que hay una relación específica entre estas dos variables según la especie.