Pregunta de investigación:

¿En qué medida las dimensiones del sépalo predicen las dimensiones del pétalo y cómo varían estas relaciones entre las distintas especies de Iris?

# Librerías 
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.1     ✔ stringr   1.5.2
## ✔ ggplot2   4.0.0     ✔ tibble    3.3.0
## ✔ lubridate 1.9.4     ✔ tidyr     1.3.1
## ✔ purrr     1.1.0     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(viridisLite)
library(viridis)
library(janitor)
## 
## Attaching package: 'janitor'
## 
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
# Lectura de datos 
iris2 <- read_csv("/Users/pilarmendez/Downloads/a4_iris_limpia.csv") 
## Rows: 150 Columns: 5
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (1): Variedad
## dbl (4): Sepalo_largo, Sepalo_ancho, Petalo_largo, Petalo_ancho
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

#Gráfica 1: Relación continua con línea de regresión Sepalo_largo vs Petalo_largo, coloreado por especie

Interpretación: Hay una relación positiva moderada, Setosa muestra baja variabilidad en pétalo, Virginica presenta mayor pendiente (mayor crecimiento del pétalo conforme aumenta el sépalo), Versicolor muestra relación lineal clara.

ggplot(iris2, aes(x = Sepalo_largo, y = Petalo_largo, color = Variedad)) +
  geom_point(size = 3, alpha = 0.8) +
  geom_smooth(method = "lm", se = FALSE, linewidth = 1) +
  scale_color_viridis(discrete = TRUE) +
  theme_minimal(base_size = 14) +
  labs(
    title = "Relación entre largo del sépalo y largo del pétalo",
    x = "Largo del sépalo",
    y = "Largo del pétalo",
    color = "Especie"
  )
## `geom_smooth()` using formula = 'y ~ x'

Gráfica 2: Gráfico de violín con puntos superpuestos distribución de Petalo_ancho por especie

Interpretación: Setosa tiene distribuciones muy compactas, versicolor muestra mayor variabilidad interna, virginica presenta valores más altos y dispersión amplia.

ggplot(iris2, aes(x = Variedad, y = Petalo_ancho, fill = Variedad)) +
  geom_violin(alpha = 0.6, trim = FALSE) +
  geom_jitter(width = 0.1, alpha = 0.7, size = 2) +
  scale_fill_viridis(discrete = TRUE) +
  theme_minimal(base_size = 14) +
  labs(
    title = "Distribución del ancho del pétalo por especie",
    x = "Especie",
    y = "Ancho del pétalo"
  ) +
  theme(legend.position = "none")

Gráfica 3: Histograma facetado, distribución del Sepalo_ancho segmentado por especie

Interpretación: Setosa tiene valores más altos en general, Versicolor tiene valores intermedios y uniforme dispersión, Virginica muestra menor ancho de sépalo en promedio, el facetado facilita comparar formas de distribución.

ggplot(iris2, aes(x = Sepalo_ancho, fill = Variedad)) +
  geom_histogram(alpha = 0.7, bins = 12, color = "white") +
  scale_fill_viridis(discrete = TRUE) +
  facet_wrap(~ Variedad) +
  theme_minimal(base_size = 14) +
  labs(
    title = "Distribución del ancho del sépalo por especie",
    x = "Ancho del sépalo",
    y = "Frecuencia"
  )

Conclusiones

  1. Las relaciones entre medidas de sépalo y pétalo cambian según especie: Virginica presenta la relación más fuerte entre longitud de sépalo y longitud de pétalo.

  2. Las distribuciones del petalo_ancho indican que Setosa tiene pétalos consistentemente delgados, Versicolor transita entre valores bajos y moderados.

  3. El análisis del sepalo_ancho revela diferencias claras: Setosa tiende a valores más amplios y Virginica tiene los sépalos más estrechos.