¿En qué medida las dimensiones del sépalo predicen las dimensiones del pétalo y cómo varían estas relaciones entre las distintas especies de Iris?
# Librerías
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.1 ✔ stringr 1.5.2
## ✔ ggplot2 4.0.0 ✔ tibble 3.3.0
## ✔ lubridate 1.9.4 ✔ tidyr 1.3.1
## ✔ purrr 1.1.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(viridisLite)
library(viridis)
library(janitor)
##
## Attaching package: 'janitor'
##
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
# Lectura de datos
iris2 <- read_csv("/Users/pilarmendez/Downloads/a4_iris_limpia.csv")
## Rows: 150 Columns: 5
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (1): Variedad
## dbl (4): Sepalo_largo, Sepalo_ancho, Petalo_largo, Petalo_ancho
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
#Gráfica 1: Relación continua con línea de regresión Sepalo_largo vs Petalo_largo, coloreado por especie
Interpretación: Hay una relación positiva moderada, Setosa muestra baja variabilidad en pétalo, Virginica presenta mayor pendiente (mayor crecimiento del pétalo conforme aumenta el sépalo), Versicolor muestra relación lineal clara.
ggplot(iris2, aes(x = Sepalo_largo, y = Petalo_largo, color = Variedad)) +
geom_point(size = 3, alpha = 0.8) +
geom_smooth(method = "lm", se = FALSE, linewidth = 1) +
scale_color_viridis(discrete = TRUE) +
theme_minimal(base_size = 14) +
labs(
title = "Relación entre largo del sépalo y largo del pétalo",
x = "Largo del sépalo",
y = "Largo del pétalo",
color = "Especie"
)
## `geom_smooth()` using formula = 'y ~ x'
Interpretación: Setosa tiene distribuciones muy compactas, versicolor muestra mayor variabilidad interna, virginica presenta valores más altos y dispersión amplia.
ggplot(iris2, aes(x = Variedad, y = Petalo_ancho, fill = Variedad)) +
geom_violin(alpha = 0.6, trim = FALSE) +
geom_jitter(width = 0.1, alpha = 0.7, size = 2) +
scale_fill_viridis(discrete = TRUE) +
theme_minimal(base_size = 14) +
labs(
title = "Distribución del ancho del pétalo por especie",
x = "Especie",
y = "Ancho del pétalo"
) +
theme(legend.position = "none")
Interpretación: Setosa tiene valores más altos en general, Versicolor tiene valores intermedios y uniforme dispersión, Virginica muestra menor ancho de sépalo en promedio, el facetado facilita comparar formas de distribución.
ggplot(iris2, aes(x = Sepalo_ancho, fill = Variedad)) +
geom_histogram(alpha = 0.7, bins = 12, color = "white") +
scale_fill_viridis(discrete = TRUE) +
facet_wrap(~ Variedad) +
theme_minimal(base_size = 14) +
labs(
title = "Distribución del ancho del sépalo por especie",
x = "Ancho del sépalo",
y = "Frecuencia"
)
Las relaciones entre medidas de sépalo y pétalo cambian según especie: Virginica presenta la relación más fuerte entre longitud de sépalo y longitud de pétalo.
Las distribuciones del petalo_ancho indican que Setosa tiene pétalos consistentemente delgados, Versicolor transita entre valores bajos y moderados.
El análisis del sepalo_ancho revela diferencias claras: Setosa tiende a valores más amplios y Virginica tiene los sépalos más estrechos.